php自動獲取字符串編碼函數mb
添加時間:2014-12-14 16:39:47
添加:
思海網絡
當在php中使用mb_detect_encoding函數進行編碼識別時,很多人都碰到過識別編碼有誤的問題,例如對與GB2312和UTF- 8,或者UTF-8和GBK(這里主要是對于cp936的判斷),網上說是由于字符短是,mb_detect_encoding會出現誤判。
例如:
復制代碼 代碼如下:
$encode = mb_detect_encoding($keytitle, array("ASCII",'UTF-8′,"GB2312′,"GBK",'BIG5′));
if ($encode == “UTF-8″){
$keytitle = iconv("UTF-8″,"GBK",$keytitle);
}
這段代碼的作用是檢測字符串的編碼是否UTF-8,是的話就轉換為GBK。
可是當 $keytitle = “%D0%BE%C6%AC”;時。檢測結果卻是UTF-8.這個bug其實不算是bug,寫程序時也不應當過于依賴mb_detect_encoding,當字符串較短時,檢測結果產生偏差的可能性很大。
怎么解決呢,我的辦法是:
復制代碼 代碼如下:
$encode = mb_detect_encoding($keytitle, array('ASCII','GB2312′,'GBK','UTF-8');
三個參數分別是:被檢測的輸入變量、編碼方式的檢測順序(一旦為真,后面自動忽略)、strict模式
對編碼檢測的順序進行調整,將最大可能性放在前面,這樣減少被錯誤轉換的機會。
一般要先排gb2312,當有GBK和UTF-8時,需要將常用的排列到前面。
關鍵字:函數、程序、php
新文章:
- CentOS7下圖形配置網絡的方法
- CentOS 7如何添加刪除用戶
- 如何解決centos7雙系統后丟失windows啟動項
- CentOS單網卡如何批量添加不同IP段
- CentOS下iconv命令的介紹
- Centos7 SSH密鑰登陸及密碼密鑰雙重驗證詳解
- CentOS 7.1添加刪除用戶的方法
- CentOS查找/掃描局域網打印機IP講解
- CentOS7使用hostapd實現無AP模式的詳解
- su命令不能切換root的解決方法
- 解決VMware下CentOS7網絡重啟出錯
- 解決Centos7雙系統后丟失windows啟動項
- CentOS下如何避免文件覆蓋
- CentOS7和CentOS6系統有什么不同呢
- Centos 6.6默認iptable規則詳解