- 金錢
- 1528
- 威望
- 5296
- 貢獻值
- 378
- 推廣值
- 2
- 性別
- 男
- 在線時間
- 401 小時
- 最後登錄
- 2024-11-14
- 主題
- 989
- 精華
- 0
- 閱讀權限
- 90
- 註冊時間
- 2011-12-29
- 帖子
- 0
TA的每日心情 | 怒 2024-11-3 15:50 |
---|
簽到天數: 1258 天 [LV.10]以壇為家III - 推廣值
- 2
- 貢獻值
- 378
- 金錢
- 1528
- 威望
- 5296
- 主題
- 989
|
樓主
發表於 2012-9-19 21:51:07
php读取文件乱码问题的解决方法:
php5中的流读取函数的默认编码貌似是UTF-8,而php4里直接file_get_contents()读取gb2312编码的正常,到了5就乱码了。
网上的解决办法说抓取后用iconv()转码。看后就觉得不对劲:一个是不一定编译了iconv库,更大的问题是编码都跟流转换的时候有关(如果用了iconv实际上php转了两次码:流 -> UTF-8 -> GB2312)
仔细看了下php的文档(不知道大家都是怎么写代码的,其实文档上很清楚啊),上面关于fopen()及file_get_contents()都 提到了“默认是UTF-8,但是用户可以用stream_default_encoding()或者用户自定义上下文属性改变编码”,手册上写道(If unicode semantics are enabled, the default encoding of the read data is UTF-8. You can specify a different encoding by creating a custom context or by changing the default using stream_default_encoding()。)。于是用stream_default_encoding(‘gb2312’);测试:但是 faint的是,这个函数不存在?!似乎php 6才支持。不过天无绝人之路,还有“用户自定义上下文属性”可以用。
经过更仔细的看文档,最后解决了这个问题:
代码如下:
<?php
//设置流的编码格式,这是文件流(file),如果是网络访问,file改成http
$opts = array(‘file' => array('encoding' => 'gb2312’));
$ctxt = stream_context_create($opts);
file_get_contents(文件名, FILE_TEXT, $ctxt);
?> |
|