PHP substr 截取中文乱码的问题解决办法

更新时间：2016年11月25日 17:38 点击：1483

在php中为我们提供了几个字符截取函数，包括substr,mb_substr,mb_strcut函数，我们有些php初学者会利用substr来截取中文，结果发现中文会有乱码了，出现乱码我们可以使用mb_substr来解决。

文章页面的 description 是使用 substr 函数来截取220字符的，但是最后一个汉字总是乱码，而且截取出来的长度也不正确。

通过神奇的 Google 找到方法，可能是因为 substr(string,start,length)，会将汉字以字符的形式截断，而造成乱码

解决方案：

使用 PHP 扩展库中的 mb_substr 方法。

注意

1.确保你的Windows/system32下有php_mbstring.dll这个文件，没有就从你Php安装目录extensions里拷入Windows/system32里面。
2.在windows目录下找到php.ini打开编辑，搜索mbstring.dll，找到
;extension=php_mbstring.dll把前面的;号去掉，这样mb_substr函数就可以生效了

方法定义：

string mb_substr ( string str, int start [, int length [, string encoding]] )

注意：在使用 mb_substr()/mb_strcut 最后要加入多一个参数，以设定字符串的编码，

例如：

代码如下	复制代码
echo mb_substr(‘原本会出现乱码的汉字！’, 0, 7, ‘utf-8′);

再如：

代码如下	复制代码
$description = mb_substr(strip_tags($post->post_content),0,220,’utf-8′);

mb_strcut函数

mb_strcut函数功能也可以截取字符串长度，下面实例具体看看区别在哪：

代码如下

复制代码

<?php
$str = '这样一来我的字符串就不会有乱码^_^';

echo "mb_substr:" . mb_substr($str, 0, 7, 'utf-8');
//结果：这样一来我的字
echo "<br>";

echo "mb_strcut:" . mb_strcut($str, 0, 6, 'utf-8');
//结果：这样
?>

从上面的例子可以看出，mb_substr是按字来切分字符，而mb_strcut是按字节来切分字符，但是都不会产生半个字符的现象。

substr()函数中文版普通的substr()函数可以取得字符串的指定长度子字符串，但遇到中文时可能会在新字符串末尾产生乱码，下面这个函数将超过$len长度的字符串转换成以“...”结尾，并且去除了乱码。
用法：$new = getsubstring($old,20);

代码如下	复制代码
function getsubstring($str,$len) { for($i = 0;$i <$len;$i++) { if ($i >=0 AND $i <$len) { if(ord(substr($str,$i,1)) > 0xa1) $result_str.=substr($str,$i,2); else $result_str.=substr($str,$i,1); } if(ord(substr($str,$i,1)) > 0xa1) $i++; } if(strlen($str)<=$len) return $result_str; else return $result_str."..."; }

csv文件是在php中有fgetcsv函数来读取,但在linux是的php5.2.8版本中会发现fgetcsv读出来的csv文件数据不完整，下面我们来看问题解决办法。

在windows其它版本中

代码如下

复制代码

# Open the File.
if (($handle = fopen("test.csv", "r")) !== FALSE) {
    # Set the parent multidimensional array key to 0.
    $nn = 0;
    while (($data = fgetcsv($handle, 0, ",")) !== FALSE) {

//print_r($data);
        # Count the total keys in the row.
        $c = count($data);
        # Populate the multidimensional array.
        for ($x=0;$x<$c;$x++)
        {
            $csvarray[$nn][$x] = $data[$x];
        }
        $nn++;
    }
    # Close the File.
    fclose($handle);
}
//print_r($csvarray);

这个代码没有任何问题，然后我放到了linux中发现有为空的字段了。

问题解析出来的数据不完整，有为空的字段
网上查了下说是在php5.2.8 中存在bug
解决办法是使用自定义函数

代码如下

复制代码

经常会有同学问我为什么php time()与date()时间与本地电脑有区别呢，相关有几个小时啊，仔细计算有8小时之差了，这个就是php date_default_timezone_set时区设置问题了，我们只要简单设置即可。

Unix时间戳

如果date时间不一致可以使用date_default_timezone_set设置时区：

代码如下	复制代码
<?php date_default_timezone_set('Asia/Chongqing'); //获取当前时间 echo date('Y-m-d H:i:s',time()); echo "<br>"; //对当前时间进行计算 echo date('Y-m-d H:i:s',time()-600); //减10小时 echo "<br>"; //时间戳转时间 echo date('Y-m-d H:i:s',1364277600); //时间转时间戳（仅精确到秒） echo strtotime("2013-03-26 14:00"); echo "<br>"; ?>

除了上面办法我们还可以在php.ini中设置一个时区，这们以后就不需要程序开加这date_default_timezone_set('Asia/Chongqing');了

代码如下	复制代码
date.timezone = PRC

在利用php解析xml时提示Invalid byte 1 of 1-byte UTF-8 sequence错误了，这个问题我百度查实说是编码问题，结果我把编码处理一下果然KO了，下面我来分享一下解决办法。

错误提示

Invalid byte 1 of 1-byte UTF-8 sequence

原因分析

在中文版的window下java的默认的编码为GBK，也就是所虽然我们标识了要将xml保存为utf-8格式但实际上文件是以GBK格式来保存的，所以这也就是为什么能够我们使用GBK、GB2312编码来生成xml文件能正确的被解析，而以UTF-8格式生成的文件不能被xml解析器所解析的原因。

把xml的encoding属性值UTF-8改为UTF8

org.xml.sax.SAXParseException: Content is not allowed in trailing section

把先要解析和字符串trim()一下即可解决问题。

解决：

1、最简单就是把<?xml version="1.0" encoding="UTF-8"?>改成<?xml version="1.0" encoding="gbk"?>

2、或者把xml打开另存的时候把字符集改为UTF-8后保存

或改程序

代码如下	复制代码
SAXReader reader = new SAXReader(); org.dom4j.Document document = reader.read("D:\ha.xml"); OutputFormat of = new OutputFormat(); of.setEncoding("UTF-8"); //改变编码方式 XMLWriter writer = new XMLWriter(new FileWriter "d:\dom4j.xml"), of);

我使用的是eclipse编辑器如下操作即可

可以在Eclipse中更改，在 eclipse 的功能表 [Project]→[Properties]，?? [Resources]，在右?的「Text file encoding」，把原?硎窍到y??的??，改? 「UTF-8」。

今天换了一个服务器运行php久了就会发现Fatal error: Allowed memory size of 33554432 bytes exhausted提示了，下面我来给大家介绍此问题解决地。

解决办法

方法一（推荐）、修改 php.ini 里的 memory_limit 的设置值 8M 改为 120M：memory_limit = 120M

方法二、在最上层的 PHP Script，加入一行：ini_set("memory_limit","120M");

我使用的是否wordpress博客，我的解决办法有点不同，下面也分享一下。

1、网络办法，据说这个适用3.0以前的版本。编辑wp-config.php这个文件，添加

代码如下	复制代码
define(‘WP_MEMORY_LIMIT’, ’64M’);

64M可以更高。可以96M、128M。

2、3.0以后的版本，要修改源文件，介意的就不用改了。在wp-includes目录下找到default-constants.php文件中的以下的代码

代码如下

复制代码

global $blog_id;

// set memory limits
if ( !defined('WP_MEMORY_LIMIT') ) {
if( is_multisite() ) {
define('WP_MEMORY_LIMIT', '64M');
} else {
define('WP_MEMORY_LIMIT', '32M');
}
}

第二行 define(‘WP_MEMORY_LIMIT’, ’32M’); 变64M即可。

[!--infotagslink--]

上一篇: php htmlentities汉字中文乱码问题解决办法

下一篇: php中fgetcsv函数在php5.2.8 中的数据不完整

PHP session_start()很慢问题分析与解决办法
本文章来给各位同学介绍一下关于PHP session_start()很慢问题分析与解决办法，希望碰到此问题的同学可进入参考。最近在做东西的时候发现一个问题有一个接口挂...2016-11-25
php生成二维码中文乱码问题解决方法
最近做了个扫描二维码得到vcard的项目，遇到一个问题，有一部分生成完的二维码，用android系统手机扫描后得到的vcard中的中文姓名是乱码，经过比对发现，这部分vcard中ORG这个...2016-11-25
js URLdecode()与urlencode方法支持中文解码
下面来介绍在js中来利用urlencode对中文编码与接受到数据后利用URLdecode()对编码进行解码，有需要学习的机友可参考参考。代码如下复制代码 ...2016-09-20
php中json_decode()和json_encode()用法与中文不显示解决办法
本文章介绍了关于php中json_decode()和json_encode()用法与中文不显示解决办法，有需要的朋友可以参考一下下。 php中json_decode()和json_encode() 1.json_decode(...2016-11-25
phpexcel导出数据身份证后四位0000解决办法
在php中我们如果要导入excel数据我们通常会使用phpexcel插件了，但是有朋友会发与使用phpexcel导出数据出现身份证后四位是0000情况了，下面我们就来看解决办法。最...2016-11-25
401错误码代表什么 401错误解决办法
401是HTTP状态码的一种，属于“请示错误”，表示请求可能出错，已妨碍了服务器对请求的处理。具体的401错误是指：未授权，请求要求进行身份验证。登录后，服务器可能会返回对页面...2017-01-22
apache网站提示503错误解决办法
Apache status 503 的原因大致有如下几种情况： 1、 CPU 负载过高，服务器响应不过来，返回503 2、系统连接数超限，超过MaxVhostClients的上限，返回503 3、单IP连接数超限，超过M...2016-01-28
Perl CPAN::Modulelist的解决办法
今天用CPAN安装Term::ReadLine，报了个这样的错误 Going to read /root/.cpan/sources/modules/03modlist.data.gz Can't locate object method "data" via package "C...2016-11-25
运行vbs脚本报错无效字符、中文乱码的解决方法(编码问题)
今天在写一个vbs的时候，发现中文乱码，后来写好代码正常运行的代码压缩一下给了同事，发现报无效字符，经过验证后发现原来是编码的问题导致，这里就为大家分享一下...2020-06-30
phpStudy访问速度慢和启动失败的解决办法
下面给大家介绍phpstudy访问速度慢的解决办法。1、修改mysql数据库链接地址为ip地址127.0.0.1。2、使用最新版本，这个坑了我好久时间。下面一段内容是关于phpstudy启动失败的解决办法。php5.3、5.4和apache都是用vc9编...2015-11-24
PHP Curl出现403错误的解决办法
自己用的小PHP应用，使用curl抓网页下来处理，为了穿墙方便，使用Privoxy作为代理，便于选择哪些网站使用proxy、哪些不用。但今天却遇到了奇怪的问题，访问google baidu这些网站居然都返回403错误，而访问其他的一些网站没事，如果...2014-05-31
关于Mysql中文乱码问题该如何解决(乱码问题完美解决方案)
最近两天做项目总是被乱码问题困扰着，这不刚把mysql中文乱码问题解决了，下面小编把我的解决方案分享给大家，供大家参考，也方便以后自己查阅。首先：用show variables like “%colla%”；show varables like “%char%”；这两条...2015-11-24
C#读取中文文件出现乱码的解决方法
这篇文章主要介绍了C#读取中文文件出现乱码的解决方法,涉及C#中文编码的操作技巧,非常具有实用价值,需要的朋友可以参考下...2020-06-25
Windows服务器MySQL中文乱码的解决方法
我们自己鼓捣mysql时，总免不了会遇到这个问题：插入中文字符出现乱码，虽然这是运维先给配好的环境，但是在自己机子上玩的时候咧，总得知道个一二吧，不然以后如何优雅的吹牛B。...2015-03-15
Mysql在debian系统中不能插入中文的终极解决方案
在debian环境下，彻底解决mysql无法插入和显示中文的问题Linux下Mysql插入中文显示乱码解决方案mysql -uroot -p 回车输入密码进入mysql查看状态如下：默认的是客户端和服务器都用了latin1，所以会乱码。解决方案:mysql>use...2013-10-04
linux mint 下mysql中文支持问题
一.mysql默认不支持中文,它的server和db默认是latin1编码.所以我们要将其改变为utf-8编码,因为utf-8包含了地球上大部分语言的二进制编码 1.关闭mysql服务 sudo /etc/init.d/mysql stop 2.修改mysql配置文件 mysql配...2015-10-21
PHP判断上传文件类型的解决办法
分享给大家php判断上传文件类型的方法，大家一起学习学习。/** * 读取文件前几个字节判断文件类型 * @return String */ function checkTitle($filename){ $file=fopen($filename, "rb"); $bin=fread($file, 2); /...2015-10-21
php怎么用拼音简单的php中文转拼音的实现代码
小编分享了一段简单的php中文转拼音的实现代码，代码简单易懂，适合初学php的同学参考学习。代码如下复制代码 <?phpfunction Pinyin($_String...2017-07-06
PHP json_encode() 函数详解及中文乱码问题
在 php 中使用 json_encode() 内置函数(php > 5.2)可以使用得 php 中数据可以与其它语言很好的传递并且使用它。这个函数的功能是将数值转换成json数据存储格式。<?php$arr = array ( 'Name'=>'希亚', 'Age'...2015-11-08
android.os.BinderProxy cannot be cast to com解决办法
本文章来给大家介绍关于android.os.BinderProxy cannot be cast to com解决办法，希望此文章对各位有帮助呀。 Android在绑定服务的时候出现java.lang.ClassCastExc...2016-09-20

PHP substr 截取中文乱码的问题解决办法

相关文章

阁下可能感兴趣的内容

推荐阅读