旧题新貌:PHP截取中文字符串的问题

为了生活922

为了生活922

2016-01-29 15:07

旧题新貌:PHP截取中文字符串的问题,旧题新貌:PHP截取中文字符串的问题
 

以下代码试用于GB2312编码,截取中文字符串是PHP中一个头疼的问题,解决方法是根据值是否大于等于128来判断是否是双字节字符,以避免出现乱码的情况。但中英文混合、特殊符号等问题总是存在,现在写一个比较全面的,仅供参考:

(本文来源于图老师网站,更多请访问http://m.tulaoshi.com/php/)

程序说明:
1. len 参数以中文字符为标准,1len等于2个英文字符,为了形式上好看些
2. 如果将magic参数设为false,则中文和英文同等看待,取绝对的字符数
3. 特别适用于用htmlspecialchars()进行过编码的字符串
4. 能正确处理GB2312中实体字符模式(𖰰)

程序代码:


function FSubstr($title,$start,$len="",$magic=true)
{
/**
  *  powered by Smartpig
  *  mailto:d.einstein@263.net
  */
 
$length = 0;
if($len == "") $len = strlen($title);

//判断起始为不正确位置
if($start 0)
{
  $cnum = 0;
  for($i=0;$i<$start;$i++)
  {
   if(ord(substr($title,$i,1)) = 128) $cnum ++;
  }
  if($cnum%2 != 0) $start--;
 
  unset($cnum);
}

if(strlen($title)<=$len) return substr($title,$start,$len);

$alen   = 0;
$blen = 0;

(本文来源于图老师网站,更多请访问http://m.tulaoshi.com/php/)

$realnum = 0;

for($i=$start;$i<strlen($title);$i++)
{
  $ctype = 0;
  $cstep = 0;
  $cur = substr($title,$i,1);
  if($cur == "&")
  {
   if(substr($title,$i,4) == "&lt;")
   {
    $cstep = 4;
    $length += 4;
    $i += 3;
    $realnum ++;
    if($magic)
    {
     $alen ++;
    }
   }
   else if(substr($title,$i,4) == "&gt;")
   {
    $cstep = 4;
    $length += 4;
    $i += 3;
    $realnum ++;
    if($magic)
    {
     $alen ++;
    }
   }
   else if(substr($title,$i,5) == "&amp;")
   {
    $cstep = 5;
    $length += 5;
    $i += 4;
    $realnum ++;
    if($magic)
    {
     $alen ++;
    }
   }
   else if(substr($title,$i,6) == "&quot;")
   {
    $cstep = 6;
    $length += 6;
    $i += 5;
    $realnum ++;
    if($magic)
    {
     $alen ++;
    }
   }
   else if(substr($title,$i,6) == "&#039;")
   {
    $cstep = 6;
    $length += 6;
    $i += 5;
    $realnum ++;
    if($magic)
    {
     $alen ++;
    }
   }
   else if(preg_match("/&#(d+);/i",substr($title,$i,8),$match))
   {
    $cstep = strlen($match[0]);
    $length += strlen($match[0]);
    $i += strlen($match[0])-1;
    $realnum ++;
    if($magic)
    {
     $blen ++;
     $ctype = 1;
    }
   }
  }else{
   if(ord($cur)=128)
   {
    $cstep = 2;
    $length += 2;
    $i += 1;
    $realnum ++;
    if($magic)
    {
     $blen ++;
     $ctype = 1;
    }
   }else{
    $cstep = 1;
    $length +=1;
    $realnum ++;
    if($magic)
    {

展开更多 50%)
分享

猜你喜欢

旧题新貌:PHP截取中文字符串的问题

PHP
旧题新貌:PHP截取中文字符串的问题

PHP截取中文字符串的问题

Web开发
PHP截取中文字符串的问题

s8lol主宰符文怎么配

英雄联盟 网络游戏
s8lol主宰符文怎么配

如何利用php来截取一段中文字符串而不出现乱码

PHP
如何利用php来截取一段中文字符串而不出现乱码

检测含有中文字符串的实际长度

Web开发
检测含有中文字符串的实际长度

lol偷钱流符文搭配推荐

英雄联盟 网络游戏
lol偷钱流符文搭配推荐

java 中文字符串数组按照音序排列

Web开发
java 中文字符串数组按照音序排列

包含中文字符的URL编码问题

Web开发
包含中文字符的URL编码问题

lolAD刺客新符文搭配推荐

英雄联盟
lolAD刺客新符文搭配推荐

LAMPJT最适用的web开发系统详细配置

LAMPJT最适用的web开发系统详细配置

MySQL中的SQL-- TEXT、DATE、和SET数据类型

MySQL中的SQL-- TEXT、DATE、和SET数据类型
下拉加载更多内容 ↓