`
bbdu540
  • 浏览: 9001 次
  • 性别: Icon_minigender_2
  • 来自: 深圳
社区版块
存档分类
最新评论

分享PHP代码 UTF-8和Unicode编码互转(多语言)

阅读更多
PHP UTF-8和Unicode编码互转
/** 
     * //将内容进行UNICODE编码
     * utf-8 转unicode
     * 
     * @param string $name
     * @return string
     */
    function utf8_unicode($name){  
        $name = iconv('UTF-8', 'UCS-2', $name);  
        $len  = strlen($name);  
        $str  = '';  
        for ($i = 0; $i < $len - 1; $i = $i + 2){  
            $c  = $name[$i];  
            $c2 = $name[$i + 1];  
            if (ord($c) > 0){   //两个字节的文字  
                $str .= '\u'.base_convert(ord($c), 10, 16).str_pad(base_convert(ord($c2), 10, 16), 2, 0, STR_PAD_LEFT);  
                //$str .= base_convert(ord($c), 10, 16).str_pad(base_convert(ord($c2), 10, 16), 2, 0, STR_PAD_LEFT);  
            } else {  
                $str .= '\u'.str_pad(base_convert(ord($c2), 10, 16), 4, 0, STR_PAD_LEFT);  
                //$str .= str_pad(base_convert(ord($c2), 10, 16), 4, 0, STR_PAD_LEFT);  
            }  
        }  
        $str = strtoupper($str);//转换为大写  
        return $str;  
    }  
  
    /** 
     * unicode 转 utf-8 
     * 
     * @param string $name 
     * @return string 
     */  
    function unicode_decodessss($name)  
    {  
        $name = strtolower($name);  
        // 转换编码,将Unicode编码转换成可以浏览的utf-8编码  
        $pattern = '/([\w]+)|(\\\u([\w]{4}))/i';  
        preg_match_all($pattern, $name, $matches);  
        if (!empty($matches))  
        {  
            $name = '';  
            for ($j = 0; $j < count($matches[0]); $j++)  
            {  
                $str = $matches[0][$j];  
                if (strpos($str, '\\u') === 0)  
                {  
                    $code = base_convert(substr($str, 2, 2), 16, 10);  
                    $code2 = base_convert(substr($str, 4), 16, 10);  
                    $c = chr($code).chr($code2);  
                    $c = iconv('UCS-2', 'UTF-8', $c);  
                    $name .= $c;  
                }  
                else  
                {  
                    $name .= $str;  
                }  
            }  
        }  
        return $name;  
    }  


调用及结果:
$utf8_str = '我';

//这是汉字“你”的Unicode编码
$unicode_str = '\u4f60';

//输出 6211
echo utf8_unicode($utf8_str) . "<br/>";

//输出汉字“你”
echo unicode_decodes($unicode_str);


注:  由于浏览器默认会解读,所以要看源代码

\U6211<br/>
你

分享到:
评论

相关推荐

    PHP中文分词代码 v1.0 UTF-8.rar

    PHP中文分词代码使用居于unicode的词库,使用反向匹配模式分词,理论上兼容编码更广泛,并且对utf-8编码尤为方便。由于PhpanAlysis是无组件的系统,因此速度会比有组件的稍慢,不过在大量分词中,由于边分词边完成...

    ASP版hmac和md5加密函数,支持中文,带unicode和utf8转码

    PHP源码还是比较容易看懂的,原来加密的字符text和密钥key都是先转换为UTF-8编码。 这一点与原先那个dll里就可能不一致,把PHP上传到空间一测试,果然密钥使用中文是不一样的。 我也无法知道易宝自己到底使用哪一种...

    grub4dos-V0.4.6a-2017-02-04更新

    例如:echo -e \x18 显示 UTF-8 字符 0x18。 echo -e \X2191 显示 unicode 字符 0x2191。 2016-03-15(yaya) 1.增加动画控制热键 F2:播放/停止。 2.增加动画控制位 0x835b,位0:0/1=停止/播放。 3.增加精简...

    MadEdit编辑器

    包括Unicode(UTF-8、UTF-16/32)、Big5、GBK以及S-JIS 支持Unicode CJK 扩展B区(Ext-B) 可进行中文繁、简体的转换 若用户输入的字符不为当前编码支持,该字符会被转换成诸如U+XXXX的Unicode格式可用正则表达式进行...

    多语言企业网站管理系统 mlecms v2.3.rar

    采用UTF-8编码的用户请勿使用记事本对代码文件及模板文件进行编辑,必须使用可以去掉 Unicode 签名(BOM)的工具(如DW)进行编辑,详情见:http://www.mlecms.com/view.php?id=56   相关链接: 前台演示:...

    NotePad2 MOD-v1.1.1.2 (简/繁/英)

    --支持 ANSI、Unicode、UTF-8 等编码互换 --直接查看 NFO 文件 --可以格式化 C/C++/Java 源代码 --可以把语法高亮方案导出为 HTML、UBB 代码 --内置 BAT/C/C++/NSIS 等语法支持 --内置 NSIS 脚本编译功能(支持 ...

    Blumentals_WeBuilder_2020_v16.1.0.226.rar

    除了支持UTF-16外,还支持UTF-8组合和不支持BOM 代码智慧升级! 大量的智能代码完成、导航和建议特性 HTML5和CSS3准备升级! 编码属性是最新的标准。 立即FTP / SFTP / FTP升级! 直接编辑在您的网站主机或打印本地改进...

    贝岭的matlab的代码-sofawiki:SofaWiki是一个基于PHP的基于文件的CMS

    UTF-8 编码。 适用于 PHP5 或 PHP4,无需数据库。 简单备份。 100'000 页及更多页面的快速服务器 HTML 5 模板 语义字段使 SofaWiki 成为可搜索的数据库 开源,免费许可 文档 一分钟演示影片中的安装 2012-2020

    MLECMS多语言企业网站管理系统 2.3.rar

    采用UTF-8编码的用户请勿使用记事本对代码文件及模板文件进行编辑,必须使用可以去掉 Unicode 签名(BOM)的工具(如DW)进行编辑 业务QQ:1905035610、1905871657 业务合作:[email protected] 客服电话:0760-...

    高级记事本....Notepad2

    2 支持ANSI,Unicode,UTF-8等编码互换 3 可以设置无限个书签(9种图标可换)轻松定位 4 空格,制表符彩色显示,并可互相转换 5 可以对任意的文本块进行操作,ALT键+鼠标 6 对括号{}〔〕()可以高亮配对...

    XML轻松学习手册--XML肯定是未来的发展趋势,不论是网页设计师还是网络程序员,都应该及时学习和了解

    可是一大堆的概念和术语往往让人望而生畏,很多朋友问我:XML到底有什么用,我们是否需要学习它?我想就我个人学习过程的心得和经验,写一篇比较全面的介绍文章。首先有两点是需要肯定的:  第一:XML肯定是未来的...

    php网络开发完全手册

    2.7.1 使用require和require_once语句 2.7.1 进行文件包含 42 2.7.2 使用include与include_once语句 2.7.2 进行文件包含 44 2.8 小结 45 第3章 PHP的数据类型与操作 46 3.1 数据类型的介绍 46 3.1.1 标量数据类型 46...

    MySQL5.1参考手册官方简体中文版

    10.6. 用于元数据的UTF8 10.7. 与其它DBMS的兼容性 10.8. 新字符集配置文件格式 10.9. 国家特有字符集 10.10. MySQL支持的字符集和校对 10.10.1. Unicode字符集 10.10.2. 西欧字符集 10.10.3. 中欧字符集 10.10.4. ...

    MySQL 5.1参考手册

    10.6. 用于元数据的UTF8 10.7. 与其它DBMS的兼容性 10.8. 新字符集配置文件格式 10.9. 国家特有字符集 10.10. MySQL支持的字符集和校对 10.10.1. Unicode字符集 10.10.2. 西欧字符集 10.10.3. 中欧字符集 10.10.4. ...

    超级批量文本替换5.0

    功能说明: &lt;br&gt; 文本替换的利器,批量文本替换的不二之选,站长必备,挂马网页杀手, 支持所有纯ANSI文件,支持GBK/Unicode/UTF8编码的htm、html、asp、java、php等文件 可自定义所支持的文件类型 ...

    mysql5.1中文手册

    用于元数据的UTF8 10.7. 与其它DBMS的兼容性 10.8. 新字符集配置文件格式 10.9. 国家特有字符集 10.10. MySQL支持的字符集和校对 10.10.1. Unicode字符集 10.10.2. 西欧字符集 10.10.3. 中欧...

    mysql官方中文参考手册

    10.6. 用于元数据的UTF8 10.7. 与其它DBMS的兼容性 10.8. 新字符集配置文件格式 10.9. 国家特有字符集 10.10. MySQL支持的字符集和校对 10.10.1. Unicode字符集 10.10.2. 西欧字符集 10.10.3. 中欧字符集 10.10.4. ...

    MYSQL中文手册

    10.6. 用于元数据的UTF8 10.7. 与其它DBMS的兼容性 10.8. 新字符集配置文件格式 10.9. 国家特有字符集 10.10. MySQL支持的字符集和校对 10.10.1. Unicode字符集 10.10.2. 西欧字符集 10.10.3. 中欧字符集 ...

    MySQL 5.1参考手册中文版

    10.6. 用于元数据的UTF8 10.7. 与其它DBMS的兼容性 10.8. 新字符集配置文件格式 10.9. 国家特有字符集 10.10. MySQL支持的字符集和校对 10.10.1. Unicode字符集 10.10.2. 西欧字符集 10.10.3. 中欧字符集 ...

Global site tag (gtag.js) - Google Analytics