[PHP API档案] htmlentities && htmlspecialchars
本帖最后由 大麦田 于 2014-9-14 14:30 编辑转换字符为HTML字符编码
函数原型:
string htmlentities ( string $string[, int $flags= ENT_COMPAT | ENT_HTML401[, string $encoding= ini_get("default_charset")[, bool $double_encode= true]]] )string htmlspecialchars ( string $string[, int $flags= ENT_COMPAT | ENT_HTML401[, string $encoding= ini_get("default_charset")[, bool $double_encode= true]]] )
函数功能:
htmlentities : 转换所有字符为HTML字符编码。
htmlspecialchars : 转换特殊字符为HTML字符编码。
函数参数:
参数 含义
$string 需要转换的字符
$flags 转换模式 (默认:ENT_COMPAT | ENT_HTML401)
ENT_COMPAT :对双引号进行编码,不对单引号进行编码
ENT_QUOTES :单引号和双引号都进行编码
ENT_NOQUOTES:不对单引号和双引号进行编码
$encoding 默认编码 UTF8 (php>5.4)
ISO-8895-1 西欧,Latin-1
GB2312 (936) 简体中文,中国国家标准字符集。
UTF8 与ASCII 兼容的多字节 8 位 Unicode(多语言项目常用)
BIG5 (950) 繁体中文,主要用于中国台湾省。 (喜欢称他:大5码)
函数实例:
<?php
//演示一个连接到鱼C论坛的html代码
$fishc_href = "<a href='http://bbs.fishc.com/'>链接到鱼C论坛首页</a>";
echo "htmlentities:<br />";
$ret_default = htmlentities($fishc_href); //等同于$ret_default = htmlentities($fishc_href, ENT_COMPAT | ENT_HTML401, 'utf-8');
echo "<xmp>实际代码:" . $ret_default . "</xmp>";
echo "网页显示:" . $ret_default . "<br />";
$ret_quote = htmlentities($fishc_href, ENT_QUOTES);
echo "<xmp>实际代码:" . $ret_quote . "</xmp>";
echo "网页显示:" . $ret_quote . "<br /><br />";
//htmlspecialchars用法同上
$ret_default_char = htmlspecialchars($fishc_href);
$ret_quote_char = htmlspecialchars($fishc_href, ENT_QUOTES);
?>
进阶:
<?php
//如何用php代码,将鱼C论坛首页,以html代码形式,直接显示在屏幕上呢?
//向浏览器声明本文件编码utf-8
header('Content-Type: text/html; charset=utf-8');
$fishc_html = file_get_contents("http://bbs.fishc.com/");
echo htmlspecialchars($fishc_html);
//然后什么都没有了, Tell me why ???
//原因是“鱼C论坛”用的是GBK,而坑爹的转换竟然只有gb2312,不支持gbk
//然后就木有然后了...
//接下来,我们将得到的内容,从gbk编码,转换到utf-8编码,最后再将标签,转化成html可显示代码,显出出来。
//这个就是大家后台编辑是,插入代码后,网页上看到的仍旧是“代码”的原因。
$fishc_html_utf8 = mb_convert_encoding($fishc_html, "UTF-8", "GBK");
echo htmlspecialchars($fishc_html_utf8);
?>
函数注意:
1. 不支持gbk编码,用的时候,一定要注意。
2. 关于php手册中提到编码区别:
htmlentities() 所有字符转换为 HTML 编码。
htmlspecialchars() 仅将预定义的字符转换为 HTML 编码。
预定义字符:
和号 (&) 成为 &
双引号 (")成为 "
单引号 (' )成为 '
小于 (<) 成为 <
大于 (>) 成为 >
这样导致的结果:
2.1. 编码英文的时候,结果一致
2.2. 编码中文的时候,htmlentities() 会对中文本身也编码,导致显示出来成为乱码
php 5.5下测试结果:
得到的编码结果一致,所以一并列出。供大家做参考。
鱼C侦探团
页:
[1]