这篇文章主要讲解了“如何用php修改中文编码格式”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“如何用php修改中文编码格式”吧!
一、中文编码方式的种类
在介绍如何改变中文编码格式之前,需要先了解中文编码方式的种类。
GBK/GB2312
GBK是“汉字内码扩展规范”的简称,是中国国家标准,它是GB2312的扩展集,支持了全世界上万种汉字的编码。GBK编码支持繁体中文、简体中文、日本、朝鲜等语言文字。
UTF-8
UTF-8是通用多字节编码技术,可对Unicode进行可变长度编码,它可以表示Unicode标准中的任意字符,且向后兼容ASCII。
二、php中处理中文编码问题
获取表单中数据的编码格式
在获取表单中的数据之前,需要先确定该数据的编码方式。可以通过使用php的mb_detect_encoding函数来判断所获取的数据编码方式。
例如:
$encode = mb_detect_encoding($_POST['name'], array("ASCII","UTF-8","GB2312","GBK","BIG5"));
这个函数会依次检测该数据是否为ASCII、UTF-8、GB2312、GBK、BIG5编码方式,如果检测到该数据的编码格式为UTF-8,则返回UTF-8编码方式。
转换编码格式
在知道了数据的编码格式之后,就需要将其转换为所需要的编码格式。在php中,有两个方法可以用来转换编码格式:
① mb_convert_encoding() :
$new_name = mb_convert_encoding($_POST['name'], 'UTF-8', 'auto');
使用 mb_convert_encoding() 函数将 $_POST['name'] 中的数据转换成UTF-8编码形式,并赋值给新的变量$new_name。
② iconv() :
$new_name = iconv($encode, "UTF-8", $_POST['name']);
使用 iconv() 函数将 $_POST['name'] 中的数据从 $encode 编码方式转换成UTF-8编码方式,并赋值给新的变量$new_name。
三、中文编码问题的实际应用
在实际开发中,我们经常会遇到需要将数据库中的中文数据进行编码转换的情况。
例如,在从数据库中读取中文数据时,通常需要将其转换为UTF-8编码方式:
mysql_query("SET NAMES 'UTF8'"); $result = mysql_query("SELECT * FROM `table`"); while($row = mysql_fetch_array($result)){ $new_name = iconv("GB2312", "UTF-8", $row['name']); }
在将中文数据写入数据库时,同样需要将数据转换为数据库所支持的编码方式:
mysql_query("SET NAMES 'GBK'"); $new_name = iconv("UTF-8", "GBK", $_POST['name']); mysql_query("INSERT INTO `table` (`name`) VALUES ('".$new_name."')");
在表单数据提交时,为了避免中文乱码,也需要将数据进行编码转换:
$new_name = iconv("UTF-8", "GBK", $_POST['name']); mysql_query("INSERT INTO `table` (`name`) VALUES ('".$new_name."')");