本文小编为大家详细介绍“mysql怎么设置字符集”,内容详细,步骤清晰,细节处理妥当,希望这篇“mysql怎么设置字符集”文章能帮助大家解决疑惑,下面跟着小编的思路慢慢深入,一起来学习新知识吧。
一、字符集的概念
字符集是关于代码和字符之间的映射关系的一种规范,它规定了计算机字符的编码方式。字符集在不同的数据库系统中可能有着不同的设定,而不同的字符集之间具有不同的特点和优势。例如,在处理汉字时,GB2312/GBK/GB18030比Latin1/Latin7更有优势。
在MySQL中,字符集是指数据库、表和列中字符数据的编码方式。通俗地说,字符集就是指用来存储和处理字符、字符串的方式。
MySQL中支持的字符集主要有如下几种:ASCII、GBK、GB2312、UTF-8、UTF-16和ISO-8859等,其中UTF-8是MySQL最常用的字符集,因为它支持多语言、编码格式灵活、节省空间等好处。
二、MySQL字符集的设置方法
查询MySQL支持的字符集
设置数据库的字符集
设置 MySQL 表的字符集
设置 MySQL 连接的字符集
其他的字符集设定
在MySQL数据库中,可以通过命令查询数据库支持的字符集,方法如下:
SHOW CHARACTER SET;
该命令可以列出MySQL可用的各种字符集,例如:
Charset | Description | Default collation | Maxlen |
---|---|---|---|
big5 | Big5 Traditional Chinese | big5_chinese_ci | 2 |
dec8 | DEC West European | dec8_swedish_ci | 1 |
cp850 | DOS West European | cp850_general_ci | 1 |
hp8 | HP West European | hp8_english_ci | 1 |
koi8r | KOI8-R Relcom Russian | koi8r_general_ci | 1 |
latin1 | iso-8859-1 West European | latin1_swedish_ci | 1 |
latin2 | iso-8859-2 Central European | latin2_general_ci | 1 |
swe7 | 7bit Swedish | swe7_swedish_ci | 1 |
ascii | US ASCII | ascii_general_ci | 1 |
ujis | EUC-JP Japanese | ujis_japanese_ci | 3 |
sjis | Shift-JIS Japanese | sjis_japanese_ci | 2 |
hebrew | iso-8859-8 Hebrew | hebrew_general_ci | 1 |
tis620 | TIS620 Thai | tis620_thai_ci | 1 |
euckr | EUC-KR Korean | euckr_korean_ci | 2 |
koi8u | KOI8-U Ukrainian | koi8u_general_ci | 1 |
gb2312 | GB2312 Simplified Chinese | gb2312_chinese_ci | 2 |
greek | iso-8859-7 Greek | greek_general_ci | 1 |
cp1250 | Windows Central European | cp1250_general_ci | 1 |
gbk | GBK Simplified Chinese | gbk_chinese_ci | 2 |
latin5 | iso-8859-9 Turkish | latin5_turkish_ci | 1 |
armscii8 | ARMSCII-8 Armenian | armscii8_general_ci | 1 |
utf8 | UTF-8 Unicode | utf8_general_ci | 3 |
ucs2 | UCS-2 Unicode | ucs2_general_ci | 2 |
cp866 | DOS Russian | cp866_general_ci | 1 |
keybcs2 | DOS Kamenicky Czech-Slovak | keybcs2_general_ci | 1 |
macce | Mac Central European | macce_general_ci | 1 |
macroman | Mac West European | macroman_general_ci | 1 |
cp852 | DOS Central European | cp852_general_ci | 1 |
latin7 | iso-8859-13 Baltic | latin7_general_ci | 1 |
utf8mb4 | UTF-8 Unicode | utf8mb4_general_ci | 4 |
cp1251 | Windows Cyrillic | cp1251_general_ci | 1 |
utf16 | UTF-16 Unicode | utf16_general_ci | 4 |
utf16le | UTF-16LE Unicode | utf16le_general_ci | 4 |
cp1256 | Windows Arabic | cp1256_general_ci | 1 |
cp1257 | Windows Baltic | cp1257_general_ci | 1 |
utf32 | UTF-32 Unicode | utf32_general_ci | 4 |
binary | Binary pseudo charset | binary | 1 |
geostd8 | GEOSTD8 Georgian | geostd8_general_ci | 1 |
cp932 | SJIS for Windows Japanese | cp932_japanese_ci | 2 |
eucjpms | UJIS for Windows Japanese | eucjpms_japanese_ci | 3 |
当我们新建一个MySQL数据库时,可以设置该数据库的默认字符集,这样所有该数据库中的表的字符集都将使用该字符集。具体操作步骤如下:
2.1 首先查看MySQL支持的字符集
mysql> SHOW CHARACTER SET;
2.2 在创建新的数据库时,添加一个字符集设定
CREATE DATABASE new_db CHARACTER SET utf8;
或者
CREATE DATABASE new_db DEFAULT CHARACTER SET utf8;
其中utf8为常用字符集之一。
为了让表的字段能够正确地存储和显示数据,我们需要为表设置字符集。在 MySQL 中,表的字符集可以通过在创建表时进行设置。如果表已经创建好了,也可以通过 Alter 命令对表进行修改。
3.1 在创建表时设置字符集
CREATE TABLE new_table (
id INT(11) NOT NULL AUTO_INCREMENT,
name VARCHAR(50) NOT NULL DEFAULT '',
PRIMARY KEY (id)
) ENGINE=InnoDB DEFAULT CHARSET=utf8;
其中,ENGINE=InnoDB用于设置表的存储引擎,CHARSET=utf8用于设置表的默认字符集。
3.2 修改表的字符集
ALTER TABLE old_table CONVERT TO CHARACTER SET utf8;
或者
ALTER TABLE old_table MODIFY COLUMN name VARCHAR(50) CHARACTER SET utf8;
其中,CONVERT TO命令用于修改表的默认字符集,MODIFY COLUMN命令用于修改表中某一列的字符集。
在连接 MySQL 服务器时,也可以设置操作的字符集。这个字符集设定通常称作“客户端字符集”,指的是在客户端中传输的数据的字符集。
4.1 查看当前连接的字符集
mysql> SELECT @@character_set_connection;
4.2 修改连接的字符集
SET character_set_connection = utf8;
或者
mysql --default-character-set=utf8 -u root -p
其中,SET命令可以修改连接的默认字符集,--default-character-set命令可以指定客户端字符集。
在部分情况下,可能需要打开 MySQL 的其他字符集设定,来处理一些比较罕见的数据存储和转换场景。这时可能需要修改 MySQL 的配置文件——my.cnf文件,修改该文件可能需要管理员权限。修改方法如下:
5.1 找到 my.cnf 文件
在Linux中,my.cnf文件通常存储在 /etc/my.cnf 或 /etc/mysql/my.cnf 目录下。
在Windows中,my.cnf文件通常存储在 MySQL 数据库的安装目录下。
5.2 修改 my.cnf 文件
在 my.cnf 文件中添加如下语句:
[mysqld]
character_set_server=utf8
init_connect='SET NAMES utf8'
其中,character_set_server命令用于设置列出来的字符集,init_connect命令用于在创建连接时自动设定字符集。