阿里云-云小站(无限量代金券发放中)
【腾讯云】云服务器、云数据库、COS、CDN、短信等热卖云产品特惠抢购

MySQL字符集详解

121次阅读
没有评论

共计 3743 个字符,预计需要花费 10 分钟才能阅读完成。

在数据库中,字符乱码属于常见、多发问题。鉴于本人水平顶多只能归于不入流之类,写这篇文章时内心诚惶诚恐,实在担心误导大家。内容仅供参考,若有错误,请各位及时指出,我也好学习提高!

MySQL 的字符集有 4 种级别的设置,分别是:服务器级、数据库级、表级、字段级。

一、服务器级字符集

(1)、可以在 my.cnf 中设置

[mysqld]
default-character-set=gbk (5.1)
character-set-server=gbk (5.5)

(2)、可以在启动选项中设置

mysqld --default-character-set=gbk

(3)、可以在编译的时候设置

./configure --with-charset=gbk
          或
cmake . -default-charset=gbk

如果没有指定服务器的字符集,默认使用 latin1 为服务器的字符集。

(4)、查看当前服务器的字符集

mysql> show variables like '%char%';
+--------------------------+-----------------------------------------+
| Variable_name            | Value                                   |
+--------------------------+-----------------------------------------+
| character_set_client     | latin1                                  |
| character_set_connection | latin1                                  |
| character_set_database   | latin1                                  |
| character_set_filesystem | binary                                  |
| character_set_results    | latin1                                  |
| character_set_server     | latin1                                  |
| character_set_system     | utf8                                    |
| character_sets_dir       | /usr/local/mysql-5.6.28/share/charsets/ |
+--------------------------+-----------------------------------------+

二、数据库字符集

数据库的字符集在创建数据库的时候指定,也可以在创建完数据库之后通过 alter database 语句修改。如果数据库中已经存在数据,修改数据库字符集并不能将已有的数据按新字符集存放。所以无法通过修改数据库字符集修改数据的内容。

设置数据库字符集的规则:

(1)、如果指定了字符集和校对规则,则使用指定的规则;

(2)、如果仅指定字符集而没有指定校对规则,则使用指定的字符集和默认的校对规则;

(3)、如果没有指定字符集和校对规则,则使用服务器的字符集和校对规;

三、表字符集

表的字符集是在建表的时候指定的,可以通过 alter table 语句进行修改。同样,对于表中已经存在的数据,修改字符集不会影响原有的记录,仍将使用原有的字符集。

设置表的字符集的规则同设置数据库的字符集规则。

四、列字符集

列的字符集和校对规则可以在建表的时候指定,也可以在修改表的时候调整。(这个不常用,仅记录一下)

五、SET NAMES 命令

除了上述的四种字符集外,对实际的应用访问来说,还存在客户端和服务端之间交互的字符集,如下:

(1)、character_set_client:客户端字符集
(2)、character_set_connection:连接字符集
(3)、character_set_resluts:结果字符集

通常情况下,这 3 个字符集都应该是相同的,才能保证用户写入的数据被正确的读出,特别是对于中文字符。

set names 命令则用于同时修改这 3 个参数的值。

六、关于中文字符集插入的实验

字符集不一致是导致数据库内中文内容乱码的罪魁祸首。

实验环境:

Server version: 5.6.28(在此说明实验环境是由于在学习过程中,从网上参考了部分资料,实验过程与资料描述稍有出入,未查出原因,只能暂归结为版本不同所致。)

实验对象:

mysql> show create table char_test\G 
*************************** 1. row ***************************
       Table: char_test
Create Table: CREATE TABLE `char_test` (`id` smallint(6) NOT NULL AUTO_INCREMENT,
  `name` char(20) NOT NULL,
  PRIMARY KEY (`id`)
) ENGINE=InnoDB AUTO_INCREMENT=3 DEFAULT CHARSET=latin1
1 row in set (0.00 sec)

由上可知,char_test 表的字符集是 latin1,如果不设置正确的字符集,插入中文字符时,必然会出现如下错误:

mysql> insert into char_test (name) values ('小王');
ERROR 1366 (HY000): Incorrect string value: '\xE5\xB0\x8F\xE7\x8E\x8B' for column 'name' at row 1

 

解决方案

(1)、先 set names latin1,然后再插入数据。

mysql> set names latin1;
Query OK, 0 rows affected (0.00 sec)

mysql> insert into char_test (name) values ('小王');
Query OK, 1 row affected (0.01 sec)

mysql> select * from char_test;
+----+--------+
| id | name   |
+----+--------+
|  1 | Tom    |
|  2 | 小明   |
|  3 | 小王   |
+----+--------+
3 rows in set (0.00 sec)

(2)、在 data.sql 文件中指定 set names latin1, 然后通过 source 命令导入 data.sql。

# vi data.sql
set names latin1;
insert into char_test (name) values ('小李');

mysql> source data.sql
Query OK, 1 row affected (0.00 sec)

mysql> select * from char_test;
+----+--------+
| id | name   |
+----+--------+
|  1 | Tom    |
|  2 | 小明   |
|  3 | 小王   |
|  4 | 小李   |
+----+--------+
4 rows in set (0.00 sec)

(3)、在 data.sql 文件中指定 set names latin1, 然后通过 mysql 命令导入

# vi data.sql
set names latin1;
insert into char_test (name) values ('小张');

# mysql -uroot -p test1 < data.sql
# mysql -uroot -p -e "set names latin1;select * from test1.char_test;"

(4)、通过指定 mysql 命令的字符集参数实现 –default-charset-set= 字符集

# vi data.sql
insert into char_test (name) values ('小张');

# 错误方法
# mysql -uroot -p  test1 < data.sql                      
Enter password: ******
ERROR 1366 (HY000) at line 1: Incorrect string value: '\xE5\xB0\x8F\xE8\xB5\xB5' for column 'name' at row 1

# 正确方法
# mysql -uroot -p  --default-character-set=latin1 test1 < data.sql 
Enter password: ******

# mysql -uroot -p -e "set names latin1;select * from test1.char_test;"
Enter password: ******
+----+--------+
| id | name   |
+----+--------+
|  1 | Tom    |
|  2 | 小明   |
|  3 | 小王   |
|  4 | 小李   |
|  5 | 小张   |
|  6 | 小赵   |
+----+--------+

(5)、在配置文件中指定客户端的字符集

vi my.cnf
[client]
default-character-set=latin1

mysql> insert into char_test (name) values ('小马');
Query OK, 1 row affected (0.00 sec)

mysql> select * from char_test;
+----+--------+
| id | name   |
+----+--------+
|  1 | Tom    |
|  2 | 小明   |
|  3 | 小王   |
|  4 | 小李   |
|  5 | 小张   |
|  6 | 小赵   |
|  7 | 小马   |
+----+--------+
7 rows in set (0.00 sec)

本文永久更新链接地址 :http://www.linuxidc.com/Linux/2016-07/133247.htm

正文完
星哥说事-微信公众号
post-qrcode
 0
星锅
版权声明:本站原创文章,由 星锅 于2022-01-22发表,共计3743字。
转载说明:除特殊说明外本站文章皆由CC-4.0协议发布,转载请注明出处。
【腾讯云】推广者专属福利,新客户无门槛领取总价值高达2860元代金券,每种代金券限量500张,先到先得。
阿里云-最新活动爆款每日限量供应
评论(没有评论)
验证码
【腾讯云】云服务器、云数据库、COS、CDN、短信等云产品特惠热卖中