暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

Mysql字符集(3)--mysql从入门到精通(四)

后端从入门到精通 2021-08-20
338

上篇文章我们说了mysql客户端到服务端会不同的字符集不断转换,其中服务端有三个重点的系统变量,1.处理客户端发来的字节串:character_set_client。2.吧请求的字节串从character_Set_cliect转成character_set_connection。3.吧字节串返回给客户端:character_Set_result。

Mysql字符集(2)--mysql从入门到精通(三)



如果你的select * from table_A where name = ‘我的’;返回的结果显示编码报错怎么办呢?

把我们可以从字节集的流程开始分析,他可能在第一步character_Set_client转换的时候就出现乱码问题,比如我们客户端发送的字节串是utf8的,但服务器的character_Set_client不是,就会乱码。也有可能character_Set_result字符集和客户端读取的字符集不一致也会乱码。这时候可以用:

Show variables like ‘character_Set_resultes’;


查看是否是和客户端相同的字符集,需要注意的是,mac的客端默认字符集是utf8,windows默认gbk。

字节串在服务器里面相互解码编码不是很影响性能吗,答案是肯定的,所以mysql给了一个sql,吧这三个系统参数一起修改字符集:set names '字符集';也可以单个修改,sql如下。

    mysql> set names 'utf8';
    Query OK, 0 rows affected (0.00 sec)

    mysql> set character_Set_Results = 'utf8';
    Query OK, 0 rows affected (0.00 sec)


    主要流程就是:

    1、mac客户端发送uft8字符集的字节串给服务器,服务器用character_Set_client解析。(如果采用的是navicat等客户端,客户端可能会自定义其字节的字符集进行发送)

    2、如果character_set_connection字符集和 character_Set_client不同,则‘我的’字节串 ,会先由utf8找到其对应的字符串’我的‘进行解码,解码之后,再有character_Set_connection的字符集gbk或者什么字符集进行编码处理。

    3、这时候看看查询的列字符集是否与character_Set_connection是否一致,如果不一致,还需要和上面那样进行转换。

    4、吧character_Set_connection返回的字节串先解码成字符串,然后在用character_Set_results编码成utf8新的字节串返回给客户端

    5、由于客户端使用的字符集和character_Set_results是相同的字符集,所以我们能正常查看。

    比较规则的应用:

    gbk_chinese_ci是不区分大小写排序的,比如order by 排序字段,返回的结果可能是’a’,’A’,’b’,’B’。

    当我们用修改当前字段列的字符集为gbk_bin,order by排序之后,可以返回’A’,’B’,’a’,’b’。所以当我们排序时候,没有我们想要的结果,也可以考虑是否是比较规则的问题。





    文章转载自后端从入门到精通,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

    评论