GBASE 8a 目前支持以下四类字符集编码:
- gbk : 1、2字节编码
- gb18030 : 1、2、4字节编码
- gbase 8a中的utf8 :1、2、3字节编码
- gbase 8a中的utf8mb4 :1、2、3、4字节编码
其中对于ASCII码,在以上四种字符集中的编码是相同的,都是单字节编码,所以只含ASCII码的文本文件,在以上四种字符集中的二进制是完全相同的,文件大小也相同。
对于中文字符,在gbk中是双字节编码,在gb18030中是双、四字节编码,在utf8中的是三字节编码,在utf8mb4中是三、四字节编码。对于常用汉字,在gbk和gb18030中都是双字节编码,在utf8和utf8mb4中是三字节编码。对于部分生僻字,在gbk中不存在,在gb18030中为双、四字节编码,在utf8中是三字节编码,在utf8mb4中是三、四字节编码。文件大小只取决于数据内容。
最后修改时间:2022-11-14 18:30:23
「喜欢这篇文章,您的关注和赞赏是给作者最好的鼓励」
关注作者
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文章的来源(墨天轮),文章链接,文章作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。




