GB 18030-2022 汉字编码和标准下载
GB 18030-2022 是最新的国家汉字编码和字符集强制标准。
GB 18030-2022汉字编码
GB 18030-2022 具有几个鲜明的特点:
- 1汉字采用变长多字节编码,每个字可以由1个、2个或4个字节组成,最多可定义161万个字符;
- 2兼容 GB2312、GBK、GB 18030-2000或 GB 18030-2005 汉字编码和字符集;
- 3完全支持Unicode,支持CJK和emoji等字符;
- 4GB 18030在微软视窗系统Windows中的代码页为54936
- 单字节: 0x00-0x7F
- 双字节: 第一字节0x81-0xFE,第二个字节0x40-0x7E和0x80-0xFE
- 四字节: 第一字节0x81-0xFE,第二字节0x30-0x39,第三字节0x81-0xFE,第四字节0x30-0x39
双字节区
符号区
双字节1区
首字节0xA1-0xA9
尾字节0xA1-0xFE
728
双字节5区
首字节0xA8-0xA9
尾字节0x40-0x7E和0x80-0xA0
166
汉字区
双字节2区
首字节0xB0-0xF7
尾字节0xA1-0xFE
6763
双字节3区
首字节0x81-0xA0
尾字节0x40-0x7E和0x80-0xFE
6080
双字节4区
首字节0xAA-0xFE
尾字节0x40-0x7E和0x80-0xA0
8145
四字节区
0x81398B32-0x8139A135
康熙部首
214
0x8139EE39-0x82358738
CJK统一汉字扩充A
6530
0x82358F33-0x82359636
CJK统一汉字
66
0x95328236-0x9835F336
CJK统一汉字扩充B
42711
0x9835F738-0x98399E36
CJK统一汉字扩充C
4149
0x98399F38-0x9839B539
CJK统一汉字扩充D
222
0x9839B632-0x9933FE33
CJK统一汉字扩充E
5762
0x99348138-0x9939F730
CJK统一汉字扩充F
7473