GB2312汉字编码与标准下载

GB/T 2312-1980 提供了一套汉字编码,给出了一套汉字字符集,共有6763个汉字,其中一级汉字3755个,二级汉字3008个。

GB2312编码

GB/T 2312-1980 是GBK的一个子集,具有以下特征:

  • 1GB2312编码范围:A1A1-FEFE,其中汉字为B0A1-F7FE,第一字节0xB0-0xF7(区号:16-87),第二个字节0xA1-0xFE(位号:01-94);
  • 2GB2312 共有94个分区(01-94),每区有94个位置(01-94),因此共有94 x 94 = 8836个码位;
  • 3收录了汉字6763个,和包括拉丁字母、希腊字母、日文平假名及片假名字母、俄语西里尔字母在内的682个全角字符;
  • 4采用双字节编码,第一个字节为“高字节”,第二个字节为“低字节”;
  • 5字符都有一个位置编码,分别对应分区编号和分区内的位置编号;
  • 6字符的分区编号,称为区码;字符位于所在区的位置编号,称为位码;
  • 7字符的区码和位码,组成字符的区位码;
  • 8字符的高字节对应区码,低字节对应位码;
  • 9区位码既可10进制表示,也可用16进制表示;
  • 10字符区码和位码分别加上32,就形成国标码;
  • 11字符区码和位码分别加上160,就形成内码;
  • 12字符国标码的区码和位码分别加上128,也能形成内码;
  • 1301-09区为特殊符号,收录除汉字外的682个字符;
  • 1410-15区为空白区,没有字符;
  • 1516-55区为一级汉字,按拼音排序,共3755个;
  • 1656-87区为二级汉字,按部首/笔画排序,共3008个;
  • 1788-94区为空白区,没有字符。
例:汉字"啊"字
1) 查询区位码:
在汉字区位列表中查到,位于16区,1位上,
"啊"区码是18,位码是01,区位码: 6101。
2)计算国标码:
区码: 16 + 32 = 48,位码: 01 + 32 =33,
"啊"国标码: 4833。
3)计算GB2312内码:
区码:16 + 160 = 176,换成16进制就是 0xB0;
位码:01 + 160 =161,换成16进制就是 0xA1,
内码: 0xB0 0xA1。一般通常记为 0xB0A1

GB2312 字符集

微信服务公众号

微信服务公众号