计算机处理汉字信息的前提条件是对每个汉字进行编码,这些编码统称为汉字编码。汉字信息在系统内传送的过程就是汉字编码转换的过程。
1、汉字信息处理系统之间或通信系统之间传输信息时,对每一个汉字所规定的统一编码,我国已指定汉字交换码的国家标准“信息交换用汉字编码字符集——基本集”,代号为GB 2312—80,又称为“国标码”。
2、国标码:所有汉字编码都应该遵循这一标准,汉字机内码的编码、汉字字库的设计、汉字输入码的转换、输出设备的汉字地址码等,都以此标准为基础。GB 2312—80就是国标码。该码规定:一个汉字用两个字节表示,每个字节只有7位,与ASCII码相似。
3、区位码:将GB 2312—80的全部字符集组成一个94×94的方阵,每一行称为一个“区”,编号为0l~94;每一列称为一个“位”,编号为0l~94,这样得到GB 2312—80的区位图,用区位图的位置来表示的汉字编码,称为区位码。
4、区位码(十进制)的两个字节分别转换为十六进制后加20H得到对应的国标码;机区位码(十进制)的两个字节分别转换为十六进制后加A0H得到对应的机内码。
5、GB码(国标码):由于区位码是十进制编码,而计算机实际使用的过程中用的是二进制编码,所以在实际使用的过程中,计算机内码使用的是国标码。
扩展资料:
ASCII(American Standard Code for Information Interchange,美国信息交换标准代码)是基于拉丁字母的一套电脑编码系统,主要用于显示现代英语和其他西欧语言。它是现今最通用的系统,并等同于国际标准ISO/IEC 646。
区位码与国标码的转换关系 :
区位码先转换成十六进制数表示 ,(区位码的十六进制表示)+2020H=国标码。 区号为20,位号为83, 将区位号2083转换为十六进制表示为1453H ,1453H+2020H=3473H,得到国标码。
参考资料来源:百度百科-国家标准代码
参考资料来源:百度百科-区位码
GB2312构成一个二维平面,分成94行和94列,行号成为区号,列号成为位号。唯一标识一个汉字。
将区位码的位号和分好分别加上32(20H),得到国标交换码
将国标码的两个字节的最高位置1(加128,即80H),得到PC机常用的机内码
汉字的区位码、国标码、机内码有如下关系:
国标码=区位码+2020H
机内码=国标码+8080H
机内码=区位码+A0A0H
汉字机内码双字节,最高位是1;西文字符机内码单字节,最高位是0
国标码=区位码+2020H
机内码=国标码+8080H
机内码=区位码+A0A0H
有区位码+A0A0H
还有国标码+8080H
机内码国标码区位码 计算机处理汉字信息的前提条件是对每个汉字进行编码,这些编码统称为汉字编码。汉字信息在系统内传送的过程就是汉字编码转换的过程。
汉字交换码:汉字信息处理系统之间或通信系统之间传输信息时,对每一个汉字所规定的统一编码,我国已指定汉字交换码的国家标准“信息交换用汉字编码字符集——基本集”,代号为GB 2312—80,又称为“国标码”。
国标码:所有汉字编码都应该遵循这一标准,汉字机内码的编码、汉字字库的设计、汉字输入码的转换、输出设备的汉字地址码等,都以此标准为基础。GB 2312—80就是国标码。该码规定:一个汉字用两个字节表示,每个字节只有7位,与ASCII码相似。
区位码:将GB 2312—80的全部字符集组成一个94×94的方阵,每一行称为一个“区”,编号为0l~94;每一列称为一个“位”,编号为0l~94,这样得到GB 2312—80的区位图,用区位图的位置来表示的汉字编码,称为区位码。
机内码:为了避免ASCII码和国标码同时使用时产生二义性问题,大部分汉字系统都采用将国标码每个字节高位置1作为汉字机内码。这样既解决了汉字机内码与西文机内码之间的二义性,又使汉字机内码与国标码具有极简单的对应关系。
汉字机内码、国标码和区位码三者之间的关系为:区位码(十进制)的两个字节分别转换为十六进制后加20H得到对应的国标码;机内码是汉字交换码(国标码)两个字节的最高位分别加1,即汉字交换码(国标码)的两个字节分别加80H得到对应的机内码;区位码(十进制)的两个字节分别转换为十六进制后加A0H得到对应的机内码。
GB码(国标码):由于区位码是十进制编码,而计算机实际使用的过程中用的是二进制编码,所以在实际使用的过程中,计算机内码使用的是国标码。
国标码和区位码一一对应,并可按照以下公式计算:
区位码—〉国标码:( ((区码)16+0xA0)<<8)+ (位码)16+0xA0