汉字编码有五种类型,分别是整字输入法、字形分解法、字形为主字音为辅的编码法、拼音为主字形为辅的编码法、全拼音输入法。具体特点如下:
1、整字输入法
将三四千个常用汉字排列在一个具有三四百个键位的大键盘上;一字一格(键),无重码,直观性好,操作简单;但需特制键盘,速度较慢。
2、字形分解法
汉字的形体分解成笔画或部件,按一定顺序输进机器;按形取码,不涉及字音,因而不认识的字也同样可以编码输入;汉字形体结构非常复杂,写法也有许多差异,分解标准不易统一。
3、字形为主、字音为辅的编码法
要利用某些字音信息,如有的方案为了简化编码规则,缩短码长,在字形码上附加字音码;有的方案为了采用标准英文电传机,将分解归纳出来的字素通过关系字的读音转化为拉丁字母。
4、全拼音输入法
以现行的汉语拼音方案为基础进行设计;操作简捷,可以“盲打”,不受汉字简化、字形改变的影响,符合拼音化方向,并且还便于作进一步信息处理。
5、拼音为主、字形为辅的编码法
在拼音码前面或后面再添加一些字形码,拼音码有用现行汉语拼音方案或稍加简化的,还有的为了缩短码长而把声母和韵母都用单字母或单字键表示的“双拼方案”或“双打方案”;除了大部分采用偏旁部首的信息外,还有采用起末笔或采用语义类别的。
扩展资料:
定型标准
1、定型化
编码方案的定型化,即一般所说的选优工作,对计算机的普及应用非常重要。当然,定型或选优并不意味着只定一种或只选一种,而要照顾到多种用户的需要。
2、标准化
1981年,国家标准局公布了《信息交换用汉字编码字符集基本集》(简称汉字标准交换码),共分两级,一级3755个字,二级3008个字,共6763个字。这种汉字标准交换码可以为各种输入输出设备的设计提供统一的标准,使各种系统之间的信息交换有共同一致性。
参考资料来源:百度百科-汉字编码
汉字编码分为外码、交换码、机内码和字形码。
1.外码(输入码)
外码也叫输入码,是用来将汉字输入到计算机中的一组键盘符号。目前常用的输入码有拼音码、五笔字型码、自然码、表形码、认知码、区位码和电报码等,一种好的编码应有编码规则简单、易学好记、操作方便、重码率低、输入速度快等优点,每个人可根据自己的需要进行选择。在后面的章节中,重点介绍智能全拼输入法和五笔字型输入法。
2.交换码(国标码)
计算机内部处理的信息,都是用二进制代码表示的,汉字也不例外。而二进制代码使用起来是不方便的,于是需要采用信息交换码。中国标准总局1981年制定了中华人民共和国国家标准GB2312--80《信息交换用汉字编码字符集--基本集》,即国标码。
区位码是国标码的另一种表现形式,把国标GB2312--80中的汉字、图形符号组成一个94×94的方阵,分为94个“区”,每区包含94个“位”,其中“区”的序号由01至94,“位”的序号也是从01至94。94个区中位置总数=94×94=8836个,其中7445个汉字和图形字符中的每一个占一个位置后,还剩下1391个空位,这1391个位置空下来保留备用。
3.机内码
根据国标码的规定,每一个汉字都有了确定的二进制代码,在微机内部汉字代码都用机内码,在磁盘上记录汉字代码也使用机内码。
4.汉字的字形码
字形码是汉字的输出码,输出汉字时都采用图形方式,无论汉字的笔画多少,每个汉字都可以写在同样大小的方块中。通常用16×16点阵来显示汉字。