5.5 末笔字型交叉识别码
我们知道,一个合字体的取码规则是这个字的一、二、三、末字根,这只是针对4个字根以上的汉字。如果这个字只有两个字根或三个字根构成,比如“叭”,这时怎么输入呢?
在五笔状态下键入“叭”的两个字根的编码“KW”,我们发现出现在第一个的汉字是“只”字,原来“叭”与“只”都是由字根“口”和“八”组成的,其编码也是KW。
由于编码少,信息量不足,会造成重码,我们要想办法把这两个字加以区别。我们给这两个字加上字型代码,“叭”是左右型汉字,字型代码为1;“只”是上下型汉字,字型代码为2。
我们再来看“洒”、“沐”、“汀”三个字,字根编码都是IS,并且字型都是左右型的,字型代码都是1。那么,如何来区分这三个字呢?
可以看到,“洒”、“沐”、“汀”三个字的最后一笔是不同的。“洒”的最后一笔是横,“沐”的最后一笔是捺,“汀”的最后一笔是竖勾,这些笔画都有区位代号。
五种笔画“横、竖、撇、捺、折”分别在1、2、3、4、5区,我们可以用最后一个笔画代号来区分这几个字。“洒”是1,“沐”是4,“汀”是2,我们把这个数字叫做末笔代码。
现在,我们有两个数字来区别基本字根相同的字,一个是字型代码,一个是末笔代码。这两个识别码都是数字,不便直接输入,最好能把它们转化为字母代码。
既然字型代码和末笔代码单独都不能区分所有的重码,我们就把这两个数字合起来,组成一个数字,我们把这个两数字与前面讲过的区位号联系起来,用区位号对应的字母作为识别码。
我们来看看识别码的构成。把汉字的末笔代码作为十位,字型代码作为个位,就组成了一个二位数,对应区位上的字母,就是识别码,又称为“末笔字型交叉识别码”。
末笔字型交叉识别码 = 末笔代码 + 字型代码
对于“洒”、“沐”、“汀”这三个字,“洒”字的末笔为横,末笔代码是1,字型为左右型,字型代码是1,识别码就是为11,也就是字母G;“汀”字的末笔为竖,末笔代码是2,字型代码是1,识别码就是为21,也就是字母H;“沐”字末笔为捺,末笔代码为4,字型代码为1,识别码为41,也就是字母Y。
由此可知,这三个字的编码分别是ISG、ISH、ISY,已经区分开了。这几个字加了识别码后仍然不够四码,所以在录入时要敲空格。启动输入法,键入ISG,再按空格,“洒”字就也现了。
汉字的笔画有5种,字型有3种,所以末笔字型交叉识别码共15种,也就是每个区位的前三位是作为识别码来用的。五笔字型的末笔字型交叉识别码见表5-2。
表5-2 末笔字型交叉识别码
我们在使用识别码输入汉字时,对汉字的末笔有一些约定,需要注意。
为了有足够多的区分能力,对“辶”、“廴”的字和全包围字,它们的“末笔”规定为被包围部分的末笔。例如:
如果“囗”包围的一个字根组成的双码字根再位于另一个字根之后,所得到的三根字的末笔仍然是被包围的那个字根的末笔。例如:
汉字“九、刀、七、力、匕”等一律用“折笔”作为末笔。例如:
带单独点的字,如“义、太”等,我们把点当做末笔,并认为点与附近的字根是“连”的关系,为杂合型,识别码为字母I。例如:
“我”、“贱”、“成”等字的“末笔”,遵循“从上到下”的原则,末笔应该是“丿”。如“我”字,最后一个字根是撇,编码是TRNT。而“贱”字,基本编码为MG,末笔为“戋”字根的撇,字型为1,所以识别码为31,即MGT。
知道了末笔的约定,就可以正确地判断文字的识别码了。我们在学习五笔输入法的过程中,识别码的判断是一个难点,虽然只有很少的字需要加识别码,但为了提高录入速度,还是要掌握这部分内容的。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。