3.2 五笔字型输入法
五笔字型输入法是一种典型的汉字输入法,它适合于专业录入人员使用,其主要优点是不需要拼音知识,重码率低,可以进行高速的输入。五笔字型输入法词汇量大,是目前输入法中速度最快、效率最高的一种汉字输入法。
3.2.1 汉字结构分析
在学习五笔字型输入法之前,首先需要了解汉字的基本结构,汉字的基本结构主要包括汉字的笔画、字型和汉字的书写顺序。
1.笔画
笔画是构成汉字的最小单位,是一次写成的一个连续的线段。5种笔画组成字根间的关系可分为4种情况:单、散连、交。单,即5种笔画的自身;散,是指组成字根的笔画之间有一定的间距,如三、心等;连,是指组成字根的笔画之间是相连接的,可以是单笔与单笔相连,也可以是笔笔相连,如人、尸、弓等;交,是指组成字根的笔画是互相交叉的,如十、力等;还有一种混合的情况,即一个字根的各笔画间既有连又有交或散,如农、禾等。
汉字在书写时应该注意以下几点:
(1)两笔或两笔以上写成的,如“木”、“二”等不叫笔画,而叫笔画结构。
(2)一个笔画不能断开成几段来处理,如“里”,不能分解为“田、土”,而是分解为“日、土”。
五笔字型将汉字分成横、竖、撇、捺和折5种基本笔画,分别以1,2,3,4,5作为代号,表3.1列出了5种基本笔画以及其他笔画的归并。
表3.1 五笔字型5种基本笔画及代号
(3)在表3.1中,将“提”归并到“横”类;“竖钩”归并到“竖”类;“点”归并到“捺”类;带“转折”的均归并到“折”类,
2.字型
在所有的方块字中,五笔字型将其分为左右型、上下型和杂合型3种类型,并以1,2,3为顺序代号。字型是对汉字从整体轮廓上来区分的,这对确定汉字的五笔字型编码十分重要。
(1)左右型。左右型汉字指汉字在总体结构上是左右或左中右几个部分。组成汉字的各个字根是按从左到右的顺序排列的,如针、他、汉、利、给等。
左右型汉字可分为双合字和三合字两种。
1)双合字。双合字是指一个汉字可以明显地分成左右两个部分,并且字根间有一定的距离,每个部分可以是一个字根,也可以是几个字根的组合。如组、快、距、胡等。
2)三合字。三合字是指一个汉字可以明显地分成3个部分。这3个部分可以从左到右并列,其字根间有一定的距离;也可以分成两部分,其中一部分由上下两部分组成,每部分可以是一个基本字根,也可以是由几个基本字根组成如树、陪、结、清等。
(2)上下型。上下型汉字是指组成汉字的各个字根是按从上到下的顺序排列的,如忐、忑、员、早等。
上下型汉字也可分为双合字和三合字两种。
1)双合字。双合字是指一个字可以明显分成上、下两个部分,并且各部分间有一定的距离,如第、类、节、尖等。
2)三合字。三合字是指一个汉字可以明显地分成上、中、下3个部分,也可以分为上下两部分,其中一部分又可分为左右两部分。
无论是3部分还是两部分,各部分间都必须有一定距离,每个部分可以是一个独立的字根,也可以是由几个字根组合而成的。如“会”是由上、中、下3部分组成的,“众”分为上下两部分,而下半部分又分为左右两部分。
(3)杂合型。杂合型是指组成汉字的字根之间存在着相交、相连或包围关系。它既非上下型,也非左右型,主要有内外型汉字、单体汉字、半包围汉字和全包围汉字。如叉白、秉、函、幽等。
3.汉字的书写顺序
在书写汉字时,可以按照先左后右,先上后下,先横后竖,先撇后捺,先内后外,先中间后两边和先进门后关门的规则进行书写。
3.2.2 汉字的拆分原则
五笔字型编码汉字的拆分遵循顺序拆分、取大优先、兼顾直观、能散不连、能连不交的原则。
1.书写顺序
在五笔字型输入法中,汉字的书写顺序与普通书写顺序是一致的,即先左后右,先上后下,先横后竖,先内后外,先中间后两边,先进门后关门。如:
2.取大优先
取大优先的原则可以保证拆出的字根是最大的基本字根如:
3.兼顾直观
在拆分字根时,为了使字根的特征明显易辨,有时要“牺牲”书写顺序和取大优先的原则,形成个别例外的情况。如:
4.能散不连
在拆出字根数相同的情况下,按“散”结构拆分比按“连”结构拆分优先。如:
矢、午:按上下型散结构处理,不按连结构处理。
5.能连不交
按“连”结构拆分比按“交”结构拆分优先。如:
3.2.3 五笔字型字根键盘
五笔字型中共有125个基本字根,这些字根按照起笔笔画的不同分为5类,每类占键盘上相连的区域,即横区、竖区、撇区、捺区、折区,用编号1,2,3,4,5表示区号。每一区又占5个键位,键位的编号称为位号。首笔为横的字根区叫横起笔类或1区字根,如12就表示1区第2位的键。因此,将字根按照一定的规则排列在25个英文字母键上,其分布情况如图3.2.1所示。
图3.2.1 五笔字型字根键盘
字根在键盘上的分配规律首先考虑的是基本字根的首笔笔画代号,将所有字根分为横、竖、撇、捺、折5类,放在5个区上,各个区上有5个位,如何将同类字根分配在5个位上,这是字根键盘分配的第二个因素,这个因素既考虑各个字的组字频度,又考虑键盘的指法击键频度。这样,字根键位易于记忆,击键效率便于提高。其记忆规则如下:
(1)基本字根与键名字根形态相近。如G(11)键上的键名字根是“王”,形态相近的有“五”字根;键名字根为“大”的键上有“犬”;“已”的键上有“已、己、尸”等。
(2)字根首笔代号与区号一致,次笔代号与位号一致。如“文、方、广”等字,首笔为点即捺,代号为“4”,次笔为横,代号为“1”,它们对应的区号为“4”,位号为“1”,故首、次笔代号与区位号一致。
(3)首笔代号与区号一致,笔画数目与位号一致。如字根“三”,首笔为横,代号为“1”,笔画数目为“3”,“三”的区位号为“13”。“一”、“刂”、“彡”、“灬”等字根也具有这一特性。
(4)与主要字根形态相近或有渊源。如字根“手”与“扌”在R键上;“夕”在Q键上;“四”和“皿”在L键上。
另外,有一部分字根的键盘安排不符合上述几条原则,主要是考虑到某些键上有一定的字根数量,以分散另一些键的击键强度,便于提高录入速度。如“丁、力、心、车、乃、匕、巴、马”等字可以从相容性去分析。
3.2.4 简码输入
为了提高输入速度,将常用汉字只取前边一个、两个或3个字根构成简码。简码输入分为一级简码、二级简码、三级简码和词汇编码4种。
1.一级简码
一级简码即高频字,这类字只要击该字对应键一次,再加击一次空格键,即可输入25个常用的汉字。高频字在键盘上的排列如下:
2.二级简码
二级简码共有25×25=625个,只要击其前两个字根加空格键即可,如:
吧:口、巴(KC)
吕:口、口(KK)
3.三级简码
三级简码由单字的前3个根字码组成,只要取前3个字根加空格键即可,如:
华:全码:亻、七、十、刂(WXFJ)
简码:亻、七、十(WXF)
4.词汇编码
(1)双字词:分别取两个字的单字全码中的前两个字根代码,共组成四码,如:
机器:木、几、口、口(SMKK)
汉字:氵、又、宀、子(ICPB)
(2)三字词:前两个字各取其第一码,最后一个字取其前两码,共为四码,如:
计算机:讠、竹、木、几(YTSM)
(3)四字词:每字各取其第一码,共为四码,如:
程序设计:禾、广、讠、讠(TYYY)
光明日报:小、日、日、扌(IJJR)
(4)多字词。按“一、二、三、末”的规则,取第一、二、三及最末一个字的第一码,共为四码,如:
电子计算机:日、子、讠、木(JBYS)
中华人民共和国:口、亻、人、囗(KWWL)
3.2.5 重码、容错码和Z键
为了使用户能够更好地使用五笔输入法,下面介绍重码、容错码以及万能键“Z”的使用。
1.重码
如果几个汉字的“五笔字型”编码完全相同,则称为“重码”。例如:
当输入重码字的编码时,重码的字会同时出现在屏幕的“提示行”中,若所要的字在第1个位置上,则直接输入下文,该字将自动跳到光标所在的位置上;若所要的字在第2个位置上,则按字母键上方的数字键2即可。
2.容错码
容错码有两层含义:一是容易搞错的码,二是容许搞错的码。
(1)拆分容错。拆分容错是指个别汉字的书写顺序因人而异,因而容易弄错,例如:
(2)字型容错。字型容错是指个别汉字的字型分类不易确定。例如:
3.“Z”键
在标准键盘上,共有26个字母键。五笔字型的字根键盘分为5个区,每区5个位,共用了25个,剩下的一个键就是万能键“Z”键。
“Z”键作为万能学习键,它不但可以代替“识别码”帮助用户把字找出来,告诉用户“识别码”;而且还可以代替一时记不清或分解不准的任何字根,并通过提示行,使用户知道“Z”键对应的键位或字根。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。