首页 百科知识 重码与容错码

重码与容错码

时间:2024-10-16 百科知识 版权反馈
【摘要】:在五笔字型编码方案中,将极少一部分无法惟一确定编码的汉字,用相同的编码来表示,这些具有相同编码的汉字称为“重码字”。五笔字型对重码字按其使用频率作了分级处理。为了进一步减少重码,提高输入速度,在五笔字型汉字输入法中特别定义了一个后缀码“L”,即把重码字中使用频度较低的汉字编码的最后一个编码改成后缀码“L”。所以,必须要认真学习,熟练掌握汉字的正确拆分方法和编码原则,不能把希望寄托在容错码上。

1.4.7 重码与容错码

1.重码

在五笔字型编码方案中,将极少一部分无法惟一确定编码的汉字,用相同的编码来表示,这些具有相同编码的汉字称为“重码字”。

五笔字型对重码字按其使用频率作了分级处理。输入重码字的编码时,重码字同时显示在提示行,而较常用的那个字排在第一个位置上,这时,机器报警,发出“嘟”的声音,提醒你出现重码字了。

如果需要的就是那个比较常用的字,则只管输入下文,这个字会自动跳到正常编辑位置上去。它们的输入就像没有重码一样,完全不影响输入速度。

如果需要的是不常用的那个字,则可根据它的位置号按数字键“1、2、3…”即可使它显示在编辑位置上去。

例如,键入“FGHY”后,屏幕的左下方就会显示出:

五笔字型:fghy  1.寸  2.雨

如果这时你需要“寸”字,就不必挑选,只管输入下文,“寸”就会自动跳到光标位置,如果需要的是“雨”字,则需击一下数字键“2”。

为了进一步减少重码,提高输入速度,在五笔字型汉字输入法中特别定义了一个后缀码“L”,即把重码字中使用频度较低的汉字编码的最后一个编码改成后缀码“L”。这样,在输入使用频率较高的重码汉字时用原码,输入一个使用频度较低的重码汉字时,只要把原来单字编码的最后一码改成“L”即可。这样两者都不必再作任何特殊处理或增加按键就能输入,从而再次把重码字离散开来。掌握了这一方法后,在输入一级汉字的范围内,就可以不用再担心遇到重码,同时也提高了汉字的输入速度。

2.容错码

在五笔字型输入法中,为了便于学习和使用,特在编码中引入了容错技术,设计了容错码。有了容错码,对一些比较容易错的编码的汉字,即使错误输入时,机器也能出现正确的汉字。但要注意,并非所有错误都能纠正,而只是较容易搞错的一些错误可以纠正。五笔字型汉字输入法中,对约5000个汉字设计了容错码,其主要类型包括下面三种:

(1)拆分容错

有些汉字在书写顺序上,因人而异不能统一。五笔字型汉字输入法中还允许其他一些习惯顺序的输入,这就是拆分容错。

例如,五笔字型汉字输入法中规定“长”拆分为“丿七丶(TAYI)”为正确码,但在实际书写时,按各人不同的习惯又存在下面三种码:

长 = 七 + 丿+ 丶    (ATYI)

长 = 丿+ 一 + 乙 + 丶  (TGNY)

长 = 一 + 乙 + 丿+ 丶  (GNTY)

考虑到这三种书写顺序,认为这三个码也代表“长”,则这三个码就是“长”字的拆分容错码。

(2)字型容错码

个别汉字的字型不很明确,在判断时往往搞错,故设计了字型容错码。例如:

占:卜口12(HKF)为正确码,卜口13(HKD)为容错码。

右:口12(DKF)为正确码,口13(DKD)为容错码。

(3)方案版本容错

五笔字型汉字输入法已经过了多年的使用、修改和优化,因而目前的最新版本与原版本有较大的判别。为了使已掌握原版方案的人员也能使用最新的优化方案,特设计了一些方案版本容错码。

例如,在目前最新的优化方案中,取消两个字根,因此,很多字在拆分时结果就不同。如“拾”字,按目前最新方案,应拆成“扌、人、一、口(RWGK)”,而按原方案则应拆成“扌、合、口(RWKG)”,现把“RWKG”就作为“拾”的容错码。

最后特别要提醒的是,容错码不是万能的,只是在一个很小的范围内能给以帮助。所以,必须要认真学习,熟练掌握汉字的正确拆分方法和编码原则,不能把希望寄托在容错码上。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈