首页 理论教育 汉字信息处理与汉字研究

汉字信息处理与汉字研究

时间:2023-03-05 理论教育 版权反馈
【摘要】:众多属性的提供,不仅提高了计算机进行汉字信息处理的功能,而且为制订汉字属性的国家标准打下了坚实的基础。例如汉字的自动识别,如果字形不规范,就会影响汉字识别的研究工作。要提高汉字信息处理的速度和效率,必须加强汉字规范标准的研究,加快汉字信息处理急需的规范标准的制订,并不断予以优化。目前还要制订的规范标准有汉字笔形分类标准、汉字字序标准、各类专业用字字符集标准等。
汉字信息处理与汉字研究_现代汉语通论 第三版 上册

20世纪50年代以来所进行的汉字简化与整理工作,其重大成果正越来越多地用于汉字信息处理,为我国计算机的普及和发展提供了有利条件。例如拼音输入法、语音自动识别、汉字自动识别、词语自动切分、同音词自动识别等输入方式的研制和应用,都与普通话的推广、汉语拼音的推行、汉字的整理和简化工作密切相关。为了促进信息处理技术的发展,必须进一步强化语言文字的规范化标准化工作。

(一)汉字属性研究

汉字属性是汉字信息处理不可缺少的基本要素。20世纪80年代先后出版的《汉字信息字典》(科学出版社1988)和《汉字属性字典》(语文出版社1988),对每个汉字的属性都给出充分的信息。这些信息包括每个字的序号、读音、笔画数、部件数、部首、部首笔画数、部首外笔画数、部首序号、笔顺、笔顺编号、结构方式、异体字、繁体字、旧字形、字频、国际码、电报码、四角号码等。众多属性的提供,不仅提高了计算机进行汉字信息处理的功能,而且为制订汉字属性的国家标准打下了坚实的基础。汉字属性丰富,今后还要继续开发,并从如何使电脑中文处理更高效、更经济、更方便的角度,进一步加强研究。

(二)汉字规范化、标准化研究

汉字信息处理中的输入、输出、频率统计、汉字识别、语音识别、语音合成等都和汉字规范化标准化有着密切的关系。例如汉字的自动识别,如果字形不规范,就会影响汉字识别的研究工作。要提高汉字信息处理的速度和效率,必须加强汉字规范标准的研究,加快汉字信息处理急需的规范标准的制订,并不断予以优化。目前还要制订的规范标准有汉字笔形分类标准、汉字字序标准、各类专业用字字符集标准等。这对推动我国现代化的历史进程,具有非常重大的意义。

练习题

一、填空。

1.计算机汉字输入方式主要有___________、___________和___________。

2.汉字键盘输入方式大体上经历了三个发展阶段:(1)___________、(2)___________、(3)___________。

3.编码方案的选优标准是___________。

4.汉语拼音输入法的优点是___________。

二、选择。

1.王永民的五笔字型码属于(1)部件码 (2)笔形码 (3)部首码 (4)四角编码。( )

2.完善汉语拼音输入法的关键是(1)确定标调方法 (2)多音节词连写定型 (3)减少同音字选择。( )

三、判断(对的打“√”,错的打“×”)。

1.汉字信息处理的关键问题是输入。( )

2.点阵栅格越少,输出的汉字字形越完整清晰。( )

思考题

一、平时你喜欢用哪一种汉字输入法?为什么?

二、汉字语音识别的主要原理是什么?它的优越性是什么?

三、形码和音码各有缺点,你认为应该如何改进?

四、汉字信息处理与汉字研究、汉字规范化有什么关系?

参考文献

郑林曦(1979)《精简汉字字数的理论和实践》,中国社会科学出版社。

冯志伟(1989)《现代汉字和计算机》,北京大学出版社。

高家莺 范可育 费锦昌(1993)《现代汉字学》,高等教育出版社。

张书岩等(1997)《简化字溯源》,语文出版社。

苏培成(2001)《现代汉字学纲要》(增订本),北京大学出版社。

周有光(2002)《周有光语文论集》(一—四卷),上海文化出版社。

王宁(2002)《汉字构形学讲座》,上海教育出版社。

费锦昌 徐莉莉(2011)《古今汉字趣说》,暨南大学出版社。

裘锡圭(2013)《文字学概要》(修订本),商务印书馆。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈