使用文字识别软件输入文档

时间：2023-02-27 理论教育版权反馈

【摘要】：文字识别软件OCR是为满足书籍、报纸杂志、报表票据、公文档案等录入需求而设计的软件系统。OCR软件的种类虽然很多，但其使用方法大同小异。利用OCR软件进行文字识别，可直接在OCR软件中扫描文稿，操作步骤如下：◆扫描文稿如果是Word文件，应选择文本文件“.TXT”保存类型，同时也选择识别内容到外编辑器。扫描后的文档图像出现在OCR软件视窗中。

文字识别软件OCR是为满足书籍、报纸杂志、报表票据、公文档案等录入需求而设计的软件系统。信息资料需要转化成电子文档以便于各种应用及管理，OCR软件能满足海量录入需求。

一、OCR系统的组成

1.OCR界面

OCR软件界面主要是由扫描处理模块、版面划分模块、文字识别模块和文字编辑模块4个部分组成，如下图所示。

2.OCR工具栏

二、OCR软件的使用方法

OCR软件的种类虽然很多，但其使用方法大同小异。首先要对文稿进行扫描，然后用OCR进行识别。利用OCR软件进行文字识别，可直接在OCR软件中扫描文稿，操作步骤如下：

（1）连接扫描仪的电源线、数据线后开启扫描仪电源。

（2）打开OCR识别软件，如下图打开“尚书七号OCR”软件。

（3）将需扫描的文稿放入扫描仪中。

（4）单击工具栏的“扫描”工具，或选择文件菜单中的“扫描”命令。

（5）扫描前设置原稿、扫描类型、输出目的、输出比例，如下图所示。

（6）扫描后选择“自动倾斜校正”，纠正扫描文稿的倾斜位置，如下图所示。

（7）准备识别：选择文件范围、进行版面分析、选择修改属性，如下图所示。

（8）开始识别，如下图所示。

（9）对照比较校正，如下图所示。

（10）识别后输出文稿的保存类型、存放位置，可选择识别内容到外编辑器，如下图所示。

友情提示

◆扫描文稿如果是Word文件，应选择文本文件“∗.TXT”保存类型，同时也选择识别内容到外编辑器。在Microsoft Word打开比较、校正。

（11）识别后的内容在保存的文件路径里打开文件，进行编辑排版，如下图所示。

友情提示

◆扫描文稿在同一页上有文字、表格时，通过选择范围分别识别文字和表格。

◆识别的文稿文件类型也可为∗.BMP，∗.JPG，∗.TIF等文件，如下图所示。

◆将要扫描的文稿放在扫描仪的玻璃面上，使要扫描的一面朝向扫描仪的玻璃面并让文稿的上端朝下，与标尺边缘对齐，再将扫描仪盖上，即可准备扫描。单击视窗中的“扫描”键，即可进入扫描驱动软件进行扫描。注意：分辨率可设置在200～400dpi，对于文本文档，调整亮度适中很关键。扫描后的文档图像出现在OCR软件视窗中。

◆清晰度较差的文稿可选用高级控制面板扫描，达到好的输出效果。

【做一做】

使用OCR识别文字，写出其操作步骤：

第1步______________________________________________

第2步______________________________________________

第3步______________________________________________

第4步______________________________________________

第5步______________________________________________

第6步______________________________________________

第7步______________________________________________

第8步______________________________________________

【知识窗】