文字识别软件OCR是为满足书籍、报纸杂志、报表票据、公文档案等录入需求而设计的软件系统。 信息资料需要转化成电子文档以便于各种应用及管理,OCR软件能满足海量录入需求。
一、OCR系统的组成
1.OCR界面
OCR软件界面主要是由扫描处理模块、版面划分模块、文字识别模块和文字编辑模块4个部分组成,如下图所示。
2.OCR工具栏
二、OCR软件的使用方法
OCR软件的种类虽然很多,但其使用方法大同小异。 首先要对文稿进行扫描,然后用OCR进行识别。 利用OCR软件进行文字识别,可直接在OCR软件中扫描文稿,操作步骤如下:
(1)连接扫描仪的电源线、数据线后开启扫描仪电源。
(2)打开OCR识别软件,如下图打开“尚书七号OCR”软件。
(3)将需扫描的文稿放入扫描仪中。
(4)单击工具栏的“扫描”工具,或选择文件菜单中的“扫描”命令。
(5)扫描前设置原稿、扫描类型、输出目的、输出比例,如下图所示。
(6)扫描后选择“自动倾斜校正”,纠正扫描文稿的倾斜位置,如下图所示。
(7)准备识别:选择文件范围、进行版面分析、选择修改属性,如下图所示。
(8)开始识别,如下图所示。
(9)对照比较校正,如下图所示。
(10)识别后输出文稿的保存类型、存放位置,可选择识别内容到外编辑器,如下图所示。
友情提示
◆扫描文稿如果是Word文件,应选择文本文件“∗.TXT”保存类型,同时也选择识别内容到外编辑器。 在Microsoft Word打开比较、校正。
(11)识别后的内容在保存的文件路径里打开文件,进行编辑排版,如下图所示。
友情提示
◆扫描文稿在同一页上有文字、表格时,通过选择范围分别识别文字和表格。
◆识别的文稿文件类型也可为∗.BMP,∗.JPG,∗.TIF等文件,如下图所示。
◆将要扫描的文稿放在扫描仪的玻璃面上,使要扫描的一面朝向扫描仪的玻璃面并让文稿的上端朝下,与标尺边缘对齐,再将扫描仪盖上,即可准备扫描。 单击视窗中的“扫描”键,即可进入扫描驱动软件进行扫描。 注意:分辨率可设置在200~400dpi,对于文本文档,调整亮度适中很关键。 扫描后的文档图像出现在OCR软件视窗中。
◆清晰度较差的文稿可选用高级控制面板扫描,达到好的输出效果。
【做一做】
使用OCR识别文字,写出其操作步骤:
第1步______________________________________________
第2步______________________________________________
第3步______________________________________________
第4步______________________________________________
第5步______________________________________________
第6步______________________________________________
第7步______________________________________________
第8步______________________________________________
【知识窗】
选中“输出到外部编辑器”,则系统在保存文件的同时调入相应的文字处理程序。
•TXT格式只保存文字、表格部分,不保存图片;
•RTF格式可以用Word、WPS等文字处理软件编辑;
•HTML格式可以输出到IE等网络浏览器;
•XLS格式可以用Excel等软件编辑。
【做一做】
用OCR软件扫描我们这本书的文字、图片和表格,然后进行编辑保存。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。