用数码相机实现文字录入,拍成照片传入电脑,再用识别软件转换成文本格式。
每当老板扔给你一叠厚厚的文件,让你一个字一个字地敲入电脑,你是不是感觉快要崩溃了?有没有想过,数码相机可以成为你多快好省的“打字员”?
如今,数码相机已经大量地走入寻常百姓家。对普通用户来说,利用数码相机来拍摄相片,这是天经地义的事情。可是用数码相机来录入文字,恐怕在大多数人眼中就有点天方夜谭了。下面,我们就来介绍一下这个独门绝活――用数码相机来录入文字的真“功夫”。
拍摄
用一台300万以上像素、3倍以上光学变焦的数码相机把原稿拍摄下来。拍摄的时候一定要注意:原稿要放平,相机要端平,光线要柔和均匀。可在走廊或窗口散射光线下,也可在三基色荧光护眼台灯下拍摄。
拍摄清楚是后面正确识别的关键,300万以上像素能保证拍摄后供识别的文字足够大;3倍以上的光学变焦能在拍摄时让原稿的每行字充满画面。笔者曾比较过,300万像素拍摄的比用200万像素拍摄的识别率明显要高。
不要用闪光灯,光照太强烈,拍摄下来的字迹反而不清楚。
转换
在电脑硬盘中建立一文件夹,把拍摄到的图片存入其中。但这些图片反差很小,整个画面很灰;而且各种数码相机的图片格式也不同,OCR软件(文字识别软件)不一定都能支持,所以宜先用ACDSee或Windows自带的“画图”程序进行转换。
笔者是在Windows自带的“画图”程序中进行转换的。首先依次点击“画图→文件→打开”,在“查找范围”中找到需要的图片,打开后点击“另存为”,在“保存类型”里选择“单色位图”。
点击“保存”后,会跳出提示语“保存成这种格式可能会造成颜色信息丢失,你还要继续吗”,继续点击“是”,就完成了转换。转换后得到的新图片沿用原名,扩展名改为“.bmp”,自动保存在原文件夹中。
识别
运行OCR软件(可以从网上下载,笔者使用的是清华TH-OCR 2000千禧专业版),依次点击“文件→打开”,在“查找范围”中找到你的图片。点击“命令”出现下拉菜单,如果需要全文识别,即可点击“全部识别”,OCR软件即进行识别。软件窗口的上部是经过拍摄、转换后的原稿图片,下部是识别出来的文字。识别结束后自动建立沿用原名的txt文件,保存在原文件夹中。
如果只需识别部分文字,可按住鼠标左键在需要识别的文字部位拉出方框,出现整块黄色后,点击“识别”即可。
整理
在一开始建立的文件夹中找出扩展名为txt的文本文件,这便是需要的资料,对识别错误的字进行修改,特别是原文中加着重号和下划线的文字,识别率还较低。同时在文件夹中,有许多扩展名为chr、trc、sim的文件,这些是OCR识别时产生的临时文件,可全部删除。
0
顶一下0
踩一下