一、什么是OCR
很早之前就听说有提取图片中文字的工具和方法,这种文字识别技术称为OCR(Optical Character Recognition)。OCR技术的出现,实现了将印刷文字扫描得到的图片转化为文本文字的功能,提供了一种全新的文字输入手段,大大提高了用户工作的效率。
二、OCR适合对象
1.印刷行业、文印店:经常会遇到客户只给你一本厚厚的宣传册(因为客户不知道电子稿保存的重要意义,甚至压根就不知道什么是电子稿),要你明天之前,必须把那本几十页宣传册上的文字,原原本本打出来。生意还是要做,没有办法,你只能再当一回为了打字而打字的工具了,除非你使用OCR;
2.办公室工作人员:老板某天拿了一张写满字的传单给你,要求你马上打成Word文档,对于打字慢或是懒得打的你,为了完成工作任务,OCR就很适合你了;
3.其他对象:工作中、网络中、现实生活中,OCR对很多人都是有用的,能帮你轻松提高效率。
三、准确选择OCR软件
正常购买扫描仪的时候,配套软件就会附有OCR功能,在网络上搜索,也会有一系列的OCR软件可以下载,如:
1.清华紫光OCR V7.5
简介:清华紫光 OCR支持Windows环境下的GB、BIG5、JIS和Shif。
下载:
http://trdx.skycn.com/down/OCR75.zip
2.ABBYY FineReader OCR Professional 8.0.0.706
简介:一款OCR软件。为用户提供了现代OCR赤铜的全部功能,给予它们对信息管理的完全控制。
下载:
http://www.onlinedown.net/soft/24081.htm
3.扫描小精灵 V1.30 Build 2003.03.21
简介:针对OCR的图像增强、虚拟TWAIN、批量扫描。
下载:
http://www.skycn.com/soft/8242.html
4.Mini Ocr 汉字显示字体识别软件 1.0
简介:本软件是飞涛软件工作室开发的一款免费Ocr软件,主要用于识别图像文件之中出现的汉字。
下载:
http://dl.pconline.com.cn/html_2/1/117/id=9813&pn=0.html
5.Mini Ocr 汉字显示字体识别软件 V1.0
简介:本软件是飞涛软件工作室开发的一款免费Ocr软件。
下载:
http://download.it168.com/03/0310/2208/2208_4.shtml
6.奥普印刷体文字识别OCR系统 专业版
下载:
http://www.onlinedown.net/soft/29690.htm
7.尚书六号
“尚书六号”识别率达到90%以上。挺好用的。
下载地址:
http://www.csdx.org/soft/shangsu6.zip
四、图片文字提取(OCR)范例教程
1.从扫描仪导入图片或截图生成,从扫描仪导入很方便。而截图我们可以借助一下photoshop,截图后,打开Photoshop,新建文件,分辨率设:300像素/英寸,粘贴后,保存为.jpg格式。截图一般是在浏览网页时,遇到含有文字的图片,利用腾讯QQ截图功能,在Photoshop粘贴生成.jpg文件;当然,也可以使用键盘上的PrintScan键截图后,打开附件里的画图,进行粘贴生成.jpg文件。
2.在尚书六号中导入需要提取的图片,点击"文件",选择"打开图象页",选择刚才保存的jpg图片,并点击"打开",提取文字并保存文本。不修改默认设置,直接点击"识别"后,会弹出界面,将框内的文字选中,并复制到文本文件或Word文档进行个别错字修正。