查看: 4352|回復: 2
打印 上一主題 下一主題

OCR 圖片文字識別圖解教程

[復制鏈接]
跳轉(zhuǎn)到指定樓層
樓主
發(fā)表于 2007-11-30 16:35:05 | 只看該作者 回帖獎勵 |倒序瀏覽 |閱讀模式
一、什么是OCR
很早之前就聽說有提取圖片中文字的工具和方法,這種文字識別技術稱為OCR(Optical Character Recognition)。OCR技術的出現(xiàn),實現(xiàn)了將印刷文字掃描得到的圖片轉(zhuǎn)化為文本文字的功能,提供了一種全新的文字輸入手段,大大提高了用戶工作的效率。
二、OCR適合對象
  1.印刷行業(yè)、文印店:經(jīng)常會遇到客戶只給你一本厚厚的宣傳冊(因為客戶不知道電子稿保存的重要意義,甚至壓根就不知道什么是電子稿),要你明天之前,必須把那本幾十頁宣傳冊上的文字,原原本本打出來。生意還是要做,沒有辦法,你只能再當一回為了打字而打字的工具了,除非你使用OCR;
  2.辦公室工作人員:老板某天拿了一張寫滿字的傳單給你,要求你馬上打成Word文檔,對于打字慢或是懶得打的你,為了完成工作任務,OCR就很適合你了;
  3.其他對象:工作中、網(wǎng)絡中、現(xiàn)實生活中,OCR對很多人都是有用的,能幫你輕松提高效率。
三、準確選擇OCR軟件
  正常購買掃描儀的時候,配套軟件就會附有OCR功能,在網(wǎng)絡上搜索,也會有一系列的OCR軟件可以下載,如:
  1.清華紫光OCR V7.5
  簡介:清華紫光 OCR支持Windows環(huán)境下的GB、BIG5、JIS和Shif。

  2.ABBYY FineReader OCR Professional 7.0.0.963
  簡介:一款OCR軟件。為用戶提供了現(xiàn)代OCR赤銅的全部功能,給予它們對信息管理的完全控制。
  3.掃描小精靈 V1.30 Build 2003.03.21
  簡介:針對OCR的圖像增強、虛擬TWAIN、批量掃描。
  4.Mini Ocr 漢字顯示字體識別軟件 1.0
  簡介:本軟件是飛濤軟件工作室開發(fā)的一款免費Ocr軟件,主要用于識別圖像文件之中出現(xiàn)的漢字。

  5.Mini Ocr 漢字顯示字體識別軟件 V1.0
  簡介:本軟件是飛濤軟件工作室開發(fā)的一款免費Ocr軟件。

  6.奧普印刷體文字識別OCR系統(tǒng) 專業(yè)版
  筆者從事互聯(lián)網(wǎng)行業(yè)也有三四年了,很早前就知道有OCR(文字識別技術),也曾花了好幾天的時間研究了不下十種的OCR軟件(包含以上6種),結(jié)果不是軟件安裝失敗,就是提取文字的識別率太低。過了好久,筆者下載了"尚書六號",才發(fā)現(xiàn)它就是多年來一直尋找的OCR軟件,并親眼見證了OCR的成果,識別率達到90%以上。欣喜之余,寫了這篇"圖片文字提取(OCR)圖解教程",為所有在尋找OCR或想體驗OCR成果的人提供參考,歡迎各網(wǎng)站轉(zhuǎn)載。
 
四、圖片文字提取(OCR)圖解范例
  1.從掃描儀導入圖片或截圖生成

[圖1] 截圖后,打開Photoshop,新建文件,分辨率設:300像素/英寸

[圖2] 粘貼后,保存為.jpg格式

[圖3] 保存后的.jpg圖片
  圖1、圖2、圖3是假設在瀏覽網(wǎng)頁時,遇到含有文字的圖片,利用騰訊TT截圖功能,在Photoshop粘貼生成.jpg文件;當然,也可以使用鍵盤上的PrintScan鍵截圖后,打開附件里的畫圖,進行粘貼生成.jpg文件。
  2."尚書六號"的界面

  3.導入需要提取的圖片

[圖5] 點擊"文件",選擇"打開圖象頁"

[圖6] 選擇剛才保存的sample.jpg并點擊"打開"

[圖7] "尚書六號"自動識別的三個選框
  4.提取文字并保存文本

[圖8] 不修改默認設置,直接點擊"識別"后,彈出的界面

[圖9] 將框內(nèi)的文字選中,并復制到文本文件或Word文檔進行個別錯字修正

 "尚書六號"下載:http://www.jxxmw.com/Art/show.asp?id=467
中國畜牧人網(wǎng)站微信公眾號
版權(quán)聲明:本文內(nèi)容來源互聯(lián)網(wǎng),僅供畜牧人網(wǎng)友學習,文章及圖片版權(quán)歸原作者所有,如果有侵犯到您的權(quán)利,請及時聯(lián)系我們刪除(010-82893169-805)。
沙發(fā)
發(fā)表于 2007-11-30 18:46:23 | 只看該作者
呵呵,微軟的也不錯,據(jù)說漢王的低檔技術,隨Office帶的,免費。中文的OCR,漢王不錯。
英文OCR,現(xiàn)在用的最多的就是Abbyy.FineReader.Pro,最新版本是9.0,效果不錯。此外,英文的還有其它幾種OCR,比如Omnipage、TextBridge等,試過,也很不錯。
板凳
發(fā)表于 2007-11-30 22:45:12 | 只看該作者
多謝樓主分享,學習中。。。。。。
您需要登錄后才可以回帖 登錄 | 注冊

本版積分規(guī)則

發(fā)布主題 快速回復 返回列表 聯(lián)系我們

關于社區(qū)|廣告合作|聯(lián)系我們|幫助中心|小黑屋|手機版| 京公網(wǎng)安備 11010802025824號

北京宏牧偉業(yè)網(wǎng)絡科技有限公司 版權(quán)所有(京ICP備11016518號-1

Powered by Discuz! X3.5  © 2001-2021 Comsenz Inc. GMT+8, 2025-5-11 09:35, 技術支持:溫州諸葛云網(wǎng)絡科技有限公司