掃一掃添加福昕福利官
ocr技術(shù)
ocr技術(shù)原理是什么?
OCR的基本原理簡單地說,OCR的基本原理就是通過掃描儀將一份文稿的圖像輸入給計算機,然后由計算機取出每個文字的圖像,并將其轉(zhuǎn)換成漢字的編碼?其具體工作過程是,掃描儀將漢字文稿通過電荷耦合器件CCD將文稿的光信號轉(zhuǎn)換為電信號,經(jīng)過模擬/數(shù)字轉(zhuǎn)換器轉(zhuǎn)化為數(shù)字信號傳輸給計算機?計算機接受的是文稿的數(shù)字圖像,其圖像上的漢字可能是印刷漢字,也可能是手寫漢字,然后對這些圖像中的漢字進行識別?對于印刷體字符,首先采用光學(xué)的方式將文檔資料轉(zhuǎn)換成原始黑白點陣的圖像文件,再通過識別軟件將圖像中的文字轉(zhuǎn)換成文本格式,以便文字處理軟件的進一步加工?其中文字識別是OCR的重要技術(shù)?
ocr技術(shù)
OCR的發(fā)展
要談OCR的發(fā)展,早在60?70年代,世界各國就開始有OCR的研究,而研究的初期,多以文字的識別方法研究為主,且識別的文字僅為0至9的數(shù)字?以同樣擁有方塊文字的日本為例,1960年左右開始研究OCR的基本識別理論,初期以數(shù)字為對象,直至1965至1970年之間開始有一些簡單的產(chǎn)品,如印刷文字的郵政編碼識別系統(tǒng),識別郵件上的郵政編碼,幫助郵局作區(qū)域分信的作業(yè);也因此至今郵政編碼一直是各國所倡導(dǎo)的地址書寫方式?
OCR可以說是一種不確定的技術(shù)研究,正確率就像是一個無窮趨近函數(shù),知道其趨近值,卻只能靠近而無法達到,永遠在與100%作拉鋸戰(zhàn)?因為其牽扯的因素太多了,書寫者的習(xí)慣或文件印刷品質(zhì)?掃描儀的掃描品質(zhì)?識別的方法?學(xué)習(xí)及測試的樣本……等等,多少都會影響其正確率,也因此,OCR的產(chǎn)品除了需有一個強有力的識別核心外,產(chǎn)品的操作使用方便性?所提供的除錯功能及方法,亦是決定產(chǎn)品好壞的重要因素?
一個OCR識別系統(tǒng),其目的很簡單,只是要把影像作一個轉(zhuǎn)換,使影像內(nèi)的圖形繼續(xù)保存?有表格則表格內(nèi)資料及影像內(nèi)的文字,一律變成計算機文字,使能達到影像資料的儲存量減少?識別出的文字可再使用及分析,當然也可節(jié)省因鍵盤輸入的人力與時間?
ocr技術(shù)的發(fā)展和應(yīng)用對我們的生活和工作影響非常大,目前ocr技術(shù)的應(yīng)用使我們的生活和工作變得更加的方便快捷?ocr技術(shù)正在不斷的走向成熟?再推薦一款非常好用的PDF編輯器——福昕PDF編輯器,它是永久免費試用的高效PDF編輯器?外行看熱鬧,內(nèi)行看門道,福昕PDF編輯可以自由編輯PDF內(nèi)容,文檔轉(zhuǎn)換,頁面管理,掃描件/圖片OCR識別,電子簽名和文檔保護,電子表單數(shù)百項大小功能?對金融,律師,財會,招投標,工程設(shè)計和施工等行業(yè)來說,更是不可或缺的實用軟件!
版權(quán)聲明:除非特別標注,否則均為本站原創(chuàng)文章,轉(zhuǎn)載時請以鏈接形式注明文章出處。
政企
合作
了解平臺產(chǎn)品
預(yù)約產(chǎn)品演示
申請產(chǎn)品試用
定制合作方案
福昕
福利官
掃一掃添加福昕福利官
了解平臺產(chǎn)品
預(yù)約產(chǎn)品演示
申請產(chǎn)品試用
定制合作方案
添加福昕福利官
微信掃碼
免費獲取合作方案和報價