ocr字符識別是二十一世紀(jì)的產(chǎn)物,目前ocr字符識別技術(shù)的應(yīng)用無處不在。我們在平時生活中可能察覺不到它的存在,例如福昕全能王這款軟件就是利用的
ocr字符識別技術(shù)。下面我?guī)Т蠹襾砹私鈕cr字符識別。
ocr字符識別是什么?
OCR是英文Optical Character Recognition的縮寫,意思是光學(xué)字符識別,也可簡單地稱為文字識別或字符識別,是文字自動輸入的一種方法。它通過掃描和攝像等光學(xué)輸入方式獲取紙張上的文字圖像信息,利用各種模式識別算法分析文字形態(tài)特征,可以將票據(jù)、報(bào)刊、書籍、文稿及其它印刷品轉(zhuǎn)化為圖像信息,再利用字符識別技術(shù)將圖像信息轉(zhuǎn)化為可以使用的計(jì)算機(jī)輸入技術(shù)。目前字符識別技術(shù)已廣泛應(yīng)用于生產(chǎn)線,能夠?qū)Ξa(chǎn)線產(chǎn)品、原料上面的字進(jìn)行
自動掃描、識別并存儲備用。
ocr字符識別發(fā)展歷程
OCR的概念是在1929年由德國科學(xué)家Tausheck最早提出來的,后來美國科學(xué)家Handel也提出了利用技術(shù)對文字進(jìn)行識別的想法。而最先對印刷體漢字識別進(jìn)行研究的是IBM公司的Casey和Nagy,1966年他們發(fā)表了第一篇關(guān)于漢字識別的文章,采用了模板匹配法識別了1000個印刷體漢字。
早在60、70年代,世界各國就開始有OCR的研究,而研究的初期,多以文字的識別方法研究為主,且識別的文字僅為0至9的數(shù)字。以一樣擁有方塊文字的日本為例,1960年左右開始研究OCR的基本識別理論,初期以數(shù)字為對象,直至1965至1970年之間開始有一些簡單的產(chǎn)品,如印刷文字的郵政編碼識別系統(tǒng),識別郵件上的郵政編碼,幫助郵局做區(qū)域分信的做業(yè);也所以至今郵政編碼一直是各國所倡導(dǎo)的地址書寫方式。
20世紀(jì)70年代初,日本的學(xué)者開始研究漢字識別,并作了大量的工做。中國在OCR技術(shù)方面的研究工做起步較晚,在70年代才開始對數(shù)字、英文字母及符號的識別進(jìn)行研究,70年代末開始進(jìn)行漢字識別的研究,到1986年,我國提出“863”高新科技研究計(jì)劃,漢字識別的研究進(jìn)入一個實(shí)質(zhì)性的階段,清華大學(xué)的丁曉青教授和中科院分別開發(fā)研究,相繼推出了中文OCR產(chǎn)品,現(xiàn)為中國最領(lǐng)先漢字OCR技術(shù)。早期的OCR軟件,因?yàn)樽R別率及產(chǎn)品化等多方面的因素,未能達(dá)到實(shí)際要求。同時,因?yàn)橛布O(shè)備成本高,運(yùn)行速度慢,也沒有達(dá)到實(shí)用的程度。只有個別部門,如信息部門、新聞出版單位等使用OCR軟件。進(jìn)入20世紀(jì)90年代之后,隨著平臺式掃描儀的普遍應(yīng)用,以及我國信息自動化和辦公自動化的普及,大大推進(jìn)了OCR技術(shù)的進(jìn)一步發(fā)展,使OCR的識別正確率、識別速度知足了廣大用戶的要求。
ocr字符識別應(yīng)用有哪些?
1、證件識別:主要識別證件信息,用于金融、銀行、保險(xiǎn)、汽車等領(lǐng)域(互聯(lián)網(wǎng)),支持大陸二代身份證、臺灣身份證、香港身份證、澳門身份證、護(hù)照、行駛證、駕駛證、港澳臺通行證等20余種證件識別。
福昕全能王 2.銀行卡識別:主要識別銀行卡卡號,用于移動支付綁卡,提升APP用戶體驗(yàn)(互聯(lián)網(wǎng))。
3.車牌識別:主要識別車牌號碼、車牌顏色、車牌類型、車標(biāo)、車身顏色等車輛特征信息,用于移動警務(wù),占道停車,停車場管理,車險(xiǎn)等領(lǐng)域(互聯(lián)網(wǎng))中,支持識別普通藍(lán)牌、黃牌(雙層)、軍牌(雙)、武警牌(雙)、警牌、農(nóng)用車牌、大使館車牌等各種常見規(guī)格的汽車號牌。
4.名片識別:主要識別名片內(nèi)容,用于移動展業(yè)、CRM客戶管理系統(tǒng)等領(lǐng)域(互聯(lián)網(wǎng)),支持橫版、豎版名片識別,及其他板式的各種名片,還支持多語種名片識別。
5.營業(yè)執(zhí)照識別:主要識別營業(yè)執(zhí)照信息(統(tǒng)一社會信用代碼、公司名稱、二維碼等),用于需要代替人工提取營業(yè)執(zhí)照信息的領(lǐng)域(互聯(lián)網(wǎng))。
6.汽車VIN碼識別:主要識別車架號(汽車VIN碼),用于汽車管理、汽車服務(wù)、二手車交易、租車等領(lǐng)域(互聯(lián)網(wǎng))。
7.票據(jù)類OCR識別:主要識別增值稅發(fā)票等不同格式的票據(jù)內(nèi)容,用于財(cái)務(wù)管理、汽車、銀行、金融等領(lǐng)域(互聯(lián)網(wǎng)),基于模板機(jī)制,針對不同的票據(jù),定制不同的識別要素。
8.文檔文字OCR識別:主要識別文檔文字,用于圖書館,報(bào)社等針對圖書、報(bào)紙、雜志等文本類,需要把這些紙質(zhì)文檔進(jìn)行電子化的領(lǐng)域(互聯(lián)網(wǎng)),需借助在掃描儀,目前有移動端的文檔OCR識別、文檔識別掃描儀,隨著掃描儀分辨率的提升,OCR軟件也在不斷升級,掃描儀廠商現(xiàn)在已經(jīng)把專業(yè)的OCR軟件搭配自己生產(chǎn)的掃描儀出售。
我們可以利用ocr字符識別技術(shù)進(jìn)行身份證識別、人臉識別、文件和車牌識別,福昕全能王就是利用了ocr字符識別這些功能來完成掃描工作。