掃一掃添加福昕福利官
文字識別 ocr
文字識別 ocr的原理是什么?
OCR文字識別的原理是計算機對圖像進行版面分析?處理和模式識別?圖像版面分析是指通過對圖像文字的預處理,文字圖像的分割和坐標定位;文字模式識別是通過檢測暗?亮的模式,放大圖像確定其形狀特征并進行提取和判斷,最終通過圖像黑白點二進制與字符編碼進行匹配,根據(jù)最相近的匹配度將文字圖像特征進行PDF文字轉換?
標準的OCR文字識別系統(tǒng)主要包括圖像處理模塊?版面分析模塊?文字識別模塊?文字校對模塊和輸出模塊?
(一)圖像處理模塊
主要是通過掃描儀設備將紙質的期刊?學位等文獻數(shù)據(jù)進行掃描,一般建議掃描成線圖模式(灰圖或彩色圖識別率低),擴展名為tif圖格式,圖像分辨率為300DPI,圖像要進行去污點?去黑邊?圖像居中和圖像糾偏等工作,最好不要有底紋,總之保持圖像為白底黑字,圖像頁面整潔從而提高文字識別率?
(二)版面分析模塊
可以分為自動和手工兩種方式,自動版面分析程序主要使用黑白二值法,逐頁將所有文字區(qū)域部分進行畫框定位并存儲相應的區(qū)域塊坐標;手工版面分析是指人工通過鼠標在圖像文字區(qū)域進行畫框,選擇特定區(qū)域進行文字識別,這種方式主要應用于需要從圖像提取特定區(qū)域的文字,有針對性的文字識別?另外還可以設置圖像文字的橫豎排版方式以及中外文字體信息等以提高文字識別率?版面分析模塊原理主要是對版面劃分?更改劃分,即對版面的理解?字切分?歸一化等,可選擇自動或手動兩種版面劃分方式?目的是告訴OCR軟件將同一版面的中英文字體?圖像?表格?橫版豎版方式等分開,以便于分別處理,并按照怎樣的順序進行識別?
(三)文字識別模塊
文字識別模塊是OCR軟件的核心部分,文字識別主要使用了黑白二值法,以單個漢字“一”為例,將文字顏色取反,也就是白變成黑,黑變成白,以單字圖像區(qū)域分為上下兩部分,這種方式將每個字都可以劃分為不同區(qū)域,將不同區(qū)域的反選區(qū)域用二進制的方式進行轉換,將每個文字區(qū)域劃分后生成一個二進制編碼,我們預先對每個標準的文字進行二進制編碼存放到數(shù)據(jù)庫中,用OCR文字識別完的結果與標準數(shù)據(jù)庫中的二進制編碼進行比對,從而選擇最接近的二進制編碼文字,最終得到文字識別結果,如果沒有找到相似度高的編碼,則系統(tǒng)識別認為有誤文字會以醒目的紅色顯示,提示用戶需進行人工修改?文字識別模塊主要對單個圖像文字進行識別,所以必須對圖像進行逐行切割,對每行漢字通常也是逐字進行識別,即單字識別,再進行歸一化處理?
(四)文字校對模塊
文字校對主要分縱向校對和橫向校對,縱向校對是指按照順序把文字識別結果進行排列,將識別結果所有相同文字進行調用,顯示識別結果中所有相同的文字,調用識別結果同時調出對應原圖進行人工比對?橫向校對是指按照我們的閱讀習慣逐行進行校對,顯示一行識別結果和對應的原圖進行校對,發(fā)現(xiàn)錯字進行人工修改,對識別結果經常出錯的文字,需要重新進行標準文字編碼庫改寫,以達到文字精準識別?
(五)輸出模塊
將校對無誤的文字可以輸出為文本或XML等格式,輸出的文本文字完全可以編輯了,同時原圖像文檔可以輸出PDF文檔用于瀏覽原圖,也可輸出符合移動閱讀的電子出版ePub格式等?
文字識別 ocr
文字識別 ocr應用場景
銀行身份認證場景中,只需提交身份證信息,OCR 就能自動識別出身份證上的姓名?性別?地址等信息并填報到系統(tǒng)中;
在企業(yè)資質審核場景中,通過上傳營業(yè)執(zhí)照,OCR 將營業(yè)執(zhí)照的注冊號?企業(yè)名稱等信息識別出并填報到系統(tǒng)中,再通過營業(yè)執(zhí)照校驗接口,自動完成企業(yè)資質校驗?
如果大家想運用文字識別 ocr技術,可以使用文字識別軟件?如果大家想要證件識別?人臉識別?車牌識別都可以去福昕編輯器個人版?
版權聲明:除非特別標注,否則均為本站原創(chuàng)文章,轉載時請以鏈接形式注明文章出處。
政企
合作
了解平臺產品
預約產品演示
申請產品試用
定制合作方案
福昕
福利官
掃一掃添加福昕福利官
了解平臺產品
預約產品演示
申請產品試用
定制合作方案
添加福昕福利官
微信掃碼
免費獲取合作方案和報價