在工作中,我們經(jīng)常會(huì)識別很多的掃描件,有的小伙伴在識別的時(shí)候發(fā)現(xiàn)結(jié)果不準(zhǔn)確,今天小編就給大家介紹一下
掃描件識別的步驟是什么?ocr識別不準(zhǔn)的原因有哪些?大家可以了解一下。
掃描件識別的步驟是什么?
1、如果想對掃描件圖片進(jìn)行識別,我們就需要借助相關(guān)
OCR文字識別工具來實(shí)現(xiàn)。
2、通過百度搜索下載福昕全能王并安裝運(yùn)行,從打開的程序主界面中,通過視圖查看以選擇相應(yīng)的圖片文件進(jìn)入掃描過程。
3、當(dāng)成功打開相應(yīng) 的圖片文件后,我們就可以在工具欄界面中,點(diǎn)擊‘頁面解析“按鈕,此時(shí)就自動(dòng)針對文字區(qū)域進(jìn)行識別。
4、對于自動(dòng)識別后的文字區(qū)域,我們還可以對其進(jìn)行更近一步的編輯操作。右擊對應(yīng)的文字區(qū)域選擇“刪除”項(xiàng)即可刪除區(qū)域。
5、同時(shí)我們還可以利用鼠標(biāo)針對想要進(jìn)行識別的區(qū)域進(jìn)行框選,之后點(diǎn)擊“識別”按鈕,即可針對相關(guān)文字區(qū)域進(jìn)行識別。
6、針對識別后的文字內(nèi)容,我們還可以更近一步的進(jìn)行編輯操作。在此可以直接對相關(guān)文字區(qū)域內(nèi)容進(jìn)行編輯。也可以將文字內(nèi)容導(dǎo)出到Word文檔中進(jìn)行操作。
ocr識別不準(zhǔn)的原因有哪些?
1:是否是常規(guī)字體,手寫體和特殊藝術(shù)字體,OCR很難有準(zhǔn)確的識別率。
2:是否有大量特殊符號,行業(yè)特殊符號OCR也無法保證識別準(zhǔn)確率。
3:注意掃描文件或者圖片的背景與文字前景的對比度,對比度是影響識別率和準(zhǔn)確率的核心參數(shù)??捎霉ぞ呷コ尘爸械碾s色,雜點(diǎn),噪點(diǎn)。
4:掃描文件或者圖片的亮度,調(diào)整到合適的亮度,可以有效提高識別率和準(zhǔn)確率。
5:設(shè)置合適的分辨率。
6:如果原圖像或者掃描件歪斜,請校正。
7:選擇正確的識別區(qū)域。
8:在
掃描文檔時(shí),設(shè)置合適的掃描參數(shù),或者在拍攝時(shí),擺正文字區(qū)域,切忌歪斜。
ocr文字識別是什么?
OCR是英文optical character recognition的縮寫,意思是:文字識別
OCR(optical character recognition)文字識別是指電子設(shè)備(例如掃描儀或數(shù)碼相機(jī))檢查紙上打印的字符,然后用字符識別方法將形狀翻譯成計(jì)算機(jī)文字的過程;即,對文本資料進(jìn)行掃描,然后對圖像文件進(jìn)行分析處理,獲取文字及版面信息的過程。
OCR文字識別很重要的一個(gè)技術(shù)參數(shù),就是識別率。就拿身份證識別來舉例子,就會(huì)涉及到兩個(gè)問題。身份證識別出來的最終目的是要有格式,供直接錄入系統(tǒng),姓名項(xiàng)、地址項(xiàng)、身份證號項(xiàng)都黏在一起,就沒辦法使用了;
目前身份證識別率能達(dá)到98%以上,如果拿通用OCR文字識別來識別,識別率達(dá)不到如此高識別率,需要專門針對身份證進(jìn)行校正優(yōu)化。所以O(shè)CR文字識別根據(jù)特殊識別內(nèi)容,形成了多個(gè)產(chǎn)品出來。
以上就是小編給大家介紹的掃描件識別的步驟是什么?ocr識別不準(zhǔn)的原因有哪些?大家可以了解一下,在識別的時(shí)候,一定要選擇清晰的圖片。