文本識(shí)別ocr技術(shù)有什么作用?怎么提高文字識(shí)別的準(zhǔn)確率?很多人在用
ocr識(shí)別軟件時(shí),擔(dān)心掃描出來的效果不好。下面福昕全能王就來給大家詳細(xì)說說如何提高識(shí)別的準(zhǔn)確率吧。
OCR文字識(shí)別技術(shù)如何獲得?
1)數(shù)據(jù)集
OCR算法訓(xùn)練最有難度的是數(shù)據(jù),一方面是訓(xùn)練數(shù)據(jù)集大。普遍應(yīng)用的深度學(xué)習(xí)
OCR技術(shù),需要大量的數(shù)據(jù)來保證訓(xùn)練效果,此外,中文漢字庫非常大,一級(jí)字庫有3755個(gè)漢字,再加上三級(jí)字庫,就有上萬個(gè)漢字,印刷體漢字還有9種常用的字體,手寫體漢字更是千人千面,這些組成一個(gè)龐大的數(shù)據(jù)集。
另一方面數(shù)據(jù)集圖片種類多,數(shù)據(jù)標(biāo)注成本高。OCR場(chǎng)景圖片識(shí)別會(huì)有很多因素影響識(shí)別效果,如復(fù)雜背景、藝術(shù)字體、低分辨率、非均勻光照、圖像退化、字符變現(xiàn)、多語言混合、文本行復(fù)雜版式、檢測(cè)框字符殘缺等等,有效的數(shù)據(jù)集需要包含這些關(guān)聯(lián)因素。
根據(jù)功能定義,OCR文字識(shí)別技術(shù)需要識(shí)別中文和數(shù)字,兼容印刷體識(shí)別和手寫體識(shí)別,未來需要擴(kuò)展英文識(shí)別。
2)框架工具
OCR技術(shù)已經(jīng)從傳統(tǒng)OCR發(fā)展到深度學(xué)習(xí)OCR,并已成為主流趨勢(shì),所以需要選擇深度學(xué)習(xí)框架和工具進(jìn)行算法訓(xùn)練。
3)框架設(shè)計(jì)
設(shè)計(jì)網(wǎng)絡(luò)結(jié)構(gòu)是OCR實(shí)踐中的另外一個(gè)關(guān)鍵點(diǎn)。識(shí)別文字建模為一個(gè)多分類任務(wù),比如3755個(gè)文字識(shí)別就需要3755個(gè)類別的分類任務(wù),實(shí)際訓(xùn)練中可能有上萬個(gè)分類。
文本識(shí)別ocr技術(shù)有什么作用?
1、
證件識(shí)別,尤其像身份證識(shí)別,護(hù)照識(shí)別,名片識(shí)別,銀行卡識(shí)別,等等;使辦公地點(diǎn)更加靈活,辦公效率大大提高。
2、發(fā)票識(shí)別,就是發(fā)票識(shí)別,適合于銀行、稅務(wù)等行業(yè)大量票據(jù)表格的自動(dòng)掃描識(shí)別及長期存儲(chǔ)。相對(duì)一般文本,通常以最終識(shí)別率、識(shí)別速度、版面理解正確率及版面還原滿意度4個(gè)方面作為OCR技術(shù)的評(píng)測(cè)依據(jù),做到了真正的方便快捷。
怎么提高文字識(shí)別的準(zhǔn)確率?
第一:首先保證掃描環(huán)境光線充足,將鏡頭調(diào)至最清楚,并盡量保證光線平均。
第二:將掃描的圖片進(jìn)行灰度圖操縱,圖片變成黑白。
第三:假如圖片的亮度、底色不平均可以調(diào)節(jié)亮度、對(duì)比度等。
文本識(shí)別ocr技術(shù)有什么作用?怎么提高文字識(shí)別的準(zhǔn)確率?上文福昕全能王給大家詳細(xì)講解這些問題,使用ocr識(shí)別軟件要注意掃描時(shí)的光線和角度。