如何對PDF文檔進行ocr識別?有一些PDF文檔即使用了PDF編輯器也不能進行編輯,是因為PDF編輯器有問題嗎?不是的,從編輯器運作原理來說,也沒辦法去編輯非圖文狀態(tài)的PDF文件。特備是咋看之下是圖片層和文字層組成,實際上是把圖和文都設(shè)計在圖片上,即使擁有PDF編輯器,也是不能編輯的。不過沒關(guān)系,現(xiàn)在ocr識別技術(shù)很強大,可以將圖文剝離出來,達到PDF可編輯狀態(tài),而且在語言上可選,文檔里有外文也不怕無法識別的情況,一起來看看教程吧。
點擊→福昕PDF編輯器個人版,可直接下載。
步驟一:打開PDF編輯器,打開需要處理PDF文件。
步驟二:點擊工具欄中的【OCR文本識別】
步驟三:此時會跳出OCR識別文本組件的彈窗,選擇好要識別的頁面,要識別的語言(默認是簡體中文、英語)。點擊【開始識別】
步驟四:識別后會得到一份新的PDF文檔,可以【文件-另存為】下來,也可以點擊編輯或者轉(zhuǎn)換,或直接提取文字圖片等操作。
如何對PDF文檔進行ocr識別?以上就是使用福昕PDF編輯器個人版PDF圖片提取文字的做法。
本文地址:http://yz19.cn/company/product/3937.html
版權(quán)聲明:除非特別標注,否則均為本站原創(chuàng)文章,轉(zhuǎn)載時請以鏈接形式注明文章出處。