OCR到底是個(gè)什么技術(shù)?你了解嗎?
作者:admin
更新時(shí)間:2022-03-22
點(diǎn)擊數(shù):
我們?cè)趯W(xué)習(xí)和辦公的過(guò)程中,肯定多多少少遇到過(guò)這樣的場(chǎng)景: 在某本書(shū)或者某張報(bào)紙上看到一大段有用的文字,想要快速摘錄出來(lái); 查找到的重要信息存儲(chǔ)格式為圖像或者文字不可復(fù)制的PDF,需要手動(dòng)輸入成文本格式; 經(jīng)常需要輸入身份證號(hào)碼或者銀行卡號(hào)碼之類(lèi)的長(zhǎng)串?dāng)?shù)字,需要仔細(xì)錄入反復(fù)核對(duì); 有大批量的表格、單據(jù)、合同等紙質(zhì)材料需要轉(zhuǎn)化為電子文檔保存; 報(bào)銷(xiāo)發(fā)票時(shí)候需要一張張錄入票據(jù)手動(dòng)計(jì)算金額; ...... 把電子文本轉(zhuǎn)化為圖像很容易,一個(gè)截圖軟件就能做到,但是反過(guò)來(lái)操作卻是一個(gè)非常艱難的過(guò)程。傳統(tǒng)且低效的人工手動(dòng)錄入方式已無(wú)法滿(mǎn)足現(xiàn)代快節(jié)奏工作生活的需求,OCR技術(shù)的出現(xiàn),讓我們有了更便利的方式可以代替人工手動(dòng)錄入。 OCR技術(shù)是Optical Character Recognition(光學(xué)字符識(shí)別)的縮寫(xiě),是一種通過(guò)光學(xué)輸入方式將卡證或者紙質(zhì)文檔上的文字轉(zhuǎn)化為圖像,再利用算法把圖像信息轉(zhuǎn)化為可以用電子設(shè)備進(jìn)行編輯的文本信息的技術(shù)。 簡(jiǎn)單來(lái)說(shuō),就是一種便捷的圖像轉(zhuǎn)文字的技術(shù)。 現(xiàn)在市面上關(guān)于OCR技術(shù)的應(yīng)用工具有很多,比如文檔識(shí)別、身份證識(shí)別、票據(jù)識(shí)別、名片識(shí)別、銀行卡識(shí)別、車(chē)牌識(shí)別......今天我們就以文檔識(shí)別為例,看看OCR技術(shù)是如何工作的。 文檔識(shí)別作為一項(xiàng)成熟的人工智能識(shí)別工具,可以在短時(shí)間內(nèi)識(shí)別和讀取紙質(zhì)文檔信息,并自動(dòng)生成可編輯的電子文檔。此外,文檔識(shí)別還能進(jìn)一步對(duì)電子文檔進(jìn)行糾錯(cuò)、添加備注、存儲(chǔ)、分享等操作。 文檔識(shí)別功能分享: OCR文檔錄入:下載并安裝文檔識(shí)別APP,打開(kāi)文檔識(shí)別并選擇右下角的“+”號(hào),選擇拍照或是打開(kāi)手機(jī)內(nèi)的圖像文件,然后選擇(右上角)識(shí)別,獲得文檔識(shí)別結(jié)果。 用戶(hù)可以對(duì)識(shí)別結(jié)果標(biāo)題、分組、內(nèi)容、備注等部分進(jìn)行修改,支持自主修改標(biāo)題、自由分組,自動(dòng)校對(duì)糾錯(cuò)、自動(dòng)分行、自助排序。 文檔自由檢索:文檔識(shí)別內(nèi)置全文檢索功能,通過(guò)檢索文檔關(guān)鍵字、文件名,就可以快速找到自己需要的電子文檔。 文檔權(quán)限分享:通過(guò)聊天工具、Email、社交平臺(tái)分享云盤(pán)中的文檔,設(shè)置瀏覽權(quán)限,沒(méi)有瀏覽權(quán)限的將無(wú)法通過(guò)該工具獲取信息。通過(guò)設(shè)置閱讀瀏覽權(quán)限,控制文件瀏覽人群,確保文件信息不外泄,保障文件信息安全。 電子圖像美化:在使用文檔識(shí)別APP過(guò)程中,需要注意拍攝的文檔圖片不可以過(guò)度曝光、不能有深重的陰影,否則會(huì)影響文檔識(shí)別結(jié)果。在OCR識(shí)別過(guò)程中,如果遇到圖片模糊(可視范圍)可以通過(guò)點(diǎn)擊右下角彩虹色小球,對(duì)即將識(shí)別的文檔進(jìn)行“強(qiáng)化”“美化”處理。通過(guò)美化圖像,銳化對(duì)比、降低噪點(diǎn)等方式可獲得更加清晰完整的圖像,使得文字識(shí)別準(zhǔn)確率在各大現(xiàn)實(shí)場(chǎng)景下有明顯提升。