OCR識別 - 常見問題

什么是OCR？
OCR（Optical Character Recognition），即光學字符識別，是一項先進技術(shù)。它通過掃描等光學手段，將各類票據(jù)、報刊、書籍、文稿以及其他印刷品中的文字轉(zhuǎn)換為圖像信息。隨后，利用文字識別技術(shù)，這些圖像信息被轉(zhuǎn)化為可以電子化處理的格式，方便計算機輸入和使用。

文字識別功能能識別哪些內(nèi)容？
基于深度學習技術(shù)的文字識別（OCR）可以智能地將圖片中的文字內(nèi)容轉(zhuǎn)換為可編輯的文本格式。此技術(shù)支持多種場景下的通用文字、卡證文字、票據(jù)單據(jù)等印刷體和手寫體文字的識別。此外，它還包括票據(jù)核驗功能，有效替代傳統(tǒng)的人工錄入方式，極大提升工作效率。

接入文字識別OCR服務(wù)，需要開發(fā)編程能力嗎？
接入文字識別OCR服務(wù)需要一定的編程開發(fā)能力。用戶需進行二次開發(fā)對接，并通過調(diào)用API接口，實現(xiàn)從圖片或掃描件中提取文字并轉(zhuǎn)換為可編輯文本的功能。識別提取后的結(jié)果需通過編程技術(shù)與用戶的業(yè)務(wù)系統(tǒng)相結(jié)合，或保存為TXT、Excel等文件格式。

我購買了通用印刷體識別資源包，各版本接口都可以使用嗎？
不可以。通用印刷體識別、通用印刷體識別（高速版）和通用印刷體識別（高精度版）是三個獨立的接口，各自的資源包不能混用。若您購買的是通用印刷體識別資源包，則僅限于該接口的使用。

文字識別OCR有哪些應(yīng)用場景？
OCR技術(shù)廣泛應(yīng)用于多個領(lǐng)域：它能自動識別圖片或視頻幀中的關(guān)鍵文字信息，使信息搜索與審核更加迅速和精準，極大地提升信息分發(fā)與管理水平。同時，OCR技術(shù)還可用于文檔電子化，如辦公文件、合同文檔、法律卷宗等，通過識別這些紙質(zhì)文檔中的文字信息，便于文件的保存、分類和檢索。

怎么提高識別的準確率和識別速度？
提高文字識別的準確率和速度，需注意以下幾點：確保拍攝光照、背景和清晰度適宜。建議上傳JPG格式的圖片，且文件大小不超過1M。在采集圖片時，盡可能放大要識別的文字區(qū)域，保證文字清晰可辨。適當壓縮圖片大小，也能有效縮短識別時間。

文字識別是否支持方向旋轉(zhuǎn)/不同朝向的圖片文字識別？
大多數(shù)文字識別能力已經(jīng)支持圖像方向的自動校正，可以正確識別旋轉(zhuǎn)的圖片中的文字。

文字識別是否可以批量識別？
目前，文字識別技術(shù)不支持批量識別。每次調(diào)用只能識別單張圖片，但您可以在QPS允許的范圍內(nèi)進行多線程調(diào)用。

可以識別PDF、Word、Excel等格式文件嗎？
目前支持JPG、JPEG、BMP、TIF、WebP等圖片格式及PDF文檔的識別，但暫不支持Word、Excel等格式。如需識別這些格式的文本，可先將其轉(zhuǎn)換為圖片或PDF格式后再進行上傳。

為什么文字識別結(jié)果不準確？
文字識別結(jié)果不準確可能有多種原因：圖片尺寸過小，低于15px；圖片畫質(zhì)差，如過暗、內(nèi)容不清晰；文字內(nèi)容被水印、印章或褶皺等遮擋；圖片樣式與接口支持類型不符，如身份證識別僅支持二代居民身份證。如遇錯誤碼，請參考相應(yīng)的錯誤碼進行問題排查。

身份證OCR是如何收費的？
身份證OCR的收費是按照調(diào)用接口的次數(shù)計算的。例如，若識別身份證的正反面各一次，則計費為兩次。具體價格詳情，請參閱我們的產(chǎn)品定價信息。

文字識別返回的文字類型和存儲方式是什么？
識別完成后，返回的結(jié)果是JSON格式的字符串。用戶可以根據(jù)需要選擇不同的存儲方式。

互億無線 · 文檔中心

OCR識別 - 常見問題

現(xiàn)在注冊，即享新用戶禮包!