眾所周知,文檔資料承載著一個企業的發展記憶、經驗以及成果,一般管理只停留在個人或部門層面,這些重要的文檔會因為員工離職而丟失,因為時間推移而失去記憶,也會因為使用不規范而出現遺失、損壞,更有被惡意擴散導致形成損失的可能。紹林科技通過30余年的努力已成為知識管理解決方案的開發、供應與運營專家,能為客戶提供各式各樣的知識類信息管理解決方案,紹林科技自主研發的知識管理系統品牌會博通能夠提供圖片、PDF文件的在線OCR服務,正確配置好OCR服務的相關參數后,當用戶上傳掃描圖片文件后,系統將會分派一個后臺任務,在系統空閑的時候,對文件進行文字識別成為文本文件,以方便系統進行全文檢索和再利用。
會博通文檔一體化管理系統的用戶也可以在文件屬性頁面,或郵件的附件列表頁面,查看OCR的成果文件(按鈕名稱為文本)。
因為進行OCR識別需要訪問百度智能云AI服務器,所以,系統管理員應確認是否具備互聯網連接條件,并預先申請百度智能云賬號,配置好系統參數。OCR的識別效果,與圖片的質量密切相關。
注冊百度智能云帳號
登錄百度AI官網然后注冊百度智能云AI帳號,點擊控制臺-文字識別-創建應用。然后填寫應用程序名和應用類型,創建應用。進入應用列表后可以查看應用的API Key和Secret Key。
百度AI,一般普通識別,提供每天5萬次的免費識別額度,對于一般用戶已經足夠,如果有特殊需求的用戶也可以購買百度的OCR額度。具體可以參考百度的相關資料或咨詢百度客服。
配置會博通OCR
說明:
會博通文檔一體化管理系統對于相關文件的處理:
1、 會將圖片文件通過OCR轉換為文本文件,以供搜索與利用。
2、 會將PDF文件里面的圖片通過OCR轉換為文本,并聯同PDF文件中已有的格式文本,轉換為文本文件。
3、 會將CAD文件中的文本抽取出來,保存為文本文件,以供搜索和再利用。
4、 OCR結果文本文件的瀏覽按鈕位于屬性和郵件中的文件列表的右側,名稱為文本。