Blog
/
Automation
Smart OCR 是什麼?什麼情況最適合使用?
Automation
ABBYY

Smart OCR 是什麼?什麼情況最適合使用?

March 28, 2024

在2020年,原本還在觀望RPA是什麼的企業,已經開始大動作採取行動,陸續加入採用RPA的行列。

PGi樺鼎也在一年內,透過6場 認識RPA與UiPath介紹活動,接觸近350家企業後,發現在RPA應用上,詢問度最高的,是企業內最最常見的Invoice與發票、訂單處理、單據資訊勾稽等需要辨識內容後才能下一步處理的文件流程。

只要有邏輯性的流程脈絡,都是 RPA 可以發揮的地方。但要能因應各類型的文件格式、並精準擷取內容,就需要另外利用能自動辨識學習的AI-powered OCR才能做的徹底了。

此篇將帶你了解:什麼樣的情況最需要 Smart OCR 的加入?

一、先釐清 OCR 跟 Smart OCR 的最大差異

OCR,全名是「光學字元辨識 Optical Character Recognition 」,是一個已經很常見的技術,主要就是將圖片上的文字資料進行辨識,並擷取出來讓你可以再做編輯使用。

例如:在通訊軟體Line上,如果有人傳了一張圖片給你,圖片上有文字,你可以直接在圖片右上角按下「A」的標符,就可直接將文字擷取出來,原本在圖片上的文字被擷取出來可再編輯利用分享出去,這就是利用OCR的技術,是很日常的應用。

那,Smart OCR 又是什麼?

最大差異是,可以做到更細膩的處理,用Smart OCR的目的,最主要不是要把圖片上的所有文字擷取出來,而是希望去擷取「特定欄位」或「特定位置」的資訊,再進一步透過RPA流程機器人輸入到對應的系統或表單中。

所以,衡量準確度的重點也不同

  • 一般 OCR 關注的:同一張圖片,擷取出來的文字有多少%是正確、多少%是錯誤的,例如:100個字到底正確幾個字?
  • Smart OCR 關注的:能正確抓到特定欄位、特定位置上的資訊的正確率是多少

二、了解要處理的文件是什麼類型

依照文件內容可否被直接選取,分為

  • 文字式文件 (可選取裡面的文字)
  • 圖片式文件 (整張圖片、內容不可選取):一定要透過OCR技術才能把圖片內的文字擷取出來。

依照文件的格式架構,分為

  • 結構式:都是固定的格式架構,例如:問卷調查表
  • 半結構式:一部分結構是固定的,一部分是變動的,例如:上半部是固定的,下半部的表格內還有小表格、欄位內的資訊跨欄等狀況,複雜度較高。常見例如:訂單、發票、提貨單等。這是企業最常遇到、最棘手的文件處理類型,這也是Smart OCR最主要要解決的類型。
  • 非結構式:信件、合約,若要擷取真正有意義的資訊,就要搭配NLP深度理解文件的內容。

三、設計一個最佳的Smart OCR 智慧文件辨識處理流程

若企業情況符合以下,就適合更進一步考慮利用Smart OCR搭配RPA流程機器人,改善企業內的文件處理流程效率。

    1. 希望要自動化處理的文件是對財務結果面、客戶信賴感具有影響力的、不能有人工出錯的風險、講求處理效率(例如:Top 20 重點客戶的大量訂單、申貸文件處理)
    2. 文件本身是屬於圖片式文件 (整張圖片、內容不可選取) 與 半結構式文件
    3. 每一次的處理量很多、每年處理的次數也很高(量大、頻率高的標準,由企業自行定義)

一般智慧文件辨識流程會分為兩階段:設計階段&執行階段

(1) 在設計階段:
  • 建立文件定義:包含文件類型、鎖定哪些特定欄位
  • 建立文件分類器:當有新的文件產生時,可以透過分類器先做分類
  • 建立資料擷取模型:針對各種不同的文件,設計相對應的資料擷取模型

以上設計階段,可以很複雜繁瑣、但也可以利用機器學習方式讓事情變得更簡單智慧。

(2) 執行階段:
  • 文件載入:可以透過不同管道自動載入,不管是透過掃瞄器進來的電子檔案、或Email內的夾帶附檔,都可以透過前一階段建立的文件分類器&資料擷取模型,快速分類文件與擷取特定欄位內的資料。
  • 若擷取出來的品質好,可以直接跳過人工驗證,用自動化方式輸入到對應的系統內。
  • 也可透過一些條件的設定,讓某些辨識結果沒有那麼好的文件,進入人工驗證的關卡,做辨識結果的修正,並把這些修正結果,回饋到原本建立的分類器與擷取模型,透過機器學習的機制,持續修正文件分類器與資料擷取模型的準確度。

四、智慧型的文件處理流程自動化 AI-Powered OCR+RPA

現在,在「OCR軟體與智慧文件處理軟體」領域內,能做到具有AI能力、能自主辨識所有文件類型的智慧型文件處理( Intelligent Document Processing) OCR軟體 在全球不到20家。

目前,我們PGi樺鼎,已經實測過,現在位居全球領導地位的「資料擷取與文件處理企業級平台」與「UiPath」的整合應用。這就是「智慧文件辨識2.0解決方案」

這個解決方案,在辨識這段,具有強大的AI文件分類、資料擷取、與驗證能力,因為整合了自然語言處理(NLP)、 機器學習(ML)與OCR等技術,才有能力去處理傳統OCR做不到的事,像是:

  • 各種格式的文件類型  (特別是非結構化資料 e.g. Invoice、發票、報支、水電帳單等)
  • 不同儲存型式  (e.g. 圖檔、PDF、Email附件)
  • 和各類文件內容 (e.g. 文字、手寫、Barcode)

最終達到業界認可的OCR辨識準確度最高、能支援超過200種語言的智慧文件辨識解決方案

簡單來說,這個「有認知辨別能力的智慧文件辨識2.0」解法,是文件處理自動化的最高成熟度展現
  1. 就是傳統的OCR技術搭配運用「機器學習」技術,才有能力應對讀取各類型文件,進而精準擷取,解決大量資料耗時輸入的問題。
  2. 再結合RPA機器人流程自動化,最終實現具有AI能力,即有認知辨別能力的智慧文件辨識2.0!

▶ 預約詢問 專門針對各種類型文件的 Smart OCR +UiPath RPA 「智慧文件辨識2.0解決方案」

五、線上RPA概念入門

如果還不是很明白RPA是什麼、UiPath的流程機器人到底怎麼運作,推薦用1小時快速掌握RPA是什麼、為什麼RPA現在這麼熱門、怎麼納入應用日常工作流?

► 立即申請觀看影片:RPA概念入門+什麼是UiPath

回到RPA資源列表

趨勢、教學、應用案例

前往了解

想直接深入討論?

歡迎直接來信

預約討論

Stay Informed with Our Newsletter

Get a summary of what we’ve shipped during the last month, behind the scenes updates, and team picks.

Thank you! Your subscription has been received!
Oops! Something went wrong. Please try again.
By submitting your email address, you agree to receive PGi’s monthly newsletter. You can always withdraw your consent.

Related Blog