Blog
/
Automation
智慧文件辨識2.0應用,AI+RPA 發票/文件處理自動化
Automation
UiPath

智慧文件辨識2.0應用,AI+RPA 發票/文件處理自動化

March 28, 2024

疫情趨緩後,相信很多企業已經開始看到另一波關於「企業數位轉型」的議題,很多企業主也又再次興起這個想要徹底變革的念頭,但同時又覺得這議題依舊太大,最後又再次行動癱瘓、不知從何下手?

其實,數位轉型議題可以先從最容易開始的「數位優化」開始,你可以不需大刀闊斧的改變整個商業模式,而是先從「營運流程面的自動化」開始,你就正式走在邁向數位轉型的漫漫長路上了。

特別是在這個加重凸顯「人力資源極其珍貴」的時期下,怎麼善用人力資源的擺放位置、人力資源利用效率?

很多準備導入UiPath流程機器人的企業客戶,都是從繁冗低效率的流程改善開始他們的數位轉型變革管理之路,

特別是從今天要分享的「文件處理流程自動化」開始,以下將帶你快速檢視自家企業正處在哪個數位優化成熟階段?以及什麼樣的解決方案組合最適合你。

一、為什麼數位優化要優先重視文件處理流程?

一家企業能否有效率的管理文件,跟其營運效率有高度相關,包含時間、人力資源、成本、資料安全等關鍵問題。

每家公司的各營運單位都會涉及「文件處理」,包含:有固定結構的文件( 例如 問卷調查表、客訴表等)、半結構式文件、非結構式文件

特別是跟財務有高度相關的文件 (e.g. 採購訂單、提貨單、發票、費用預算等) 以及跟商務資訊相關的重要文件 (e.g. Email、合約、會議記錄、內控文件、規章制度等)

這裡要談的不是企業文件管理系統,而是要談用什麼方式收集整合文件、擷取這些文件上的內容,再放到特定的管理系統內。

這三大類型的文件,從一家企業如何處理「半結構式文件&非結構式文件」的方式,即可看出其營運效率的程度、其數位優化的程度

例如:其文件內的資訊處理方式是人工擷取、還是自動擷取的? 人與系統工具之間的工作分配比例? 不同系統間的數據如何移動與整合?

這關乎的不只是運作上的效率(省時省力),同時也是資料的正確性,及其後續連帶的資料分析或財務面的風險管理。

二、文件處理流程的三階段成熟度表現

現在辦公室自動化盛行,如何自動化完成大量文件收集整理、再將內容輸入到對應系統內是辦公室自動化很重要的一環。

依照企業營運流程自動化的程度,一般會有三階段成熟度的表現,不同階段需要的是不同的解決方案,以下可檢視公司位在目前正處在哪一階段:

1. 從紙本文件變成電子檔案 (掃描器+OCR)

這階段還不能談所謂的「數位優化」,因為還在最基本的「紙本文件數位化」。這階段目標是把紙張上的內容變成數位文字,才能有後續的重新編輯、取用、搜尋等電腦上作業的動作。

若還在此階段,現階段主要利用的技術就是OCR光學字元辨識這項技術,將搜描後的圖片檔案轉成可編輯的文字檔案,而這個技術早在1960年代就已經出現了,也就是現在OCR軟體已經很容易取得、且應用也非常普及,就連通訊軟體Line都有內建OCR文字辨識功能,可以讓圖片轉成文字。

2. 電子檔案到內容擷取、進入系統(OCR+人工處理)

當大多數的文件已經是電子檔案的形式,且透過OCR技術轉成可編輯、可選取的元件型檔案後,接著你需要把這些電子檔案上的文字、數字等資料,輸入到某個系統或彙整在Excel表上等。

80%的企業都在這階段,用「人力」的方式,坐在電腦前,識別要在文件上的哪個地方擷取(複製)電子文件上的內容,再輸入(貼上)到某個系統或匯總表中。

以採購到付款(P2P)、訂單到收現(O2C) 的流程為例,都涉及到電子文件檔內容的擷取、輸入ERP系統、核准與驗證等動作。特別是製造產業、有上下游供應關係的行業領域,當配合的廠商很多時,每月可能會有數十萬筆以上的Invoice、訂單要處理。

現在絕大多數企業的處理方式,還是需以人力手動方式,一筆筆將資訊輸入系統,過程既耗時又有風險,因為會有人為輸入錯誤的可能,且一但錯誤發生,後續的帳單和供應商付款也會跟著出錯或延宕。

這是第二階段的文件處理流程成熟度,其實「流程自動化」的成熟度還很低,因為員工「浪費」在重新輸入、剪下和貼上訂單資料到各種系統中的「時間總數」,依舊很可觀。

3. 電子檔案到內容擷取、進入系統(OCR+RPA)

這是第二階段的進化版,也就是讓「RPA流程軟體機器人」上場發揮價值的地方。

上述員工做的事:打開每個電子文件檔案、選取複製需要的資訊、登入系統、輸入/貼上資訊等重複性動作,都可交由「RPA流程機器人」來執行。

RPA就像是電腦裡的小精靈,可以自動幫你執行例行工作中最瑣碎、最耗時、一直重複、生產率最低的事情

RPA是一種「營運流程自動化技術」,未來5年內,全球80%的企業,不分產業,都會優先採用的技術。

現在,任何人都有能力「設計自己專屬的軟體流程機器人」,就像擁有一位絕對聽從命令的私人助理,幫你高效、精準完成那些無聊又重複的流程。

看到這裡你可能會疑惑?

為什麼 RPA 流程機器人也可以把圖片 PDF 檔上的文字擷取下來?

因為 RPA 流程機器人也內建 OCR 功能啊!

RPA市場上銷售第一品牌的 UiPath 為例,就內建了2種OCR引擎讓使用者自己選擇,包含:

  1. Google OCR (使用開源的Tesseract OCR Engine)
  2. Microsoft OCR  (使用MODI OCR Engine)
  3. 需要另外安裝的
    1. Google Cloud OCR (需要Google Cloud API Key)
    2. Microsoft Cloud OCR (Microsoft Computer Vision API)

以下示範三種最基本的 UiPath 流程機器人可以做到的文件資訊擷取

  1. 擷取整張圖片型式的PDF檔內的文字資訊:只要使用兩個Activity像是「Find Image」、「Get OCR Text 」
  2. 擷取可選取文字型式的PDF檔內的資訊:使用「Find Element」、「Get Text 」兩個基本的Activity即可
  3. 擷取一份同時包含可被選取文字+圖片內有文字的PDF檔案:原本就可被選取的文字部分用「Read PDF Text」這個Activity來執行,圖片內有文字的部分就用「Read PDF with OCR」來處理

▶ 延伸參考:UiPath 內所有與 OCR 相關的Activities

UiPath-FindImage-GetOCRText
UiPath-FindElement-GetText
UiPath-ReadPDFText-Read PDF with OCR

以下影片示範一個「處理財務流程的RPA流程機器人」

自動化擷取發票上的必要資訊、並輸入到系統內,主要動作包含:

    1. 監控一個資料夾,當有任何一個新的Invoice PDF被丟進資料夾
    2. UiPath流程機器人會打開Invoice PDF
    3. 擷取我們預先指定他要擷取的必要資訊
    4. 接著UiPath流程機器人會打開、登入SAP
    5. 把剛剛擷取的資訊key-in SAP
    6. 最後UiPath流程機器人發Email通知負責這個流程的人,告訴負責人他完成任務了

三、進階難題:電子檔案文件格式太多樣

上面範例看起來似乎一切完美。

但如果正在閱讀此篇文章的你,是在有上下游供應關係的行業領域,合作廠商很多,例如高科技製造業,那麼每個月可能會有數十萬筆以上的Invoice、訂單要處理,且每家廠商的文件格式都不太一樣,該怎麼辦?

傳統 OCR 引擎的限制

傳統的OCR引擎,無法閱讀半結構化、非結構化資料,所以需要手動建立表格範本(e.g.客戶訂單表格範本),但同類型文件的版型只要有一點不一樣,就可能導致資料擷取的結果不一致,最後反而花更多時間在排解問題或驗證上。

有內建傳統OCR引擎的RPA流程機器人也會受到一些限制,像是:

  1. 讀取文件時,文件顯示比例需要固定
  2. 不同文件類型(如PDF、圖檔)需使用不同方式處理
  3. 較複雜文件內容(如表格)需使用正規表達式(RegExp)擷取內容
  4. 同類型文件的版型只要有一點不一樣,就需要設計新的機器人程式處理

有沒有更聰明的方式?OCR引擎能否自己有學習能力?學會自己辨識不同文件的格式?

這就是智慧文件辨識2.0的概念。

如果OCR本身是有AI能力的 (透過機器學習技術,而擁有自主辨別能力以應對不同情況),那麼內建AI-powered OCR的RPA流程機器人,就能在遇到各式各樣的發票、採購訂單、合約等半結構化、非結構化的文件時,繼續執行任務了。

(因為RPA流程機器人是典型的說一動做一動的數位助手,如果沒有預先教他要讀取特定文件的哪個部位,他是不會動作的)

如果OCR引擎本身有了學習能力,就不再需要把不同格式的文件,一個個建立範本,然後再指定RPA流程機器人在不同文件範本上的區塊去擷取需要的資訊

這種不夠聰明的工作方式,不是我們該忍受的。

這就是為什麼「AI-powered OCR+RPA」的概念必須被廣泛知道的原因。

四、智慧型的文件處理流程自動化(AI-powerd OCR+RPA)

現在,在「OCR軟體與智慧文件處理軟體」領域內,能做到具有AI能力、能自主辨識所有文件類型的智慧型文件處理( Intelligent Document Processing) OCR軟體 在全球不到20家。

目前,我們PGi樺鼎,已經實測過,現在位居全球領導地位的「資料擷取與文件處理企業級平台」與「UiPath」的整合應用。這就是「智慧文件辨識2.0解決方案」

這個解決方案,在辨識這段,具有強大的AI文件分類、資料擷取、與驗證能力,因為整合了自然語言處理(NLP)、 機器學習(ML)與OCR等技術,才有能力去處理傳統OCR做不到的事,像是:

  • 各種格式的文件類型  (特別是非結構化資料 e.g. Invoice、發票、報支、水電帳單等)
  • 不同儲存型式  (e.g. 圖檔、PDF、Email附件)
  • 和各類文件內容 (e.g. 文字、手寫、Barcode)

最終達到業界認可的OCR辨識準確度最高、能支援超過200種語言的智慧文件辨識解決方案

簡單來說,這個「有認知辨別能力的智慧文件辨識2.0」解法,是文件處理自動化的最高成熟度展現
  1. 就是傳統的OCR技術搭配運用「機器學習」技術,才有能力應對讀取各類型文件,進而精準擷取,解決大量資料耗時輸入的問題。
  2. 再結合RPA機器人流程自動化,最終實現具有AI能力,即有認知辨別能力的智慧文件辨識2.0!

▶ 預約申請 專門針對各種類型發票做智慧辨識的 Smart OCR +UiPath RPA 的「智慧文件辨識2.0解決方案」

五、線上RPA概念入門

如果還不是很明白 RPA 是什麼、UiPath 的流程機器人到底怎麼運作,推薦用1小時快速掌握RPA是什麼、為什麼RPA現在這麼熱門、怎麼納入應用日常工作流?

► 建議參加:RPA 概念入門+什麼是 UiPath

六、實測過通用性最高的「智慧文件辨識2.0」解法

如果已經很清楚 RPA是什麼、UiPath 流程機器人的運作邏輯,很想要趕快解決每個月有數十萬筆以上的Invoice 且訂單格式都不一樣的繁冗文件流程,

那就很推薦你參加以下的「進階應用分享」,打造最輕鬆、自動化程度最高的文件處理流程

看更多RPA應用

趨勢、教學、應用案例

前往了解

想直接深入討論?

歡迎直接來信

預約討論

Stay Informed with Our Newsletter

Get a summary of what we’ve shipped during the last month, behind the scenes updates, and team picks.

Thank you! Your subscription has been received!
Oops! Something went wrong. Please try again.
By submitting your email address, you agree to receive PGi’s monthly newsletter. You can always withdraw your consent.

Related Blog