fbpx

智慧文件辨識2.0應用,AI+RPA 發票/文件處理自動化

AI_powered OCR_UiPath RPA_文件辨識

為什麼我們寫這篇文章?

疫情趨緩後,相信很多企業已經開始看到另一波關於「企業數位轉型」的議題,很多企業主也又再次興起這個想要徹底變革的念頭,但同時又覺得這議題依舊太大,最後又再次行動癱瘓、不知從何下手?

其實,數位轉型議題可以先從最容易開始的「數位優化」開始,你可以不需大刀闊斧的改變整個商業模式,而是先從「營運流程面的自動化」開始,你就正式走在邁向數位轉型的漫漫長路上了。

特別是在這個加重凸顯「人力資源極其珍貴」的時期下,怎麼善用人力資源的擺放位置、人力資源利用效率?

很多準備導入UiPath流程機器人的企業客戶,都是從繁冗低效率的流程改善開始他們的數位轉型變革管理之路,

特別是從今天要分享的「文件處理流程自動化」開始,以下將帶你快速檢視自家企業正處在哪個數位優化成熟階段?以及什麼樣的解決方案組合最適合你。

 

一、為什麼數位優化要優先重視文件處理流程?

 

一家企業能否有效率的管理文件,跟其營運效率有高度相關,包含時間、人力資源、成本、資料安全等關鍵問題。

每家公司的各營運單位都會涉及「文件處理」,包含:有固定結構的文件( 例如 問卷調查表、客訴表等)、半結構式文件、非結構式文件

特別是跟財務有高度相關的文件 (e.g. 採購訂單、提貨單、發票、費用預算等) 以及跟商務資訊相關的重要文件 (e.g. Email、合約、會議記錄、內控文件、規章制度等)

這裡要談的不是企業文件管理系統,而是要談用什麼方式收集整合文件、擷取這些文件上的內容,再放到特定的管理系統內。

這三大類型的文件,從一家企業如何處理「半結構式文件&非結構式文件」的方式,即可看出其營運效率的程度、其數位優化的程度

例如:其文件內的資訊處理方式是人工擷取、還是自動擷取的? 人與系統工具之間的工作分配比例? 不同系統間的數據如何移動與整合?

這關乎的不只是運作上的效率(省時省力),同時也是資料的正確性,及其後續連帶的資料分析或財務面的風險管理。

 

二、文件處理流程的三階段成熟度表現

 

現在辦公室自動化盛行,如何自動化完成大量文件收集整理、再將內容輸入到對應系統內是辦公室自動化很重要的一環。

依照企業營運流程自動化的程度,一般會有三階段成熟度的表現,不同階段需要的是不同的解決方案,以下可檢視公司位在目前正處在哪一階段:

1. 從紙本文件變成電子檔案 (掃描器+OCR)

這階段還不能談所謂的「數位優化」,因為還在最基本的「紙本文件數位化」。這階段目標是把紙張上的內容變成數位文字,才能有後續的重新編輯、取用、搜尋等電腦上作業的動作。

若還在此階段,現階段主要利用的技術就是OCR光學字元辨識這項技術,將搜描後的圖片檔案轉成可編輯的文字檔案,而這個技術早在1960年代就已經出現了,也就是現在OCR軟體已經很容易取得、且應用也非常普及,就連通訊軟體Line都有內建OCR文字辨識功能,可以讓圖片轉成文字。

2. 電子檔案到內容擷取、進入系統(OCR+人工處理)

當大多數的文件已經是電子檔案的形式,且透過OCR技術轉成可編輯、可選取的元件型檔案後,接著你需要把這些電子檔案上的文字、數字等資料,輸入到某個系統或彙整在Excel表上等。

80%的企業都在這階段,用「人力」的方式,坐在電腦前,識別要在文件上的哪個地方擷取(複製)電子文件上的內容,再輸入(貼上)到某個系統或匯總表中。

以採購到付款(P2P)、訂單到收現(O2C) 的流程為例,都涉及到電子文件檔內容的擷取、輸入ERP系統、核准與驗證等動作。特別是製造產業、有上下游供應關係的行業領域,當配合的廠商很多時,每月可能會有數十萬筆以上的Invoice、訂單要處理。

現在絕大多數企業的處理方式,還是需以人力手動方式,一筆筆將資訊輸入系統,過程既耗時又有風險,因為會有人為輸入錯誤的可能,且一但錯誤發生,後續的帳單和供應商付款也會跟著出錯或延宕。

這是第二階段的文件處理流程成熟度,其實「流程自動化」的成熟度還很低,因為員工「浪費」在重新輸入、剪下和貼上訂單資料到各種系統中的「時間總數」,依舊很可觀

3. 電子檔案到內容擷取、進入系統(OCR+RPA)

這是第二階段的進化版,也就是讓「RPA流程軟體機器人」上場發揮價值的地方。

上述員工做的事:打開每個電子文件檔案、選取複製需要的資訊、登入系統、輸入/貼上資訊等重複性動作,都可交由「RPA流程機器人」來執行。

RPA就像是電腦裡的小精靈,可以自動幫你執行例行工作中最瑣碎、最耗時、一直重複、生產率最低的事情

RPA是一種「營運流程自動化技術」,未來5年內,全球80%的企業,不分產業,都會優先採用的技術

現在,任何人都有能力「設計自己專屬的軟體流程機器人」,就像擁有一位絕對聽從命令的私人助理,幫你高效、精準完成那些無聊又重複的流程。

看到這裡你可能會疑惑?

為什麼RPA流程機器人也可以把圖片PDF檔上的文字擷取下來?

因為RPA流程機器人也內建OCR功能啊!

RPA市場上銷售第一品牌的UiPath為例,就內建了6種OCR引擎讓使用者自己選擇,包含:

    1. Google OCR (使用開源的Tesseract OCR Engine)
    2. Google Cloud OCR (需要Google Cloud API Key)
    3. Microsoft OCR  (使用MODI OCR Engine)
    4. Microsoft Cloud OCR (Microsoft Computer Vision API)
    5. ABBYY OCR  ( 其中專門針對各種類型發票做智慧辨識的FlexiCapture表現超群,但需另外租賃授權,可來信詢問細節或申請試用)
    6. ABBYY Cloud OCR (需另外租賃授權,詳情點此

以下示範三種最基本的UiPath流程機器人可以做到的文件資訊擷取

    1. 擷取整張圖片型式的PDF檔內的文字資訊:只要使用兩個Activity像是「Find Image」、「Get OCR Text 」
    2. 擷取可選取文字型式的PDF檔內的資訊:使用「Find Element」、「Get Text 」兩個基本的Activity即可
    3. 擷取一份同時包含可被選取文字+圖片內有文字的PDF檔案:原本就可被選取的文字部分用「Read PDF Text」這個Activity來執行,圖片內有文字的部分就用「Read PDF with OCR」來處理

▶ 延伸參考:UiPath內所有與OCR相關的Activities 

UiPath-FindImage-GetOCRText

UiPath-FindElement-GetText

UiPath-ReadPDFText-Read PDF with OCR

以下影片示範一個「處理財務流程的RPA流程機器人」

自動化擷取發票上的必要資訊、並輸入到系統內,主要動作包含:

    1. 監控一個資料夾,當有任何一個新的Invoice PDF被丟進資料夾
    2. UiPath流程機器人會打開Invoice PDF
    3. 擷取我們預先指定他要擷取的必要資訊
    4. 接著UiPath流程機器人會打開、登入SAP
    5. 把剛剛擷取的資訊key-in SAP
    6. 最後UiPath流程機器人發Email通知負責這個流程的人,告訴負責人他完成任務了

 

三、進階難題:電子檔案文件格式太多樣

 

上面範例看起來似乎一切完美。

但如果正在閱讀此篇文章的你,是在有上下游供應關係的行業領域,合作廠商很多,例如高科技製造業,那麼每個月可能會有數十萬筆以上的Invoice、訂單要處理,且每家廠商的文件格式都不太一樣,該怎麼辦

傳統OCR引擎的限制

傳統的OCR引擎,無法閱讀半結構化、非結構化資料,所以需要手動建立表格範本(e.g.客戶訂單表格範本),但同類型文件的版型只要有一點不一樣,就可能導致資料擷取的結果不一致,最後反而花更多時間在排解問題或驗證上。

有內建傳統OCR引擎的RPA流程機器人也會受到一些限制,像是:

    1. 讀取文件時,文件顯示比例需要固定
    2. 不同文件類型(PDF、圖檔)需使用不同方式處理
    3. 較複雜文件內容(如表格)需使用正規表達式(RegExp)擷取內容
    4. 同類型文件的版型只要有一點不一樣,就需要設計新的機器人程式處理

有沒有更聰明的方式?OCR引擎能否自己有學習能力?學會自己辨識不同文件的格式?

這就是智慧文件辨識2.0的概念。

如果OCR本身是有AI能力的 (透過機器學習技術,而擁有自主辨別能力以應對不同情況),那麼內建AI-powered OCR的RPA流程機器人,就能在遇到各式各樣的發票、採購訂單、合約等半結構化、非結構化的文件時,繼續執行任務了

(因為RPA流程機器人是典型的說一動做一動的數位助手,如果沒有預先教他要讀取特定文件的哪個部位,他是不會動作的)

如果OCR引擎本身有了學習能力,就不再需要把不同格式的文件,一個個建立範本,然後再指定RPA流程機器人在不同文件範本上的區塊去擷取需要的資訊

這種不夠聰明的工作方式,不是我們該忍受的。

這就是為什麼AI-powered OCR+RPA」的概念必須被廣泛知道的原因。

四、智慧型的文件處理流程自動化(AI-powerd OCR+RPA)

 

現在,在「OCR軟體與智慧文件處理軟體」領域內,能做到具有AI能力、能自主辨識所有文件類型的智慧型文件處理( Intelligent Document Processing) OCR軟體在全球不到20家。

目前位居全球領導地位的廠商就是ABBYY這家公司,從1989年成立以來就一直專注在做資料擷取與文件處理的企業級平台。

其中 ABBYY 的 FlexiCapture,已經具有強大的AI文件分類、資料擷取、與驗證能力,因為整合自然語言處理(NLP)、 機器學習(ML)與OCR等技術,才有能力處理像是:

    • 各種格式的文件類型  (特別是非結構化資料 e.g. Invoice、發票、報支、水電帳單等)
    • 不同儲存型式  (e.g. 圖檔、PDF、Email附件)
    • 和各類文件內容 (e.g. 文字、手寫、Barcode)

最終達到業界認可的OCR辨識準確度最高、能支援超過200種語言的智慧文件辨識解決方案

我們目前實測過,在擷取中文圖片與文字效果部分,ABBYY FlexiCapture 目前不支援中文手寫辦識,但支援中文的電子文字格式,中文圖文的效果會依圖片的相素高低有所影響。

但總的來說,ABBYY的OCR能力果真還是市面上解決方案最好的

若有需要協助申請試用做測試,很歡迎直接與我們聯繫

ABBYY的FlexiCapture與UiPath RPA流程機器人的無縫整合,強強聯手合作:智慧文件辨識2.0

簡單來說,ABBYY是能夠理解沒有固定格式文件的智慧之眼,而UiPath則是負責高效率、使命必達的執行雙手。

▶ 延伸資源:ABBYY – FlexiCapture Connector for UiPath

以下示範兩個軟體:UiPath RPA流程機器人(深藍色) 如何跟ABBYY FlexiCapture(紅色)互相搭配合作,完成一個「智慧文件辨識2.0流程」

看到這裡,就是文件處理自動化的最高成熟度展現就是傳統的OCR技術搭配運用「機器學習」技術,才有能力應對讀取各類型文件,進而精準擷取,解決大量資料耗時輸入的問題,再結合RPA機器人流程自動化,最終實現具有AI能力,即有認知辨別能力的智慧文件辨識2.0

UiPath + ABBYY FC智慧文件辨識流程

▶ 預約申請 專門針對各種類型發票做智慧辨識的ABBYY FlexiCapture OCR +UiPath RPA

 

五、線上RPA概念入門

 

如果還不是很明白RPA是什麼、UiPath的流程機器人到底怎麼運作,推薦用1小時快速掌握RPA是什麼、為什麼RPA現在這麼熱門、怎麼納入應用日常工作流?

► 免費報名:08/18(二)RPA概念入門+什麼是UiPath

► 線上進行流程:以講師示範特定流程為主,且線上參與者「不強制要求必須跟著操作」

    • 13:50-14:00,開放上線準備
    • 14:00-14:30,RPA概念介紹&UiPath介紹
    • 14:30-14:50,示範如何設計一個流程的自動化
    • 14:50-15:00,問答交流、活動回饋+禮券回饋

► 每家公司體驗人數:不限

► 參與準備 (optional) :歡迎下載試用UiPath Studio Community ,可參考本篇文章下載指示

► 線上會議連結:活動前一天將 Email 會議連結給您

► 立即報名:08/18(二)RPA概念入門+什麼是UiPath

六、免費下載:RPA與我的未來職涯關係

 

未來的工作型態很確定是「人機合作」, 因此RPA與每一個人未來職涯的關係,其實是合作,而非替代關係。

RPA會是我們工作產出效率的加分助手,因為當你懂得利用RPA,你將能有更多時間,發展對自己有持續升值的軟硬技能,而非花時間在重複性、對自己的能力毫無幫助的事情上。

「人機合作」是一個必要的思維轉變:你將會從恐懼思維到駕馭主導的積極思維。而聰明開放的你, 相信你不會有「害怕被機器人取代」的恐懼思維。

但如果你身旁的同事、朋友還有這些疑惑或恐懼,我們很推薦分享這份電子書給他們

►  兩種免費包下載:工作任務分析指南+RPA與我的未來職涯關係

帶你快速了解RPA概念&為什麼UiPath是500強企業首選

1小時線上分享 @ 2020.08.18(二)

UiPath 是目前全球估值最高的 RPA + AI 公司,致力讓每一位現代數位工作者,提高「創造性」工作的比例,提升工作滿意度。

截至目前,UiPath 已經被全球4,000多家組織採用,其中包括前10大財富500強中的8家。其他知名企業像是Uber、HP惠普、麥當勞、NASA 和 Virgin Media 也都是UiPath的客戶。

不論你是在IT單位或營運單位,只要你會使用電腦,且每日開啟電腦工作,工作流程中包含一些有規則性、很機械化、但又高準確率要求的重複性動作,絕對會因為RPA而受益!

台灣企業導入RPA | 用UiPath自動化報表整理工作 RPA導入案例 || 用UiPath加速品質檢驗流程

搶先登記!職場高薪硬技能 Tableau Skill 培訓班, 7/31以前,「限量30張」75折課程優惠券

了解更多
X