李 碩,李鳳至,雷 鵬,李 揚(yáng)
(中國(guó)郵政儲(chǔ)蓄銀行股份有限公司山東省分行,濟(jì)南 250101)
(1)OCR 技術(shù)成功應(yīng)用于諸多領(lǐng)域。光學(xué)字符識(shí)別(Optical Character Recognition,簡(jiǎn)稱OCR),是指電子設(shè)備檢查紙上打印的字符,通過檢測(cè)暗、亮的模式確定其形狀,然后用字符識(shí)別方法將形狀翻譯成計(jì)算機(jī)文字。OCR 技術(shù)已應(yīng)用于很多領(lǐng)域,如證件識(shí)別、銀行卡識(shí)別、車牌識(shí)別、名片識(shí)別、汽車VIN 碼識(shí)別、票據(jù)識(shí)別、圖片文件識(shí)別等,其應(yīng)用場(chǎng)景還在逐步擴(kuò)展。營(yíng)改增后增值稅發(fā)票樣式的統(tǒng)一和財(cái)務(wù)報(bào)賬影像系統(tǒng)的應(yīng)用,為OCR 技術(shù)在財(cái)務(wù)審計(jì)領(lǐng)域的應(yīng)用創(chuàng)造了客觀條件。
(2)財(cái)務(wù)審計(jì)現(xiàn)狀分析。一是財(cái)務(wù)審計(jì)工作量大。傳統(tǒng)的銀行財(cái)務(wù)審計(jì)工作中,一個(gè)財(cái)務(wù)審計(jì)或經(jīng)濟(jì)責(zé)任審計(jì)項(xiàng)目中,涉及財(cái)務(wù)會(huì)計(jì)憑證抽樣的科目多達(dá)幾十個(gè),財(cái)務(wù)審計(jì)人員需要針對(duì)每個(gè)科目抽查一定筆數(shù)的會(huì)計(jì)憑證,并對(duì)這些會(huì)計(jì)憑證及其附件逐筆逐張查看比對(duì),審查其合規(guī)性、真實(shí)性、完備性,但無法快速高效地將同類費(fèi)用或同一時(shí)段報(bào)銷憑證進(jìn)行批量比對(duì)核查。目前財(cái)務(wù)審計(jì)領(lǐng)域的非現(xiàn)場(chǎng)分析技術(shù)有限,針對(duì)報(bào)賬憑證圖片等非結(jié)構(gòu)化數(shù)據(jù),審計(jì)人員無法快速定位相關(guān)信息位置和快速提取報(bào)賬影像的關(guān)鍵要素,耗費(fèi)大量時(shí)間,抽樣量較為有限,審計(jì)效率亟待提升。二是審計(jì)人員有限。審計(jì)隊(duì)伍面臨的最大困難是人員不足、人才短缺。財(cái)務(wù)類高水平復(fù)合型審計(jì)人才較少,人員知識(shí)結(jié)構(gòu)單一、精力有限,針對(duì)繁雜的財(cái)務(wù)憑證,在有限的現(xiàn)場(chǎng)審計(jì)時(shí)間內(nèi)完成規(guī)定審計(jì)任務(wù)存在一定的困難,審計(jì)的深度和精準(zhǔn)度也受到制約。
(3)OCR 技術(shù)的逐漸成熟為提升財(cái)務(wù)審計(jì)價(jià)值提供了可行方案。一是通過OCR 技術(shù)實(shí)現(xiàn)發(fā)票信息自動(dòng)提取,審計(jì)人員可以在非現(xiàn)場(chǎng)分析階段對(duì)財(cái)務(wù)報(bào)賬影像系統(tǒng)中的非結(jié)構(gòu)化發(fā)票影像進(jìn)行識(shí)別,并將發(fā)票中的有用信息歸集輸出,形成非常有價(jià)值的結(jié)構(gòu)化數(shù)據(jù)表,通過對(duì)此數(shù)據(jù)表進(jìn)行充分的數(shù)據(jù)挖掘,可以在非現(xiàn)場(chǎng)階段鎖定問題線索,節(jié)約大量的現(xiàn)場(chǎng)審計(jì)時(shí)間,更快速、高效地完成審計(jì)要點(diǎn),靶向施力、精準(zhǔn)審計(jì)。二是借助OCR 通用文本識(shí)別技術(shù)定位關(guān)鍵字,在海量憑證影像中快速搜索出有用信息,實(shí)現(xiàn)批量財(cái)務(wù)憑證分析,進(jìn)一步拓展審計(jì)廣度和深度,有效降低審計(jì)風(fēng)險(xiǎn)。如果在非現(xiàn)場(chǎng)審計(jì)分析平臺(tái)嵌入相關(guān)審計(jì)模型,還能夠敏銳識(shí)別風(fēng)險(xiǎn)、發(fā)揮預(yù)警作用,及早揭示問題,促進(jìn)內(nèi)控機(jī)制及時(shí)完善,提升審計(jì)時(shí)效性和審計(jì)成果價(jià)值,維護(hù)企業(yè)資金安全。
由于報(bào)賬系統(tǒng)中同一單位的憑證按時(shí)間順序排列,財(cái)務(wù)審計(jì)人員往往需要對(duì)抽樣憑證逐個(gè)查看,對(duì)同類報(bào)賬事項(xiàng)的綜合性分析不足。以銀行財(cái)務(wù)報(bào)賬影像系統(tǒng)為切入點(diǎn),利用OCR 技術(shù)提取增值稅發(fā)票關(guān)鍵信息形成數(shù)據(jù)表進(jìn)行穿透式分析,可嘗試實(shí)現(xiàn)如下應(yīng)用流程及場(chǎng)景。
(1)自動(dòng)下載財(cái)務(wù)憑證影像并命名。審計(jì)人員結(jié)合審計(jì)重點(diǎn),按照相關(guān)科目在報(bào)賬系統(tǒng)中下載由逐個(gè)報(bào)銷單匯總的統(tǒng)計(jì)表(簡(jiǎn)稱《報(bào)銷查詢表》),利用RPA(機(jī)器人流程自動(dòng)化)工具根據(jù)《報(bào)銷查詢表》中的“報(bào)銷單號(hào)”字段從報(bào)賬系統(tǒng)逐筆下載報(bào)賬憑證影像,將報(bào)賬憑證影像保存至《20××年×月—20××年×月報(bào)賬憑證影像查詢》總文件夾內(nèi),每筆報(bào)賬憑證影像以“報(bào)銷單號(hào)”字段為文件夾名保存至文件夾內(nèi)。
(2)自動(dòng)識(shí)別增值稅發(fā)票影像并生成相關(guān)審計(jì)數(shù)據(jù)表。從增值稅發(fā)票影像中提取“購(gòu)買方名稱”“銷售方名稱”“銷售方地址”“銷售方電話”“貨物或應(yīng)稅勞務(wù)、服務(wù)名稱”“規(guī)格型號(hào)”“單位”“數(shù)量”“單價(jià)”“金額”“稅率”“價(jià)稅合計(jì)”“開票日期”“發(fā)票代碼”“發(fā)票號(hào)碼”信息。將提取的信息按發(fā)票代碼和號(hào)碼,自動(dòng)回填到《報(bào)銷查詢表》對(duì)應(yīng)的行,若一張發(fā)票中含多行貨物,則在對(duì)應(yīng)的發(fā)票代碼和號(hào)碼行下方插入新的行填入。
(3)OCR 發(fā)票信息提取應(yīng)用場(chǎng)景。結(jié)合審計(jì)要點(diǎn)可針對(duì)回填之后生成的《報(bào)銷查詢表》,進(jìn)行數(shù)據(jù)挖掘和匯總分析。
①費(fèi)用入賬的及時(shí)性。如:從《報(bào)銷查詢表》中2020年計(jì)列費(fèi)用科目的事項(xiàng)中,篩選發(fā)票“開票日期”非2020 年度的事項(xiàng),可以發(fā)現(xiàn)跨年度計(jì)列費(fèi)用、調(diào)節(jié)損益的項(xiàng)目。
②單價(jià)的合規(guī)合理性。如:從《報(bào)銷查詢表》中篩選“貨物或應(yīng)稅勞務(wù)、服務(wù)名稱”為住宿費(fèi)的事項(xiàng),通過“單價(jià)”批量篩查差旅費(fèi)中是否存在超標(biāo)準(zhǔn)住宿的情況。再如:按“貨物或應(yīng)稅勞務(wù)、服務(wù)名稱”“規(guī)格型號(hào)”兩個(gè)字段進(jìn)行分類匯總,對(duì)報(bào)銷的同類物品單價(jià)進(jìn)行分析,篩選相同貨物名稱和規(guī)格型號(hào)但單價(jià)相差較大報(bào)銷事項(xiàng),可結(jié)合現(xiàn)場(chǎng)審計(jì)對(duì)采購(gòu)價(jià)格差異較大的原因進(jìn)一步核實(shí)。又如:對(duì)單價(jià)超過一定標(biāo)準(zhǔn)的物品,按照固定資產(chǎn)管理辦法應(yīng)建立固定資產(chǎn)卡片予以資本化核算,通過單價(jià)篩選可以有效發(fā)現(xiàn)資本性支出費(fèi)用化的情況。
③資金流向的合規(guī)性。如:從《報(bào)銷查詢表》中篩選發(fā)票“銷售方名稱”與報(bào)銷資金實(shí)際收款方不一致的報(bào)銷事項(xiàng),核查是否存在資金流向不合規(guī)的情形。再如:篩選“購(gòu)買方名稱”與報(bào)賬單位不匹配的事項(xiàng),核查是否存在單位報(bào)銷個(gè)人應(yīng)承擔(dān)的費(fèi)用等情況。
④采購(gòu)數(shù)量的合理性。如:對(duì)一段時(shí)間內(nèi),同一單位報(bào)銷的修理費(fèi)等按“貨物或應(yīng)稅勞務(wù)、服務(wù)名稱”“數(shù)量”分類匯總,分析是否存在數(shù)量不合理的情況。對(duì)數(shù)量異常偏高的情況,結(jié)合現(xiàn)場(chǎng)審計(jì)訪談、盤點(diǎn)等方法進(jìn)一步核查。
⑤集中采購(gòu)制度執(zhí)行情況。如:對(duì)“貨物或應(yīng)稅勞務(wù)、服務(wù)名稱”中屬于上級(jí)集中采購(gòu)范圍內(nèi)的事項(xiàng),核查其供應(yīng)商是否在集中采購(gòu)準(zhǔn)入的供應(yīng)商范圍內(nèi),精準(zhǔn)發(fā)現(xiàn)違反集中采購(gòu)制度的情況。
由于銀行報(bào)賬影像系統(tǒng)中,費(fèi)用類報(bào)賬憑證居多,一筆報(bào)賬憑證往往有十幾張甚至幾十張憑證附件的影像,且系統(tǒng)中影像多為單張獨(dú)立的影像,要對(duì)一筆憑證進(jìn)行審查,需要逐張影像查看,耗時(shí)費(fèi)力。為了幫助審計(jì)人員從大量的憑證影像中快速搜索定位所需查找的關(guān)鍵信息,OCR 關(guān)鍵字識(shí)別技術(shù)可嘗試應(yīng)用如下流程及場(chǎng)景。
(1)憑證影像搜索關(guān)鍵字。在導(dǎo)出的報(bào)賬影像中,搜索有某一特定字樣的影像,比如“預(yù)算”。對(duì)有此字樣的影像,將此字樣按報(bào)賬單號(hào)標(biāo)注在《報(bào)銷查詢表》中,若可行提取字段后對(duì)應(yīng)的信息,將有此字樣的圖片的路徑(含所在文件夾名和圖片名)按報(bào)銷單號(hào)列入《報(bào)銷查詢表》對(duì)應(yīng)行中,作為重點(diǎn)抽樣關(guān)注對(duì)象。
(2)OCR 關(guān)鍵字識(shí)別技術(shù)應(yīng)用場(chǎng)景。對(duì)于不同會(huì)計(jì)科目的入賬事項(xiàng),財(cái)務(wù)審計(jì)時(shí)往往有不同的關(guān)注點(diǎn)。采用關(guān)鍵字識(shí)別技術(shù),有利于針對(duì)特定類別的審計(jì)事項(xiàng),按照審計(jì)人員指定的關(guān)鍵字搜索信息,進(jìn)行精準(zhǔn)抽樣。
①對(duì)公務(wù)接待等事項(xiàng)是否嚴(yán)格落實(shí)中央“八項(xiàng)規(guī)定”精神的核查。如:在公務(wù)招待費(fèi)報(bào)賬影像中搜索含有“特產(chǎn)”“煙”“酒”的報(bào)銷事項(xiàng),結(jié)合招待清單等其他報(bào)銷單據(jù)進(jìn)行重點(diǎn)核查。再如:在差旅費(fèi)報(bào)賬影像中搜索含有火車票一等座的報(bào)銷事項(xiàng),結(jié)合差旅費(fèi)報(bào)銷審批單等信息進(jìn)行比對(duì),核查是否存在超標(biāo)準(zhǔn)乘坐交通工具的行為。
②對(duì)費(fèi)用預(yù)算執(zhí)行情況的核查。如:對(duì)于會(huì)議費(fèi)報(bào)銷影像,通過OCR 技術(shù)搜索含有“預(yù)算”金額的會(huì)議審批單或簽報(bào)所在的影像,輔助審計(jì)人員快速查找出關(guān)鍵信息,與實(shí)際報(bào)銷金額進(jìn)行比對(duì),判斷有無超預(yù)算支出的情形。
③對(duì)審批手續(xù)完備性的核查。如:對(duì)應(yīng)有上級(jí)行批復(fù)文件的重要事項(xiàng),在其報(bào)賬影像中搜索“批復(fù)”字樣,如果OCR 反饋未查找到含此字樣的影像,則須作為重點(diǎn)進(jìn)行進(jìn)一步核查,關(guān)注是否存在超越權(quán)限實(shí)施的財(cái)務(wù)事項(xiàng)。
④對(duì)合同執(zhí)行情況的核查。如:對(duì)于附有合同的大額報(bào)賬事項(xiàng),通過OCR 技術(shù)在其報(bào)賬影像中搜索含有“標(biāo)的額”“履行期”等字樣的影像,與實(shí)際報(bào)銷金額、費(fèi)用期間進(jìn)行比對(duì),判斷是否存在超出合同金額采購(gòu)、逆流程實(shí)施等情況。
(1)要識(shí)別的影像清晰度不統(tǒng)一影響OCR 技術(shù)識(shí)別結(jié)果。就增值稅專用發(fā)票而言,雖然發(fā)票格式及關(guān)鍵信息統(tǒng)一,但每張發(fā)票打印的字跡深淺不統(tǒng)一、發(fā)票專用章加蓋的位置及深淺不統(tǒng)一,可能造成發(fā)票關(guān)鍵信息識(shí)別統(tǒng)計(jì)有誤或缺漏,這就要求提高發(fā)票打印或掃描留存影像的質(zhì)量,便于后續(xù)識(shí)別提取關(guān)鍵信息。
(2)銀行財(cái)務(wù)報(bào)賬系統(tǒng)中各類憑證影像機(jī)打、手寫不統(tǒng)一,影響關(guān)鍵字提取效果。由于財(cái)務(wù)憑證附件有機(jī)打、有手寫,特別是手寫字跡不統(tǒng)一、難以辨認(rèn)等因素將影響關(guān)鍵字提取結(jié)果,從而造成影像信息提取不完整、不準(zhǔn)確,進(jìn)而影響審計(jì)效果。
(3)系統(tǒng)安全及影像下載存儲(chǔ)合規(guī)性問題。為了擴(kuò)大審計(jì)面、使審計(jì)結(jié)果更具全面性,往往會(huì)審查更多的抽樣憑證,或針對(duì)同類事項(xiàng)進(jìn)行專項(xiàng)抽樣審查,就會(huì)造成更多的影像憑證被下載留存,且以財(cái)務(wù)報(bào)賬系統(tǒng)為切入點(diǎn)融入OCR 技術(shù)應(yīng)用,也同時(shí)存在著系統(tǒng)安全、影像安全及信息泄露的風(fēng)險(xiǎn),這就要求OCR 技術(shù)的應(yīng)用要以合規(guī)安全為前提。
(4)研發(fā)投入和實(shí)踐經(jīng)驗(yàn)尚需不斷積累。由于OCR技術(shù)在財(cái)務(wù)審計(jì)中的應(yīng)用處于探索階段,成熟系統(tǒng)的應(yīng)用解決方案尚未形成,相關(guān)領(lǐng)域的研究開發(fā)仍需要加大投入。同時(shí),現(xiàn)有內(nèi)審人員接觸OCR 新技術(shù)、新工具的時(shí)間不長(zhǎng),實(shí)踐經(jīng)驗(yàn)仍需不斷積累和豐富。
(1)提高發(fā)票打印或掃描留存影像的質(zhì)量,制定影像留存設(shè)備標(biāo)準(zhǔn)和人員操作規(guī)范,從源頭上提高影像質(zhì)量,為后續(xù)識(shí)別工作奠定基礎(chǔ)。在實(shí)現(xiàn)OCR 技術(shù)過程中,添加判斷影像質(zhì)量的功能,對(duì)質(zhì)量較低的影像,采用相應(yīng)的影像增強(qiáng)技術(shù)提高影像清晰度。在數(shù)據(jù)識(shí)別后,從技術(shù)上給出數(shù)據(jù)的識(shí)別可信度,對(duì)識(shí)別可信度較低的關(guān)鍵數(shù)據(jù),在數(shù)據(jù)后面添加相應(yīng)的備注提示,以便審計(jì)人員重點(diǎn)關(guān)注。
(2)加入各類憑證影像的機(jī)打、手寫分類功能。由于機(jī)打字體較規(guī)范,只要清晰度滿足要求,相對(duì)較容易識(shí)別,而手寫字體形式多樣,可采用機(jī)器學(xué)習(xí)的方式,采集大量訓(xùn)練樣本,訓(xùn)練出識(shí)別率較高的識(shí)別器。因此,需要對(duì)不同種類的影像憑證(機(jī)打或手寫)采取不同的識(shí)別處理技術(shù)和流程。在識(shí)別結(jié)果中,對(duì)識(shí)別可行度較低的信息,可給出備注提示,以便審計(jì)人員重點(diǎn)關(guān)注。
(3)制定相應(yīng)的OCR 技術(shù)在財(cái)務(wù)審計(jì)方面的應(yīng)用規(guī)范,對(duì)相關(guān)從業(yè)人員進(jìn)行應(yīng)用前的上崗培訓(xùn),從制度上保障數(shù)據(jù)的安全性。可將影像資料按照重要性程度分為多種保密等級(jí),數(shù)據(jù)使用者也分為多種等級(jí),不同等級(jí)的用戶對(duì)數(shù)據(jù)有不同的下載應(yīng)用權(quán)限,即對(duì)于保密等級(jí)高的數(shù)據(jù),只有高級(jí)別的用戶才有下載使用權(quán)限。系統(tǒng)中應(yīng)留存關(guān)鍵影像的下載記錄,保存下載人的信息,為資料泄露追責(zé)保存證據(jù)。
(4)加大基于OCR 技術(shù)的財(cái)務(wù)審計(jì)研發(fā)投入,從財(cái)政上提供足夠的支持。抽調(diào)專門的審計(jì)人員作為OCR系統(tǒng)的用戶,與研發(fā)人員對(duì)接,通過雙方充分溝通交流,進(jìn)一步明確需求和技術(shù)細(xì)節(jié),提高OCR 系統(tǒng)操作的便捷性和識(shí)別的準(zhǔn)確性。系統(tǒng)研發(fā)成型后,開展多種影像的應(yīng)用試點(diǎn)工作,測(cè)試系統(tǒng)的性能及操作的便捷性,及時(shí)發(fā)現(xiàn)并反饋使用過程中遇到的問題,不斷積累經(jīng)驗(yàn),完善升級(jí)系統(tǒng)。
在人工智能、大數(shù)據(jù)等技術(shù)迅速發(fā)展的時(shí)代,加強(qiáng)審計(jì)技術(shù)創(chuàng)新研究、運(yùn)用科技手段推進(jìn)審計(jì)深度轉(zhuǎn)型和價(jià)值提升,是內(nèi)部審計(jì)機(jī)構(gòu)和人員順應(yīng)審計(jì)工作發(fā)展新形勢(shì)、新要求,履行好審計(jì)監(jiān)督評(píng)價(jià)咨詢職責(zé),促進(jìn)企業(yè)高質(zhì)量可持續(xù)發(fā)展的必然要求。相信OCR 技術(shù)在審計(jì)領(lǐng)域的應(yīng)用探索,定能推動(dòng)審計(jì)信息化智能化水平再上新臺(tái)階。在商業(yè)銀行審計(jì)工作中,OCR 技術(shù)不僅可應(yīng)用于財(cái)務(wù)報(bào)賬憑證審計(jì),也會(huì)對(duì)信貸業(yè)務(wù)審計(jì)、合規(guī)操作性審計(jì)等涉及影像資料的其他專項(xiàng)審計(jì)提供便捷。除了在現(xiàn)場(chǎng)審計(jì)項(xiàng)目中發(fā)揮作用外,在非現(xiàn)場(chǎng)審計(jì)工作中開發(fā)OCR 相關(guān)模型或工具,能夠優(yōu)化監(jiān)控預(yù)警模型,結(jié)合風(fēng)險(xiǎn)監(jiān)測(cè)實(shí)現(xiàn)對(duì)數(shù)據(jù)的自動(dòng)分析、違規(guī)行為的自動(dòng)監(jiān)測(cè)及審計(jì)邏輯的自動(dòng)提煉,為發(fā)現(xiàn)審計(jì)疑點(diǎn)、評(píng)估風(fēng)險(xiǎn)等也會(huì)提供有力支撐。
展望未來,OCR 技術(shù)、大數(shù)據(jù)分析技術(shù)、文本挖掘、商業(yè)智能等先進(jìn)技術(shù)的應(yīng)用,將進(jìn)一步提高審計(jì)作業(yè)和審計(jì)管理的智能化、自動(dòng)化程度,實(shí)現(xiàn)審計(jì)工作模式轉(zhuǎn)型和審計(jì)流程升級(jí)改造,降低審計(jì)人員工作強(qiáng)度,不斷拓展審計(jì)廣度和深度,促進(jìn)審計(jì)質(zhì)效和價(jià)值持續(xù)提升。