□袁佳
截至2020年底,中國石化已在超過60個國家(地區)設有常設機構300余個,主要分為全資分子公司(項目部)、參股合資企業、聯合作業企業等三大類。中國石化境外審計監督力量主要分為兩個層面:一是集團層面,專門成立境外審計中心負責對境外機構進行監督,該中心現有人員35人;二是企業層面,在各涉外單位建立獨立審計部門或與其他業務部門合署辦公對其管轄境外機構開展審計。
從資源配給與中國石化境外資產規模對比看,各類專兼職審計人員配備仍處于嚴重不足的狀態。國家和集團層面都對境外機構監督的檢查頻率和要求越來越高,但境外審計的現狀是境外企業規模與監督力量嚴重不匹配。再加上疫情在全球范圍內的長期影響,遠程審計成為唯一的審計監督途徑,審計風險與壓力陡增。境外遠程審計對信息技術和智能工具的需求更緊迫,通過技術改變目前境外規模和審計力量嚴重不匹配的困境,成為提高審計效率確保審計質量的重要途徑之一。
開展遠程審計主要存在以下風險和困難:一是目前多數境外業務尚未建立統一數據管理平臺;二是境外業務數據資源共享不夠,各類業務信息系統查詢權限開通受限;三是信息化和時差等因素對審前調查和現場審計約束較多、影響效率;四是因境外業務信息化程度差異較大,國內初步實現的大數據審計方法、技能、模型等難以適用。
為降低遠程審計風險,解決上述問題,遠程審計對信息技術的需求較國內審計更迫切,且存在特殊方面。
一是數據獲取。遠程訪問數據有兩個渠道。第一,被審計單位開通訪問權限,并且可從境內遠程登錄業務系統,在這種情況下,需求主要是確保被審計單位的權限開通要滿足業務查詢需求,確保有足夠權限查看相應業務數據;第二,無法通過遠程訪問被審計單位業務系統,只能由被審計單位從系統中導出相關數據,在這種場景下,需求主要是確保被審計單位提供的數據的真實完整,無刪減和篩選。
二是數據清洗。針對境外審計單位提供的海量數據,格式繁多,數據獲取只是第一步,需要將源數據進行結構化和清洗,去掉干擾信息,才能為審計人員所用,便于后續分析,查找異常。因此在審計過程中,一線審計人員的迫切需要如Excel等具有數據處理、格式轉換功能的工具快速轉換格式、清洗數據。
三是數據分析。主要針對清洗后的數據,審計組需要對其利用excel Power B,以及python編程等大數據智能工具進行全樣本數據分析,將從業務系統中導出的海量數據進行關聯性分析,結合查證需求,將邏輯關系確定,完成建模,利用數據模型查找異常點,并對異常數據快速統計。
一是數據采集的方法。
在實施境外遠程審計中,數據采集的方法主要有以下幾種:物理拷貝、后臺抽取、定制軟件采集、網絡采集、遠程訪問、數據集市。采集數據種類范圍逐漸擴大,除了結構化數據,還非常重視非結構化數據的采集。隨著大數據技術的發展,對非結構化數據采集運用網絡爬蟲技術實現了更廣泛、全面的采集。
線下文本類數據的采集。當前,信息技術可以更高效地對文本類數據采集,除了較為成熟的OCR(光學字符識別)技術幫助文本的識別和文檔的轉換,將紙質文檔及掃描格式文件轉化成結構化可提取的文件格式,以便后續批量數據采集和智能分析,還可以利用開源計算機視覺庫OpenCV等快速應用圖像、物體識別等,結合編程語言,從圖像、視頻中進行檢測、識別,應用于像資產盤點審計查證的信息收集。
線下表格類數據的采集。目前,已有通用類的軟件工具可以幫助審計人員將不可編輯的圖片類或是PDF格式的文檔,直接轉化為表格類可編輯的文檔。在境外審計中常常關注的資金預算審查中,審計人員需要被審計單位合作伙伴的籌款通知書中的資金預算數據與被審計單位收到的實際賬單中的資金支出數據,審計人員要將識別出的電子表格以Excel的形式儲存于本地。
系統數據采集。通過定制高度自動化、智能化的數據抽取和底稿生成工具(軟件),實現快速的財務數據導出和標準化底稿自動生成、規范化數據整理。支持多個財務系統高速數據提取,節約審計人員從不同的分支機構收集數據的時間,數據清理節省了審計人員準備數據的工作量,格式化的數據可以直接使用。
網絡信息采集。在互聯網網絡頁面中隱藏了可免費公開訪問的有效數據集,可對審計工作起到重要作用。基于網絡爬蟲技術的審計大數據采集與分析的方法在審計項目中應用具有可行性和實用性。
二是數據清洗應用實踐。
典型數據分析流程包括明確目標、數據處理、數據分析、數據展現、報告撰寫,以對境外資金預算執行審計為例,當被審計單位提供的不是系統的格式化數據時,第一步用OCR技術采集到了該審查所需的表格之后,接下來并不是直接開展分析,而是對數據質量進行審查,首先我們要對識別出來的表格數據審查其是否存在缺失值、重復值及異常值的問題,在進行數據處理時我們需要先將這些數據問題處理掉,這一過程也叫做數據清洗。在實際數據分析項目中,面對龐大的數據可以用多種軟件來實現數據清洗。
三是數據分析應用實踐。
中國石化推動審計信息化建設,將初步形成圍繞財務、采購、銷售、工程等業務領域的審計數據資源和審計數據模型體系,目前已建立85個審計預警模型。
由于數據專區仍在建設過程中,對數據治理情況不一的境外數據來說,其審計查證需要以一個更加靈活、更加快捷的方式來建立分析過程。傳統的數據分析模型建設周期從數月至一兩年不等,還必須嚴格地以清晰的審計業務需求為前提,且受限于數據來源的系統本身的設計,數據細節無法進行有效動態挖掘。由于數據預警與分析維度多樣,更新迭代是發現問題、形成分析結論的必由之路,在實際做分析之前很難預先設計出來,分析思路與分析過程是相輔相承的,并且境外實際業務也處于不斷變化之中,所以根據當時分析需求建設出的模型往往開發出來就“過氣”了。
面對多樣的境外業務,需要一種過程結果持續循環的新型工作方式,敏捷分析和快速建模不講求大規模的數據建模,直接利用輕型分析應用,針對各類數據快速進行監測、分析業務探索。它能很好地適應監測、分析業務需求快速變化的特點,它的顯著特征是輕量、快速、靈活,便于開展動態業務分析。當然,好的方法還要有好的軟件工具作為支撐,進行數據分析的工具有很多種,但數據分析的步驟,無非是明確目標、數據處理、數據分析、數據展現及報告撰寫這幾個步驟。數據分析工具如Python、Excel、R、SPSS、SAS、SQL等,Power BI、Tableau是支持敏捷分析的有效工具。有一定基礎編程語言的審計人員,可以運用編譯的程序進行數據分析。而Python相較于JAVA、C++而言,代碼量小,開發周期短,運行速度非常快。