有數字經濟的發展,數字經濟與實體經濟會進步、企業發展的新引擎,發展數字經濟是企業數字化轉型的必由之路。銀行數字化是促進經濟體系產融結合,助力銀行經營降本增效的核心戰略規劃。在數字經濟背景下,銀行內部審計工作要實現高質量發展也迫切需要推進數字化轉型升級,關鍵是要加強基礎數據源頭治理。本文以A城市商業銀行(以下簡稱A銀行)為例,淺析如何在審計視角下開展數據治理以提升數據質量,并結合實際案例闡述數據治理工作對內部審計數字化轉型的重要意義及實現路徑。
一、數據治理背景
隨著信息技術的飛速發展,審計工作方法和管理模式也發生了變化。實踐證明,“數字賦能”對內部審計轉型和發展具有重要意義,能夠有效提升審計質量和監督效能,促進企業提高風險防控水平。根據中國人民銀行印發的《金融科技發展規劃(2022-2025)》和原中國銀保監會發布的《關于銀行業保險業數字化轉型的指導意見》等文件的要求,A銀行審計部(以下簡稱審計部)在總行黨委指導下,結合內部審計工作實際積極謀劃,重點圍繞“數據 + 技術 + 平臺”夯實基礎數據平臺建設,提升數據治理能力,落地數據治理成果,實現數據資產化和數據價值變現,推動由碎片化的程序型審計向系統深人的研究型審計轉變,不斷提升內部審計增加價值能力。
近年來,審計部多次組織業務骨干前往中信、浦發、興業、廣發等股份制銀行進行數字化轉型先進經驗調研。調研發現,數據是內部審計數字化轉型的基礎,也是數字化轉型的難點問題。一是商業銀行內部系統之間的“孤島”現象成為數字化建設的軟肋,缺少統一的數據標準或數據標準難以落地,突出表現為數據來源多頭、定義不一致、格式不統一、交換困難。二是歷史數據遺留問題突出,數據錯誤、冗余、缺失等質量問題已成為行業通病,嚴重影響大數據審計、大模型生態的發展。
二、數據治理實施
為提升數據質量,改善數據壁壘現狀,提升數字化審計工作質效,A銀行審計部數據治理工作組(以下簡稱工作組)牽頭制定了數據治理框架,共涉及六大方面26項具體內容,旨在統一多源異構數據標準,提高數據可用、可信程度,充分發揮數據驅動價值(見圖1)。
數據治理是一項系統長期工作,并非通過單一項目即可完成。按照審計數據治理框架,審計部確定了“審計數據治理一期工程”的工作重點。一是數據的標準化處理,對已接入審計系統的業務數據進行過濾清洗,并完成碼值轉換;統一數據表結構,規范數據表、字段標準,實現數據準確表達及提取。二是數據的驗證與應用,梳理A銀行業務條線數據結構,編制源系統數據字典,確定數據表存儲內容和數據表之間的邏輯關系;根據審計工作需要,借助審計工具構建大數據監測模型。具體實施步驟可細分為四個階段。
(一)制定數據標準
審計部組織業務骨干與技術支持人員進行多次座談交流,重點圍繞審計接入數據質量及數據應用等方面展開討論,針對行業數據質量共性問題提出建議,在A銀行數字化轉型發展規劃指引下,制定《審計數據治理工作方案》,并按照方案內容,制定《審計數據標準規范》,進一步明確審計數據治理工作的主要內容和質量標準。
(二)規范數據展現形式
針對審計接入數據來源多、格式不統一、定義不一致等數據規范問題,工作組對審計系統已接人的數據表進行了梳理。一是甄別數據表內容。工作組通過與行內數據倉庫、上游業務系統等聯絡人溝通交流,對審計接人數據表進行逐表分析,確保數據表命名能夠準確表達其業務含義。二是規范數據表命名。根據審計工作需要,對數據表名、字段名進行了重新定義,剔除了元數據表中的特殊字符,將數據表名及其字段全部轉換為中文,降低了審計人員數據應用的難度。三是分類展示數據。審計系統按照“業務數據/源系統簡稱/數據表名”三級目錄進行數據表展示;同時,在同一系統中,針對不同業務屬性的數據表進行了分類展示處理,提升了審計人員查找效率。

(三)數據清洗與轉換
數據清洗與轉換是數據治理工作的難點,針對失效、冗余等數據質量問題,工作組對審計系統已接人的數據進行了過濾清洗。一是確保數據完整性。使用腳本比對審計數據集市與行內數據倉庫,對每張數據表的記錄數、字段個數、字段排序、空值等指標進行比對,驗證數據接入的完整性,并補齊缺失的記錄和字段。二是確保數據唯一性。通過表結構主鍵或唯一標識符,檢查數據表中是否存在重復記錄,刪除失效、冗余的數據記錄。三是確保數據有效性。通過數據類型特征,對日期類、數值類、字符類等數據進行特征值分析,檢查數據是否滿足用戶定義條件、是否在一定值域內,修正存在明顯錯誤和域外的數據。
針對接入數據轉碼錯誤、無效轉碼、碼值不全等轉碼問題,工作組對審計系統已接入的數據進行了碼值轉換。一是確保碼值完整性。通過行內數據倉庫推送數據比對和源業務系統調研,獲取關鍵字段的中文注釋,完成對審計系統已接入數據關鍵字段碼值轉換。二是確保碼值唯一性。通過腳本去重判斷關鍵字段的碼值是否唯一,避免出現一對多的問題。三是確保碼值有效性。根據審計工作需要,對需要轉碼的關鍵字段能轉盡轉,剔除釋義表達錯誤的碼值,為審計人員準確獲取每個字段的含義奠定基礎。
(四)數據驗證與應用
為充分驗證審計數據治理成果,工作組在數據治理過程中編制了數據字典,并將數據字典轉發至各審計團隊,各審計團隊對審計數據治理成果進行了驗證和應用。一是驗證數據要素與業務含義表達是否準確一致。二是驗證碼值轉換情況。是否按照前期各審計團隊提出的轉碼需求完成關鍵字段能轉盡轉,并對轉碼結果進行驗證。三是推動審計數據應用。以“培訓 + 測試”的形式鼓勵審計人員通過“模型分析”工具完成數據分析,進一步強化大數據審計應用。
三、數據治理成果
(一)建立審計數據標準,規范數據質量要求
自數據治理工作開展以來,工作組圍繞《審計數據治理工作方案》,經過擬定、修正、完善等階段,完成了《審計數據標準規范》的制定,分別從命名規范、數據展示、數據清洗、數據轉換、數據存儲五個方面,提出了審計數據治理工作要求,進一步明確了審計數據治理工作的質量和標準,為審計數據治理工作的開展和后續審計數據的接入提供了制度遵循,指明了方向。
(二)完成審計數據治理,提升審計數據質量
工作組經過數據梳理、數據標準化處理、數據驗證等方式,通過多方調研了解、比對核實,歷經5個月的時間,順利完成了審計數據集市全部數據表的數據治理工作,提高了審計數據質量。在數據治理成果的基礎上,審計部重點圍繞數據治理、數據分析、模型建設等先后開展了兩次培訓,并將成果運用到審計項目疑點篩選、線索核查過程中,顯著推動了數據服務、模型服務在審計工作中的應用。
(三)形成審計數據字典,推動數據服務應用
為更好地推動大數據審計分析工作,此次數據治理通過“數據字典”的形式,對每一張數據表、每一個字段要素的真實含義進行了定義和說明,并建立了索引和目錄,幫助審計人員快速厘清不同數據表之間的業務邏輯關系,降低了數據理解和應用難度,成為審計人員模型建設、數據分析的有效工具,有力推動了研究型審計的開展。
四、數據治理建議
(一)堅持數據標準先行,加強數據源頭治理
商業銀行審計系統數據多來自行內數據倉庫,工作組調研發現,部分商業銀行審計系統接人的數據中,字符類型占比較高,失去了原有日期類型、數值類型、布爾類型等數據類型的約束,致使數據采集過程中產生了大量的空格、斜杠、回車、換行等特殊字符,在未清洗的情況下,審計人員在進行數據分析時很難精準找到數據。因此,應開展數據源頭治理,規范源系統業務數據類型,并在源系統數據入倉時,增加數據清洗和數據轉換步驟,以減少下游系統使用數據的難度,進而提升數據整體質量和應用水平。
(二)建立源系統數據字典,推動數據精準反哺業務
數據字典是數據分析人員不可或缺的工具,工作組調研發現,部分商業銀行業務系統存在數據字典缺失或不完整的情況,許多帶有重要含義碼值字段的中文注釋缺乏系統性,審計人員進行數據分析時,無法快捷、清楚了解每一個字段所代表的真實含義。應由源系統的管理部門牽頭,將數據字典納入本行資產管理,在新建系統時同步完成數據字典的編寫工作;對于存量系統,應組織相關人員重新編制數據字典,規范數據標準,以提高數據質量,推動數據精準反哺業務。
(三)數據分層分級管理,提升數據分析效率
工作組經統計發現,很多單個元數據表結構中雖然字段要素較多,但審計人員關注的真正具有業務含義的字段要素,如客戶類、交易類、日期類、狀態類等,占比不足 50% ,其余字段要素均為數據關聯、數據轉換等元數據管理而設置,這對于非科技背景的審計人員來說,理解起來比較困難。應通過采取中間表的形式,對元數據進行數據清洗、轉換、匯總計算,生成中間業務表后加載到審計數據集市,以降低審計人員數據理解難度,提升數據分析效率。
(四)規范數據采集機制,擴大數據采集范圍
審計系統可開拓多種數據結構、多種數據接入方式,加強半結構化、非結構化數據的獲取,以拓展審計范圍及深度。除了獲取常規業務系統數據,還應確保Excel報表數據的無縫接入;利用Python、NLP、RPA語言實現網絡爬蟲數據的獲取和處理,借助OCR、ASR、Hadoop工具實現音視頻、圖像等非結構化數據的獲取和處理;建立標準的數據ETL機制,清洗錯誤、冗余的垃圾數據,補全缺少的數據元素,做好碼值轉換,最后分類存儲、歸集到不同的標準數據庫中(見圖2)。通過以上措施,努力實現“三個提升”,即大幅提升海量數據的分析效率,提升非結構化數據的處理和分析能力,提升多角度、深層次挖掘問題的能力。
圖2 數據采集治理流程框架

(五)注重實戰鍛煉,組建攻堅克難“突擊隊”
數據治理只是數字化轉型的基礎,數據賦能才是數字化轉型的目標。隨著內部審計數字化轉型的不斷深入,商業銀行內部審計面臨的最大挑戰是數字化人才的短缺。商業銀行迫切需要結合本行實際情況,組建一支攻堅克難“突擊隊”來引領數字化轉型。一是通過以干促學、以考促訓等方式,營造良好的“學科技、用科技、謀科技、推科技”工作氛圍。二是充分發揮人才第一資源效能,通過自主分析、模型構建等方法,依托SQL 編輯器、模型分析、數據挖掘等工具開展大數據審計,助力審計項目疑點分析,持續擴展內部審計的能力邊界。
五、結語
本文結合當前數字經濟發展的時代背景,通過多種方式調查研究、剖析、歸納了影響內部審計數字化轉型的關鍵因素,分別從數據標準制定、規范數據展現形式、數據清洗與轉換、數據驗證與應用四個階段介紹了數據治理實施步驟,最后對數據治理成果進行了總結并提出了數據治理建議。
隨著數字經濟的發展,商業銀行內部審計在數字化轉型過程中,仍需重點圍繞數據質量、數據合規、數據安全等方面開展審計智能化研究,突出審計“促戰略、控風險、查合規、強能力”作用,推動實現內部審計高質量發展。
(作者單位:天津銀行審計部,郵政編碼:300202,電子郵箱:1635993194@qq.com)