楊映希
省級農信的大數據審計,即依托省級農信的整體數字化轉型,從大量不同的業務系統中獲取多樣性的海量數據,再利用大數據技術進行存儲和處理,形成具有審計價值的數據以指導和推進審計工作。2023年5月23日,習近平總書記在二十屆中央審計委員會第一次會議上發表重要講話,要求打造經濟監督“特種部隊”,對審計提出了“如臂使指”“如影隨形”“如雷貫耳”的更高要求。在當前社會大數據技術應用不斷拓展和深化、金融數字化快速轉型的背景下,借助大數據技術提升審計的信息化水平,對于省級農信經營管理的全面提升,既是外在壓力,也是內在要求。本文將以甘肅省農村信用社聯合社(以下簡稱甘肅省聯社)大數據審計為基礎,研究省級農信應用MPP技術開展大數據審計的應用實踐。
一、大數據技術在甘肅農信審計中的應用現狀
審計作為風險防控的最后一道線,對于兩級法人治理結構具有重要意義。省級農信行業審計是代表省聯社對各獨立法人行社的公司治理、合規經營、金融風險、國家方針政策落實、省聯社部署執行等情況進行全方位監督的重要抓手。甘肅農信通過2020年至2022年的新一代信息工程建設,總體上完成了數字化轉型,在此基礎上,新一代審計系統于2023年3月建成投用。目前,甘肅農信大數據平臺已集中主要業務平臺的重要真實數據,包括月末等歷史時點數據,總數據量已接近900T;大數據平臺基于GreenPlum并行分析型數據庫等技術建立,相比傳統數據庫,其在批量運行、高速查詢、非結構化數據應用等方面具備明顯優勢。因此,甘肅農信目前的數據環境基本上能夠滿足大數據標準,并在此基礎上建立新一代審計系統,開展大數據審計。甘肅省聯社的大數據審計,正按照“數據先行、精準定位、快速實施、全面覆蓋”的總體原則逐步推進。
二、MPP技術的審計應用模式
MPP是一種基于分布式數據庫架構的大規模并行處理技術,它將計算任務分解為多個小的子任務,并將這些子任務分配到多個處理單元上并行處理。這種并行處理的方式可以顯著提高數據處理的速度和效率,特別適用于對大規模數據集的分析和處理。甘肅省聯社使用MPP數據庫中的主流產品之一Greenplum數據庫構建集群,建設了大數據平臺。Greenplum數據庫集群應用于審計,具有以下優勢。
(一)分布式架構:相比傳統的集中式數據庫所有數據都存儲在一個或多個高性能的服務器上,分布式架構將數據分散到多個節點進行處理。這種架構為處理大規模數據提供了極好的擴展性,因為可以通過增加節點來提高處理能力,同時它也提供了高可用性。由于審計全覆蓋的需要,審計業務中需要不斷接入大量新業務數據,同時也需要根據審計重點回溯歷史重要節點的時點數據,這些都要求大數據審計能夠靈活處理快速在線增長的大規模數據。因此分布式架構的數據處理更具優勢。
(二)并行計算:基于MPP架構,可并行處理多個數據片段,每個節點都可以獨立地處理分配給它的數據片段,從而加速整體處理速度。通過數據分片,可以更有效地管理和訪問數據,減少單個節點的I/O壓力,提高整體性能。對于審計業務而言,往往需要對大量數據進行關聯查詢以發現疑點線索,數據計算量將呈幾何級數上升,并行計算可以將計算任務并行地分配到多個服務器上同時處理,極大地提升效率,在合理的時間內完成大數據審計任務。
(三)并行查詢:支持在同一時間執行多個查詢,并將這些查詢分散到多個節點上。不僅提高了查詢速度,還使得復雜的數據分析變得更快。同時支持復制表功能,對于頻繁訪問的數據集可以減少I/O操作和網絡傳輸,查詢性能得到顯著提高。并行查詢+復制表的功能,可以滿足多任務處理的需要,滿足甘肅省聯社每日開展實時審計、進行監測預警的需要,同時滿足各審計機關根據實際情況按需開展大數據審計查詢的需要。
三、MPP技術下大數據審計模型應用實例
(一)信貸業務審計模型案例
信貸業務審計以“貸款資金回流至借款人關聯人或關系人”模型為例。該模型揭示的主要風險點是疑似貸款資金用途不真實。貸款資金發放或受托支付后,資金通過一手或數手流轉后重新回到借款人關聯人或關系人賬戶,說明借款人可能并未將借款用于實際經營或消費用途,而是轉移至其關聯關系人挪作他用。為審計該風險點,使用如下模型思路建模:
從貸款借據表中提取未結清貸款明細→從貸款客戶交易明細表中提取貸款客戶放款交易明細→分別提取貸款客戶的存款賬戶貸方交易和借方交易→未結清貸款明細和貸款客戶放款交易明細關聯,獲取貸款放款交易流水號→貸款客戶的存款賬戶貸方交易與貸款放款交易流水號關聯,獲取貸款放款核心流水明細→貸款客戶的存款賬戶貸方交易與貸款放款核心流水明細關聯,獲取放款后資金一手流出明細→貸款客戶的存款賬戶貸方交易與放款后資金一手流出明細關聯,獲取放款后資金二手流出明細→貸款客戶的存款賬戶貸方交易與放款后資金二手流出明細關聯,獲取放款后資金三手流出明細→貸款客戶的存款賬戶貸方交易與放款后資金三手流出明細關聯,獲取放款后資金四手流出明細→貸款客戶的存款賬戶貸方交易與放款后資金四手流出明細關聯,獲取放款后資金五手流出明細→對以上五步中一手至五手資金流水的對手信息分別進行整理并合并流水明細→放款后資金一手至五手流出明細合并表與客戶關聯關系信息表關聯,獲取放款后資金一手至五手流出對手方為貸款客戶關聯關系人的信息。
該模型運行結果在信貸業務審計中進行逐筆查證,取得了較好效果,但也存在一些不足。一是客戶關聯關系信息表數據不全面,后期計劃根據甘肅農信客戶關系管理系統(CRM)建設和優化進度不斷補充全面客戶關聯關系數據,擴大模型覆蓋面;二是資金流出只覆蓋五手信息,由于關系型數據庫的特性,多次關聯將導致數據量呈幾何級數增長且難以解決關聯回路的問題,后期計劃運用圖數據庫技術加以解決。
(二)柜面業務審計模型案例
柜面業務以“網點現金申請狀態異常”模型為例。該模型揭示的主要風險點是獲行社現金管理流程和員工日常操作風險。為審計該風險點,使用如下模型思路建模:
從調撥申請記錄表獲取網點調撥申請記錄信息,篩選出申請狀態為未處理狀態信息→從現金出入庫狀態登記簿獲取現金出入庫狀態信息,通過現金申請編號對數據進行篩選,取唯一值→將網點調撥申請記錄和現金出入庫狀態登記簿,通過現金申請編號進行關聯→篩選出網點調撥申請有記錄,現金出入庫無記錄數據。
該模型運行結果在柜面業務操作風險審計中進行了逐筆查證,查證結果與數據結果基本一致。未來將繼續完善數據倉庫現金出入庫管理記錄信息,結合現金出入庫管理審計風險點,完善數據模型。
四、省級農信大數據審計展望
甘肅省聯社大數據審計的發展,可為農村合作金融機構大數據審計的開展提供以下實例和借鑒:一是持續推進審計系統建設和優化。根據審計實踐運用情況不斷提出新的需求,將審計業務流程化、線上化、電子化,加強大數據技術應用水平,不斷提升信息化審計能力。二是不斷增強審計數據的應用能力。借助大數據平臺技術優勢,挖掘數據的審計價值,積極發現審計數據中存在的不足,促進甘肅省聯社的數據治理水平不斷提升。審計系統不斷優化數據結構,提升查詢分析效率。三是通過大數據審計轉型提升審計價值。通過數字化轉型,快速發現疑點線索,快速進行非現場查證,提高審計監督的及時性;對接內外部數據以及審計模型疑點篩查,追蹤資金流向、關聯貸款等信息,積極參與風險化解;運用大數據構建分析性模型,積極開展經營分析,促進甘肅農信業務持續穩健發展。
本文系甘肅省2023年金融學會重點課題《科創金融的實踐與探索研究——大數據技術在省級農信審計監督中的應用》相關研究成果。