【摘 要】 數字經濟正加速改變世界,審計作為經濟監督“特種部隊”面臨著大數據和人工智能重塑業務場景與規則的挑戰,創新審計技術方法,以智能化全方位賦能審計工作,推動審計事業高質量發展勢在必行。從實際審計工作需求出發,探索智能審計應用場景、核心技術和實踐方向,提出智能審計的工程化路徑,結合多方安全計算技術、多模態大數據治理技術、審計大語言模型技術、一站式大模型開發管理平臺等技術給出實踐分析,切實提高審計工作實效和質量,在可視化展示與交互、智能決策支持的助力下為審計人員提供更直觀、更具有深度的數據模式解讀方式,提高了審計決策的科學性。大數據和人工智能的應用開啟了智能審計時代,為建設新型審計監督體系、推動審計工作向更高水平發展、審計信息化向全面數字化轉型發展,提供了創新思路、技術支持和實現路徑。
【關鍵詞】 智能審計; 研究型審計; 多方安全計算; 多模態大數據治理; 審計大語言模型; 大模型開發管理平臺
【中圖分類號】 F239.1 【文獻標識碼】 A 【文章編號】 1004-5937(2024)20-0014-08
一、智能審計的創新特點
習近平總書記在二十屆中央審計委員會第一次會議上指出,做好新時代新征程審計工作,總的要求是在構建集中統一、全面覆蓋、權威高效的審計監督體系[1]和更好發揮審計監督作用上聚焦發力,并用“如臂使指”“如影隨形”“如雷貫耳”形象概括了新型審計監督體系的特性,從“三個如”的創新論述中明晰智能審計的創新特點和實踐方向。智能審計通過數字化、智能化技術和工具的應用,強化審計的政治屬性、全覆蓋審計監督效果,提升審計的研究能力和斗爭本領,是構建新型審計監督體系、推進國家治理體系和治理能力現代化建設水平提升的重要一環。
(一)政治屬性和政治功能的增強
智能審計有利于增強審計的政治屬性和政治功能。通過大數據和人工智能相關技術、深度數據分析手段,增強審計機關在決策層面的動能發揮,確保審計服務在國家大局工作中、國家治理中的針對性。審計機關應用智能化審計工具實現“如臂使指”,將審計工作與黨中央部署有機結合執行中央審計委員會的決策,并在審計過程中緊追所指的大局方向和工作重點。
(二)常態化、動態化震懾的全覆蓋審計
智能審計保證“如影隨形”的審計監督[2],通過智能審計相關技術體系實現對使用公共資金、國有資產、國有資源的地方、部門和單位的審計監督無一遺漏、無一例外。數字化智能化審計工具的應用,使得審計能夠高效地實現常態化和動態化的監督目標,達到全覆蓋、無禁區的審計效果,從而增強審計的震懾力、穿透力。
(三)強化研究型審計和斗爭本領
智能審計強化了研究型審計,是做實研究型審計的技術支持。通過數字智能審計技術和數據分析,審計人員能夠深入地剖析、系統地研判審計對象,開展研究型審計,挖掘審計對象潛在的問題和風險[3]。智能審計技術和工具的應用賦能審計機關,增強斗爭本領是打造經濟監督“特種部隊”的必然選擇,特別是數字共享技術有助于審計與其他形式的監督形成合力,實現信息的溝通、工作的聯通和成果的融通,從而提升監督質效。
二、智能審計的創新應用場景
智能審計在數據采集和治理、實時監控與預警、自動化測試、跨領域融合、決策支持、可視化展示、信息安全與隱私保護、風險識別、持續審計、協同優化、預測分析等多方面有顯著的創新成效,為新時代的審計工作帶來全新的思路和工作方法,在提高具體審計工作水平和效益的同時,全面推動了整個監督領域的升級和發展。
(一)數據處理層面
1.數據采集與分析
智能審計實現數據采集的自動化和智能化,對各類數據進行高效處理。采用自然語言處理、機器學習和深度學習等數據處理技術,以提高對多源、多模態數據的處理效率。通過多模態數據整合,使得不同類型的數據(如文本、圖像、視頻等),為審計人員提供更為綜合、全面的信息。在大數據分析方面,智能審計利用數據挖掘技術深入挖掘海量數據和潛在業務風險。通過模式識別、關聯分析和異常檢測,審計系統能夠快速識別出異常模式,進而提醒審計人員可能存在的問題。這使審計工作更具針對性,能夠更加精準地關注潛在風險點,提高審計效益。
2.實時監控與預警
智能審計通過大數據和云計算等新技術實現實時監控和發揮預警功能。實時監控對象不僅包括傳統的財務數據,還包括業務流程、資金流向等多個維度。通過建立實時監測系統,審計人員能夠在第一時間獲知被審計單位的變化情況,及時發現異常和潛在風險。智能審計通過預警系統,自動識別異常模式,并向審計人員發送、報告預警信息,提醒其關注可能出現的問題。實時監控與預警不僅提高了審計的時效性,也大幅度減小了潛在風險漏報的可能性。
3.可視化展示與交互
智能審計通過可視化技術,將審計結果和報告按不同使用者的興趣進行直觀、生動的展示。這一創新提高了審計人員對數據的理解和分析效率,也使得審計結果更具可信度、容易獲得相關方的認可。可視化展示將龐大的數據集以直觀的方式呈現,幫助審計人員、被審計單位更好地發現潛在問題和趨勢。通過交互式設計,審計人員能夠與數據進行實時互動,進一步提高審計工作的可操作性和用戶體驗。
4.智能化多模態數據治理
審計對象的數字化轉型對內部審計既是挑戰也是機遇。智能審計通過自動化、智能化的技術手段,實現對多源、多模態數據的高效獲取、處理、分析和報告。通過自適應大數據治理技術,系統能夠根據數據的實時性和權重自動調整數據的治理策略[4],確保數據的一致性和準確性,使得審計人員能夠便捷地獲取所需數據縮短審計周期。
(二)風險與安全層面
1.信息安全與隱私保護
在數字化時代,特別是數據合規、信息安全和隱私保護成為重要關注。智能審計在應用大數據和人工智能等新技術的同時,充分考慮和保障被審計單位的信息安全和隱私。采用加密技術,確保審計數據在傳輸和存儲過程中的安全性。系統設計中注重隱私保護機制,遵守數據相關法律法規,確保審計過程中不發生侵犯被審計單位合法權益的審計風險。
2.智能風險識別
智能審計利用大數據技術對企業的全部財務數據進行實時監控和分析。通過模式識別和異常檢測等技術手段,審計系統能夠及時發現潛在的財務風險。舉例來說,通過對交易模式的分析,系統能夠實時地識別出異常的資金流向,為審計人員提供重要線索。這種智能化的風險識別大幅提升了審計的準確性和效率。
3.智能預測與持續審計
智能審計利用大數據和人工智能等新技術進行預測分析。建立預測模型,系統對未來的財務風險進行預測和預警。智能化的預測能力為審計人員提供了發現未來趨勢的線索,幫助其更好地制訂審計計劃。通過持續審計模型,審計系統對被審計單位進行持續監控和評估,及時發現和解決問題,提高審計工作的時效性、準確性。
(三)融合應用層面
1.智能化審計決策支持
以大數據和人工智能等為技術核心,智能審計提供智能化的決策支持服務。通過對海量數據的挖掘和分析,發現不同行業、不同領域數據背后的規律、模式和趨勢。包括對財務數據、市場趨勢、行業動態等多方面信息的整合研判分析。審計人員基于數據依據做出更為準確、全面的決策,提高審計工作的水平和專業度。智能化審計系統基于模型解釋性工具,幫助審計人員理解模型的決策邏輯,使得審計決策更為科學可信,降低了決策的風險。
2.自動化審計測試
通過大數據、人工智能等新技術智能審計實現了自動化審計測試。這一技術應用減少了繁瑣的測試環節中的人工參與。自動化審計測試涵蓋了審計過程中的多個環節,包括數據采樣、賬務核對、生成審計中間表、內部控制測試等。采用機器學習、深度學習算法,以監督、非監督結合的模式學習并優化測試方案,逐步提高測試的準確性和全面性。使得審計人員能夠更專注于復雜業務問題的解決,拓寬審計工作的深度和廣度。
3.智能協同與流程優化
智能審計能夠實現與其他監督部門的貫通協同,形成監督合力。通過信息共享和協同工作,共同打擊違法違規行為,提高監督的權威性和有效性。同時,通過流程自動化和智能化的技術手段優化審計流程,高效地完成審計任務,而不是過度依賴人工操作。
4.跨行業、跨領域融合與技術創新
智能審計實現了跨領域、跨行業的融合,將審計工作與財務管理、風險管理、內部控制等有機結合,包括不同數據源、不同模態數據的整合、歸集,審計方法和工具的創新。在風險管理和內部控制的融合中,智能審計與風險管理系統相連接,實現風險事件的自動關聯,使得審計人員能夠更好地理解業務背后的風險,并有針對性地進行審計工作,給出內部控制策略。智能審計在關注傳統數字審計領域的同時關注新興技術領域,如區塊鏈審計、虛擬現實場景中的審計。這種融合和創新為審計行業帶來新的發展機遇,使得審計工作更加符合時代變革潮流,更具前瞻性。
三、智能審計的核心技術
隨著企業數字化轉型的加速和審計工作的日益復雜,傳統的審計方法已經無法滿足現代審計的需求。創新應用場景的需求推動了智能審計核心技術的不斷發展,技術創新又為審計應用場景拓展提供了技術支持和保障。
(一)審計數據的多方安全計算技術
1.技術要點
由于被審計單位、其他關聯方提供的數據中可能包含大量的個人隱私信息、政府敏感信息以及企業商業秘密。這就需要在審計過程中關注數據使用的安全性、保密性,防止由于人為管理、系統漏洞等原因導致數據遭到泄露或破壞。隨著審計全覆蓋數據采集范圍的不斷擴大,數據安全和隱私保護則成為審計中需要解決的基礎性問題。多方安全計算是保護數據隱私和安全的重要技術,其起源可追溯到1982年亞洲圖靈獎第一人姚期智院士提出的百萬富翁問題,自此以后多方安全計算技術得到廣泛研究和應用。已經衍生出多個技術分支,包括混淆電路、秘密分享、同態加密[5],不經意傳輸[6],隱私集合交集和差分隱私、聯邦學習等。技術應用方面,差分隱私機制已被廣泛應用于邏輯回歸、支持向量機等簡單二分模型[7],實現隱私與可用性的平衡;聯邦學習則通過GBoard輸入法,實現聯想詞和智能提示等功能。
2.技術應用
多方安全計算是一種保護數據隱私和安全的技術,允許多個參與方在不共享原始數據的情況下,對數據進行聯合計算和分析。應用于多種場景,在審計領域多方安全計算助力審計人員在保護被審計單位數據隱私的同時,完成數據的采集、分析和驗證工作,步驟如下。
(1)數據預處理:審計人員和被審計單位首先對各自的數據進行預處理,如數據清洗、格式轉換等,以確保數據的質量和兼容性。(2)建立安全計算環境:審計人員和被審計單位共同建立一個安全計算環境,該環境采用先進的加密技術和訪問控制機制,確保只有經過授權的人員才能訪問和操作數據。(3)數據聯合分析:在安全計算環境中,審計人員和被審計單位對數據進行綜合分析,如比對財務報表和交易記錄的一致性、檢查異常交易等。以上分析過程是在加密狀態下進行的,以保證數據的隱私性。(4)生成審計報告:根據聯合分析的結果,審計人員生成審計報告。報告中只包含分析結果和結論,而不包含任何原始數據。這樣既可以保證報告的準確性和合規性,又可以避免數據泄露的風險。
(二)面向多模態大數據的審計數據治理技術
1.技術要點
自2015年實施審計全覆蓋后,審計數據體量日趨龐大,審計數據呈現出多模態、大體量的特點,涉及文本、圖像、圖表等多種形式的數據。針對審計業務中多模態大數據開展智能抽取、安全存儲、隱私使用等方面的治理是基礎。首先針對多模態審計大數據進行編碼處理,將編碼后信息進行融合對齊,通過多模態指令調整,將系統指令/文本查詢與輸入多模態上下文相關聯,抽取成為知識。通過融合多方安全計算和聯邦學習來確保模型聚合或參數更新過程中的數據隱私和安全性,同時構建完備的審計領域元數據管理體系,制定元數據治理規范和標準,形成安全有效的數據底座。
在審計數據的智能抽取方面則通過單一形式數據和混雜數據抽取實現數據的全覆蓋能力。
單一形式的數據抽取技術主要針對形式單一的數據如單純的文本、圖像等進行抽取。數據編碼器是實現有效數據轉換的關鍵。方法包括深度學習算法,如卷積神經網絡和循環神經網絡等,用于自動提取數據的特征并進行編碼。采用傳統的特征工程方法,如手工設計特征提取器,結合審計領域知識進行數據編碼。在多模態大數據中,不同模態的數據存在異構性,向量對齊旨在將不同模態的數據映射到同一向量空間中,以實現數據融合和關聯分析。研究方法包括基于距離度量的向量對齊法,如歐氏距離、余弦相似度等,以及基于深度學習的向量對齊法,如孿生神經網絡、三元組損失函數等,用于衡量不同模態數據之間的相似性,并實現向量空間的對齊。多模態令牌指令是多模態大數據中的一種重要表示形式,融合不同模態的信息并傳遞給下游任務,包括基于規則的方法手動設計令牌指令的生成規則,結合領域知識進行指令的設計;基于深度學習的方法序列生成模型(LSTM、Transformer等),通過訓練模型自動生成多模態令牌指令。
混雜數據抽取指的是針對審計數據中夾雜著文本、圖像、圖表等信息的數據的抽取。通過模型訓練構建一個預處理分離模型,提高對資料中圖片和表格等信息的識別和提取能力。該模型自動從審計資料中分離出圖片和表格,針對圖片信息采用多模態大模型,識別提取出圖片中的關鍵內容形成圖片摘要。對于表格信息的識別與提取,模型將采用大模型技術,通過解析表格的結構和內容,提取出其中的重要信息。從材料中獲取有關表格的語義結構信息,將其用于后續的處理和分析。為了綜合利用多模態數據,將使用多模態模型來結合單一形式的數據信息處理方式,同時考慮文本、圖片和表格等多種形式的數據,統一形成文本數據將它們融合在一起,生成全面且準確的語義摘要。根據語義摘要來檢索相關的原始數據,實現更高效和準確的信息訪問和查詢能力。
2.技術應用
審計機構對一家大型企業的財務進行審計。企業的財務信息包含文本、圖片和圖表等多種形式的數據。審計人員需要從多模態數據中提取關鍵信息,進行合規性和真實性檢查,具體步驟如下。
(1)數據預處理與抽取:使用預處理分離模型對財務報表進行預處理,自動分離出文本、圖像和圖表等信息。采用多模態大模型進行識別與提取,形成圖片摘要和表格摘要。(2)數據融合與關聯分析:將提取出的文本、圖片和圖表信息進行融合對齊,形成統一的向量表示。通過關聯分析技術找出數據之間的潛在聯系和異常點,為后續審計提供線索。(3)安全存儲與隱私使用:采用多方安全計算和聯邦學習技術對模型進行訓練和優化,以保護數據的隱私性。將融合后的多模態數據存儲在安全的數據倉庫中,確保只有經過授權的人員才能訪問。(4)生成審計報告:根據多模態數據的分析結果生成審計報告。報告中包含對財務信息的合規性和真實性的評估結果,以及相關的證據和解釋。
(三)基于多模態大數據的審計大語言模型技術
1.技術要點
傳統的數據處理技術已無法滿足審計對多模態大數據處理的需要。圍繞這類數據情形,在基座模型的基礎上,結合人工智能等技術,開展領域分析專屬大語言模型的研究。分別通過針對垂直審計語料庫構建、增量數據微調模型、知識圖譜結合大模型關聯分析三方面內容進行構建,以期更加準確、全面了解和分析被審計單位的數據情況,發現潛在的風險和問題,為審計決策提供科學依據[8]。訓練垂直領域審計大模型需要一定規模的語料,由于人工標注語料成本很高,因此采用智能方式,自動快速進行審計語料庫的構建,為模型訓練提供高質量數據集。
由于審計數據的敏感性,獲取大規模的訓練數據非常困難,在多數的下游任務微調時,下游任務的目標與預訓練的目標差距過大導致提升效果不明顯,因此微調過程中需要引入大量監督語料。在此背景下,少量樣本學習成為一種有效的方法,通過構建基于少量樣本學習的大語言模型訓練微調模式,能夠讓機器從少量數據中學習并泛化到新情境,其基本思想是在數據集上構建預訓練模型,通過人工定義、自動搜索、文本生成等方法設置模板,通過標簽詞映射,使用小規模的支持集完成模型微調,旨在解決傳統微調的語義差異和過擬合痛點問題。具體過程是結合特定審計領域的業務場景對數據進行分類標注處理,收集標記過的數據和未標注的數據,使用標記過的數據進行微調訓練,得出預定義標準的觀測結果和結果的置信度,選擇置信度概率較高的樣本作為可信樣本加入訓練集;使用新訓練集重新訓練微調模型,并對審計文檔進行人工標注和檢查問答對效果等。重復上述操作,直到模型的抽取效果滿足指標要求。
審計領域大語言模型不僅要面臨樣本數據過少問題,還要面臨和其他垂直領域一樣的問題,即參數量過于龐大的訓練學習,會面臨高額的訓練硬件成本與數據成本問題。解決以上問題基于增量學習技術,只需少量的訓練數據調整部分的模型參數,使得模型能夠達到領域適應的目的,這是審計領域大語言模型應用的核心難點。
將知識圖譜的信息關聯與可解釋性能力和大模型的語義理解能力結合對審計數據進行高效全面分析與挖掘,增強知識圖譜的表征是審計大模型的特色。知識圖譜的特性在于能夠挖掘實體節點間的隱藏關聯關系,大模型具備強大的語義分析、語言交互特性。審計人員通過自然語言交互向大語言模型提出關聯分析的需求,由大語言模型進行需求理解與分析,將需求轉譯成圖查詢語言或者語義向量,然后通過圖向量檢索以及圖查詢等方式從知識圖譜中挖掘出答案,并使用自然語言的方式返回給審計人員,給出知識圖譜中的分析解釋。
2.技術應用
以某審計機構對一家大型企業的財務報表及其相關數據的深度分析為例,評估其財務狀況和潛在風險,具體步驟如下。
(1)構建垂直審計語料庫:收集該企業的歷史財務報表,相關法規、行業報告等多源數據,形成初始的審計語料庫;利用智能抽取技術,自動從語料庫中提取文本問答對,構建高質量的垂直審計語料庫,為模型訓練提供數據支持。(2)增量數據微調模型:在預訓練的大語言模型基礎上,利用增量學習技術,對模型進行微調。選擇部分具有代表性的財務報表數據作為增量數據,通過調整模型參數,使模型更適應審計領域的數據特點。這種微調方式有效降低了訓練成本和時間,提高了模型的準確性和泛化能力。(3)結合知識圖譜關聯分析:將知識圖譜的信息關聯能力與大模型的語義理解能力相結合,對財務報表進行深入分析。通過自然語言向大語言模型提出關聯分析需求,如“請分析該企業近三年的營收增長趨勢及其與同行業企業的比較”。大語言模型理解需求后,以自然語言的形式返回給審計人員,根據返回的分析解釋,評估企業的財務狀況和潛在風險。
(四)一站式大模型開發管理平臺技術
1.技術要點
對審計大模型的開發應用進行一站式管理是智能審計工程化應用的重要環節。一站式大模型開發管理平臺覆蓋了數據處理、模型訓練、模型評估和推理、人機交互界面等方面的內容,具體架構如圖1所示。
審計結果智能生成過程,需要將標準化的多模態審計大數據以及法律法規等審計知識注入基礎預訓練模型中,以此來實現模型訓練任務,這就需要研究和設計一個智能化標注數據的系統,以便更好地支持大模型的訓練。
實現大語言模型的自動標注。利用大模型的能力先對多模態大數據進行初步自動標注,由專業標注員進行細化和校正、反饋給大模型,從而使模型反復迭代得到更高的模型性能,最終形成高質量訓練數據集、提高標注速度。
利用全流程評測工具完成大模型能力的評估。全流程評測工具包含了評測數據集構建、模型加載與生成、結果的評測與指標計算等流程。預處理完評測數據集后,對評測數據配置指標計算方式、目標答案解析規則等。對模型評測工作進行拆分,確定評測維度、細化評測數據集,以定義最小粒度的工作節點,根據不同的執行模式云集群模式、基于SLURM(Simple Linux Utility for Resource Management)的并行模式、基于本地Python的local模式等,最終完成模型評估任務,生成模型評估結果。
智能審計算法模型之間的協同和調度越來越重要。為提高算法模型的效率和性能,需要設計面向多模態大數據的大語言模型的智能調度與系統協同技術,包括兩方面的內容:(1)通過大語言模型作為控制器實現智能調度算法,利用大模型生成任務規劃;實現大語言模型對現有模型的選擇;通過任務執行,將任務分配給不同的模型并進行執行。實現大模型的回答生成,并評測結果的準確性、可讀性。(2)利用大語言模型生成RPA業務流,實現審計工作的智能化和自動化處理流程,包括流程的自動設定、關鍵參數的智能設定和調優,實現在對審計大數據采集分析的基礎上與以往知識融合形成新認知的智能體自演進學習能力,確保其能在面對突發事件、新生問題等強時效性業務場景時提供可靠的知識服務能力,實現數據與知識的持續集成、領域大模型的演進學習,為多模態業務數據的感知與建模、全生命周期業務場景的智慧化精準服務提供底層平臺支撐。
2.技術應用
審計人員依托一站式大模型開發管理平臺技術開展智能審計,應用過程如下。
(1)數據處理與自動標注:收集企業多維度來源的多模態數據,對數據進行標準化處理。利用平臺提供的自動標注功能,對多模態數據進行初步自動標注。自動標注系統通過大模型的語義理解能力,對數據中的關鍵信息進行提取和標注,為后續模型訓練提供高質量的訓練數據集。(2)模型訓練與評估:將處理后的數據注入預訓練的大模型中,進行模型訓練。利用平臺提供的全流程評測工具,定期評估模型的能力。通過配置評測數據集、計算指標等方式,評估模型的準確性、可讀性等。根據評估結果對模型進行調優,提高模型的性能。(3)智能調度與系統協同:利用大模型作為控制器,實現智能調度算法。通過大模型的生成任務規劃,實現對現有模型的選擇和調度,將任務分配給不同的模型執行。生成RPA業務流,實現審計工作的智能化和自動化處理。包括流程的自動設定、關鍵參數的智能設定和調優,實現與以往知識的融合,形成新認知的智能體自演進學習能力。(4)結果展示與決策支持:通過大模型的推理功能,生成審計報告,展示審計結果。審計報告包括對企業財務報表的分析、潛在風險的識別、不合規行為的揭示等內容。根據報告結果為企業提供決策支持,幫助企業改進財務管理、加強風險防控等方面的工作。
四、智能審計的工程化路徑
工程化是智能審計廣泛應用的基礎,是審計向數字化轉型的必經之路。智能審計的核心技術發展和創新為工程化路徑的不斷完善和優化提供了可能,而工程化路徑的實施和應用則為核心技術的進一步發展和應用提供實踐基礎和反饋。
(一)基于多模態大數據的審計數據治理路徑
采用“多模態大數據智能抽取→多方數據隱私計算保護融合→審計元數據管理體系構建”的技術路徑,實現面向多模態審計大數據的安全治理。總體技術路線如圖2所示。
對接多種異構數據源,對異構數據進行梳理轉化,進行數據清洗,對數據進行編碼對齊,實現對采集圖片、文本、音視頻等形式異構數據的智能抽取,做到廣泛的數據采集。構建多方安全計算算法,實現數據存儲加密,在多方安全計算與聯邦學習融合的基礎上,實現數據隱私存儲以及數據交互安全。最后構建一套元數據管理體系,將智能抽取的數據通過元數據體系管理起來,實現數據的高效使用,保證審計質效。
考慮到企業的日常運營涉及多種數據類型,包括文本合同、圖片發票、視頻監控等。多模態數據為審計提供了豐富的信息,也帶來了治理上的挑戰。如何有效保證數據安全、隱私和高效利用,成為審計工作的關鍵。一是多模態大數據智能抽取。使用智能抽取技術從企業各個業務系統中抽取關鍵數據。通過自然語言處理技術從合同文本中提取簽約日期、金額、條款等關鍵信息;通過圖像識別技術從發票圖片中識別出供應商、發票號、金額等信息;通過視頻分析技術從監控視頻中識別出異常行為或違規行為。審計數據治理大大提高了業務數據采集的效率和準確性,為后續的審計分析提供了堅實基礎。二是多方數據隱私計算保護數據融合。大型企業審計涉及多地區和多子公司的數據,采用多方安全計算算法,確保在數據不離開本地的情況下進行聯合分析。對于涉及不同地區子公司的財務數據,利用聯邦學習算法進行模型訓練,實現跨區域的聯合審計保證數據的隱私性。三是審計元數據管理體系構建。構建一個元數據管理體系,將所有抽取的數據進行分類、標簽化和索引。對于合同數據,根據合同類型、簽約方、金額等維度進行分類和標簽化;對于發票數據,根據供應商、發票類型、開票日期等進行分類和索引。通過元數據管理體系,審計人員能夠快速定位到所需數據,達到“如臂使指”的效果。
(二)基于多模態大數據的審計大語言模型應用路徑
采用“預訓練數據準備→大語言模型訓練和評估→知識圖譜融合大模型應用分析”的技術路線,實現面向審計領域多模態大數據的大語言模型應用。如圖3所示。
審計領域需要處理大量多模態數據。為了從復雜的數據中提取有用的信息,選用基于多模態大數據的審計大語言模型。審計機構審查一家大型跨國企業的全部財務數據,并希望使用大語言模型來自動化處理和分析這些數據:一是預訓練數據準備。收集大量的財務報表、合同文本和圖片數據;利用自然語言處理技術對文本數據進行清洗和標注;對圖片數據則提取其中的關鍵信息。經過預訓練數據準備,得到高質量的數據集,為后續的大語言模型訓練和評估提供基礎。二是大語言模型訓練和評估。使用大語言模型,并基于預訓練數據集進行訓練。訓練過程中如發現模型的推理邏輯能力在某些財務報表分析任務上表現不佳,可使用增量微調LoRA方法對模型進行調整,經過訓練和評估,得到一個適用的多模態大數據處理模型。三是知識圖譜融合大模型應用分析。為進一步提高模型的性能,將知識圖譜與大語言模型進行融合。構建審計領域的知識圖譜,包括各種財務報表的實體、關系和規則;利用知識圖譜增強大語言模型的能力,使其能夠更好地理解財務報表中的復雜關系和規則。通過知識圖譜融合大模型應用分析,審計人員發現模型的實體發現、共指消解和關系提取能力得到了顯著提升。
(三)基于多模態大數據的審計智能體自演進路徑
采用“大模型設計→模型評估及生成智能體→審計問題自動發現、審計報告自動生成、審計建議自動輸出等應用落地→審計智能體自演進”的技術路線,實現數據與知識融合驅動的一站式自演進審計應用平臺,總體技術路線如圖4所示。
依托前述工程化基礎,通過提取審計業務活動所涉及的相關數據,采用命令實體分類、文本分類等技術構建可供大模型智能體學習的高質量訓練數據集,使之成為審計智能體的知識底座。針對審計知識底座,利用一站式模型開發管理平臺中的模型微調、評估、部署等功能,完成對大模型的調優,進而形成審計智能體。借助于知識底座的不斷更新,為審計智能體的自演進提供數據基礎。利用RPA技術審計智能體完成對審計業務規則和流程的制定[9],發現業務活動中的關鍵問題、生成審計報告,給出相應的審計建議。在上述基礎上形成基于大模型的審計智能體自演進框架,最后對形成的框架進行人工評價和調整,以使其更為準確和全面地理解審計業務,并最終服務于審計業務。
五、結語
隨著大數據、人工智能等新技術的廣泛應用,特別是大語言模型等的探索應用,能夠迅速處理和理解大量的非結構化數據。審計場景、審計方法、審計過程和審計工具正在經歷著全面而深刻的變革,推動著傳統審計向智能審計轉型,建成新型審計監督體系。現有審計實踐與成果,標志著審計工作不再局限于傳統的數據整理和初步分析,而是更多地依賴自動化流程和先進算法,協助審計人員更快速度、更為準確地挖掘數據模式、規律。
智能審計賦能審計人員更靈活地應對復雜的審計任務,專注于業務分析和方向性決策。審計機關一旦掌握先進的智能審計技術和工具,包括多方安全計算技術、多模態大數據處理、自動化審計測試、智能決策支持、大模型開發管理平臺技術等,實現審計過程的高度自動化和智能化,則審計人員的工作將從繁瑣的數據收集、初步分析中解放出來,轉而致力于對復雜分析結果的深度解讀、決策制定和行業研究。
總之,大數據和人工智能等新技術將為審計領域注入新活力,讓審計人員從煩瑣、初級的數據處理中解放出來,通過深層次的、高維度的數據分析為國家治理提供更有深度和戰略性的審計服務。
【參考文獻】
[1] 習近平.在二十屆中央審計委員會第一次會議上的講話[EB/OL].(2023-05-23)[2024-02-16].https:// www.ccps.gov.cn/tpxw/202310/t20
231031_159717.shtml.
[2] 晏維龍,孟金卓,張璐,等.開展“如影隨形”審計工作的思路[J].審計觀察,2023(8):56-61.
[3] 秦榮生.研究型審計的現實使命與實現路徑研究[J].會計之友,2024(4):2-5.
[4] 葉祥,錢鋼.審計領域大數據治理體系研究[J].網絡安全與數據治理,2023,42(4):27-32.
[5] YAO A C C.How to generate and exchange secrets[C].27th Annual Symposium on Foundations of Computer Science (SFCS 1986),Toronto,ON,Canada,1986.
[6] 李莉,宣佳錚,高尚,等.基于不經意多項式估值的SM4協同加解密方案[J].計算機應用研究,2024,41(6):1862-1868.
[7] GIDDENS S,ZHOU Y,KRULL KevinR,et al.A differentially private weighted empirical risk minimization procedure and its application to outcome weighted learning[Z].2023.
[8] 徐超.審計大模型的構建與運用[J].審計觀察,2023(11):4-7.
[9] 樊俏.財務機器人RPA的智能數據提取與處理技術[J].中國信息化,2024(1):58-59.