
自2022年11月OpenAI(美國的一家人工智能研究與開發公司)發布ChatGPT以來,人工智能進入了快速發展階段。ChatGPT是一種基于Transformer架構(一種在自然語言處理領域具有革命性意義的架構)的自然語言處理技術,廣泛應用于對話生成、文本創作。它標志著AI(人工智能)從過去的“小模型+判別式”轉變為“大模型+生成式”,即大語言模型(LLMs)。從功能方面來看,LLMs屬于生成式人工智能(GAI)。
目前,人工智能技術在各行各業得到了廣泛應用,并呈現出明顯的長尾效應。截至2023年底,關于ChatGPT的學術研究已橫跨計算機科學、法學、信息管理、哲學等多個領域。另外,在金融科技、智慧醫療、智慧交通等實際應用領域,ChatGPT已取得了顯著成績。借助企業級計算平臺(服務器)與微型計算工具(個人電腦與智能手機),LLMs正融入人類的生產生活中。
當各行各業紛紛尋求數字化、網絡化、智能化,力圖實現“人、機、物”三元融合時,審計模式也會隨之發生改變。基于此,本文以人工智能與LLMs的發展為切入點,以大型企業集團審計平臺建設為基礎,結合S集團經濟責任審計案例,探討了LLMs在經濟責任審計中的實際應用。
新技術的應用會帶來審計證據形態與審計取證模式的變革。秦榮升(2014年)認為,審計技術和方法會隨著科學與管理技術的變化而變化。自現代審計理論從西方傳入中國以來,我國審計發展經歷了傳統手工審計、計算機輔助審計、大數據審計三個階段,審計方法也從賬表導向審計、制度導向審計、風險導向審計演變為數據式審計。秦榮生(2014年)提出,云審計平臺和大數據審計分析平臺能夠以審計大數據為中心,進行遠程存儲和移動計算,從而減少數據移動帶來的損耗。在許多企業認識到數據審計平臺的重要性并紛紛搭建該平臺后,秦榮生(2023年)繼續提出,構建數據審計平臺是實施數據導向審計的基礎,并且數據審計平臺應打通不同行業、不同領域、不同單位之間的數據關系,繪制數據關聯網絡,構建數據關系網,從而為實施數據導向審計提供方向。黃佳佳等人(2023年)指出,智慧審計是指將人工智能、物聯網、云計算、區塊鏈等新一代信息技術應用于審計業務活動中,基于人工智能技術將“專家經驗”轉換為數字化大知識和大智能模型,并運用智能化人機交互方式開展審計作業,從而提高審計效率、提升審計質量的審計思維與審計方法的總稱。他們還認為數據審計平臺應包含基礎設施層、數據中臺層與審計知識層。其中,基礎設施層的主要功能是為智慧審計平臺提供基礎軟硬件支持;數據中臺層的主要功能是通過多種方式,采集多源異構數據,對這些數據進行清洗、轉換、分類等處理,將處理后的數據儲存在平臺的數據倉庫中;審計知識層的主要功能是根據審計業務模型需求,從海量數據中凝練出審計領域知識,并構建審計領域知識庫、審計領域知識模型和審計領域大語言模型。
綜上所述,大數據與云計算等新技術的發展促進了審計技術和方法的創新,推動了數據審計平臺的建設。同時,經濟責任審計等審計業務的實施也依賴數據審計平臺的建設與大模型的部署。
經濟責任審計是指審計機關依法依規對黨政主要領導干部和國有企業領導人員經濟責任履行情況進行監督、評價和鑒證的行為。經濟責任審計有利于加強對黨政主要領導干部和國有企業領導人員的管理監督,強化對權力運行的制約和監督,推進黨風廉政建設和反腐敗工作,推進國家治理體系和治理能力現代化。1986年9月,中共中央和國務院頒布的《全民所有制工業企業廠長工作條例》明確規定,廠長離任前,企業主管機關(或會同干部管理機關)可以提請審計機關對廠長進行經濟責任審計評議。這是黨中央和國務院第一次對企業領導人員經濟責任審計提出明確要求,標志著廠長(經理)離任經濟責任審計制度的初步建立。此后,經濟責任審計的審計對象和范圍不斷擴大。1999年5月,中共中央辦公廳、國務院辦公廳印發的《中共中央辦公廳、國務院辦公廳關于印發〈縣級以下黨政領導干部任期經濟責任審計暫行規定〉和〈國有企業及國有控股企業領導人員任期經濟責任審計暫行規定〉的通知》(中辦發〔1999〕20號)提出,對縣級以下黨政領導干部進行經濟責任審計;2005年,黨政領導干部經濟責任審計范圍擴大到地廳級;2010年10月,中共中央辦公廳、國務院辦公廳印發的《黨政主要領導干部和國有企業領導人員經濟責任審計規定》,進一步明確了經濟責任審計對象,擴大了審計對象范圍,使經濟責任審計對象涵蓋了從鄉鎮級到省部級的黨政領導干部,以及國有企業的法定代表人。
需要注意的是,我國經濟責任審計內容往往涉及宏觀政策落實、重大事項決策、風險隱患排查、黨風廉政建設等,覆蓋政策、業務、財務與法律等多個領域,同時文件數據量大且較為分散,難以進行整合與分析。因此,經濟責任審計需要借助數據審計平臺來打通數據關系,繪制數據網,實現對“實體、人員、行為、信息”四類審計客體的全面分析與整體把握。
目前,數據審計平臺往往將單一的數值計算作為審計的方法,并采用編程方法將不同的數據輸入算法模型中得出相應的分析結果,但這種分析結果難以反映業務與財務之間的邏輯關系,也無法作為審計證據。未來,數據審計平臺可以引入人機交互系統,使人與機器雙方可以準確、自然地傳達信息,而無須通過編程來實現。同時,LLMs可以憑借語言理解和記憶功能,聯系上下文,主動串聯起業財數據中的信息點,為審計人員提供審計疑點與證據。因此,在數據審計平臺部署LLMs以輔助審計人員執行審計,既具有必要性,也具有可行性。
簡單來說,語言模型就是一串詞序列的概率分布,而LLMs是基于深度學習技術的神經網絡模型,擅長理解和生成人類語言。提示詞是LLMs在人機交互過程中輸出的關鍵要素,能夠幫助人類實現認知超越。近年來,越來越多的學者開始關注提示技術領域。
目前,提示技術可以根據人機交互方式分為在線提示技術與離線提示技術,在線提示技術通常適用于需要實時交互和即時反饋的情境,而離線提示技術適用于需要大規模處理或預生成文本的情境。另外,提示技術可以根據組織方式,分為輸入輸出提示技術、思維鏈提示技術、思維樹提示技術、思維圖提示技術與思維算法提示技術;可以根據樣本數量,分為零樣本提示技術與少樣本提示技術。其中,思維鏈提示技術是指通過給模型提供多個相關提示,使模型能夠在生成文本時沿著用戶給定的邏輯思維鏈條進行連貫推理的一種提示技術。Jason Wei(2022年)通過研究發現,思維鏈提示技術可以顯著提升LLMs的推理與問題解決能力。Kim等人(2024年)的研究結果顯示,通過使用思維鏈提示技術,LLMs可以模仿人類分析師的思維來分析財務報表數據,其分析預測效果要優于人類分析師的分析預測效果,甚至可與財報分析領域最先進的機器學習算法相媲美。
需要注意的是,在審計領域,不同的經濟責任審計項目通常具有不同的審計內容。例如:貫徹執行重大政策措施情況審計應重點關注是否存在被審計領導干部及其所在單位貫徹執行重大政策措施不堅決、不全面、不到位等情況;重大經濟事項決策及執行情況審計主要對被審計領導干部貫徹執行重大經濟事項決策制度和執行效果情況開展審查評價;組織治理情況審計主要依據國家法律法規、政策和標準及相關規定,對組織治理環境的完善性和監督約束機制運行的有效性等方面進行審查和評價;黨風廉政建設責任和個人遵守廉潔從業規定情況審計主要審查被審計領導干部在任職期間落實職責范圍內黨風廉政建設責任、遵守中央八項規定及實施細則精神和廉潔從業有關規定的情況;等等。因此,審計人員首先應根據經濟責任審計項目的內容,綜合考慮角色、背景、任務、步驟、示例、風格、語氣等因素,編寫模塊化的提示詞;然后在與LLMs實時交互的過程中,以思維鏈的方式確定提問的內容、方式與順序。

本文以S集團審計中心對子公司某技術研究院董事長開展的經濟責任審計為例,并基于相關資料與數據,探索應用LLMs開展經濟責任審計的方法與步驟。
在應用LLMs開展經濟責任審計工作開始前,審計人員首先會研究被審計對象與被審計單位的相關資料,即在LLMs中創建具體的審計場景,使LLMs扮演審計人員的角色,提前知曉審計項目的背景、任務,以及最終輸出分析結果的格式要求等。離線模塊化提示詞在這一過程中發揮著重要作用,能夠幫助審計人員在審計伊始搭建好具體的審計場景。離線模塊化提示詞如圖1所示。
在搭建好審計場景后,LLMs可以運用思維鏈提示技術模仿審計人員分析數據的思路與步驟,按照宏觀、中觀、微觀三個分析維度將提示思路設定為“企業發展定位—領導權責劃分—領導畫像刻寫—內控審查測試—數據分析查疑”,將相應的分析資料按照“黨政方針政策—集團黨組戰略部署—領導個人簡歷、履歷與會議講話—內控風控體系—業務財務數據”的順序進行排列。這樣一來,審計人員能夠通過LLMs來把握被審計對象,快速發現審計疑點與線索。提示詞與分析結果如圖2所示。

LLMs在經濟責任審計中的應用研究結果顯示,隨著人工智能的快速發展,在數據審計平臺上使用LLMs實施審計是實現審計全覆蓋、提高審計質量與效率的必由之路。在該數據審計平臺上,審計人員能夠應用LLMs全面分析經濟責任審計數據,從而快速發現審計疑點與線索。未來,筆者將繼續探索如何使用LLMs開展其他審計(如工程審計、績效審計等)。
(作者單位:南京審計大學)