




【摘 要】 大語言模型在重塑知識檢索與問答系統上取得重要進展。在審計數智化轉型背景下,構建基于大模型的審計知識問答系統是提升審計效率的關鍵途徑。文章提出一種基于大模型“智能驅動”的審計知識問答系統構建范式,核心思想是利用大模型的世界知識和審計領域高質量數據源,使大模型適應具體業務需求,實現細粒度審計知識的理解,并通過人機協作方式輔助審計人員高效決策這一范式將通用人工智能與審計人員的實踐經驗相結合,共同推動智能決策過程的實現。基于該研究方案構建的審計知識問答系統將智慧審計理念付諸實踐,賦能審計高質量發展。
【關鍵詞】 智能驅動; 審計大模型; 審計問答系統; 數智化審計
【中圖分類號】 F239.45" 【文獻標識碼】 A" 【文章編號】 1004-5937(2025)09-0024-07
一、引言
大語言模型(Large Language Model,LLM)(簡稱“大模型”)作為新一代人工智能(Artificial Intelligence Generated Content,AIGC)技術的典型代表,正在深刻影響著審計行業的發展[1]。大模型豐富的世界知識、流暢的人機對話能力和強大的語言理解能力使其成為構建審計知識問答系統的最佳模型。問答系統以用戶提問和系統回復的方式實現人機交互,可將形式多樣的審計應用場景整合到一個系統中,既極大降低了審計人員利用人工智能技術的難度,也增加了人機交互的靈活性,實現了對審計專家經驗的充分利用。
然而,由于審計領域知識專業性以及對答案精準性要求,直接應用通用大模型構建問答系統難以滿足審計實踐需求,因此,探索構建適用于審計領域的知識問答系統具有重要研究意義和實踐價值。本文提出一種基于大模型“智能驅動”的審計知識問答系統構建范式,并設計了該系統架構方案,以期為AIGC技術在審計領域的實踐應用提供新思路。
二、文獻回顧
在信息化背景下,我國審計已經經歷了計算機輔助審計、聯網審計和大數據審計三個階段[2],正在積極探索和實踐智慧審計[3],以提高審計效率和質量。自知識圖譜概念被提出以來,信息系統的構建逐漸轉向以“知識”為核心,而非傳統的“數據”驅動模式,輔以人工智能和知識圖譜的智能問答系統實現了從“數據”到“數智”的躍遷[4],審計方法也從大數據審計階段過渡到智慧審計階段[3]。
審計數智化轉型時代[5],大數據[6]是實現智慧審計的抓手,為智慧審計提供海量的電子數據;而人工智能開始在智慧審計中發揮大腦作用。在智慧審計實踐方面,陳雪嵩[7]探討了大模型在企業內部審計中的應用思路及技術細節;劉錦[8]討論了AIGC技術在審計全過程的應用場景,并探索“開源大模型+檢索增強生成技術(Retrieval-Augmented Generation,RAG)”在審計領域的應用原型與實踐效果;萬鈞[9]從審計知識管理視角設計了基于大模型的審計知識應用框架,即通過構建審計知識倉、審計知識管理系統和審計知識應用場景,形成一套高效的審計知識管理應用體系。然而,大數據到人工智能不僅是從數據到知識的躍遷,更是從傳統范式到融合范式的探索[4]。因此,本文在劉錦[8]研究基礎上,從系統構建視角進一步探究AIGC技術與審計領域深度結合的理論框架,從理論上創新審計大模型構建新范式,即“智能驅動”范式,進而設計基于大模型的知識問答系統架構方案,讓AIGC技術賦能審計高質量發展。
三、審計問答系統應用場景探討
(一)當前審計信息檢索面臨的困境
目前審計機關利用信息檢索技術強化審計知識支撐時,主要面臨以下三類矛盾:
一是豐富的審計知識與低效的檢索方法之間的矛盾。隨著信息技術在審計行業的深入應用,審計領域積累了大量的專業知識和歷史數據,包括法律法規、政策文件、審計報告、財務報表等,它們構成了審計知識的基礎[9]。盡管審計知識量巨大,但審計人員在檢索知識時往往依賴于傳統的搜索引擎技術,這些技術在處理非結構化文本、多表格數據時難以快速準確地找到所需信息。
二是相關性低的原始檢索結果與生成式答案之間的矛盾。基于檢索系統獲得的反饋信息往往包含若干個相關網頁,這些網頁的內容信息分散、“雜質”較多,并非用戶想要的答案形式。審計人員期望系統可以將這些分散的信息整合起來,根據用戶輸入需求,形成一個連貫、有邏輯、按照指定格式輸出的結果。
三是簡單信息檢索結果與復雜問題推理之間的矛盾。信息檢索系統?;陉P鍵詞匹配,能夠快速反饋與查詢相關的信息,但缺乏對信息背后復雜邏輯的理解和分析。此外,此類檢索方式只能觸及信息表面,無法深入分析信息的深層次含義及上下文聯系;而審計人員期望得到一個準確、精煉的答案。因而信息檢索無法滿足需要進行深入分析的復雜問題和多跳推理問題的應用需求。
(二)審計知識智能問答應用場景設計
基于大模型的審計問答系統應立足于審計行業,以滿足審計人員業務需求為核心,以互動式問答為使用模式,旨在清晰、準確地回答審計相關問題,輔助撰寫審計相關文檔?;诖耍疚膶⒃撓到y命名為審計知識智能問答大模型系統(簡稱“審計問答系統”)。具體來說,本文認為該系統需要滿足以下三類應用場景。
1.審計知識的理解與智能問答
審計問答系統的第一個任務是與審計知識相關的交互式問答。審計人員向問答系統輸入問題,并期望獲得準確答案。該場景對應的系統設計難點在于:(1)問答系統能夠準確理解審計人員輸入的各種類型、各種表達方式的問題;(2)問答系統能夠準確回答這些問題,這里既需要考慮答案準確性,也需要考慮答案多樣性。這就要求問答系統在模型構建時既具備充足且廣泛的知識儲備和自然流暢的語言表達能力,也需要學習和掌握審計領域相關知識,如審計法規制度文件、審計案例等,還需要在問答系統中輔以企業內部資料的知識庫支持,實現對隱私信息或精準度要求極高問題的答案溯源。
2.審計問題定性與法規推薦
第二個任務是檢查審計項目是否存在違規違法問題,并判斷哪些法規制度可以作為該問題的審計依據。這一應用場景要求問答系統能夠從輸入的審計底稿中總結審計問題,并“檢索”而非“生成”恰當的法規制度作為該審計問題的定性依據和處罰依據。該場景對應的問答系統設計難點是基于審計底稿的問題總結能否抓住本質,進而在定性問題上能否引用恰當且準確的法規制度。這要求問答系統的答案具有零幻覺能力和盡可能高的準確率,并依據已有的法規制度等知識檢索出原始文件作為解釋和佐證。
3.指定格式/內容的審計文檔生成
審計問答系統不僅需要回答審計相關問題,還能夠根據審計人員需求總結、改寫、擴寫、撰寫各類審計文檔。這些需求要求系統可以分步執行審計人員的命令,并具有較強的上下文記憶能力。此外,在這一過程中,系統可能需要與審計人員進行多輪交互,并在審計人員提供的知識和提示下實現最終文檔生成。
四、“智能驅動”的審計問答系統構建范式
在審計領域,審計問答系統主要是指針對企業或審計機關的各類審計知識及圍繞這類知識所衍生的各類問答場景,構建一個基于大模型的智能問答系統。該系統以企業知識體系為知識源,以大模型為引擎,結合檢索增強生成技術和智能代理技術,構建一個既滿足開放性也滿足精準性需求的審計知識智能問答系統。為此,本文提出一種“智能驅動”的審計問答系統構建新范式,在“數據驅動+模型驅動”融合范式[3]基礎上,強調以大模型為基座,以高質量領域數據為素材,構建“智能驅動”新范式,體現世界知識與領域知識協同決策的訴求。
(一)傳統范式下問答系統面臨的挑戰
傳統檢索/問答系統構建時根據所需要關注的領域視野、問題類型和數據資源Dsmall,構建滿足功用的系統,即構建映射函數y=f(x)。對輸入問題x,問答系統反饋答案,其中函數f由領域數據資源Dsmall將問題映射為答案,該映射過程可以是基于字符串匹配的記錄查詢、基于關鍵詞檢索的搜索引擎、基于知識圖譜的答案推理。然而,數據驅動或模型驅動的研究范式在實際應用中面臨嚴峻挑戰。一是模型針對性較強,即模型是為特定類型的任務而設計的(如分類模型、推薦模型、檢索模型等),不具備任務遷移能力;二是數據來源較窄,即針對特定應用領域構建數據資源,面向領域外的問題數據覆蓋面不足;三是系統使能有限,即模型是基于特定領域的有限數據量構建而成,其具有“從零構建”“一類問題一個模型”的特點,進而使得應用企業需要構建多個功能類似的系統,增加了企業建設成本;四是無交互問答,即系統只能根據用戶輸入問題給出一個答案,無多輪的人機交互能力。
(二)“智能驅動”范式下的模型闡釋
如圖1所示,本文提出的“智能驅動”問答系統構建范式可有效應對上述挑戰。該系統構建范式具有如下三個特征。
首先,該范式以大模型為內核,已包含了廣泛的世界知識。世界知識是指大模型以海量的、包含各種場景的世界知識語料庫數據Dbig為基礎,以包含數百億甚至千億參數規模的深度神經網絡模型為框架,在模型預訓練過程中編碼了從基本事實信息到復雜社會規范和邏輯結構的廣泛世界知識,并以自然文本的形式存在。因此,大模型具有通用人工智能的特點,不僅能回答有明確答案的問題,還具有較強的邏輯推理和求解不確定性問題的能力。因而模型映射函數f(·)=F(Dbig)使能較強,即針對用戶輸入x,問答系統依據大模型輸出相應結果y=f(x)。該交互形式廣泛適用于各類型問答任務,包括領域知識和世界知識問題。
其次,“智能驅動”范式具有較強的領域適應能力。領域適應是指問答系統能夠理解審計領域的具體需求和細粒度知識和提問,進而滿足知識問答和智能決策的需求。這里需要通過知識對齊和檢索增強生成兩種方式實現領域適應。在知識對齊階段,使用較小規模的領域數據Dsmall使原有大模型對齊領域數據,即f-gt;f’,f’(·)=F(Dsmall),其中F(Dsmall)即為大模型的知識對齊函數,一般采用可微調算法f'(·)=F(Dsmall)使得模型的映射函數由f調整為f'。知識增強是指通過整合企業或審計機關內部知識和資料以提高問答結果的精準性,即構建審計知識倉[9]。在檢索增強生成階段中,針對用戶輸入x,從審計知識倉中檢索與之相關的知識源k,并將其交由大模型根據問題進行答案整合。需要說明的是,在領域適應訓練與應用時,可將開放的通用大模型下載到本地并利用小規模領域數據中進一步訓練和在局域網內部署應用。
最后,“智能驅動”范式具有靈活的人機協同能力。在人機協同決策過程中,可將人類決策過程抽象為智能代理可完成的業務流程。智能代理通過對用戶提問的深入分析,并通過知識庫檢索、大模型答案生成、信息組織和規劃等一系列過程實現最終決策。這一過程利用大模型內嵌的廣泛知識、領域知識倉的精準知識以及智能代理的業務流程智能化編排答案推理過程,最終完成智能決策。
簡而言之,“智能驅動”范式的審計知識智能問答系統具有開發成本低、脫機/局域網使用、領域適應性強、使能創新能力更強的優勢。
五、基于大模型的審計問答系統架構設計
當前通用大模型直接應用于現實業務場景時容易產生幻覺問題,這會降低系統性能,無法滿足用戶的期望[10]。審計大模型應著眼于人與模型的協同合作,共同高效、準確地完成審計任務[7]。這一需求不僅要求審計大模型能夠掌握審計領域概念、術語、知識等,還需要大模型能夠理解審計工作基本流程,以其較強的上下文記憶能力、知識檢索與復雜問題推理能力、流暢的文本生成能力等輔助審計人員高效、高質量地完成審計工作。因此,本文從領域適應角度設計基于大模型的審計知識問答系統架構方案,使其能夠對審計領域的術語、概念和規則有更深入的理解,從而提供更準確和可靠的結果。系統架構如圖2所示,包括五層結構:數據倉庫層、數據工程層、模型倉庫層、模型任務層和系統應用層。
(一)數據倉庫層
數據倉庫層的主要功能是為大模型知識對齊和推理應用提供領域專有數據?;趯徲嫶竽P蛻脠鼍暗某橄笈c凝練,并結合審計大模型構建實踐經驗,本文認為與審計問答系統密切相關的領域知識包括所在企業或機關所使用的審計法規制度、審計案例、審計問題定性與法規推薦、審計報告文檔等信息。這些領域數據涉及審計業務的方方面面,具有質量高、專業性強、文檔較長等特點,既可為審計大模型知識對齊提供高質量的訓練數據源,也可為審計大模型推理應用提供可溯源的審計知識倉,提高了問答系統的可解釋性和忠誠度。此外,數據倉庫層需要確保領域數據覆蓋全面、實時。
(二)數據工程層
數據工程層的主要功能是為問答系統提供各類數據處理與轉化組件,包括:
1.數據清洗,即將原始非結構化文檔分塊、切片轉化為細粒度文本片,如將電子書《審計常用定性表述及適用法規導向——固定資產投資審計》按章節內容分成若干文本片,每個片段涉及一個審計問題的【表現形式】【定性依據】【處理處罰依據】等字段。
2.數據標注,即對審計數據標注類別信息,如對上述電子書中的審計問題“未按規定繳納印花稅”標注所屬類別為“固定資產投資審計”。
3.特征抽取,即針對較長文本從中抽取出所涉及的審計疑點、法規名稱等自定義特征,以便對該數據進一步構建大模型微調任務和提高檢索召回的準確率。
4.問答對構建,即對結構化文本數據通過大模型轉換為問答對形式,其作用在于將法規制度等條款型文本轉化為自然問答對形式,便于構建大模型知識對齊的指令數據集。
5.指令構建,即通過提示工程將問答對根據不同任務需求進一步轉換為指令數據,通常包括一個問題、任務描述或預定義的文本片段,用于指導模型生成合適的文本結果。指令能夠幫助語言模型更好地理解特定任務。
6.數據向量化,即將文本片和問答對等非結構化數據通過向量模型轉換為數值向量并存儲到向量數據庫中。此外,在審計業務場景中經常面臨審計人員對提交的臨時/局部/私有知識文檔進行檢索的場景,而這些知識在審計大模型知識對齊階段并未涉及,需要在推理階段額外提供給大模型。為解決這類知識更新問題,可采用數據向量化方式將臨時輸入文檔切片并轉換為數值向量為審計大模型回答用戶提問提供新的獨有數據。
最后將整理好的數據分別存入指令數據庫和向量數據庫中供領域大模型知識對齊和推理應用使用,數據工程的整體處理流程如圖3所示,通過對數據倉庫中各類型數據進行處理與轉化,可將繁雜無組織的領域原始數據轉化為精簡無冗余、高質量、具有強特征表達能力的大模型數據。
(三)模型倉庫層
模型倉庫層主要為問答系統提供關鍵算法模型,包括:(1)提示工程,即設計和優化輸入提示以有效引導大模型生成所需輸出的過程。提示工程的目標是通過精心設計的提示詞,結合用戶輸入使系統的回復更加準確、相關。(2)通用大模型,主要指當前主流開源大模型,如LLaM、QWen、ChatGLM等。由于大模型是在數萬億字符集上通過復雜的深度學習算法訓練而得,已具備了廣泛的世界知識與流暢的人機對話能力,是問答系統走向通用人工智能的重要橋梁。使用已有的開源大模型作為審計智能問答系統的基礎模型可有效節約開發成本和開發時間。(3)嵌入模型,即將文本、圖像等轉換為數值向量的模型,如Text-embeddings、M3E等。嵌入模型選擇的關鍵在于該模型能否將領域文本映射到一個恰當的語義空間,使得文本之間相似度度量更加準確。嵌入模型對大模型能否從大規模知識庫中檢索到恰當的答案至關重要。(4)微調算法,指在通用大模型(如QWen)基礎上,通過在特定任務或領域數據集上進行知識對齊,以優化模型在特定應用場景中的表現。在領域大模型建設中,基于指令數據集通過微調算法(如LoRA)構建一個領域適應性好、知識與任務理解能力強的領域大模型是一種常見建設思路。(5)智能代理是使用自然語言處理和機器學習技術來創建能夠自主感知、決策和行動的系統。利用大模型的自身能力,智能代理可以不斷學習和適應新的任務和環境,因而可用于知識檢索與歸納、審計定性法規推薦、審計報告生成、財務報表分析等復雜任務。
(四)模型任務層
模型任務層的主要功能是根據審計知識智能問答系統建設要求抽取和設計大模型建設任務,主要包括:
1.知識對齊
基于大模型知識對齊的本質特征,結合提示工程抽象出各類大模型微調任務。一般可以將知識對齊任務分為3個層次,包括句子級、段落級和文檔級,并構建不同任務的微調指令數據集。句子級任務側重于信息抽取與短語分類,如從審計文本中抽取審計問題、法規名稱等實體,構建實體關系分類等。段落級任務側重于根據提供的信息自動回答各類審計問題,如審計知識的概念與定義、法律制度相關問答、審計問題定性與法規推薦等。文檔級任務側重于綜合文件的分析和生成,包括審計風險/問題分析、審計案例/報告生成等,該答案在滿足準確性要求下,還具有較強的開放性和多樣性。
2.檢索增強生成
檢索增強生成的目的是從審計知識倉中準確無誤地找到與用戶查詢最相關的知識片,這對降低大模型幻覺問題至關重要。受限于訓練數據的時效性和領域局限性,當涉及實時數據或專業領域知識時,大模型的生成結果可能不夠準確,這時需要引入額外的知識庫輔助大模型生成準確答案。例如,審計大模型在回答法規制度類問題時需要準確生成法規原文內容,這時可從向量數據庫中檢索出相關文本片段并按相關性排序作為問答系統的答案輸出。
基于RAG的審計大模型推理流程如圖4所示。首先對審計知識倉中的文本切片并通過索引優化構建與向量數據庫之間的索引關系;其次,在大模型推理階段,根據用戶輸入問題從向量數據庫中通過相似度計算及檢索重排獲得一組與問題相關的文本片作為召回信息反饋給審計大模型;最后,在大模型答案生成階段,對輸入的用戶問題結合召回信息重寫問題,并按用戶輸入要求生成相應答案。這一過程既利用了大模型對輸入問題的解析和重構能力,也利用檢索召回技術為大模型生成答案提供相關素材,有效降低了大模型的幻覺問題。
3.模型評估
模型評估的目的在于評測所構建的審計知識問答系統能否滿足審計人員的實際應用需求。在審計大模型系統評估中,除了常規的系統功能性、兼容性、并發性、可用性等評估指標外,還需評估大模型的通用人工智能水平,一般可通過測試生成答案的準確性、相關性、忠實性等評估大模型語言理解能力、語言生成能力和任務完成能力,通過對噪聲和敏感數據的測試評估大模型的魯棒性和確保內容安全能力。
(五)系統應用層
系統應用層的主要功能是實現產品部署與應用,進而獲得一組審計大模型生態系統,即為審計人員設計一個或多個方便易用的審計知識問答系統前端。從審計實踐調研中發現,審計大模型的主要應用場景包括審計問題定性與法規推薦、審計智能問答、審計文檔生成等。面向上述場景,適宜的審計大模型信息系統形態包括:(1)微信小程序:該產品形態簡單易用、便于推廣,適用于非敏感審計信息查詢檢索,如查詢審計準則與法律法規、審計問題表現與相似案例等。(2)Web瀏覽器方式是常用的問答系統呈現方式,該方式可在企業局域網內部署,產品功能較為豐富,可實現多輪問答、基于自定義文檔的問答與內容生成、數值計算、審計報告生成等各類任務。(3)系統插件,即將大模型嵌入到企業的其他內部信息系統(如審計業務系統)中,輔助提升其智能化水平,如實現從審計底稿中自動總結審計問題、對審計問題自動生成問題分類與推薦定性依據等功能。(4)OpenAPI,即將審計大模型的各類功能以標準化接口形式封裝起來,使得這些功能能夠被關聯企業或下游機關單位方便地集成和調用,從而大大擴展了智能問答系統的應用范圍和推廣價值。
六、審計大模型問答系統構建實踐——以中石化審計智能問答系統為例
大型國有企業內部審計由于審計數據量龐大且審計流程復雜,其工作既依賴于人工操作,也需要輔以大量的電子文檔(如法規制度、審計案例等),因而整個審計過程耗時冗長、效率不高且效果不彰[6]。為提高審計工作效率、準確率和覆蓋率,基于本文提出的“智能驅動”范式設計審計問答系統架構方案,以中石化內部審計為應用需求,探討基于大模型的審計知識問答系統示范應用。
(一)審計知識智能問答系統需求分析
通過對中石化審計部實際應用場景深入解析與探討,歸納出中石化審計知識問答系統的開發需求。
1.準確性。系統首先需要保證能夠精確理解用戶的查詢意圖,并提供準確無誤的答案或信息,真實反映中石化內部審計相關的知識和法規。
2.時效性。系統應能夠識別并糾正錯誤或過時信息,保持知識的時效性和準確性,如《中華人民共和國會計法》2024年7月已施行新版本,需要及時將該知識更新到系統中。
3.唯一性。系統提供的答案或解決方案具有排他性,即在特定情境下是最適用和最合適的,特別是針對企業內部信息和有確定答案的問題,要求系統能夠給出唯一準確的答案。
4.開放性。針對審計文檔生成、審計底稿總結、審計意見撰寫等具有一定開放性和發散性的任務,系統在確保準確性的前提下,能夠變換語言組織,給出更加開放多樣的答案。
5.隱私性。問答系統應實施嚴格的訪問控制措施,確保只有授權用戶才能訪問相應等級的知識庫信息。
6.安全性。確?;诖竽P偷膯柎鹣到y在所有階段都受到保護,這包括數據安全、模型安全、系統安全、內容安全、認知安全和倫理安全等。
(二)中石化審計知識智能問答系統構建
1.模型選擇。在審計實踐調研基礎上凝練和抽象出三個關鍵業務場景,即審計知識的理解、審計問題定性與法規推薦和審計文檔生成。基于上述應用場景抽象出審計大模型知識對齊任務,進而實現領域任務個性化定制,并構建一份包含多個任務的審計大模型評測數據集用于評估現有大模型(如Baichuan、Qwen、ChatGLM3)對審計領域知識的掌握和運用能力,最終選擇國產大模型通義千問(Qwen-14B)為問答系統提供通用世界知識。
2.領域適應。參考已有大模型訓練思路[11],構建面向中石化內部審計的大規模、高質量、有監督指令數據集并通過指令微調獲得中石化審計大模型。該模型以中石化審計關鍵業務場景為基礎,通過審計領域數據微調讓通用大模型掌握更豐富、更細粒度的審計領域知識、概念及其關系,并理解中石化內部審計中的常見問題。此外,在模型評估階段,從多個維度、不同指標對比評估了中石化審計大模型與通用大模型在審計任務上的完成能力。表1對比展示了該模型與Qwen-14B在中石化審計中一系列任務上的性能。評估結果表明中石化審計大模型具備更強的中石化審計領域任務完成能力,任務理解與答案質量均優于通用大模型,領域適應性良好。
3.人機協同。以檢索增強技術為大模型提供細粒度的中石化內部審計知識,以智能代理封裝審計問答系統業務流程,并以Web瀏覽器方式作為問答系統呈現方式。在該模式下,基于中石化審計大模型的問答系統已預先載入大量審計相關文檔、高質量問答對等審計知識倉。智能代理判斷用戶提問意圖并選擇恰當的業務流程實現對輸入問題的解析與優化、對相關知識的檢索與召回、調用大模型進行答案組織與生成輸出等。圖5展示了基于智能代理的問答結果及答案溯源信息??梢钥闯觯陬I域大模型的審計知識問答系統不僅能更準確地理解各類審計任務,還能給出更加準確、可解釋的答案來源。此外,審計人員可通過與大模型進行多輪對話、向系統提交文檔等方式實現人機協同,使得該系統能更好地理解不同審計人員的提問意圖,也能實時接收審計人員經驗知識實現更高效的人機交互,共同完成審計作業。
七、結語
隨著以大模型為代表的通用人工智能的快速發展與廣泛應用,人工智能驅動的審計知識智能問答系統成為實施智能化審計流程的有力助手。相關監管及研究機構已經開始探索大模型審計相關研究與實踐,從數據、模型、應用場景等開展前瞻性的探索。各級審計機關和國有企業內部審計部門也應結合自身發展現狀,有步驟、有計劃地開發基于大模型的審計知識問答系統。借助大模型所內嵌的豐富世界知識與較高智能水平,輔以高質量審計領域知識與審計人員的專業經驗,相信基于大模型的審計問答系統能夠提高審計工作效率、提升審計工作質量。
為充分發掘大模型潛力,審計部門可根據自身業務需求的迫切性,凝練大模型應用場景、構建大模型運用數據源進而定制部門私有化大模型系統,讓通用人工智能真正助力審計工作,也希望本文的研究框架能為大模型落地審計領域提供一定的指導和借鑒,也為行業大模型健康有序發展提供支撐。
【參考文獻】
[1] LIBBY R,WITZ P.Can artificial intelligence reduce the effect of independence conflicts on audit firm liability?[J].Contemporary Accounting Research,2024,
41(2):1346-1375.
[2] 徐超,陳勇,葛紅美,等.基于大數據的審計技術研究[J].電子學報,2020(5):1003-1017.
[3] 黃佳佳,李鵬偉,徐超.面向智慧審計的思維變革與審計平臺構建研究[J].審計研究,2023(5):11-20.
[4] 陳國青,任明,衛強,等.數智賦能:信息系統研究的新躍遷[J].管理世界,2022,38(1):180-196.
[5] 楊柔堅.數智化轉型背景下審計工作高質量發展研究[J].審計研究,2024(1):18-27.
[6] 劉國城,馬欣萌,徐志.審計全覆蓋驅動下大數據審計平臺構建研究[J].會計之友,2021(11):125-132.
[7] 陳雪嵩.大語言模型在企業內部審計中的應用研究[J].會計之友,2024(11):23-29.
[8] 劉錦.AIGC技術在國家審計中的應用[J].審計研究,2024(4):18-29.
[9] 萬鈞.基于大語言模型的審計知識應用研究[J].審計研究,2024(5):38-44.
[10] ZIWEI JI,NAYEON LEE,RITA FRIESKE,et al.Survey of hallucination in natural language generation[J].ACM Computing Surveys,2023(55):1-38.
[11] JIAJIA HUANG,HAORAN ZHU,CHAO XU,et al.Auditwen:an open-source large language model for audit[C].Chinese Computational Linguistics (CCL),Lecture Notes in Computer Science,2024(14761):505-521.Springer.