






[摘要] 本文以“文心大模型4.0”為例,系統分析了通用大模型在注冊會計師審計的審前、審中、審后各環節的應用。通過對注冊會計師審計的全環節具體應用分析,提出如何讓輸入提示詞具體明確、如何更有效解讀輸出結果等方面的建議,為通用大模型在注冊會計師審計中的應用提供更多實踐參考與理論視角。
[關鍵詞]通用大模型" "大語言模型" "注冊會計師" "審計" "應用
一、引言
自然語言處理技術的一個重大進步是大語言模型的出現。由于大語言模型結合了大規模體系結構和大量文本訓練數據,能夠生成類似人類邏輯的文本及回答,并以高精度完成其他與語言相關的任務,加上更為復雜高效的模型算法與更加強大穩定的算力優勢,在醫療、教育、金融等領域已有應用并引發較多研究與探索。
然而,目前大語言模型在審計實務中的應用尚處于初步階段,盡管已有“Kuaiji”“審元”等審計領域的垂直大模型,但其技術支撐、專業性能、信息安全等方面都還有待提升,且相關規定與標準尚不完善,加上審計工作對準確性與穩定性有較高要求,因而審計領域垂直大模型目前在實務中的應用相對較少。另一方面,由于通用大模型推出已有一段時間,且已積累各種實例,從技術基礎、應用程度、影響范圍等維度看,與垂直大模型相比,注冊會計師在審計中應用ChatGPT、文心一言等通用大模型更具有“較易可得性”“成本較低”“相對安全”等優勢。鑒于國內上市公司相關信息數據的語言特征,本文著重研究通用大模型“文心一言4.0”在注冊會計師審計中的應用。
學術界關于大語言模型在審計中的應用已有大語言模型垂域推理能力、在內部審計方面的應用、部分審計應用場景案例等方面的相關研究與探索,但鮮有專門針對通用大模型在注冊會計師審計各環節、全流程應用的系統分析。區別于籠統地從審計視角或AI視角進行的相關研究,本文以具體大語言模型(文心大模型4.0)在具體審計類別(注冊會計師審計)的具體審計環節與審計流程(了解審計新規→尋找審計客戶→風險評估程序→進一步審計程序→審計報告→期后事項)的應用進行研究,為大語言模型在注冊會計師審計中的應用改進與效果提升提供一定理論借鑒與實踐參考。
本文將注冊會計師進行上市公司年度財務報表審計的相關環節分為審前、審中、審后環節,因此下文將主要對通用大模型“文心大模型4.0”在注冊會計師審計這三個環節的具體應用場景案例進行分析。
二、通用大模型在審前環節的應用分析——“詢良師,覓益友”
審前環節對執業注冊會計師來說首先是了解相關領域的最新規定,然后尋找審計客戶(如是連續審計需評估審計客戶也可參考下述相關分析),最終確定接受委托則雙方簽訂審計業務約定書。以“詢良師,覓益友”恰可譬喻通用大模型在審前環節的應用,從注冊會計師自身和客戶兩大“源頭”控制審計風險。此處“詢良師”主要指通過詢問通用大模型了解審計新規方面的應用,師者有指引、指導之功,與通用大模型有相似之處。“覓益友”則主要指通用大模型在尋找審計客戶中的應用,審計客戶質量越好審計風險相對越低。
(一)通用大模型在了解審計新規中的應用
注冊會計師是高質量落實財會法規制度的監督者與支撐者,因此對于注冊會計師來說了解相關最新規定非常重要。以“文心大模型4.0”應用為例:假設查找目標為“了解最新的關于簽訂審計業務約定書的審計準則規定”。如果對目標不太清楚則輸入內容比較簡略、模糊,如表1中第1次輸入的提示詞為“哪一項審計準則名稱含有業務約定書”。第2次輸入的內容更明確,相應的輸出內容也更詳細,但在未限定字數的情況下大語言模型可能會“長篇大論”,而限定字數的輸出結果,參見表1中第3—5次所示。在第4次提問中增加“請列出準則的詳細名稱”,輸出內容含有《中國注冊會計師審計準則第1111號——就審計業務約定條款達成一致意見》,基本達成目標。第5次和第3次輸入內容相同,但輸出內容有所不同,表明大模型在不斷“自我成長”。
(二)通用大模型在尋找審計客戶中的應用
2020年,新修訂的證券法實施后,會計師事務所從事證券服務的資格從“審批制”改為“備案制”,加劇了審計行業市場的競爭,因此尋找優質審計客戶就顯得尤為重要。以“文心大模型4.0”應用為例:假設目標為“尋找一家上市公司潛在客戶,條件為該上市公司財務與經營業績較好、盈余管理指標低、資產規模約為人民幣1億元左右,需了解公司具體名稱與推薦理由”。如表2所示,前兩次輸入內容的區別在于第2次含有“請列出公司完整名稱與推薦理由、具體盈余管理指標值”,而第1次未含完整二字及具體盈余管理指標值,但兩次輸出的結果都并不令人滿意,因為都未指出具體公司名稱。第3次輸入內容中添加“深交所上市的公司,該公司登記注冊地在廣東”以及“請列出這家上市公司的名稱和股票代碼”,此次輸出內容含具體公司名稱,基本達到目標。第4次在第3次的基礎上增加列出“盈余管理指標值”要求,但“文心大模型4.0”似乎對該指標“比較謹慎”,第2次輸出內容中含“盈余管理指標中的可操控性應計利潤較低,僅為0.05”,但未含公司具體名稱,而第4次輸出內容則含公司具體名稱但未含具體盈余管理指標值,具有回避風險“意識”。另外,可進一步提問公司的財務指標、近三年利潤、違法違規行為、交易所對該公司信息披露考評的結果等,以更全面的信息指導是否承接業務的決策。
三、通用大模型在審中環節的應用分析——“增信源,降風險”
通用大模型在審中環節的應用,主要分析“文心大模型4.0”在注冊會計師審計的風險評估程序、進一步審計程序(包括控制測試與實質性程序)及審計報告環節的應用。本文提到的信源是指通用大模型的“參與主體”,由于通用大模型“參與主體”與信息來源規模巨大,在審計過程中有效應用有助于拓展相關信息來源、提高信息質量,從而降低審計風險。
(一)通用大模型在風險評估程序中的應用
風險評估程序是指注冊會計師為識別、評估財務報表層次和認定層次的重大錯報風險而設計和實施的審計程序。雖然風險評估程序的詢問、觀察和檢查等程序難以直接通過大語言模型進行分析,但依然可通過大語言模型對公司是否有違法違規的報道、公司所屬行業面臨的市場形勢、法規政策變化、公司所屬地域的經濟發展情況、是否并購、公司組織結構及所有權等進行相關分析。以“文心大模型4.0”應用為例:假設用戶目標為“了解華光環能行業形勢”。如表3所示,4次提問的輸出內容都基本圍繞華光環能所在行業形勢,第2次與第3次結果顯示如用戶希望輸出含有具體數字、具體名稱等較為具體的內容,那么輸入內容需盡可能準確。
(二)通用大模型在控制測試中的應用
控制測試是指用于評價內部控制在防止或發現并糾正認定層次重大錯報方面的運行有效性的審計程序。由于被審計單位的內部控制制度難以通過公開途徑獲取,并且將被審計單位內部控制制度上傳至大語言模型進行分析很可能違反如保密性等相關規定,因此大語言模型在控制測試方面的應用更像“間接”應用。假設注冊會計師需測試被審計單位的一項內部控制制度“存貨出庫需由庫管人員審批”是否有效運行,大語言模型可幫助注冊會計師了解相關產品生產過程,有助于更有針對性地開展控制測試。以“文心大模型4.0”應用為例:用戶目標為“了解華光環能主要產品的生產”。如表4所示,第1次輸出的內容答非所問。第2次輸入內容修改之后實現所答即所問。為了更詳細、準確了解目標內容,設計了第3次和第4次提問,兩次的輸出內容均有助于審計人員加強對華光環能存貨中燃機余熱爐的了解,從而結合該產品出庫數量、次數、物流運輸憑證等更有針對性地進行控制測試。
(三)通用大模型在實質性程序中的應用
實質性程序是指用于發現認定層次重大錯報的審計程序,包括對各類交易、賬戶余額和披露的細節測試以及實質性分析程序。以“文心大模型4.0”應用為例:用戶目標為“了解華光環能主要產品燃機余熱爐的售價”。如表5所示,第1次輸入內容指定“2022年的行業平均售價”,無法輸出目標內容。第2次輸入內容提醒了信息來源渠道,輸出內容至少含有“數萬元”“數十萬元”這樣的具體數據。第3次輸入內容既指明途徑也限定了時間,并且說明列出“具體售價”,輸出內容含具體數字。為了解被審計單位產品可能位列的級次,第4次提問涉及“高端燃機余熱爐”。以上應用幫助審計人員了解產品市場售價,有助于提升對被審計單位主營業務收入的“發生”“完整性”認定等方面職業判斷的準確性及審計效果。
(四)通用大模型在審計報告環節的應用
審計報告涵蓋的信息具有高度綜合性,體現了對前面所有審計程序及審計內容的綜合考量。以“文心大模型4.0”應用為例:用戶目標為“根據未經審計的華光環能2022年第三季度報告,生成一份審計報告”。輸入內容為:一個PDF文檔(未經審計的華光環能2022年第三季度報告),以及提示詞“假如你是一名注冊會計師,對華光環能2022年第三季度報告進行了審計,請生成一份審計報告”。從輸出內容(限于篇幅,輸出內容省略,留存被索)看大語言模型似乎有些“落后”,按最新規定,審計報告在“二、形成審計意見的基礎”之后應該是“三、關鍵審計事項”,但在輸出內容中沒有關鍵審計事項部分,而關鍵審計事項是審計報告中的重要內容。另外,在輸出的審計報告最后附有:“請注意,由于我無法直接獲取審計過程中實際執行的審計程序和獲取的審計證據,上述審計報告是基于假設情況編寫的模板。在實際審計工作中,注冊會計師需要根據具體情況調整審計意見和其他相關內容”,一定程度表明“文心大模型4.0”具有回避風險“意識”。
四、通用大模型在審后環節的應用分析——“固前功,減后患”
本文所指的審后環節是指財務報表報出之后,“注冊會計師沒有義務針對財務報表實施任何審計程序”。但注冊會計師在這一階段仍需“關注”是否發生相關事項可能導致修改審計報告,及時了解可能面臨的隱患并采取應對措施。以“文心大模型4.0”應用為例:用戶目標為“了解華光環能在2023年4月26日至2023年12月31日之間發生的若在審計報告日知悉可能導致修改審計報告的相關事項”。第1次說明了信息來源“媒體報道事項、監管機構”,輸出內容(見表6)主要為1項“對外擔保預計公告”事項,第2次輸出內容含2項事項。另外,2023年4月26日涉及的3.86億元擔保事項在第1次輸出內容中為“對外擔保預計公告”,在第2次則變為“公告了對中設國聯及其下屬控股子公司提供總額不超過3.86億元的擔保”,那么究竟當日公布的擔保事項是預告還是已經發生?用戶點擊參考信息源第1條(華光環能:關于公司2023年度對外擔保預計的公告)可判斷出是“對外擔保預計公告”。第3次輸入內容將字數減少至100字,雖然輸出僅1項相關事項,但其輸出的“注”中內容卻有較高信息含量,提到“財務公告、合作項目”。因此第4、5次輸入內容繼續深挖“合作項目”事項及具體涉及金額。通過大語言模型在審后環節的應用,審計人員增加對該階段可能對其審計業務有所影響的相關事項的了解,有助于控制或減少相關事項可能產生的不利影響。
五、總結與建議
本文以“文心大模型4.0”為例,詳細分析其在注冊會計師審計財務報表的審前、審中、審后環節的應用。結合以上應用分析,提出以下三點建議:一是用戶輸入的提示詞需具體明確,包括明確完整的條款名稱、字數限制;地點、行業、具體指標值;具體數據、具體時間范圍。二是“文心大模型4.0”雖具有一定“謹慎避險意識”,但仍有前后矛盾等“迷糊出錯”情況,用戶在解讀其輸出內容時需細心全面且三思而行,有時也需關注其輸出內容的“注”及參考信息源部分。三是“擁抱”通用大模型,在注冊會計師審計中充分、高效應用通用大模型。盡管審計并非通用大模型的“專長”領域,但從前文應用分析可看出,正常情況下其輸出內容“出錯”或“低質”的幾率很小,大部分情況下能夠輸出審計專業內容,且通用大模型“成長”快速,隨著未來相關法律規定逐漸完善,通用大模型將會“成長”為注冊會計師審計的一個重要輔助工具。
主要參考文獻
[1]陳雪嵩.大語言模型在企業內部審計中的應用研究[J].會計之友, 2024,(11):23-29
[2]鐘慧,陳宋生,王明.大語言模型的會計垂域推理能力探究[J].財會月刊, 2024,45(11):17-25
[3]Eulerich M, Sanatizadeh A, Vakilzadeh H, et al. Is it all hype? ChatGPT’s performance and disruptive potential in the accounting and auditing industries[J]. Review of Accounting Studies, 2024,29(3): 2318-2349
[4]Huang A H, Wang H, Yang Y. FinBERT: A large language model for extracting information from financial text[J]. Contemporary Accounting Research, 2023,40(2): 806-841
[5]Teubner T, Flath C M, Weinhardt C, et al. Welcome to the era of chatgpt et al. the prospects of large language models[J]. Business amp; Information Systems Engineering, 2023,65(2):95-101