









【摘 要】 隨著人工智能技術的快速發展,智能財務稽核成為數字化轉型的關鍵環節,如何將類似DeepSeek的大模型應用于高校財務稽核系統中是亟需解決的熱點問題。文章通過構建融合多模態數據的智能財務稽核模型,深入研究了DeepSeek在智能財務稽核中的應用。研究結果表明:多模態數據融合顯著提高了異常檢測的準確性和效率,進一步豐富了模型的輸入信息,提升了模型對復雜場景的適應能力;動態優化模型能夠根據不同的風險水平調整審批閾值,有效降低補正率并提高準確率。此外,通過模擬三種不同深度的語義理解方法,驗證了領域知識推理在識別語義矛盾案例中的優越性能。該研究為財務智能化轉型提供了可落地的技術方案。
【關鍵詞】 智能財務稽核; 閾值優化; 語義理解; 多模態檢測
【中圖分類號】 F234.3" 【文獻標識碼】 A" 【文章編號】 1004-5937(2025)11-0069-09
一、引言
隨著人工智能技術的發展,會計數字化轉型升級成為信息化工作的總目標之一。在財務工作中,收入、支出稽核是一項常規操作,可以預防錯誤、舞弊、造假等現象,然而目前關于票據的稽核大多數還是靠人工審核,只有電子發票等規范化的票據可以通過二維碼等識別(不需要人工審核)。對于高校而言,來自科研、教學、職能等不同部門的不同支出事項,需要設定針對部門和事項的相關稽核規則與流程,進一步進行審核[ 1-2 ]。財政部《關于規范電子會計憑證報銷入賬歸檔的通知》(2020)[ 3 ]要求企業實現電子會計憑證的全流程數字化管理,傳統人工審核模式難以滿足合規性要求。
部分高校財務造假、重復報銷等問題頻發,亟需智能系統進行自動化風險識別[ 4 ]。DeepSeek作為多模態大模型[ 5 ],可突破傳統OCR和規則引擎的局限性,自動加載不同業務類型的審核規則,支持政策更新的快速適配,減少人工維護成本,為會計行業的發展帶來諸多機遇[ 6 ];可以對非結構化數據進行處理[ 7 ],如解析電子發票、掃描件、手寫單據,提取關鍵字段(金額、稅號、事由);通過語義理解判斷報銷事由的合理性,基于歷史數據識別隱性風險[ 8 ]。
使用AI進行財務稽核是未來財務管理的必然趨勢[ 9 ],符合財政部對電子會計憑證“四性”(真實性、完整性、可用性、安全性)的審核要求[ 10 ];與區塊鏈(防篡改)、大數據(風險預測)結合,構建下一代智能財務系統,能減少80%以上人工復核工作量,顯著降低運營成本。本文主要貢獻體現在三方面:首先,將多模態大模型的動態閾值優化機制引入財務稽核領域,拓展了智能財務的理論內涵[ 11 ];其次,提出的“領域預訓練+規則引擎”混合架構(圖1),補充了已有文獻[ 12 ]未涉及的稽核專項優化;最后,通過可解釋性規則映射(表2),實現了AI決策與高校經費管理制度的合規性對齊,為智能財務系統的審計追溯提供了新范式。
二、文獻綜述
在科技發展日新月異的當下,智能財務稽核成為各行業財務管理的研究熱點(構建智能財務稽核管理體系的轉型策略,推動財務風險管控與業財深度協同[ 13 ])。在人工智能時代,為適應高科技信息技術更迭和人工智能浪潮,傳統行業需進行數字化變革,高校財務稽核工作也必須向信息化、智能化轉型[ 14-15 ]。王莉等[ 16 ]指出,面對高校擴招、政府會計改革及大數據人工智能時代需求,傳統高校財務管理模式面臨挑戰。
關于大數據技術下財務稽核體系的構建,張振中等[ 17 ]認為國家加強財會監督的要求促使高校利用大數據技術構建信息化、智能化稽核體系,并以H大學為例,從“制度”和“技術”層面探索構建路徑,為高校實施智能財務稽核提供參考,強調了大數據技術在高校財務稽核中的關鍵地位。基于財會監督的智能稽核系統建設,李曉粉等[ 18 ]提出隨著財務數字化推進,大數據、人工智能分析等技術在互聯網金融行業廣泛應用,但在高校財會監督中應用尚屬空白,并以中國計量大學為例,剖析財會監督問題,探究建設基于財會監督的高校財務智能稽核系統及運行效果,凸顯了高校智能稽核系統建設的必要性和重要性。周榮婧[ 19 ]探討了運用大數據、云計算等14項先進技術構建的“12465”智能財務會計共享體系,該體系可實現智能報賬、核算、稽核等功能,進一步說明了智能稽核是智能財務體系的重要組成部分。
因此,利用DeepSeek智能圖像識別、自然語言解析、內控制度自動優化等技術,建設高校財務共享服務中心,可以實現信息流與票據流一體,推動高校財務管理轉型。但是相關研究還未涉及高校智能財務稽核。
三、理論分析與研究假設
(一)理論分析
在當前“大、智、移、云、物、區”等新興技術快速發展以及企業大力推進財務共享中心建設的背景下,傳統財務稽核模式已難以適應時代需求。傳統財務稽核主要依賴人工核對票據信息,包括金額、抬頭、稅號、事項說明等內容。這種方式效率不高,人工處理大量票據需要耗費大量的時間和精力,而且易受主觀因素影響,不同的稽核人員可能會因個人經驗、判斷標準的差異而得出不同的結論,從而影響稽核結果的準確性和可靠性[ 20 ]。DeepSeek作為多模態大模型,在財務稽核中的技術優勢:一是自然語言處理(NLP)[ 21 ],可識別非結構化文本中的關鍵詞及語義關聯性;二是規則引擎集成[ 22 ],通過預置高校財務規則,將關鍵詞映射為標準化編碼,實現自動分類;三是異常檢測功能,基于歷史數據訓練,識別非常規特征[ 8 ]。
DeepSeek具備自然語言處理能力,能夠識別非結構化文本中的關鍵詞及語義關聯性。在財務稽核場景中,發票備注、報銷事由等往往是非結構化文本,包含著豐富的業務信息。例如,發票備注中可能會提及“某項目會議費”“出差調研差旅費”等內容,傳統的人工稽核方式可能難以快速、準確地從這些非結構化文本中提取關鍵信息。而DeepSeek的自然語言處理技術可以自動識別其中的關鍵詞,如“會議費”“差旅費”等,并分析其語義關聯性,從而更好地理解業務實質。莫蓉[ 14 ]指出,在人工智能時代,高校財務稽核工作需要向信息化、智能化轉型,利用先進的信息技術處理非結構化數據是提升稽核效率和準確性的重要手段。
DeepSeek可以集成規則引擎,通過預置高校財務規則,如《科研經費管理辦法》等,將關鍵詞映射為標準化編碼。在高校財務稽核中,不同類型的費用報銷有明確的規定和分類標準。例如,將“差旅費”映射為標準化編碼“A001”,這種標準化處理有助于實現財務數據的統一管理和自動分類。王翠玉和李海琳[ 23 ]提到,大數據時代下,高等院校財務稽核工作需要實現信息化和智能化,通過規則引擎集成可以提高稽核工作的規范性和準確性,更迅速、準確地發現工作中存在的問題。
基于歷史數據訓練,DeepSeek具備異常檢測功能,能夠識別非常規特征。在財務報銷中,可能會出現一些不符合常規的情況,如同一項目多次報銷餐飲費等。通過對大量歷史財務數據的學習和分析,DeepSeek可以建立正常業務模式的模型,當出現與正常模式不符的報銷行為時,能夠及時識別并標記為異常。張敏潔等[ 24 ]強調,智能稽核作為傳統財務稽核的創新手段,能夠實現財務監督由“事后稽核糾錯”向“事前智能引導”“事中全程監控”延伸,異常檢測功能可以在事前和事中及時發現財務風險,推動財務風險管理向“智慧風控”邁進。
(二)DeepSeek智能財務稽核框架
基于財務報銷審核規則與DeepSeek智能稽核系統結合的分層架構設計,通過規則引擎與多模態技術的深度融合實現自動化審核,詳細的架構如圖1。DeepSeek智能財務稽核系統整體架構也可以稱為“感知—決策—反饋”模型,其中:感知層即為OCR識別票據信息,DeepSeek識別圖像信息,提取文本和關鍵特征并進行分析;決策層為規則庫匹配;反饋層為通過企業微信或短信自動推送異常項。
1.票據輸入與預處理層
該層負責多源票據的標準化處理,支持電子發票(二維碼/PDF)、紙質票據(掃描件/照片)及非結構化附件(合同、審批單等)的輸入。DeepSeek采用增強OCR技術,優化模糊、傾斜或低質量票據的識別,例如自動修復破損的稅號或缺失的金額信息。同時,系統對票據數據進行結構化解析,提取關鍵字段(如金額、開票單位、稅號)和非結構化文本(如報銷事由、手寫備注),確保后續審核流程的數據準確性。
2.規則引擎層
規則引擎層依據預設的財務審核規則(根據制定的38項審核點)進行自動化合規性檢查。該層支持動態加載不同業務類型的審核規則,例如差旅費需驗證交通閉環性(審核18),科研采購需匹配驗收單(審核23)。規則以邏輯條件判斷為主(如“金額gt;1萬元需領導簽字”),并支持實時更新,以適應高校財務政策的調整。基礎規則(通用):發票真偽、審批齊全性(審核點1—12)。業務規則(專項):科研經費需匹配驗收單(審核點23),會議費需簽到表(審核28)。通過規則匹配,系統能快速識別明顯違規項(如發票超期、審批缺失),提高審核效率。
3.DeepSeek智能分析技術
針對規則引擎無法處理的復雜場景,該層利用多模態AI技術——類BERT-Transformer混合模型(圖2)進行深度分析。
多模態輸入:文本模塊,采用財務專用FinBERT模型,擴展高校財務稽核相關術語(如“縱向課題/結題審計”),添加票據類型標識符,增強領域語義理解。圖像模塊,使用ResNet-50提取票據視覺特征,通過CLAHE算法增強圖像模糊區域,用于識別發票真偽。
跨模態融合:動態門通過Transformer注意力機制實現圖文特征對齊,精準識別“發票品名(圖像)—報銷事由(文本)”矛盾(如“餐飲服務”VS“設備采購”)。
財務適配性:容器化部署(Docker鏡像lt;500MB),支持IntelR OpenVINOTM加速,CPU推理速度達200ms/單,兼容主流財務系統接口。動態加載制度文件(如《高校科研經費管理辦法》),提供規則插件,支持用戶自定義審核點。
4.決策中心
決策中心綜合規則引擎和決策樹分析的結果,生成表1中的三級審核結論,作為模型的輸出,同時輸出審核結果的相關評價指標(包括準確率、精確率、召回率等)。
系統通過權重投票機制(如優先采納規則引擎的發票真偽判斷)確保決策可靠性,同時記錄所有判定依據以供審計追溯。
5.反饋與優化層
該層實現審核閉環管理,實時反饋:通過企業微信或短信通知報銷人駁回原因;持續優化:人工復核結果反哺規則庫,并用于DeepSeek模型迭代(誤判案例加入訓練集)。這一機制使系統具備自我進化能力,逐步減少人工干預需求。
(三)研究假設
基于財務審核規則和DeepSeek技術特性,分技術效能、流程優化和語義理解三個維度提出研究假設。現行財務規則引擎采用固定閾值,導致大量邊際案例因機械判斷進入補正流程。DeepSeek的強化學習模塊通過分析歷史審批結果,降低補正率,為留出安全邊際,可動態調整閾值置信度90%時的值,既減少無意義補正又不增加風險。基于此,提出假設H1:通過強化學習動態優化規則閾值[ 25 ],可使系統補正率降至10%以下,同時保持準確率波動范圍≤2%,且優化過程在50輪迭代內收斂。
在高校財務稽核中,存在許多專業場景,例如“學術會議餐費”與“普通招待費”的區分。這些場景中,傳統的關鍵詞匹配方法可能會導致較高的誤判率。為了提高語義理解的準確性,DeepSeek的領域自適應模型在200條科研報銷數據上進行了預訓練,能夠識別如“IEEE會議”與“餐費”之間的合理關聯。基于此,提出假設H2:基于領域預訓練的DeepSeek語義模型能將復雜事由的誤判率降低到10%以下。
財務稽核涉及票據圖像、報銷文本和結構化數據的多源信息,傳統單模態方法(如獨立使用OCR或NLP)存在信息割裂問題。DeepSeek的多模態融合技術通過跨模態機制,可捕捉“發票品名與報銷事由矛盾”等復合特征。基于此,提出假設H3:采用多模態融合的DeepSeek模型在財務單據稽核中的綜合準確率顯著高于單模態方法。
四、研究設計
本研究選用DeepSeek模型基于三重考量:(1)技術適配性:其多模態架構(類Transformer)可同步處理票據圖像、報銷文本(FinBERT)與結構化數據(全連接層),滿足財務稽核的復合數據特征;(2)領域驗證:陳虎等[ 26 ]已證明DeepSeek模型在財務數據分析和預測中的有效性;(3)創新空間:現有文獻尚未涉及該模型在稽核閾值動態優化中的應用,本文提出的強化學習微調方法可填補此空白。
(一)數據來源
1.規則引擎基準
在財務數據審核中規則引擎起著核心作用,它根據預設的規則對財務報銷發票數據進行評估。規則引擎主要根據高校的財務稽核審核要素制定,包含通用規則、各業務類型專項規則,以及規則應用和結果分類方法。共38個審核點,1表示通過,0表示不通過,根據發票的業務類型,選擇相應的規則進行應用,表2是具體對應關系。
該方法會遍歷所選規則,對每張發票數據進行評估,并將評估結果存儲在字典中返回。若規則執行失敗,則視為不通過。
2.仿真模擬數據
為了驗證假設H1,本研究設計并生成了閾值邊緣案例數據集。該數據集聚焦特定金額區間,模擬了財務審批過程中與金額閾值相關的審批決策情況。本文采用基于真實業務邏輯的仿真數據生成方法,構建了包含2 000條財務報銷申請記錄的數據集。數據生成過程以金額為核心特征,通過正態分布N(20 000,8002)模擬實際業務中圍繞2萬元審批閾值的邊際案例,并限定在[18 000,22 000]元區間以聚焦關鍵決策區域。基于邏輯函數:
將金額映射為風險概率,其中18 700元設定為風險拐點(P=0.5),生成理論審批標簽IPlt;0.5。同時模擬了含8%隨機誤差的人工審批結果,并添加申請人、部門等輔助字段,最終生成的數據集既保留了真實業務的核心特征(如補正案例聚集在閾值附近),又通過可控參數確保實驗可復現性。
針對假設H2的驗證需求,本研究構建了語義理解測試數據集。該數據集專注于財務報銷事由的語義分析,旨在測試模型對專業術語和語義邏輯的理解能力。生成數據時,首先,定義了三個主要領域——科研、教學和行政,并為每個領域設定了相應的專業術語集合。例如,科研領域包含“IEEE會議”“SCI論文”等術語。在生成樣本時,70%的樣本為合規案例,即報銷事由與所屬領域術語一致且語義邏輯合理;而30%的樣本為語義矛盾案例,通過將不同領域的術語進行不合理組合來構造矛盾,例如將科研領域的術語與教學領域的術語混合使用。其次,為了增加數據的復雜性和真實性,隨機對部分樣本進行了同義詞替換和術語標準化處理。最終生成的語義理解測試數據集包含500個樣本,每個樣本包含領域、報銷事由和語義有效性三個字段,其中語義有效性字段用于標注樣本是否語義合規,為后續語義理解模型的訓練與評估提供了豐富的測試素材。
通過仿真模擬生成多模態財務稽核測試數據,旨在為驗證假設H3提供數據支持。生成的數據集涵蓋了結構化數據、圖像數據和文本數據。結構化數據部分包括業務類型(按照實際分布設定權重,如差旅報銷占35%、固定資產采購占25%等)、金額(在合理區間內隨機生成)、日期等核心信息。圖像數據模擬了不同質量的票據掃描件,其中70%為清晰票據,20%為輕度模糊票據,10%為重度模糊或缺損票據,以反映真實場景中票據的多樣性。文本數據則包含報銷事由和備注,其中報銷事由根據業務類型生成具有針對性的描述,例如差旅報銷事由會涉及具體城市及出差目的等信息。此外,為增加數據復雜性,30%的樣本添加了手寫備注模擬。在生成數據時,還特別構造了跨模態矛盾案例,占總量的15%,例如發票圖像顯示“餐飲服務”而事由文本描述“設備采購”,以此來測試模型捕捉圖文不一致的能力。最終生成的多模態數據集包含1 000個樣本,每個樣本都具備完整的結構化字段、票據圖像和報銷文本信息,同時標注了異常標記,用于后續模型訓練與性能評估。
(二)變量定義
1.解釋變量
在假設H1驗證實驗中,解釋變量是模態組合,即在異常檢測過程中所使用的不同模態信息的組合方式,具體包括三種情況:僅使用文本模態信息(如報銷事由等文本內容),結合文本和圖像模態信息(如票據圖像與文本內容),融合文本、圖像以及數字模態信息(如金額等數字信息與文本、圖像內容)。在假設H2驗證實驗中,解釋變量是審批閾值,即用于判斷是否通過審批的金額閾值,初始值為20 000元,通過實驗逐步調整至最優值。在假設H3驗證實驗中,解釋變量是語義理解方法,驗證不同的語義理解方法對誤判率的影響,包括關鍵詞匹配、句法分析、領域知識推理三種方法。具體對應關系如表3。
2.被解釋變量
被解釋變量是各實驗中關注的性能指標。在假設H1驗證實驗中,被解釋變量為召回率,反映了模型能夠識別出多少真正的異常樣本。在假設H2驗證實驗中,被解釋變量是誤批率、漏批率和準確率,分別表示應拒絕但被批準的比例、應批準但被拒絕的比例以及模型對審批結果的準確率。在假設H3驗證實驗中,被解釋變量是誤判率,衡量將正常案例誤判為異常的比例。具體對應關系如表4。
3.控制變量
控制變量是實驗中保持不變的變量,以確保實驗結果的可靠性。在假設H1驗證實驗中,控制變量包括業務類型、金額、日期、發票編號、報銷事由、備注和圖像質量。在假設H2驗證實驗中,控制變量是金額、初始審批狀態和優化目標狀態。在假設H3驗證實驗中,控制變量包括領域、報銷事由和語義有效性,用于判斷樣本是否語義合規。具體對應關系如表5。
(三)模型設計
模型旨在通過融合多模態數據(結構化數據、文本數據和圖像數據)來檢測財務報銷中的異常情況。模型的核心思想是利用不同模態數據的特點,提取各自的信息,并通過一個綜合的決策函數來判斷是否存在異常。對數據進行預處理,包含關鍵三步:(1)文本清洗,使用正則表達式剔除發票中的無意義符號,保留關鍵語義信息;(2)圖像增強,對20%模糊票據采用CLAHE算法對比度優化;(3)數據劃分,按業務類型7:3劃分訓練集/驗證集,確保數據分布一致性。
結構化數據包括金額、日期、業務類型等字段。這些數據可以直接用于模型輸入,為了避免不同字段的量綱差異對模型的影響,需要進行歸一化處理:
文本數據包括報銷事由和備注。這些數據需要進行文本嵌入處理,將文本轉換為數值向量,可以使用預訓練的詞嵌入模型(FinBERT)來提取文本特征:
為了驗證假設H1,模擬每個樣本的真實風險水平,使用邏輯函數來計算真實風險概率(TR)。該函數基于金額與優化閾值的關系,公式如下:
其中:A是樣本的金額;T是優化后的審批閾值;250是邏輯函數的縮放參數,用于控制風險概率的變化速度。該公式將金額映射到一個介于0和1之間的風險概率,表示樣本被正確審批的概率。風險概率越低,樣本越可能需要補正。補正率用于衡量需要人工干預的比例,即模型預測錯誤的比例。補正率的計算公式為:
補正率越低,表示模型的自動審批性能越好。準確率用于衡量模型預測的準確性,即模型正確預測的比例。準確率越高,表示模型的預測性能越好。通過不同閾值變化,計算準確率波動情況,波動越小,表示模型的性能越穩定。構建一個動態優化模型,用于調整審批閾值,降低補正率并提高準確率,確保模型能夠在實際應用中高效地進行審批決策。
對于假設H2,模擬了三種不同深度的語義理解方法,以評估它們在識別語義矛盾案例中的性能。關鍵詞匹配:基于簡單關鍵詞的存在與否進行判斷;句法分析:考慮關鍵詞的組合和句子結構;領域知識推理:結合領域知識和上下文信息進行推理。
誤判率用于衡量將正常案例誤判為異常的比例,計算公式如下:
該框架通過生成具有語義矛盾的測試數據,并使用誤判率作為評估指標,能夠有效評估不同語義理解方法在財務報銷場景中的性能。這種方法為優化語義理解模型提供了科學依據,有助于提高財務稽核的準確性和效率。
針對假設H3,在多模態財務稽核數據中,圖像票據掃描件使用OCR工具識別其文本內容,然后將內容根據審核規則進行結構化處理。這些圖像進行預處理(如調整大小、歸一化)后,輸入到預訓練的卷積神經網絡中,提取圖像特征:
將結構化數據、文本數據和圖像數據的特征進行融合:
其中,融合方式采用Softmax函數,F結構化、F文本、F圖像為采用Transformer提取的注意力特征。
使用高校制定的規則引擎邏輯樹來判斷是否異常。驗證模塊負責評估不同模態組合特征的檢測性能,采用極限梯度提升(XGBoost)實施訓練和檢測,通過集成多棵弱分類樹實現高精度預測。其目標函數結合對數損失和L2正則項:
其中,yi為真實值,pi為預測概率,λ為L2正則化系數。
關鍵參數設置:樹深度為5控制模型復雜度,學習率0.1調節權重更新步長,特征工程包含38維規則特征和50維TF-IDF文本特征。相比深度學習模型,XGBoost在結構化特征處理上更高效,但受限于人工特征工程能力。
設計了三種模態組合:僅文本、文本+圖像、文本+圖像+結構化數據。性能評估模塊計算并比較不同模態組合的準確率(Accuracy)、召回率(Recall)、精確率(Precision)和F1分數。計算公式分別為:
模型中的可視化模塊通過條形圖和混淆矩陣熱力圖展示不同模態組合的性能指標和預測結果分布。該模型通過生成多樣化的異常樣本,確保模型能夠學習到更復雜的特征。通過歸一化、文本嵌入、圖像特征提取等預處理步驟,以及特征融合和損失函數的定義,模型能夠有效學習數據中的模式,并在財務稽核中檢測異常情況。
五、結果及分析
假設H1通過動態優化審批閾值,能夠顯著降低補正率至0.0%,遠低于設定的15%要求,這說明優化后的模型在自動審批方面表現出色,幾乎無需人工干預即可做出正確決策。同時,準確率波動控制在±1.06%以內,滿足了不超過2%的要求,體現了模型決策的高度穩定性。優化過程僅用了11輪迭代,遠少于設定的50輪上限,顯示出優化算法的高效性。總體而言,這些結果證明了動態優化方法在財務審批中的有效性,不僅減少了人工干預,而且確保了審批決策的一致性和可靠性,為財務審批流程的自動化提供了有力支持。
假設H2的結果揭示了不同語義理解方法在財務報銷場景中的誤判率表現。句法分析方法的誤判率為0.0812,意味著在所有正常案例中,有約8.12%的案例被錯誤地識別為異常,這可能是因為該方法考慮了更復雜的句子結構和關鍵詞組合,從而在某些情況下引入了額外的誤判。而關鍵詞匹配讓領域知識推理方法的誤判率同樣為0,說明在利用領域知識進行推理時,模型能夠準確區分正常和異常案例,沒有出現誤判。
圖3是多模態模擬財務稽核數據的檢測結果可視化效果,各個指標值如表6所示。
圖4對比了不同模型在多模態模擬財務數據上的檢測ROC曲線,包括XGBoost、輕量級梯度提升機(LightGBM)、Transformer、孤立森林(Isolation Forest)、圖神經網絡(GNN)。
圖4的ROC曲線對比了五種模型在(a)訓練集和(b)測試集上的性能表現,結果顯示:XGBoost和LightGBM在訓練集上表現完美,在測試集上仍保持優異性能,展現出強大的分類能力;Transformer和GNN表現穩定且接近樹模型,未出現過擬合現象;而Isolation Forest作為無監督算法在分類任務上表現相對較弱,與其他監督學習方法存在明顯差距。
六、結論
本文通過構建融合多模態數據(結構化數據、文本數據和圖像數據)的智能財務稽核模型,深入研究了 DeepSeek在智能財務稽核中的應用。研究結果表明,多模態數據融合顯著提高了異常檢測的準確性和效率。特別是通過OCR技術提取圖像中的文本內容,進一步豐富了模型的輸入信息,提升了模型對復雜場景的適應能力。動態優化模型能夠根據不同的風險水平調整審批閾值,有效降低補正率并提高準確率。此外,通過模擬三種不同深度的語義理解方法,驗證了領域知識推理在識別語義矛盾案例中的優越性能。為了檢測深度學習特征融合對檢測的影響,采用了五個常見模型進行對比,在數據量較小的情況下采用XGBoost最佳,數據量較大時可以選擇LightGBM。這些發現為智能財務稽核提供了科學依據,展示了多模態數據融合和動態優化在實際應用中的潛力。
然而,本研究也存在不足之處。首先,盡管多模態數據融合顯著提升了模型的性能,但模型在處理某些復雜場景時仍可能存在局限性。例如,在處理高度模糊或缺損的票據圖像時,OCR技術的識別準確率可能會下降,從而影響模型的整體性能。其次,語義理解方法雖然在識別語義矛盾案例中表現出色,但在處理特定行業術語和復雜語義關系時,仍可能存在誤判。此外,動態優化模型雖然能夠有效調整審批閾值,但在實際應用中,模型的訓練和優化需要大量的歷史數據支持,數據的獲取和標注成本較高。未來的研究可以進一步優化多模態數據融合方法,提升模型在復雜場景下的魯棒性和適應性,同時應關注區塊鏈存證、小樣本學習等方向,以推動智能財務稽核技術的落地應用和創新發展。
【參考文獻】
[1] 宋文婧.高校財務稽核新路徑探索[J].財會學習,2024(22):61-63.
[2] 楊陽.高校內部控制與財務稽核的協同作用探討[J].財經界,2024(33):90-92.
[3] 財政部,國家檔案局.關于規范電子會計憑證報銷入賬歸檔的通知[A].2020.
[4] 劉盼盼,李強.數字化轉型背景下高校網絡財務報銷優化研究:以K高校為例[J].教育財會研究,2024,35(6):71-76,91.
[5] 孟添,陸岷峰.基于DeepSeek的科技金融數智化探索:技術優勢、行業賦能與未來挑戰[J/OL].企業科技與發展,2025-03-29.
[6] 白卓玉.DeepSeek對我國會計行業的挑戰、機遇與應對[J].會計之友,2025(8):143-149.
[7] IS S,DR A.Advancements in AI-Powered NLP models:a critical analysis of ChatGPT and DeepSeek[J].Available at SSRN 5125445,2025.
[8] SHARMA N.Large language models in semantic parsing for log analysis and anomaly detection[D].Norwegian University of Life Sciences,2024.
[9] YAO L.Application of artificial intelligence technology in enterprise financial audit[C]//2024 International Conference on Integrated Circuits and Communication Systems (ICICACS).IEEE,2024:1-5.
[10] 財政部,國家檔案局.會計檔案管理辦法[A].2015.
[11] 潘潔,劉勤,吳忠生,等.類ChatGPT技術在企業智能財務建設中的應用思考[J].會計之友,2024(3):139-144.
[12] 何瑛,趙欣越,朱子明.ChatGPT賦能智能財務建設的理論機制與實施路徑[J].會計之友,2025(10):94-101.
[13] 董中友,李慧,張璐.郵政企業財務稽核智能化轉型思路及策略研究[J].郵政研究,2023,39(4):11-18.
[14] 莫蓉.人工智能時代高校財務稽核工作轉型探析[J].會計師,2023(5):112-114.
[15] 劉策.人工智能技術在通信企業財務稽核中的應用探討:以A通信企業為例[J].企業改革與管理,2022(12):30-32.
[16] 王莉,邵立,陳友翠.基于內控管理視角的高校財務共享服務中心建設:以M大學為例[J].中國鄉鎮企業會計,2024(16):187-189.
[17] 張振中,王寧,劉笑冉,等.大數據技術下構建高校財務稽核體系的實踐探索:以H大學為例[J].財政監督,2024(16):87-92.
[18] 李曉粉,陳國旗,李紹君,等.基于財會監督的高校財務智能稽核系統建設及應用:以中國計量大學為例[J].教育財會研究,2024,35(1):57-61,95.
[19] 周榮婧.基于大數據管理會計的“12465”智能財務會計共享體系研究[J].中國總會計師,2024(1):79-82.
[20] LIU L.Construction of financial bill recognition model based on deep learning[J].Journal of Combinatorial Mathematics and Combinatorial Computing,2024, 120:253-264.
[21] 張雯,靳霞,李昂.基于自然語言處理技術的財務分析:以比亞迪公司為例[J].會計之友,2022(23):28-36.
[22] 桑磊,李世豪,南山,等.基于規則引擎的醫保審核系統的開發和應用[J].中國數字醫學,2023,18(11): 65-69.
[23] 王翠玉,李海琳.基于大數據角度的高等院校財務稽核工作探索[J].納稅,2023,17(9):43-45.
[24] 張敏潔,蔡鵬生,劉鳴偉.運用智能稽核強化財務監督職能,打造高效、智能的財務稽核體系[J].中國總會計師,2022(5):40-44.
[25] 莊瑋瑋,陳財,邱國新.基于深度強化學習的動態投資組合優化新模型[J].中國科學技術大學學報,2022,52(11):15-28.
[26] 陳虎,付宏.DeepSeek在財務領域的應用研究[J].會計之友,2025(10):87-93.