999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于多模態(tài)機(jī)器學(xué)習(xí)的財(cái)務(wù)數(shù)據(jù)異常自動(dòng)檢測(cè)研究

2025-04-08 00:00:00李琛琛
無線互聯(lián)科技 2025年5期

摘要:當(dāng)前,財(cái)務(wù)數(shù)據(jù)異常檢測(cè)研究通常只關(guān)注數(shù)值型數(shù)據(jù),這種單模態(tài)的數(shù)據(jù)處理方式在一定程度上限制了數(shù)據(jù)異常檢測(cè)的精度。為此,文章研究了一種基于多模態(tài)機(jī)器學(xué)習(xí)的財(cái)務(wù)數(shù)據(jù)異常自動(dòng)檢測(cè)方法。文章對(duì)企業(yè)財(cái)務(wù)數(shù)據(jù)進(jìn)行預(yù)處理,構(gòu)建財(cái)務(wù)數(shù)據(jù)集,基于數(shù)據(jù)集提取數(shù)值和文本特征,同時(shí)借助多模態(tài)數(shù)據(jù)融合技術(shù)進(jìn)行特征融合,建立多模態(tài)機(jī)器學(xué)習(xí)下的財(cái)務(wù)數(shù)據(jù)異常檢測(cè)模型,將融合后的特征輸入該模型,根據(jù)輸入數(shù)據(jù)的不同部分利用注意力機(jī)制對(duì)預(yù)測(cè)結(jié)果的貢獻(xiàn)度動(dòng)態(tài)加權(quán),從而輸出最終異常檢測(cè)結(jié)果。實(shí)驗(yàn)結(jié)果顯示,該方法受試者工作特征曲線(Receiver Operating Characteristic Curve,ROC)下的真正例率高、檢測(cè)正確率在90%以上、檢測(cè)損失值小,具有較好的實(shí)際應(yīng)用價(jià)值。

關(guān)鍵詞:多模態(tài)機(jī)器學(xué)習(xí);財(cái)務(wù)數(shù)據(jù);財(cái)務(wù)數(shù)據(jù)異常;數(shù)據(jù)異常檢測(cè);自動(dòng)檢測(cè)

中圖分類號(hào):TM76文獻(xiàn)標(biāo)志碼:A

0引言

隨著信息技術(shù)發(fā)展,企業(yè)財(cái)務(wù)數(shù)據(jù)管理與分析成為企業(yè)運(yùn)營的關(guān)鍵。然而,面對(duì)海量的財(cái)務(wù)數(shù)據(jù),如何高效識(shí)別異常值,對(duì)于企業(yè)預(yù)防財(cái)務(wù)風(fēng)險(xiǎn)、提升決策效率至關(guān)重要。傳統(tǒng)的財(cái)務(wù)數(shù)據(jù)異常檢測(cè)方法大多依賴于人工設(shè)定的規(guī)則和閾值,這不僅耗時(shí)耗力,還難以適應(yīng)復(fù)雜環(huán)境。因此,相關(guān)學(xué)者探索一種智能、高效的財(cái)務(wù)數(shù)據(jù)異常自動(dòng)檢測(cè)手段顯得尤為重要。針對(duì)這一問題,馮華偉[1]提出了基于深度神經(jīng)網(wǎng)絡(luò)的異常財(cái)務(wù)數(shù)據(jù)識(shí)別方法。該方法通過增加方差項(xiàng),改進(jìn)了傳統(tǒng)的隨機(jī)森林模型。同時(shí),利用深度遞歸神經(jīng)網(wǎng)絡(luò)訓(xùn)練隨機(jī)森林。但深度神經(jīng)網(wǎng)絡(luò)因模型的復(fù)雜性和多參數(shù)易導(dǎo)致過擬合,影響泛化能力和檢測(cè)精度。李自霞等[2]提出了基于孤立森林算法的企業(yè)分布式財(cái)務(wù)不良數(shù)據(jù)檢測(cè)方法。該方法通過分析企業(yè)分布式財(cái)務(wù)元數(shù)據(jù)管理體系,提取實(shí)際財(cái)務(wù)數(shù)據(jù),對(duì)其進(jìn)行預(yù)處理保證數(shù)據(jù)質(zhì)量,同時(shí)計(jì)算不良數(shù)據(jù)分布特征,基于孤立森林算法實(shí)現(xiàn)不良數(shù)據(jù)檢測(cè)。但孤立森林算法對(duì)噪聲和冗余信息敏感,影響檢測(cè)精度。為提高異常數(shù)據(jù)檢測(cè)精度,文章提出基于多模態(tài)機(jī)器學(xué)習(xí)的財(cái)務(wù)數(shù)據(jù)異常自動(dòng)檢測(cè)方法。

1財(cái)務(wù)數(shù)據(jù)預(yù)處理

在企業(yè)財(cái)務(wù)數(shù)據(jù)的預(yù)處理階段,文章采用Selenium爬蟲技術(shù)實(shí)現(xiàn)財(cái)務(wù)報(bào)表數(shù)據(jù)的自動(dòng)化采集,采集到的數(shù)據(jù)類型包括資產(chǎn)負(fù)債表數(shù)據(jù)、利潤表數(shù)據(jù)、現(xiàn)金流量表數(shù)據(jù)、交易記錄數(shù)據(jù)、賬戶信息數(shù)據(jù)、財(cái)務(wù)指標(biāo)數(shù)據(jù)等。每一類數(shù)據(jù)都對(duì)應(yīng)著企業(yè)財(cái)務(wù)狀況的不同方面,共同構(gòu)成了企業(yè)財(cái)務(wù)數(shù)據(jù)的完整體系。然而,在數(shù)據(jù)采集過程中,該過程易受傳輸中斷、硬件故障等外部因素的影響,導(dǎo)致數(shù)據(jù)記錄存在缺失的情況[3]。為此,文章引入線性插值法,填補(bǔ)這些缺失的數(shù)據(jù)點(diǎn)。為有效消除干擾,文章采用Zscore標(biāo)準(zhǔn)化方法,以削弱數(shù)據(jù)中的不確定性成分[4]。表達(dá)式如式(2)所示。

2融合財(cái)務(wù)數(shù)據(jù)多模態(tài)特征

筆者經(jīng)過研究發(fā)現(xiàn),數(shù)值特征作為財(cái)務(wù)數(shù)據(jù)的直觀體現(xiàn),主要包括收入、成本、利潤、資產(chǎn)及負(fù)債等一系列核心財(cái)務(wù)指標(biāo)。它們直接反映了企業(yè)的財(cái)務(wù)健康狀況和經(jīng)營成果。文本特征主要聚焦于財(cái)務(wù)數(shù)據(jù)中的非結(jié)構(gòu)化信息,如財(cái)務(wù)報(bào)表附注、審計(jì)報(bào)告、管理層討論與分析等文本內(nèi)容[5]。這些信息雖然不像數(shù)值數(shù)據(jù)那樣直觀,但卻蘊(yùn)含著豐富的財(cái)務(wù)信息和業(yè)務(wù)背景,對(duì)于深入理解企業(yè)的財(cái)務(wù)狀況至關(guān)重要。文章為了充分利用這些多樣化的模態(tài)特征,應(yīng)用多模態(tài)數(shù)據(jù)融合技術(shù)將數(shù)值特征和文本特征等多樣化的模態(tài)特征進(jìn)行整合。

文章在多模態(tài)融合過程中為每個(gè)模態(tài)的特征向量分配一個(gè)權(quán)重,然后計(jì)算它們的加權(quán)和。文章假設(shè)權(quán)重向量為w=[w1,w2,…,wm],則融合后的特征向量如公式(3)所示。

3建立多模態(tài)機(jī)器學(xué)習(xí)下的財(cái)務(wù)數(shù)據(jù)異常檢測(cè)模型

文章在多模態(tài)機(jī)器學(xué)習(xí)下的財(cái)務(wù)數(shù)據(jù)異常檢測(cè)模型構(gòu)建的具體實(shí)踐中,以企業(yè)財(cái)務(wù)數(shù)據(jù)樣本為訓(xùn)練集。針對(duì)財(cái)務(wù)數(shù)據(jù)具有時(shí)間序列特性的特點(diǎn),文章采用機(jī)器學(xué)習(xí)中的卷積神經(jīng)網(wǎng)絡(luò)單元進(jìn)行序列數(shù)據(jù)的訓(xùn)練與處理[6]。在多模態(tài)機(jī)器學(xué)習(xí)下,財(cái)務(wù)數(shù)據(jù)異常檢測(cè)模型如圖1所示。

4引入注意力機(jī)制輸出最終異常檢測(cè)結(jié)果

為提升模型在財(cái)務(wù)數(shù)據(jù)異常檢測(cè)中的精確性,文章在財(cái)務(wù)數(shù)據(jù)異常檢測(cè)的復(fù)雜場(chǎng)景中,引入注意力機(jī)制。

在注意力機(jī)制中,權(quán)重通常是通過計(jì)算查詢向量Q和一系列鍵向量Ki之間的相似度或相關(guān)性得到的。Q和Ki分別代表了財(cái)務(wù)數(shù)據(jù)異常檢測(cè)模型在處理輸入數(shù)據(jù)時(shí)所要關(guān)注的“焦點(diǎn)”和“候選信息”。文章通過計(jì)算它們之間的相似度得分,可以量化每個(gè)候選信息對(duì)于最終預(yù)測(cè)結(jié)果的重要性程度。相似度得分為:si=Q,KTi,為了得到更加穩(wěn)定和可靠的權(quán)重分配,應(yīng)用Scale操作和softmax函數(shù)來計(jì)算權(quán)重αi:

5實(shí)驗(yàn)

51實(shí)驗(yàn)準(zhǔn)備

文章以某大型制造業(yè)公司為例進(jìn)行了測(cè)試,該公司擁有完善的財(cái)務(wù)系統(tǒng),記錄了近5年的財(cái)務(wù)數(shù)據(jù),包括銷售收入、成本、利潤、現(xiàn)金流等關(guān)鍵指標(biāo),收集該公司某年1月的部分財(cái)務(wù)數(shù)據(jù),如表1所示。

由表2可知,該公司1月26日的數(shù)據(jù)明顯異常,其銷售收入、成本、利潤和現(xiàn)金流均遠(yuǎn)高于其他日期。文章使用除1月26日外的其他日期數(shù)據(jù)作為訓(xùn)練集,對(duì)模型進(jìn)行訓(xùn)練,同時(shí)將訓(xùn)練好的模型應(yīng)用于整個(gè)數(shù)據(jù)集,對(duì)包括1月26日的數(shù)據(jù),進(jìn)行異常檢測(cè)。

52實(shí)驗(yàn)結(jié)果與分析

在完成了多模態(tài)機(jī)器學(xué)習(xí)下的財(cái)務(wù)數(shù)據(jù)異常檢測(cè)模型的構(gòu)建與訓(xùn)練后,筆者將文章方法與基于深度神經(jīng)網(wǎng)絡(luò)的異常財(cái)務(wù)數(shù)據(jù)識(shí)別方法(方法1)和基于孤立森林算法的企業(yè)分布式財(cái)務(wù)不良數(shù)據(jù)檢測(cè)(方法2)進(jìn)行對(duì)比,采用ROC曲線、檢測(cè)精度以及檢測(cè)方法的損失值作為評(píng)價(jià)指標(biāo),驗(yàn)證3種檢測(cè)方法的效果,繪制相關(guān)的圖2、圖3、圖4,以便直觀展示。

在圖2中,筆者展示了基于多模態(tài)機(jī)器學(xué)習(xí)的財(cái)務(wù)數(shù)據(jù)異常自動(dòng)檢測(cè)方法(文章方法)與其他2種方法(方法1和方法2)的性能對(duì)比。從ROC曲線的走勢(shì)來看,文章方法的曲線更加陡峭,在相同假正例率下,其真正例率明顯高于方法1和方法2。在假正例率較低時(shí),文章方法就能達(dá)到較高的真正例率。這表明文章方法在保持低誤報(bào)率的同時(shí),能夠更有效地識(shí)別出財(cái)務(wù)數(shù)據(jù)中的異常。這一優(yōu)勢(shì)在財(cái)務(wù)數(shù)據(jù)異常檢測(cè)中尤為重要,因?yàn)檎`報(bào)可能會(huì)給企業(yè)帶來不必要的困擾和損失。

根據(jù)圖3所示,筆者對(duì)比了3種方法在不同財(cái)務(wù)樣本數(shù)量下的檢測(cè)正確率。隨著樣本數(shù)量的逐步增加,文章方法展現(xiàn)出了顯著的優(yōu)勢(shì),其檢測(cè)正確率較高,在90%以上。相比之下,另外2種方法的檢測(cè)正確率則相對(duì)較低,特別是在樣本數(shù)量較多的情況下,文章方法的正確率遠(yuǎn)高于另外2種方法,這充分證明了基于多模態(tài)機(jī)器學(xué)習(xí)的財(cái)務(wù)數(shù)據(jù)異常自動(dòng)檢測(cè)方法的有效性,以此證明文章方法能夠充分利用財(cái)務(wù)數(shù)據(jù)的多種模態(tài)特征,實(shí)現(xiàn)更精準(zhǔn)、更高效的異常檢測(cè)。

筆者通過對(duì)3種不同方法在檢測(cè)財(cái)務(wù)數(shù)據(jù)異常上的損失值變化情況進(jìn)行分析,得出以下結(jié)論:在圖5所展示的樣本數(shù)量范圍內(nèi),可以清晰地看到基于多模態(tài)機(jī)器學(xué)習(xí)的財(cái)務(wù)數(shù)據(jù)異常自動(dòng)檢測(cè)方法相較于其他2種方法表現(xiàn)出了顯著的優(yōu)勢(shì)。隨著樣本數(shù)量的增加,文章方法的檢測(cè)損失值下降得更為迅速,這表明其能夠更好地適應(yīng)和學(xué)習(xí)數(shù)據(jù)中的特征。這一結(jié)果驗(yàn)證了多模態(tài)機(jī)器學(xué)習(xí)在財(cái)務(wù)數(shù)據(jù)異常檢測(cè)中的有效性,因此,筆者可以認(rèn)為基于多模態(tài)機(jī)器學(xué)習(xí)的財(cái)務(wù)數(shù)據(jù)異常自動(dòng)檢測(cè)方法效果好,具有廣闊的應(yīng)用前景。

6結(jié)語

綜上所述,文章研究的基于多模態(tài)機(jī)器學(xué)習(xí)的財(cái)務(wù)數(shù)據(jù)異常自動(dòng)檢測(cè)方法能夠自動(dòng)識(shí)別并分析財(cái)務(wù)數(shù)據(jù)中的異常模式,這不僅提高了財(cái)務(wù)審計(jì)的準(zhǔn)確性和效率,還為企業(yè)的風(fēng)險(xiǎn)管理和內(nèi)部控制提供了強(qiáng)有力的技術(shù)支持。然而,在模型訓(xùn)練過程中,算法的參數(shù)調(diào)優(yōu)和模型選擇也面臨一定挑戰(zhàn),需要不斷嘗試和優(yōu)化才能達(dá)到最佳效果。基于多模態(tài)機(jī)器學(xué)習(xí)的財(cái)務(wù)數(shù)據(jù)異常自動(dòng)檢測(cè)研究仍有較大發(fā)展空間,可深入研究更先進(jìn)的機(jī)器學(xué)習(xí)算法和深度學(xué)習(xí)模型,以更好地捕捉財(cái)務(wù)數(shù)據(jù)中的復(fù)雜異常模式。通過不斷努力和改進(jìn),筆者相信未來基于多模態(tài)機(jī)器學(xué)習(xí)的財(cái)務(wù)數(shù)據(jù)異常自動(dòng)檢測(cè)方法將更加成熟和完善,為企業(yè)的財(cái)務(wù)管理和風(fēng)險(xiǎn)控制做出更大的貢獻(xiàn)。

參考文獻(xiàn)

[1]馮華偉.基于深度神經(jīng)網(wǎng)絡(luò)的異常財(cái)務(wù)數(shù)據(jù)識(shí)別方法[J].電子設(shè)計(jì)工程,2022(10):31-35.

[2]李自霞,周波.基于孤立森林算法的企業(yè)分布式財(cái)務(wù)不良數(shù)據(jù)檢測(cè)研究[J].湖北文理學(xué)院學(xué)報(bào),2024(8):22-27.

[3]張學(xué)凱,張仰森,劉帥康,等.面向財(cái)務(wù)審計(jì)的數(shù)據(jù)異常偵測(cè)算法研究[J].重慶理工大學(xué)學(xué)報(bào)(自然科學(xué)),2024(7):158-165.

[4]高倩,王春飛.大數(shù)據(jù)分析與財(cái)務(wù)舞弊檢測(cè)[J].中國注冊(cè)會(huì)計(jì)師,2023(12):63-66.

[5]劉華玲,陳尚輝,曹世杰,等.基于多模態(tài)學(xué)習(xí)的虛假新聞檢測(cè)研究[J].計(jì)算機(jī)科學(xué)與探索,2023(9):2015-2029.

[6]陳云杰,柏溢.基于卷積神經(jīng)網(wǎng)絡(luò)的移動(dòng)通信網(wǎng)絡(luò)入侵檢測(cè)方法研究[J].無線互聯(lián)科技,2024(17):122-124.

(編輯王永超)

主站蜘蛛池模板: a在线观看免费| 日韩欧美色综合| 高清欧美性猛交XXXX黑人猛交| 92午夜福利影院一区二区三区| 国产91精品最新在线播放| 天堂在线视频精品| 国产丝袜丝视频在线观看| 日韩国产精品无码一区二区三区| 伊人国产无码高清视频| 无码中文字幕精品推荐| 波多野结衣在线se| 精品一区国产精品| 亚洲天堂网视频| 一本二本三本不卡无码| 毛片免费高清免费| 国产毛片片精品天天看视频| 伊人色综合久久天天| a免费毛片在线播放| 色婷婷啪啪| 成AV人片一区二区三区久久| 国产精品大白天新婚身材| 国产精品视频系列专区| 91免费观看视频| 九九九精品成人免费视频7| 亚洲无码电影| 天天躁夜夜躁狠狠躁图片| 97精品国产高清久久久久蜜芽| 亚洲第一区在线| 99视频在线免费| 91国内在线观看| 亚洲天堂久久久| 最新加勒比隔壁人妻| 欧美福利在线| 久久永久免费人妻精品| 国产精品久久久久久久久久98| 高清色本在线www| 欧美激情二区三区| 亚洲va在线观看| 国产精品9| 丁香六月激情婷婷| 亚洲无码A视频在线| 日本国产在线| 成人在线观看不卡| 中文字幕日韩丝袜一区| 在线观看国产精品第一区免费| 国产午夜小视频| 亚洲欧美成人在线视频| 美女被狂躁www在线观看| 人妻无码中文字幕第一区| 色偷偷男人的天堂亚洲av| 精品小视频在线观看| 亚洲福利片无码最新在线播放| 日韩一级毛一欧美一国产| 国产精品免费露脸视频| 狠狠操夜夜爽| 国产美女精品人人做人人爽| 国产成人三级| 国产女人喷水视频| 三上悠亚精品二区在线观看| 精品伊人久久大香线蕉网站| 久久精品视频亚洲| 免费看一级毛片波多结衣| 综合天天色| 国产福利小视频在线播放观看| 老司机午夜精品网站在线观看| 国产第二十一页| 欧美一级在线播放| 第一页亚洲| 无码免费试看| 欧美色视频日本| 亚洲精品无码高潮喷水A| 四虎影视永久在线精品| 国产成人无码综合亚洲日韩不卡| 欧美笫一页| 欧美午夜在线视频| 九色91在线视频| 亚洲国产精品久久久久秋霞影院| 亚洲天堂网在线观看视频| 国产浮力第一页永久地址| 国产一二三区在线| 丁香综合在线| 中文精品久久久久国产网址 |