999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于數據挖掘的異常財務數據識別方法研究

2021-11-10 05:27:08金恒過文俊
電子設計工程 2021年21期
關鍵詞:數據挖掘

金恒,過文俊

(西安航空職業技術學院,陜西西安710089)

隨著我國經濟的發展,上市公司的數量不斷增多,上市公司提供的財務會計信息是市場參與者進行投資決策的重要依據。但近年來,上市公司進行財務數據舞弊的行為屢見不鮮。這對市場和投資者均造成了極大的傷害,破壞了資本市場公平、公正的原則。從市場和投資者的角度出發,如何識別異常的財務數據,及時發現公司的舞弊行為具有重要意義[1-7]。

對于異常財務數據的識別通常包含兩種模式:一種是基于基礎財務知識的統計識別模式,該模式在經濟學理論的基礎上對公司進行財務審計,這種方法更注重于財務模型的精確性和共性,而忽略了公司的個性;另一種是基于數據挖掘思想的數據分析方法,該模式更注重對于財務數據本身的取樣和特征的提取,側重于數據的實驗。該文基于數據挖掘的模型,進行了財務數據的分析。在模型的構建上,為了解決上市公司成立時間不同導致數據格式在時間粒度累計的差異性,和由此引發的數據挖掘模型實用性差的問題,采用動態時間規整算法計算時間序列的相似度,對K 鄰近算法的輸入樣本進行了格式統一。仿真結果表明,文中提出的基于DTW算法的異常財務數據模型,具有較樸素貝葉斯算法更高的識別精度[8-15]。

1 模型設計

1.1 動態時間規整算法

對于財務數據的處理和分析需要依托于公司的財務數據,由于公司的成立時間不同,不同公司間財務數據的采集時間粒度不同。這導致了數據格式在時間維度上的累積不同,時間跨度無法做到統一。一般的數據挖掘模型難以在該場景下發揮自身的性能,因此該文引入動態時間規整算法(DTW)進行財務數據的處理與分析。其基本原理如下:

設測試數據集為R,訓練數據集為T,各個數據集樣本的維度分別是m和n。對于監督性學習算法,需要比對測試數據集和訓練數據集間的相似度。此時,可通過計算樣本間的歐式距離D來衡量樣本的相似度,當n=m時:

當n≠m時,需要引入動態規劃的思想進行D的計算。

如圖1所示,將測試樣本的序號在直角坐標系的x軸上標注;將訓練樣本在y軸上標注。此時,可以在坐標軸上形成縱橫交錯的網格,網格的交叉點是測試樣本與訓練樣本的交匯。同時需要尋找一條從坐標軸左下角出發右上角結束的路徑,將這條路徑經過的第i個點記為(ni,mi),路徑函數記為:

圖1 DTW算法路徑搜索原理

在路徑搜索時,需要對斜率進行約束,以保證路徑的走向,通常斜率的變化范圍是0.5~2。當路徑在當前時刻通過的點為(ni-1,mi-1)時,其下一點的所有可能情況為:

此時,將式(3)作為約束條件,求解式(1)中的最佳路徑,以最短路徑為優化目標,得到目標函數:

對于坐標軸中的任意點,在路徑搜索的過程中,最終只有一條路徑可以穿過。因此對于(ni,mi),其路徑上的前一點也只有3種情況,即(ni-1,mi)、(ni-1,mi-1-1)或(ni-1,mi-2)。此時,需要選擇(ni,mi)點到這3 種情況下兩點距離最短的點作為路徑上的前一節點。此時,可以得到路徑的總距離為:

其中,ni-1和mi-1的確定方式如下:

此時,可以通過逐點前向迭代的方式得到整條路徑。

1.2 基于動態彎折的改進DTW算法

在上文中,DTW 算法在路徑搜索過程中對于路徑彎折的斜率進行了限制。但實際的迭代過程中,存在著無法滿足該限制條件的點。以圖2為例,圖2中的菱形在進行距離匹配時,其格點之外的距離無需計算。由于菱形的幾何特性,在計算中也無需保存所有步驟的累計距離。因此,可以在計算時間和計算開銷上對1.1 節中的算法進行優化。

圖2 算法路徑約束示意圖

在圖2中,將實際的彎折劃分為3 個路徑段,分別是(1,Xa)、(Xa+1,Xb)、(Xb+1,N),其坐標存在以下關系:

將Xa與Xb取為相近的整數,此時可以得到動態彎折匹配的約束條件:

引入動態彎折后,無需再將X軸上的特征向量與Y軸點對應的特征向量進行比對。只需要與[ymin,ymax]內的特征向量分別進行比對即可,這個區間端點的計算方式如下:

此時,距離累計的更新方法如下:

根據式(11)所示,當X軸上的時間標號逐步前進時,只需要關注前一列的累計距離即可。因此,該算法無需保存全部的距離矩陣,從而實現節省運行所需內存的目的。具體的更新方法如圖3所示。

圖3 累計距離更新方法

2 方法實現

2.1 實驗設計

為了評估算法的性能,需要進行公司財務數據的搜集與清洗。該文選取了RESSET 金融數據庫中對外公布的上市公司相關數據。在2010-2020年的所有公司中,剔除數據缺失的相關公司,篩選了100家上市公司。同時,該文還從該時間段內存在財務舞弊的公司中,篩選了100 家公司及其財務數據,共同組成了包含200 家公司的數據集。

該文實現算法的仿真平臺參數如表1所示。

表1 計算環境參數

圖4給出了基于DTW 算法的財務數據分析處理流程。

由圖4可以看出,該文算法需要將財務數據表示為時間序列。對于一個單位,分別使用式(12)、式(13)作為訓練樣本和測試樣本的時間序列標號:

圖4 算法流程

其中,m、n分別是訓練樣本和測試樣本的時序標號,M、N分別是訓練樣本與測試樣本對應的年份總數。在機器學習算法中,為了保障算法的性能,需要引入合適的特征對測試集、訓練集的數據進行描述,這些特征組合為數據集的特征向量。特征向量的維度,對于算法的訓練測試效果具有深刻的影響。在異常財務數據的識別中,需要引入表征財務特征的相關數據,該文引入的表征財務特征的數據如表2所示。

表2 算法使用的財務數據信息

根據圖4所示的算法流程,基于DTW 算法計算時間序列的間距,然后使用K 鄰近算法得到序列的分類結果。當同一公司正常的財務數據數大于異常數時,將該公司的狀態置為正常;當該公司正常的財務數據數小于異常數時,將該公司的狀態置為異常。

2.2 算法仿真結果

在進行算法的仿真時,為了提高獲取的數據集的利用效率,文中使用k重交叉驗證的方式進行算法的訓練與測試。在k重交叉驗證時,首先將所有的數據劃分為維度相同的k個子集。在劃分過程中,需要保證子集之間互不相交,且有同樣的概率分布。然后選擇其中的一個作為測試集,其余的作為訓練集。交叉驗證后,可以得到混淆矩陣。該文得到的混淆矩陣形式如表3所示。

表3 交叉驗證混淆矩陣

在表3中,A 代表公司為異常、算法預測結果也是異常的公司;B 代表公司為異常、算法預測為正常的公司;C 代表公司為正常、算法預測為異常的公司;D 代表公司為正常、算法預測為正常的公司。該文在進行k重交叉驗證時,取k為10,這樣就得到了10 組預測結果。為了更優地評估算法性能,使用樸素貝葉斯分類算法進行對照實驗,實驗結果如表4所示。

表4 基于BP神經網絡的實驗結果

從表4可以看出,該文算法在進行異常財務數據的識別時,每組數據的正確識別率基本都達到了80%,且均明顯高于樸素貝葉斯算法的識別準確率。表4的結果證明了文中算法相較于現有的貝葉斯算法,在異常財務數據的識別上具有更優的性能和應用前景。

3 結束語

文中針對公司財務數據分析需求,從時間序列處理的角度進行了研究。基于動態時間規整算法,解決了不同時間維度下時間序列處理的問題。基于動態彎折的思想,算法在迭代過程中無需存儲所有的距離矩陣,從而節約了算法運行時的存儲需求。最終通過對比仿真,驗證了文中算法可以取得比貝葉斯算法更優的識別正確率,說明該文算法可以應用到異常財務數據識別的場景中。

猜你喜歡
數據挖掘
基于數據挖掘的船舶通信網絡流量異常識別方法
探討人工智能與數據挖掘發展趨勢
數據挖掘技術在打擊倒賣OBU逃費中的應用淺析
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
數據挖掘技術在中醫診療數據分析中的應用
一種基于Hadoop的大數據挖掘云服務及應用
數據挖掘在高校圖書館中的應用
數據挖掘的分析與探索
河南科技(2014年23期)2014-02-27 14:18:43
基于GPGPU的離散數據挖掘研究
利用數據挖掘技術實現LIS數據共享的開發實踐
主站蜘蛛池模板: 国产在线无码一区二区三区| 伊人久综合| 网友自拍视频精品区| 日韩欧美国产中文| 91精品国产福利| 欧美精品1区2区| 999国产精品永久免费视频精品久久| 国产黄网站在线观看| 日本精品αv中文字幕| www.亚洲天堂| 亚洲三级色| 呦女亚洲一区精品| 少妇极品熟妇人妻专区视频| 全免费a级毛片免费看不卡| 亚洲天堂成人在线观看| 午夜三级在线| 中文字幕免费播放| 中日韩欧亚无码视频| 青草免费在线观看| 国产精品3p视频| 国产自在线播放| 精品天海翼一区二区| 色综合中文字幕| 福利在线不卡一区| 波多野结衣中文字幕一区二区| 国产精品视频猛进猛出| 欧美亚洲另类在线观看| 中文字幕1区2区| 久久综合伊人 六十路| 亚洲青涩在线| 成人自拍视频在线观看| 热伊人99re久久精品最新地| 国产精品露脸视频| 国产制服丝袜无码视频| 国产精品国产主播在线观看| 真实国产乱子伦视频| 四虎综合网| 欧美在线黄| 色婷婷丁香| 欧美日韩国产在线人成app| 福利在线不卡| 日韩经典精品无码一区二区| 国产成人精品一区二区三在线观看| 一级毛片基地| 六月婷婷激情综合| 日韩av电影一区二区三区四区| 四虎永久免费网站| 一级毛片视频免费| 蜜臀AV在线播放| 亚洲成人精品在线| 国产在线精品99一区不卡| 中文字幕 91| 国模极品一区二区三区| 亚洲中文在线视频| 国产精品久久久久无码网站| 欧美日韩国产成人高清视频| 国产精品欧美亚洲韩国日本不卡| 亚洲国产综合自在线另类| 女人18毛片水真多国产| 黄色网在线| 欧洲日本亚洲中文字幕| 色网站在线视频| 欧洲亚洲一区| 久久综合伊人 六十路| 男女男免费视频网站国产| 丁香婷婷久久| 99国产精品国产| 亚洲大尺度在线| 午夜福利在线观看入口| 91在线视频福利| 国产综合日韩另类一区二区| 一区二区三区成人| 少妇精品久久久一区二区三区| 国语少妇高潮| 久久中文无码精品| 国产精品深爱在线| 久久一色本道亚洲| 国产精品自在拍首页视频8| 在线观看国产黄色| 亚洲成a人在线播放www| 亚洲国产精品一区二区第一页免| 亚洲国产成人精品无码区性色|