999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

審計信息系統的異常數據挖掘算法和應用

2020-09-22 03:26:26毛玲玥
全國流通經濟 2020年19期
關鍵詞:應用

摘要:信息系統作為企業經營管理活動的基本手段,需要從海量數據中搜索得到有效的審計證據和審計線索,能夠發現經營活動的異常是審計工作的重要內容。本文在對各類異常數據挖掘算法的分析和總結基礎上,關注審計數據挖掘中問題的解決,使得審計信息系統的異常數據挖掘算法得以推廣應用。

關鍵詞:審計信息系統;異常數據;挖掘算法;應用

中圖分類號:F232.6;TP393?文獻識別碼:A?文章編號:2096-3157(2020)19-0183-02

隨著信息技術的發展和廣泛應用,審計單位的經營和管理及核算模式出現明顯變化,其更加復雜且龐大的信息系統,使得傳統的會計核算和經營管理系統的構成要素也隨之改變。審計人員在進行資料整理的時候,需要面對大量電子數據信息,信息系統審計屬于信息環境中全新的審計方式,其地位日益凸顯。當前審計信息系統所面臨的問題是應對數據海量化的挑戰,能夠在海量數據中有效快速得到規律及特點,挖掘審計線索,降低審計工作的風險,需要數據挖掘技術的支持,這也為審計信息系統的構建及應用提供新的發展方向[1]。

一、數據挖掘概論

數據挖掘主要是指從大量不完全和有噪音及隨機數據信息中提取隱含的信息和知識的過程,數據挖掘在信息系統審計工作開展的時候具有重要作用和積極影響,其不僅能夠對信息系統所產生審計業務數據及財務信息等深層次研究,得出其本來所具有的特點和內在聯系,也可以在模型匹配及挖掘算法的支持下實現信息系統開發審計和安全審計等各個方面的實際應用,在數據挖掘技術和信息系統審計技術的融合下,能夠明確系統控制審計符合文件資料嵌入審計程序所需要采集的信息內容[2]。

二、異常數據及其來源

數據挖掘主要是在計算機技術和軟件支持的基礎上,所獲取的大量模糊的數據中提取一些不明顯的規律,在這一基礎上得出更多有效的知識內容。異常指不一般的數據,推動人們認識到這些數據不屬于原本系統的隨機偏差,多數情況下是在不同機制的支持下實現的,異常本質和正常數據之間差異明顯,個數和正常數據相對比具有對象數量比較少的特點,通常情況下,異常數據的來源主要有相異的類和自然變異及數據收集誤差等。

首先,相異的類屬于數據對象的異常,其可能來源于不同的對象,在審計處理的時候,需要分析異常變動數據,例如資金流量異常變化和異常的交易情況等,這些異常多數情況下存在著代表性特點,是關注的重要對象。

其次,自然變異則屬于多數數據在正態規律分布的基礎上實現的,通常這些數據都比較接近數據的中心,而兩邊的數據相對較少,例如在營業收入分析的時候,主營業務是正常的計算對象,而偶然一次性營業收入是對象類中的異常情況[3]。

最后,數據測量收集誤差的異常是在設備測量問題比較突出所得出的不正確記錄問題,這些數據本身不會提供被審計對象認可的有價值信息支撐,相關數據資料不會為去除這些異常,同時注重提高數據及數據分析的質量。

三、異常數據挖掘算法

1.基于統計方法的數據挖掘算法

數據挖掘算法產生之前,多數情況下處于異常數據的時候是利用剔除法,近些年是基于不同分布的異常檢驗方式進行異常數據處理,通常是在不同分布的異常檢驗方式基礎上實現的,在概率分布模型支持下,隨后在某一個顯著性水平上明確得出具體的拒絕域和接受域,如果數據落在拒絕域范圍中,將其確定為異常數據,基于統計的算法受到廣泛關注,實際操作的時候,具有兩種比較簡單快速的異常檢測方式,也就是3σ異常檢測方法和Z統計量法。統計方法本身具有較為堅實的數學基礎,如果給定相關模型,其本身存在著比較大的指導意義,但是這一方式多數是在明確單個屬性的情況下實現的,無法有效處理多維空間的異常數據。

2.基于距離方式的數據挖掘算法

基于距離方式的數據挖掘算法是基于數據點距離進行計算的,其本身具有明顯的幾何解釋,且能夠避免統計方式的局限性特點,其也能夠有效應用到多維數據樣本中,而統計方法則不行。基于距離的算法中應用比較多的包含著DB(p,d)方法和k-近鄰方法。DB(p,d)方法的基于距離的異常是沒有充足的另據的對象。k-近鄰方法的主要思想是為每個對象找到其k個最近的鄰居,在有效對其對象到這k個鄰居的最大的距離分析的情況下,進行對象距離排序處理,得出排序比較靠前的對象作為異常點。

3.基于密度的數據挖掘算法

基于統計學和距離的異常數據方式主要是在給定的數據集合的全局分布基礎上實現的,隨后,也要能夠結合明確數據分布情況得出當前基于密度的方法是局部離群范圍是遠離的,則可以成為局部離群點,其不將離群點作為二元性質的對象,而僅僅是評估一個對象為離群點的程度[4]。

四、審計信息系統的異常數據挖掘算法的選擇和應用

在審計數據的時候,要求能夠盡快發現其中的異常數據,從而達到預警和減少損失的效果,被審計的信息通常情況下都會被儲存到ERP等信息系統中,審計人員也要能夠將數據導入到計算機分析數據表內,隨后挖掘其所包含著的異常數據,但是,在企業信息化更大范圍推廣和數據庫并行應用的基礎上,單一的異常數據挖掘算法當前無法滿足被審計對象數據異常的及時發展過程中,需要加強對算法的改進和完善[5]。

1.基本算法

首先,測量距離的量度相對較為常用的包含著絕對距離和歐式距離,絕對距離的定義為:

最后,描述算法,如果數據集合S中所涉及到的P部分和對象O距離明顯要大于d,對象O也為帶參數的P和d的給定距離方面具有的異常點。R[k]表示在第一屬性值記錄情況下,假設O(1,2,…,n)按照順序排列,則具體算法如下:第一步選擇中心點,第二步設置初始值和權重向量,第三步WHILE(不滿足結束條件)。

2.基于單元的異常數據算法

基于單元的孤立點是充分將數據劃分為相似的單元格,根據單元格的坐標及數據對象關系有效推動數據對象能夠更好地映射到單元格中,從而對其異常點深入檢查和有效確定,對于無法利用單元格的算法也能夠根據其所具有的距離算法加以解決,首先假設數據為二維數據,隨后向多維數據推導[6]。

(1)經典的基于單元的異常點算法

最早得出基于單元的異常數據的算法是可以檢測儲存于內部的存儲數據信息,這一算法能夠檢測所有的DB(p,d)異常點,其也存在著一定不足,也就是閾值和距離值屬于常量,并不是動態調整的,其中閾值首先是不會隨著單元格的位置不同而產生差異,可以在相關分析中得出,如果邊界單元格的第一層鄰居主要為三個或者五個,而其他的單元格顯示為八個,如果是結合單一的閾值,就可以使得邊界處的異常點出現誤判。另外距離值也屬于固定值,在程序給定這一固定值后,對距離值進行計算,在不同的用戶需求分析的時候,也要能夠明確尺度差異,需要存在著不同的距離值,且對比不同的距離值之后產生結果的時候,也會促使問題掌握更加透徹。

(2)算法的實際調整

固定閾值對判斷會造成一定影響,而造成這些影響的主要原因是邊界單元格和非邊界單元格之間的差異,因此,對閾值調整的時候,較為有效的方式是判斷單元格是否為邊界單元格,這一問題解決的時候,主要是利用以下公式解決:

(3)經典單元異常挖掘算法的完善擴展

多維度數據始終是沒有問題的。

五、具體實踐及效果

為了對算法實際應用效果有效改善,需要在實驗的方式基礎上開展實際驗證,實際數據主要是基于電力企業的2017年~2019年的財務信息和業務數據等收集分析處理,數據屬性中主要有52項,其具體的實驗目標是監測異常數據。硬件環境Pentium雙核2.1GHz,3.2G內存,硬盤為160G,數據庫利主要是利用DB2,程序則實驗net架構編寫。實驗的過程也要清理相關數據,將中文和字幕等充分轉換為統一編碼數值數據,在這一環境下確定相關的目標數據庫,隨后利用算法挖掘的方式得出具有的實驗結果。

在和原本算法相對比的基礎上,可以得出新的算法對不同數據操作時間相對減少,平均的節約量主要為3%,新的算法也會得到比較多異常數據點,在實際實施的時候存在著顯著的指導作用,利用電力企業的實際應用情況分析,為企業提供更多舞弊行為的審計證據。

六、結語

在基于距離的經典算法擴展的基礎上,能夠對審計對象多類數據應用的要求有效滿足,明確得出滿足審計系統的異常數據挖掘算法,這一算法也就能夠充分發現異常數據,從而減少損失,同時也能夠廣泛在相關商務實踐活動異常數據挖掘中具體實施。

參考文獻:

[1]潘東陽,劉靜瑞.基于數理統計的網絡運行異常數據挖掘模型構建[J].信息通信,2019,(07):21~22.

[2]張波,李舸.基于改進聚類算法的Web異常數據挖掘軟件設計[J].現代電子技術,2019,42(08):73~76+81.[3]張凱斐,劉繼華,張菊芳.大規模高維數據集中局部異常數據挖掘算法[J].微電子學與計算機,2018,35(03):116~119+124.

[4]向楨,向守兵.基于模糊遺傳算法的數據庫異常數據挖掘[J].控制工程,2017,24(05):947~951.[5]馬寧,廖慧惠.云計算環境下頻繁出現異常數據挖掘方法研究[J].赤峰學院學報(自然科學版),2017,33(03):31~32.

[6]王樂,王芳.數據庫異常數據的檢測仿真研究[J].計算機仿真,2016,33(01):430~433.

作者簡介:

毛玲玥,供職于浙江浙能富興燃料有限公司,中級審計師。

猜你喜歡
應用
配網自動化技術的應用探討
科技視界(2016年21期)2016-10-17 19:54:47
帶壓堵漏技術在檢修中的應用
科技視界(2016年21期)2016-10-17 19:54:05
行列式的性質及若干應用
科技視界(2016年21期)2016-10-17 18:46:46
癌癥擴散和治療研究中的微分方程模型
科技視界(2016年21期)2016-10-17 18:37:58
紅外線測溫儀在汽車診斷中的應用
科技視界(2016年21期)2016-10-17 18:28:05
多媒體技術在小學語文教學中的應用研究
考試周刊(2016年76期)2016-10-09 08:45:44
微課的翻轉課堂在英語教學中的應用研究
大學教育(2016年9期)2016-10-09 08:28:55
分析膜技術及其在電廠水處理中的應用
科技視界(2016年20期)2016-09-29 14:22:00
GM(1,1)白化微分優化方程預測模型建模過程應用分析
科技視界(2016年20期)2016-09-29 12:03:12
煤礦井下坑道鉆機人機工程學應用分析
科技視界(2016年20期)2016-09-29 11:47:01
主站蜘蛛池模板: 91探花国产综合在线精品| 综合色88| 大学生久久香蕉国产线观看 | 亚洲黄网在线| a级毛片毛片免费观看久潮| 亚洲欧美日韩综合二区三区| 国产91九色在线播放| 久久香蕉国产线| 国产九九精品视频| 青草视频久久| 日本在线免费网站| 亚洲精品中文字幕午夜| 欧洲熟妇精品视频| a免费毛片在线播放| 中国一级毛片免费观看| 中文字幕调教一区二区视频| 精品国产一二三区| 99久久国产综合精品2020| 97se亚洲综合不卡| 久久久久人妻一区精品色奶水| 国产精选小视频在线观看| 久久精品中文字幕免费| 亚洲人成亚洲精品| 国产激情国语对白普通话| 亚洲,国产,日韩,综合一区 | 成人毛片在线播放| 高清久久精品亚洲日韩Av| 91色在线观看| 成人无码一区二区三区视频在线观看| 国产网站免费观看| 手机精品福利在线观看| 日韩欧美色综合| 中文成人在线视频| 日本午夜在线视频| 人人爱天天做夜夜爽| 欧美狠狠干| 一级毛片在线播放| 久久婷婷五月综合97色| 国产精品女同一区三区五区| 久久久亚洲色| 国产精女同一区二区三区久| 无码专区国产精品第一页| 久久综合激情网| 青青操视频在线| …亚洲 欧洲 另类 春色| 国产一级毛片在线| 成年网址网站在线观看| 深爱婷婷激情网| 国产永久免费视频m3u8| 免费三A级毛片视频| 777国产精品永久免费观看| 欧美成人免费一区在线播放| 国产午夜不卡| 色综合久久88| 无码人妻免费| 国产区在线看| 四虎免费视频网站| 一级成人a毛片免费播放| 无码精油按摩潮喷在线播放| 国产成人精品高清不卡在线 | 99久久国产综合精品女同| 国产精品视频猛进猛出| 成人看片欧美一区二区| 亚洲精品动漫| 99热这里都是国产精品| 国产精品大白天新婚身材| 日韩精品资源| 免费一级毛片不卡在线播放| 国产成人精品优优av| 欧洲成人在线观看| a级免费视频| 露脸真实国语乱在线观看| 日韩在线第三页| 成人中文在线| 久久久久国产精品嫩草影院| 欧美一级高清片久久99| 国产白浆视频| 666精品国产精品亚洲| 黄色不卡视频| 性视频一区| www.精品国产| 亚洲欧洲日韩国产综合在线二区|