999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

應用Benford法則和Apriori算法對海量數據的審計分析

2011-12-31 00:00:00衛劍楊滋榮
中國管理信息化 2011年14期

[摘 要] 隨著信息時代的飛速發展,被審計單位財務和業務數據量爆炸式增長,審計技術必須不斷發展和創新以適應信息時代審計的新要求。本文在這一背景下,對審計技術的創新作了探索性的研究,主要通過Benford法則和Apriori算法的關聯數據挖掘的技術手段在審計中的應用,探討了如何在被審計單位海量數據中進行挖掘分析,從而發現有業務意義的強規則,通過這些強規則解釋數位發生偏離的原因,從而快速發現審計疑點。

[關鍵詞] Benford法則; Apriori算法;關聯規則; 審計數據分析

doi : 10 . 3969 / j . issn . 1673 - 0194 . 2011 . 14. 018

[中圖分類號]F239.1 [文獻標識碼]A [文章編號]1673 - 0194(2011)14- 0029- 03

1 技術簡介

1.1 Benford法則簡介

1.1.1 Benford法則[1]的定義

1938年,通用電氣公司物理學家Frank Benford收集了大量的數據集合后發現,人們處理較低數字開頭的數值的頻率較大。

1.1.2 Benford法則的Benford分布

Benford分布屬于第二代(second generation)分布,描述了數據總體的客觀分布規律,數據總體由其他分布中的抽樣數據組成的分布。

2004年Utah State University的Cindy Durtschi的研究[2]表明:

(1)數字出現概率的期望值的標準偏差為:

Z=(|P0-Pe|-1/2n)/Si

(2)分布概率的Z統計量為:

P0:實際的數據出現比率;Pe:根據Benford法則的預期出現比率;Si:某個數字的標準偏差;n:目標數據集的記錄數。

1.1.3Benford分布中的數字頻率上下限

(1)數字頻率的上限:

(2)數字頻率的下限:

1.1.4Benford法則的應用范圍

(1)可以針對海量數據進行挖掘分析,數據規模越大,分析結果越精確。

(2)會計舞弊調查[3-5]、審計[6-8]、稅收監管[9]、金融分析和反洗錢[10]。

1.2Apriori算法簡介

Apriori算法[11]是一種對布爾關聯規則頻繁項集進行挖掘的算法。Apriori算法使用一種逐層搜索的迭代方法,即使用k-項集用于探索(k+1)-項集,其中k=1,2,3,…,n,n∈N,直到最終無法找到頻繁(k+1)-項集,從而確定最終的頻繁k-項集。

2應用Benford法則和Apriori算法對海量數據的審計分析

Benford法則和Apriori算法的聯合數據挖掘在審計中的應用主要圍繞為以下兩個核心步驟展開:

2.1應用Benford法則發現審計疑點

(1)判斷數據的來源是否符合Benford法則的應用范圍。

(2)對總體數據的一、二位有效數字進行Benford法則的符合性測試,初步發現對數據進行深入鉆取的線索。

(3)對標準分布頻率和實際分布頻率進行比較,分析頻率偏差,確定合理的鉆取重點。

(4)根據分析結果和實際需要,進行更多位數字的進一步數據鉆取和分析,直至發現目標數據。

鉆取過程如圖1所示。

2.2 應用Apriori算法分析審計疑點

(1)采集通過Benford法則分析后輸出的疑點數據集。

(2)整理疑點數據集以建立事務集,即Apriori算法要求輸入的數據集合。

(3)掃描事務集產生候選數據集合,并依據最小支持度篩選出頻繁項集。

(4)頻繁項集進行自關聯,迭代第三、第四步,確定最終的頻繁項集。

(5)依據最小置信度從頻繁項集產生強規則。

(6)對強規則進行人工審計業務分析。

3應用案例

3.1應用Benford法則對審計疑點的發現過程

3.1.1 確定審計數據和目標字段

分析某企業的憑證數據,從其記賬憑證表accvouch摘取字段結構如表1所示:

3.1.2 數據導入

將相應的目標數據表導入審計人員使用的數據庫。

3.1.3總體頻率計算

3.1.3.1 數位的選取

以憑證T2000001和T2000002為例解釋數位選取方式,如我們選取憑證編號T2000001的金額欄1 000元的第一、二位數值為”10”,作為該筆記錄的第一、二位數;我們選取憑證編號為T2000002的借方金額欄3 029元的第一、二位數值為”30”,作為該筆記錄的第一、二位數,如表2所示:

3.1.3.2 數位分析

對記賬憑證表accvouch中的借方金額字段前兩位進行分析,第一、二數值為10的憑證紀錄有540筆,全部記錄有10 149筆,因此第一、二位數為”10”頻率為5.3%(540/10 149)。部分結果如圖2所示。

3.1.4 分析頻率偏差

根據Benford分布的數字頻率上限、數字頻率下限和分布概率Z統計量的公式計算得到圖2所示數據。

分析圖2數據可以得出:

(1)第一、二位數為”10”的實際頻率為5.3%,高于Benford法則的理論上限4.53%,計算其Z統計量的值,Z值為5.844 4,也大于1.96,因此我們初步判定存在錯誤、潛在舞弊行為或者人為的偏差。

(2)第一、二位數為”11”的實際頻率為3.25%,低于Benford法則的理論下限3.4%,雖然Z值為3.038也大于1.96,但可能是由于數位為”10”超過Benford法則的理論頻率過大從而導致其頻率偏低,因此應該屬于無異常。

3.2應用Apriori算法對審計疑點的關聯規則挖掘

3.2.1獲取并整理疑點數據

為了進一步明晰數據間的關系,觀察數據的規律性,對疑點數據(首一二位數為“10”)通過關聯查詢篩選出來,形成審計中間表,部分數據如表3所示。

3.2.2運用Apriori算法探索關聯規則

步驟一:以表3中的第1列、第3列、第4列和第5列數據建立事務集D,由D建立候選1-項集C1,部分數據如表4所示。

步驟二:假設最小支持記錄數為100,將支持度不足的項去掉,得到頻繁1-項集L1,如表5所示。

步驟三:循環步驟一和步驟二,得到最終的頻繁3-項集L3,如表6所示。

步驟四:根據最終的頻繁3-項集L3和設置的最小置信度100%得出表7所示的強規則。

步驟五:由業務審計人員確定強規則的業務價值,進行人工排查后,確定編號為1的強規則為有意義的規則。

4結論

在實際的審計項目中,對于大量的企業財務數據和業務數據,可以運用Benford法則和Apriori算法的關聯數據挖掘手段進行分析,一般能夠發現有業務意義的強規則,這些強規則能夠解釋數位發生偏差的原因,而這種偏差一般是由于潛在的舞弊或違規行為所導致的。

主要參考文獻

[1]F Benford. The Law of Anomalous Numbers[J]. Proceedings of the American Philosophical Society,1938,78(4):551 - 572 .

[2]Cindy Durtschi,et al. The Effective Use of Benford’s Law to Assist in Detecting Fraud in Accounting Data[J]. Journal of Forensic Accounting,2004: 17 - 34.

[3]Andreas Diekmann, Ben Jann. Benford’s Law and Fraud Detection: Facts and Legends[J]. German Economic Review, 2010,11(3):397-401.

[4]Roger S Debreceny, Glen L Gray. Data Mining Journal Entries for Fraud Detection: An Exploratory Study[J]. International Journal of Accounting Information Systems, 2010,11(3):157-181.

[5]Kimin Seo, Jaemin Choi,et al. Research about Extracting and Analyzing Accounting Data of Company to Detect Financial Fraud[C]//IEEE International Conference on Intelligence and Security Informatics,2009: 200-202.

[7]辛金國,邢莉萍,等.舞弊審計程序研究 [J].審計研究 , 2004 (4) : 60 - 63.

[8]Dorina Marghescu, Minna Kallio, Barbro Back.Using Financial Ratios to Select Companies for Tax Auditing: A Preliminary Study[C]. The Proceedings of WSKS:Organizational Business,and Teehnological Aspects of Knowledge Society,Part Ⅱ:Communications in Computer and Information Science,2010:393-398.

[9]Nigrini M. A Taxpayer Compliance Application of Benford's Law[J]. Journal of the American Taxation Association,1996,18(1):72-91.

[11]Ketan D Shah, Sunita Mahajan.A New Efficient Formulation for Frequent Item-Set Generation[C]//ICAC3’09 Proceedings of the International Conference on Advances in Computing, Communication and Control,2009: 198-201 .

注:本文中所涉及到的圖表、注解、公式等內容請以PDF格式閱讀原文

主站蜘蛛池模板: 一本无码在线观看| 1级黄色毛片| 青青草国产一区二区三区| 人妻出轨无码中文一区二区| 亚洲男人的天堂久久香蕉网 | 午夜精品影院| 日韩高清欧美| 国产精品第一区在线观看| 毛片手机在线看| 天天躁日日躁狠狠躁中文字幕| 日韩天堂在线观看| 日韩毛片基地| 91久久偷偷做嫩草影院| 青草视频网站在线观看| 亚洲视频影院| 国产真实乱子伦精品视手机观看| 国产美女叼嘿视频免费看| 毛片网站免费在线观看| 97久久人人超碰国产精品| 国产精品久久久久久影院| 国产一级毛片网站| 国内熟女少妇一线天| 久久久久亚洲精品成人网| 亚洲欧州色色免费AV| 青青久久91| 亚洲第一区精品日韩在线播放| 91福利在线看| 88国产经典欧美一区二区三区| 四虎影视8848永久精品| 91视频首页| 国产成人精品男人的天堂下载| 国产日韩欧美成人| 天天色天天操综合网| 手机在线国产精品| 老司机精品久久| 亚洲精品成人片在线观看| 亚洲中文字幕无码mv| 欧美精品成人| 国产91特黄特色A级毛片| 日本三级精品| 日韩精品亚洲人旧成在线| h视频在线观看网站| 少妇极品熟妇人妻专区视频| 制服丝袜一区二区三区在线| 成人一级免费视频| 欧美一区二区啪啪| 国产综合网站| 免费毛片视频| 亚洲综合狠狠| 亚洲中久无码永久在线观看软件 | 制服丝袜国产精品| 免费人成在线观看视频色| 国产一在线观看| 亚洲成人精品久久| 狠狠色香婷婷久久亚洲精品| 日韩美一区二区| 丰满少妇αⅴ无码区| 亚洲精品在线观看91| 久久国产精品国产自线拍| 国产成人成人一区二区| 亚洲浓毛av| 国产一区二区三区免费观看| 97免费在线观看视频| 毛片网站观看| 好紧好深好大乳无码中文字幕| 91精品国产综合久久香蕉922| 国产美女在线观看| 久久这里只有精品2| 玖玖免费视频在线观看| 一区二区在线视频免费观看| 国产亚洲精品自在久久不卡| 免费高清毛片| 亚洲精品制服丝袜二区| 免费看的一级毛片| 亚洲第一中文字幕| 国产全黄a一级毛片| 久久国产黑丝袜视频| 亚洲精品动漫在线观看| 精品成人一区二区| 日韩经典精品无码一区二区| 中文字幕欧美日韩| 国产精品一区在线麻豆|