999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

大數據時代基于DBSCAN聚類方法的審計抽樣

2016-09-23 06:22:13程平陳珊
中國注冊會計師 2016年4期
關鍵詞:關聯規則

程平 陳珊

大數據時代基于DBSCAN聚類方法的審計抽樣

程平陳珊

高度信息化的大數據時代,導致企業的生產經營產生大量、分散、復雜的會計數據,在審計全覆蓋無法實現的情況下,審計抽樣的質量至關重要。針對現有審計抽樣問題,本文提出了在已有的審計領域知識庫的基礎上,建立審計樣本與審計目標的關聯規則,并利用DBSCAN聚類算法對審計抽樣關聯規則進行聚類,接著對聚類結果進行新穎度評價,篩選出高價值聚類結果存入審計領域知識庫,實現審計領域知識的積累和再利用。最后,運用審計實例對實驗進行分析。

大數據審計抽樣聚類關聯規則

21世紀是一個高度信息化的大數據時代,信息經濟和知識經濟占據了主導地位。企業為了提高管理水平,信息化應用越來越深入已經成為企業管理與業務運行的神經系統。云會計(程平,2011)等AIS系統雖然能夠幫助企業獲取與其經營活動相關的各種結構化、半結構化和非機構化的數據,但是如此大規模、大數量、大范圍的數據信息,給大數據時代下的審計抽樣帶來了不小的挑戰。如何在此環境下實現審計目標、提高審計抽樣的質量本文就此展開探討。

一、大數據時代的審計抽樣

2015年,國務院印發《關于加強審計工作的意見》,第19條明確提出:探索在審計實踐中運用大數據技術的途徑,加大數據綜合利用力度,提高運用信息化技術查核問題、評價判斷、宏觀分析的能力。隨著大數據時代的來臨,許多被審計單位的數據越來越呈現出海量化的趨勢,不少單位已建立起TB甚至PB級的數據庫。云會計AIS軟件功能和規模的不斷壯大,以及基于云計算的軟件開發環境和大數據環境發生的深刻變化,使得企業的財務數據不僅數量愈加龐大,復雜程度也呈現前所未有的高度。其實,大數據審計的最終目標是實現數據全覆蓋,但是就目前的技術水平以及審計數據的復雜程度來看,短時間內難以實現。審計抽樣作為計算機審計的一個至關重要的模塊,在國內剛剛起步。

近幾年來,針對大數據時代的審計做了不少研究。秦榮生(2014)分析了大數據、云計算技術對審計的影響,并且針對相關問題給出了應用的建議。顧洪菲(2015)根據大數據的特點,從數據量、數據結構、數據處理方式三個方面分析大數據環境下進行審計數據分析所需的技術要求,從分析學和使用者的角度闡述了大數據環境下進行審計的數據分析方法和分析結果的顯示需求。陳新華(2010)對時間抽樣法這種非概率抽樣方法進行了介紹,具體分析了樣本選擇和樣本量兩個基本內容。王海霞(2014)分析了聚類技術及其對電子政務審計的意義,結合電子政務抽樣審計中對多維數據進行分層的需要,提出將基于主次屬性劃分的聚類方法用于分層算法之中,以適應多維數據分層抽樣的需要。

縱觀現有研究發現,面對當今企業面臨的數量龐大、種類繁多的數據,要通過審計抽樣方法實現審計目標,最優的方案莫過于利用數據挖掘技術。基于概率和數理統計理論的審計抽樣在計算機軟件的輔助下,則可以在保證科學性的前提下,有效地提高審計效率并降低審計成本。然而,現有的研究雖然也有這方面的考量,卻忽視了領域知識和審計樣本與審計目標間的關聯規則對審計抽樣結果的影響。基于此,本文主要研究在獲取審計領域知識之后,針對審計目標對審計業務進行聚類、抽樣算法的研究,并帶入實際業務數據進行應用研究和檢驗其可行性。

二、基于DBSCAN聚類方法的審計抽樣方法

(一)基于聚類算法的審計抽樣流程

基于領域知識的審計樣本聚類過程是對挖掘出的審計樣本與審計目標間的關聯規則進行聚類分析,而后對聚類后的審計關聯規則進行審計抽樣并且利用審計結果進行新穎度分析篩選出審計規則中高價值、高可信的規則,其過程如圖1所示。

基于領域知識的審計樣本聚類過程,是在建立基于云會計AIS審計領域知識庫的基礎上,建立審計樣本與審計目標之間的關聯規則,并最終形成基于云會計AIS審計知識關聯規則庫。然后,采用基于密度的聚類算法DBSCAN對審計規則進行聚類。針對聚類之后的結果,又有如下兩個方面的處理:一是完成對聚類后的結果進行隨機抽樣,完成審計抽樣的流程;二是對聚類后的結果進行新穎度的評價,根據實際應用情況設計閾值選取有價值的規則存儲于審計領域知識庫中,用以引導下次的審計規則挖掘過程,這就使得新的審計規則能夠實現審計領域知識的積累和再利用。

(二)基于DBSCAN的審計關聯規則聚類算法

總體上,規則聚類對聚類算法并沒有特殊的要求。現有的大部分聚類算法,如K-means,BIRCH,CHAMELEON,OPTICS等算法均可實現規則的聚類。在傳統的聚類算法中,沒有一種聚類算法可以保證應用于各類樣本空間分析中并保證較好的性能,每一種算法都有自己的特點和應用范圍,只有根據具體實際應用去選擇合適的聚類算法。鑒于存在于網絡虛擬環境審計數據數量巨大、復雜,本文選擇基于密度的聚類算法DBSCAN(Density-Based Spatial Clustering of Applications with Noise)用于基于云會計AIS審計抽樣聚類。

DBSCAN算法由Ester等人最早提出。它是利用類的高密度連通性,快速發現任意形狀的簇。其基本思想是:對于簇中的每個數據點,在給定的半徑(用Eps表示)的鄰域(neighbor-hood)內包含的數據點數目必須不小于某一給定值(用minPts表示)。如圖2為基于DBSCAN聚類方法的關聯規則聚類過程圖。

基于DBSCAN聚類方法的審計關聯規則聚類過程是:首先輸入審計關聯規則庫,半徑e和閾值MinPts,檢查審計規則R是否為小于閾值MinPts的核心規則。如果審計規則R是核心規則,那么就開始創建初始的類S,S中包含審計規則R及其R直接密度可達的所有審計規則,也就是包含審計規則R及其e-領域內的所有審計規則。然后,判定該領域中的每一條審計規則是否為核心規則。如果都是核心規則,那么將其e-領域內尚未包含在類中的所有審計規則追加到S中,并繼續判定這些新加進到類S中的審計規則是否為核心規則。如果是核心規則,則繼續進行以上的追加過程,直到沒有新的審計規則可以追加到S中。

三、審計規則的積累與再利用

為了實現對每次審計抽樣過程中新挖掘的審計規則的積累與利用,需要對審計關聯規則進行新穎性的評價。

關聯規則的新穎性是針對與原有的知識而言,這些知識包括兩部分:一部分是以往得到的準確性很高的關聯規則,與這些知識相悖的關聯規則可能說明以下幾種情況:一是形成這條關聯規則的數據有問題,這條規則是錯誤的;二是這條規則是對原有規則的一個修正,可以與原有的知識結合形成一條具有更多約束的新的規則;三是否定了原有的規則,說明使原有知識成立的前提條件已經不存在了,以后的證據已不足以支持原有規則的成立,從而相悖的新發現的規則取代了它。也就是對這種發現的規則是不同的情況進行不同的處理。另一部分是與用戶的期望相悖,這樣有利于幫助用戶找到影響期望情況出現的因素,從而可以采取一定的措施阻止這些因素的出現。衡量主要是從形式上,即分別與關聯規則的前件和后件的相悖程度來衡量。可用與原有知識相悖的項數來衡量。

由此,新穎性程度分別表現在發現的規則與基礎知識庫(主要存放專家輸入的領域知識和用戶已知的一些規則)中的規則的各項差異程度上,分別表現在前件各項的差異和后件各項的差異上(分別從語言變量和同一語言變量的不同語言值的角度)。此外前件和后件也分別看待。

設審計知識庫里的審計規則組成的集合為R,審計知識庫中的規則集合為A。A中的審計規則個數為|A|,R中的審計規則數為|R|。

設Wi為R中的審計規則Ri與A的新穎度,W(i,j)是規則Ri與原始審計知識庫中的規則Aj之間的新穎度即差別程度。W(i,j)包含兩部分,前件的新穎度L(i,j)和后件的新穎度Z(i,j)。

1.計算L(i,j)

設原始審計知識庫中的審計規則Aj中所有前件的語言變量組成的集合為J。并且R中審計規則Rj的所有前件的所屬的語言變量組成的集合為I。

對I中的任一項Ik,記V(i,j)k為這一項與審計規則Rj的差異程度,則有

negk為I中的第k項的語言值與J中同一語言變量對應的語言值之間的差異程度。前面加1是為了避免當所有項都在J中出現并且對應語言均值相同時,會出現0的情況。

這樣前件的新穎度等于:

2.計算Z(i,j)

經過規則簡約后,原始審計知識庫中所有規則后件的項數均為1,同時通過數據挖掘算法得到的規則后件的項數也為1。所以新發現的審計規則Ri與審計知識庫中的任一條規則Aj在后件上只有下面兩種可能關系:

一是兩條規則的后件屬于同一個語言變量,這時首先計算兩者的語言值對應的矛盾度,則Z(i,j)=1+neg;加1的目的是為了避免當后件是同一個語言變量的相同語言值時出現0的現象。

二是兩條規則的后件不屬于同一個語言變量,這時令度量后件差異的數值記為2,即Z(i,j)=2。

3.計算W(i,j)

4.計算Wi

通過以上模型的篩選,衡量了新規則與審計領域知識庫中的規則的各項差異程度,根據實際應用情況設計閾值選取有價值的規則存儲于審計領域知識庫中,用以引導下次的審計規則挖掘過程,這就使得新的審計規則能夠實現審計領域知識的積累和再利用。

四、基于領域知識和聚類的審計抽樣實例分析與結果

下面選取某在美國上市生產太陽能多晶硅片為主營業務的集團企業合同審計項目為例。合同審計是指內部審計機構和人員對合同的簽訂、履行、變更、終止過程及合同管理進行獨立客觀的監督和評價活動。該集團企業的不同的部門、業務類型、合同金額和授權級別都是會影響該合同是否有效的重要因素,表1為截取的部分合同審批權限。

如表2所示,為通過本體論的方法獲取的初始審計領域規則知識庫,并結合該集團公司的合同審計制度建立的部分審計規則。其中,M代表金額,P代表管理職位,D代表部門,B代表業務類型,R代表風險程度,C代表控制點。在建立規則的基礎上,運用DBSCAN聚類的方法,對本審計規則庫進行聚類。但是值得注意的是,從表中可以看出,規則后件為No的審計規則,在實驗中應該不參加聚類,因為如果篩選出的審計樣本屬于此種規則,那么說明這項業務就有問題。在審計過程中,如果遇到有問題的樣本,必須全部抽取出來詳細清查,所以就不參與后面的聚類。這樣不僅提高了審計的質量,也可以減輕后期參與聚類的審計規則的數量。根據對規則的聚類,R3和 R16聚為一類C1,R4、R11和R15聚為一類C2,R9和R19聚為一類C3,R5和R18聚為一類C4。

針對本次合同審計的具體內容,通過決策樹4.5挖掘算法,得到了如表3所示的新審計規則。由于已對審計領域知識庫和新規則集分別聚類并對應,因而在計算新規則新穎性時不必將新規則與領域知識庫中的規則逐條比較。而只要比較同一類中的領域知識,對于成熟的大規模領域知識庫來說,聚類后的規則比較將大大提高算法效率。

表1 審批權限表

表2 初始審計領域知識

如表4所示為新審計關聯規則的新穎度評價,每一大類中的新規則都計算出了規則新穎度,而如何確定選取規則新穎度的閾值則需要依據實際情況而定。在本例中,可以看出新穎度小于0.5的規則與原審計領域知識重復性較大或者說是原審計領域知識的子集,應當予以刪除,而將剩余的有價值規則按大類存入領域知識庫中。

表3 新審計關聯規則集

表4 新審計關聯規則新穎度

本例中,在利用本體論建立企業的原始審計領域知識庫的基礎上,通過DBSCAN聚類的方法,將原始審計領域知識規則分為C1、C2、C3、C4這4類。接著,利用決策樹4.5挖掘算法,針對當前審計要求,挖掘出了新的審計規則,并依照原始的分類進行聚類。在得到以上聚類之后,對屬于本項規則的合同項進行隨機抽樣,完成審計抽樣的流程。同時,對新挖掘出的審計規則進行新穎度的評價,將新穎度高的審計規則存入到審計領域知識庫。

通過本次實例可以看出,基于領域知識和聚類的審計抽樣對大數據時代下基于云會計的審計業務意義重大。通過計算機軟件的輔助, 基于領域知識和聚類的審計抽樣可以在保證科學性的前提下,不僅可以有效地提高審計質量與審計效率,同時還可以降低審計成本。

五、結語

本文在獲得審計領域知識的基礎上,建立審計樣本與審計目標之間的關聯規則,并形成審計知識關聯規則庫。然后,采用DBSCAN聚類的方法,對審計關聯規則庫進行聚類,在利用挖掘算法挖掘針對本次審計項目的新審計規則,對比原始審計知識庫,篩選出新穎度較高的儲存于審計知識庫,以便以后審計項目的實施再利用。最后,以某在美國上市的生產太陽能多晶硅片企業的合同審計項目為例,驗證了大數據時代基于領域知識和聚類的云會計AIS審計抽樣的有效性。

作者單位:重慶理工大學

主要參考文獻

1.程平,何雪峰.“云會計” 在中小企業會計信息化中的應用.重慶理工大學學報(社會科學版).2011(1)

2.秦榮生.大數據、云計算技術對審計的影響研究.審計研究.2015(06)

3.顧菲洪.大數據環境下審計數據分析技術方法初探.中國管理信息化.2015(03)

4.陳新華,胡桂華.一種非概率審計抽樣方法:時間抽樣法.財會月刊.2010(7)

5.王海霞,多維數據聚類技術在電子政務審計分層抽樣中的應用研究.商業會計.2014(01)

6.夏鋒,基于聚類方法的審計分層抽樣算法研究.計算機應用與軟件.2008(01)

國家自然科學基金青年項目(批準號:71201179);教育部人文社會科學基金青年項目(批準號:12YJC630025);重慶市教委科學技術研究項目資助(批準號:KJ1400905);重慶理工大學財會研究與開發中心科研創新重大項目(批準號:14ARC101);重慶理工大學研究生創新基金項目(批準號:YCX2015105)

猜你喜歡
關聯規則
撐竿跳規則的制定
不懼于新,不困于形——一道函數“關聯”題的剖析與拓展
“苦”的關聯
當代陜西(2021年17期)2021-11-06 03:21:36
數獨的規則和演變
“一帶一路”遞進,關聯民生更緊
當代陜西(2019年15期)2019-09-02 01:52:00
規則的正確打開方式
幸福(2018年33期)2018-12-05 05:22:42
奇趣搭配
讓規則不規則
Coco薇(2017年11期)2018-01-03 20:59:57
智趣
讀者(2017年5期)2017-02-15 18:04:18
TPP反腐敗規則對我國的啟示
主站蜘蛛池模板: 国产成人AV综合久久| 亚洲国产精品不卡在线| 色综合中文字幕| 日韩国产一区二区三区无码| 国产麻豆福利av在线播放| 97在线碰| 成人一区在线| 91精品国产一区| 免费三A级毛片视频| 97国产精品视频自在拍| 青青热久麻豆精品视频在线观看| 国产黄在线免费观看| 中文字幕日韩欧美| 国产一二视频| 欧美中文字幕第一页线路一| 久久精品无码一区二区日韩免费| 亚洲综合精品第一页| 国产一在线| 亚洲国产精品久久久久秋霞影院| 99在线观看免费视频| 波多野结衣视频一区二区| 亚洲日韩欧美在线观看| 日本手机在线视频| 98超碰在线观看| 国产成人精品高清不卡在线| 国产视频你懂得| 亚洲最猛黑人xxxx黑人猛交| 午夜激情婷婷| AV在线天堂进入| 亚洲黄网视频| 国产丰满大乳无码免费播放| 国产精女同一区二区三区久| 国产va在线观看| 日韩 欧美 小说 综合网 另类| 青青草欧美| 丁香五月激情图片| 好紧好深好大乳无码中文字幕| 亚洲色图在线观看| 国产精品hd在线播放| 91蝌蚪视频在线观看| 日韩高清成人| 国产成人资源| 在线播放国产99re| 99久久精品国产自免费| 日本欧美精品| 国产主播喷水| 免费看美女自慰的网站| 国产精品亚洲天堂| 亚洲成人一区二区| 在线看片中文字幕| 国产丝袜无码一区二区视频| 国产激爽大片高清在线观看| 欧美日本在线一区二区三区| 夜夜拍夜夜爽| 在线播放真实国产乱子伦| 久久99蜜桃精品久久久久小说| 国产精品区视频中文字幕| 看av免费毛片手机播放| 国产成人综合亚洲欧美在| 亚洲无码久久久久| 国产性生交xxxxx免费| 久久a级片| 丁香六月综合网| 成人看片欧美一区二区| 亚洲AⅤ综合在线欧美一区| 久久国产香蕉| 亚洲欧洲日产国产无码AV| 欧类av怡春院| 国产一区二区在线视频观看| 欧美国产中文| 欧美亚洲一区二区三区导航| 国国产a国产片免费麻豆| 精品人妻无码中字系列| 欧美午夜在线观看| 亚洲成人一区在线| 狼友视频一区二区三区| 国模粉嫩小泬视频在线观看| 亚洲黄色激情网站| AV无码无在线观看免费| 97青草最新免费精品视频| 久热re国产手机在线观看| 毛片网站在线播放|