999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于B/S架構的電子數據相似檢測審計方法研究

2017-04-05 14:06:57陳文佳
現代經濟信息 2017年3期

陳文佳

摘要:在一個或者多個被審計數據源中可能存在相似重復實體,這些相似重復實體可能隱藏著審計項目中需要查找的疑點,筆者采用了基于B/S架構的軟件開發方法分析并設計出相似檢測審計方法。本文中介紹了相似檢測方法的定義和工作原理,并應用了審計案例數據對該方法的實用性進行了檢驗。

關鍵詞:相似檢測;電子數據審計;案例應用

中圖分類號:TP31 文獻識別碼:A 文章編號:1001-828X(2017)003-0-02

在筆者研讀文獻和參與實踐的過程中發現,一種用于數據清理的相似檢測方法可以有效地適用于審計工作中。在一個或者多個被審計數據源中可能存在相似重復實體,這些相似重復實體可能隱藏著審計項目中需要查找的疑點。

一、相似檢測方法的定義

審計數據中也常常出現冗余或有意重復的部分,通過應用相似檢測方法,一方面可以提高電子審計數據的質量,另一方面審計人員在分析相似重復記錄時也可能挖掘出新的審計線索。相似重復記錄的產生通常發生在數據取得和傳遞過程中,審計人員需要結合審計數據本身的作用、來源等分析相似重復記錄產生的情況是否可以合理解釋,以及相似重復記錄產生后是否會引起重大的后果。

二、相似檢測方法的工作原理

(一)相似檢測的參數設置

兩條記錄是否相似,常常是通過其具有代表性的屬性值判斷。因此計算相似度之前,首先需要選定判斷相似的屬性字段并分配字段權重。現實生活中,每個實體都有著多個屬性,判斷相似時,需要綜合各個屬性的相似情況。另外,每個屬性的重要性也是有差別的,因此,對每一個屬性需要設置權重來反映其在判定相似度的重要程度,權重的分配一般需要基于人員對數據屬性的理解和需求來自主地確定。

(二)記錄相似度的算法和度量

1.字符型字段的相似度計算方法

對于字符型字段,其匹配算法采用編輯距離算法,這種算法是計算一個字符串通過插入、替換、刪除字符等編輯方式轉換成另一個字符串所需要的最少的編輯次數,根據計算出的編輯距離,需要對應地給出一個介于0和1之間的小數表示其相似的程度(完全不同時為0,完全相同時為1),這個數值的確定方法可以根據操作人員的需要自行設定,漢字表述為主的數據通常適用這個算法。

2.數值型字段的相似度計算方法

對于數值型字段,可以通過計算數字間的相對差異取得其相似度:

其中a與b為數值型字段。值得注意的是,通常情況下S(a,b)的取值范圍為[0,1],而當兩個數值符號不同時,會導致S(a,b)≤0,在該情況下,相似度取值為0。

3.布爾型字段的相似度計算方法

對于布爾型字段,如果相同,則相似度為1,如果不同,則相似度為0。

計算完每個字段對應的相似度后,結合參數設置時確定的字段權重,計算出兩條記錄的整體相似度,這個相似度的值應當也介于0和1之間,數值越大代表其為相似記錄的可能性也越大。

三、電子數據相似檢測審計的應用

在多個被審計數據源中可能含有相似的內容,這些相似內容在某些情況下也許會成為審計問題的突破口。下文將以某審計案例數據為例介紹本系統的應用。

為了審計某省應取消的行政審批事項是否及時取消,審計人員搜集了國務院取消行政審批事項的發文,并讓省法制辦公室提供該省行政審批事項的清單。審計人員的審計方法是將國務院發文中每項取消的事項帶入該省行政審批事項清單中查找是否存在應取消的審批事項,隨時將可疑的審批事項記錄下來。然而,2013年以來,國務院通過取消和下放行政審批事項共618項,進行完所有的查找至少需要一個小時。

如果使用本系統的相似檢測審計方法,只需要簡單的幾步操作,具體如下:

1.將待對比的兩個文件轉換為數據庫文件的格式。具體操作過程為:打開Access并新建“空白桌面數據庫”,選擇從外部獲取數據,在對應類型下選擇數據文件導入即可。本案例中的文檔應當是國務院取消行政審批事項的發文和該省行政審批事項的清單。

2.在網頁界面中,選擇進行匹配的數據庫文件,將數據庫文件上傳到系統指定的目錄下,并界面中顯示出兩個文件中的內容,同時,左側的“表一字段”和“表二字段”下方的下拉菜單直接獲取表頭的字段名。

3.根據審計的需要,首先選擇需要進行相似檢測的字段,并根據字段的數據類型選擇相應的相似檢測算法,再設置每對字段在此次匹配中的權重,接著設置“字段間閾值”和“記錄閾值”,用于判斷字段相似度和記錄相似度是否滿足審計人員認定的相似程度。本案例中,兩張表的對應字段為:表一的“項目名稱”與表二的“權力名稱”相對應,表一的“審批部門”和表二的“行使主體”相對應。其中,“權力名稱”的相似比“部門”的相似更重要,所以暫且設置“權力名稱”的權重為0.7,“權力名稱”的權重為0.3,假設將字段閾值控制在0.3,記錄閾值為0.4,執行命令后獲得了兩組記錄(詳細內容見圖1),這兩組數據可以作為審計線索進行下一步審計工作。

四、結語

上述案例中,使用本系統的相似檢測審計方法得到的結果與審計人員得到的結果是一致的,因此,使用相似檢測審計系統能夠更加便于審計人員發現更多的審計線索,提高審計工作的效率和效果。

參考文獻:

[1]陳偉.大數據環境下基于模糊匹配的審計方法[J].中國注冊會計師,2016(11):84-88+3.

[2]殷秀葉.大數據環境下的相似重復記錄檢測方法[J].武漢工程大學學報,2014(09):66-69.

基金項目:本文系2016年南京審計大學研究生科研創新計劃項目(項目編號:MZ2016001)的研究成果之一。

主站蜘蛛池模板: 欧美亚洲激情| 亚洲日本中文字幕天堂网| 伊人成人在线| 国产麻豆福利av在线播放| 亚洲国产成人久久精品软件| 久久精品日日躁夜夜躁欧美| 免费在线国产一区二区三区精品| 青青草原国产免费av观看| 国产乱人激情H在线观看| a国产精品| 99精品视频播放| 亚洲九九视频| 欧美性精品不卡在线观看| 好吊妞欧美视频免费| 久久96热在精品国产高清| 欧美日本在线一区二区三区| 亚洲欧美不卡视频| 亚洲Av综合日韩精品久久久| 亚洲国模精品一区| 中国一级特黄视频| 亚洲另类第一页| 亚洲成人动漫在线观看 | 一区二区三区精品视频在线观看| 91成人试看福利体验区| 久久精品国产在热久久2019| 日本精品视频一区二区| 亚洲无码视频一区二区三区| 国产偷国产偷在线高清| 91精品啪在线观看国产91九色| 亚洲久悠悠色悠在线播放| a毛片基地免费大全| 亚洲系列无码专区偷窥无码| 成人毛片免费观看| 久草视频精品| 亚洲一区波多野结衣二区三区| 午夜视频在线观看免费网站| 久久激情影院| 亚洲国产成人久久77| 亚洲日本中文字幕天堂网| 久久视精品| 玖玖精品视频在线观看| 免费午夜无码18禁无码影院| 欧美日韩激情在线| 成人亚洲天堂| 亚洲αv毛片| 国产香蕉在线视频| 91啪在线| 全午夜免费一级毛片| 98精品全国免费观看视频| 99福利视频导航| 亚洲最大看欧美片网站地址| 人妻无码一区二区视频| 亚洲成年人网| 免费在线a视频| 国产毛片高清一级国语| 亚洲国产系列| 国产日韩欧美在线播放| 毛片免费观看视频| 成年A级毛片| 日韩精品成人网页视频在线| 久久精品这里只有国产中文精品| 国产伦精品一区二区三区视频优播| 在线观看国产小视频| 这里只有精品在线播放| 伊人久久婷婷五月综合97色| 久久a级片| 日韩精品无码免费专网站| 欧美综合中文字幕久久| 粗大猛烈进出高潮视频无码| 久久精品午夜视频| 色成人亚洲| 男人天堂亚洲天堂| 国产区91| 久久精品国产免费观看频道| 黄色网在线| 久久国产亚洲欧美日韩精品| 国产精品hd在线播放| 成人免费视频一区二区三区| 久久亚洲国产视频| 国产成人高清精品免费软件| 久久久噜噜噜| Jizz国产色系免费|