999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于大數據背景下的社會審計探索

2018-09-10 03:48:21曾堯
企業科技與發展 2018年7期
關鍵詞:大數據

曾堯

【摘 要】目前,我國審計領域的大數據技術和方法僅停留在理論上的呼吁與倡導層面,社會審計亟待運用科學的大數據分析方法創新現有審計分析思維,以適應海量數據的持續增長。文章應用最流行的大數據分析語言和成熟的統計分析、數據挖掘算法,為審計業務部門提供探索性的數據分析思路,為審計數據分析的拓展做出貢獻。

【關鍵詞】統計模型;大數據;數據可視化

【中圖分類號】F239 【文獻標識碼】A 【文章編號】1674-0688(2018)07-0033-03

1 目的和意義

伴隨國家審計大數據的逐漸形成,傳統審計的思維方式和數據分析方法成為現出效率低、范圍窄的弊端,探索大數據環境下的審計方法已是當務之急。隨著云計算、移動互聯網等新技術的不斷推廣,全球社會經濟發展迎來了新機遇和新挑戰,大數據時代的來臨,不僅是體量的擴充,更是數據思維的轉變,面對因數據思維轉變所帶來的分析模式及分析要求的變化,審計人員需應時而變以適應大數據導致的新變革。

2 使用的軟件及研究方法介紹

本文主要使用R語言處理數據。一方面,由于被審計單位多樣,數據標準不一,所以審計人員必須做大量的數據處理和清洗工作(統稱審計預處理),而R語言對數據處理的強大性能可以滿足多樣的審計預處理需求。此外,審計預處理往往需要多個步驟,審計人員在數據庫中保存為中間表的傳統做法對大數據表進行操作時,不僅占用存儲空間,效率也較低,而R語言可以通過多種形式靈活保存中間結果,十分快捷、方便。另一方面,R語言具備強大的數據可視化功能,被公認為行業中的佼佼者,可以滿足一般圖形展示要求。對于高級數據圖形展示,會用到gplot2數據包,其理念是將繪圖與數據分離,以圖層作圖的理念,并把常見的統計變換融入繪圖中,可以創建優雅、信息豐富、定制化的圖形。

3 樣本的選擇實證分析

3.1 對A市高速公路數據的描述

通過對A市高速現場的各個路口采樣,我們對A市高速公路的各個收費站出現的問題數進行分類與匯總,首先繪制箱線圖(如圖1所示),直觀明了地表明在某一方面表現極其異常的收費站名稱。其次可以將各收費站按照其所屬中心進行匯總,繪制星圖,不僅可以觀察與比較各個所屬中心的表現情況,還可以直觀地看到各個所屬中心在不同問題方面的表現情況。此外,對于不同貨車車型在不同時間段內的超限比率進行分析時,我們也可以使用箱線圖(如圖2所示)。

由圖1可知,該收費站在入口大客車出口變小客車問題上極為異常,需要重點檢查與加強管理。由圖2的雷達圖我們可以直觀地了解到所屬中心為1號、4號、10號、18號、19號、22號、24號、28號、30號、40號、50號的問題很少,而26號問題最多,具體又可以表現為入口貨車出口變客車、車型貨車變客車及車型大客車變小客車問題較為嚴重,23號所屬中心只是入口貨車出口變客車問題嚴重。

對24個行車時段進行了聚合,按照1~6、7~12、13~18、19~24時段分為深夜、上午、下午和晚上4個分類變量。由此對某月份所有超載記錄的貨車進行了箱線圖繪畫(如圖3所示),并在途中顯示了各個分類下的均值點,可以看到貨車15號的超限比率最高,而所有車型都是在深夜超限率最高,這也對高速部門整治有了精確方向。

散點圖分析時,我們選取其中某個收費站某一天(2月27日)的數據,分車型畫出收費與里程關系的散點圖(如圖4所示),擬合曲線并將置信區間設置為90%,追蹤具體到車牌號的異常值的信息(如圖5所示)。

從圖4中可以看出1、2、3、4類車型擬合曲線最好,因其代表車型為客車,是按照里程數計費,所以很少存在偏差,而其他車型在擬合的曲線外仍存在較多離散的點,因其代表車型為貨車,收費標準不僅依據里程數,更受到載重量及是否超限的影響,而擬合曲線時僅考慮了里程數,所以擬合效果不是特別好,針對離散最為嚴重的紫色圓圈內的點追蹤車牌后可以得到圖5,不難看出車型全為大貨車,經查詢也發現其大都是超限所致,從而也印證了前面的說法。

3.2 對A市高速公路數據的實證分析

3.2.1 因子分析模型

應用因子分析模型,對314個收費站進行降維處理:將9個變量合并為2個復合因子,且重新命名為免費問題因子和收費問題因子。根據擬合的統計公式得到了在2個因子上的得分,畫出散點圖(如圖6所示),直觀地展示出314個收費站中特別異常的收費站。根據各個收費站的年通行次數即權重,原點的大小代表了收費站的年通行量大小;藍色深淺表示了各個收費站免費軍車通行次數的等級。免費軍車通行次數等級的劃分標準是選取了上下四分位數和中位數為劃分依據。X坐標軸代表了收費問題因子的得分大小,Y坐標軸表示了免費因子的得分。得到了問題比較多的9個收費站。收費站在坐標軸得分大于0表示該收費站的問題大于平均水平,小于0表示低于平均水平,可以看出年通行量較大的收費站收費問題更大。

3.2.2 Kmeans模型聚類分析

如今,信息技術飛速發展,大多數企業、機關、事業單位及其他組織的財務、業務信息早已實現了電算化,脫離了傳統的紙質記錄。在此背景下,審計工作也日益依賴計算機的協助。在計算機審計中,傳統的查找異常、發現審計線索的方法主要有排序、篩選、查找重號、查找斷號、分類、分層等。但在當下數據量越來越大、數據維度越來越復雜的情況下,許多異常數據混雜在海量的數據中,要用這些略顯原始的方法將它們一一找出來,多少顯得力不從心。因此,我們希望能夠通過將統計方法引入審計工作中,利用統計模型對數據有一個宏觀的把握,從而查出異常,進而發現審計線索。

我們取A市高速2017年某一個月的出口收費站流水數據,共2 000余萬條記錄進行試驗,考慮到計算機內存處理能力的限制,需要對這些數據進行壓縮。于是使用R語言取其中所有超限記錄,再選取出口站編號、最終車種、最終車型3個變量作為分類變量,對分得的每一類都計算其行駛里程、車貨總重、通行次數,得到壓縮后的數據記錄約4 000條,之后采用Kmeans聚類算法進行聚類,結果如圖7所示。

圖7中文字表示坐標軸含義,如第一行各圖的縱坐標和第一列各圖的橫坐標是“行駛里程”,以此規律可讀出其他各圖的橫、縱坐標含義。圖1中的圓點即壓縮后的數據點,它們的顏色表示它們在Kmeans聚類算法中被歸入的類別(見表1)。

3.2.3 面板模型分析

根據各收費站2017年的最終收費金額及總的通行次數先建立面板數據進行動態分析(如圖8所示)。

由圖8可知,各收費站最終收費金額一年中整體走勢較平穩,在2月份(春節期間)全部收費站收費金額均下降,縱向比較來說有幾個收費站的收費金額明顯高于其他收費站。這是由很多因素決定的,其中經濟因素是最不容忽視的,從中我們可以看出區域經濟發展的不均衡性及需要加強管理的地區。

下面我們將各收費站2017年1年間的最終收費金額對通行次數、車貨總重、行駛里程等變量進行了建模分析。

最終收費金額=X1×通行次數;R方=39.43%。

最終收費金額=X2×車貨總重;R方=69.57%。

最終收費金額=X2×行駛里程;R方=61.95%。

說明通行次數每增加1次,各收費站收費平均增加X1元。其中,通行次數的變化可以解釋最終收費金額變化的39.43%;車貨總重的變化可以解釋最終收費金額變化的69.57%;行駛里程的變化可以解釋最終收費金額變化的61.59%;說明收費站的最終收費金額與車貨總重關系最密切。

4 結論與啟發

大數據時代的審計方法應該結合我國社會審計的信息化條件,一方面將傳統成熟的數據分析方法繼續融入審計實踐中,形成面向數字化平臺的海量數據分析機制,另一方面結合科學的統計數據分析方法與工具特征研究如何將這些技術應用到審計創新,為將來社會審計使用這些技術提供前期積累和準備。通過實證分析發現,年通行量較大的收費站收費問題更大,行駛里程、車貨總重、通行次數3個指標都顯著大于其他類別,應作為審計重點加以審查。通過面板分析發現,收費站的最終收費金額與車貨總重關系最密切。收費站流量預測是一個很值得分析的問題,統計學上所提到的很多模型都可以用來對其進行預測,我們嘗試過采用一些其他模型,時間問題還沒有形成系統的結果,沒有辦法呈現。后期若條件允許,在流量預測方向上還有很多可以深入分析拓展的內容。我們對高速數據的分析,目前僅限于微觀層面上,后期若結合宏觀數據分析一些收費站問題出現的原因,會是一個很好的思路。

參 考 文 獻

[1]邵松長.淺議大數據環境下企業內部審計工作的轉型提升[J].財會學習,2018(11):145,147.

[2]馬志娟,梁思源.大數據背景下政府環境責任審計監督全覆蓋的路徑研究[J].審計研究,2015(5):28-34.

[3]周霞,林津翹,華峰.大數據時代企業內部審計新常態研究[J].中國內部審計,2017(3):13-17.

[4]王茂森.大數據背景下政府審計工作的挑戰及解決策略研究[J].財會學習,2018(13):168.

[5]王昊,趙越,石楷文,等.審計方法于大數據時代的革新[J].市場周刊,2018(5):123-124.

[責任編輯:鄧進利]

猜你喜歡
大數據
基于在線教育的大數據研究
中國市場(2016年36期)2016-10-19 04:41:16
“互聯網+”農產品物流業的大數據策略研究
中國市場(2016年36期)2016-10-19 03:31:48
基于大數據的小微電商授信評估研究
中國市場(2016年35期)2016-10-19 01:30:59
大數據時代新聞的新變化探究
商(2016年27期)2016-10-17 06:26:00
淺談大數據在出版業的應用
今傳媒(2016年9期)2016-10-15 23:35:12
“互聯網+”對傳統圖書出版的影響和推動作用
今傳媒(2016年9期)2016-10-15 22:09:11
大數據環境下基于移動客戶端的傳統媒體轉型思路
新聞世界(2016年10期)2016-10-11 20:13:53
基于大數據背景下的智慧城市建設研究
科技視界(2016年20期)2016-09-29 10:53:22
數據+輿情:南方報業創新轉型提高服務能力的探索
中國記者(2016年6期)2016-08-26 12:36:20
主站蜘蛛池模板: 天堂成人在线视频| 97免费在线观看视频| 国产成人综合久久精品尤物| 伊人久久综在合线亚洲2019| 免费av一区二区三区在线| 欧美天堂久久| 亚欧成人无码AV在线播放| 一级毛片免费观看不卡视频| 亚洲精品无码日韩国产不卡| 91区国产福利在线观看午夜 | 无码精品国产VA在线观看DVD| 毛片视频网| 2021国产在线视频| 国产精品午夜电影| 国产欧美专区在线观看| 东京热高清无码精品| 国产人人干| 少妇高潮惨叫久久久久久| 午夜a视频| 亚洲色欲色欲www在线观看| 色哟哟色院91精品网站| 国产精品漂亮美女在线观看| 国产传媒一区二区三区四区五区| 91久久偷偷做嫩草影院| 国产极品嫩模在线观看91| 亚洲va视频| 粗大猛烈进出高潮视频无码| 亚洲va视频| 亚洲精品第一页不卡| 久久窝窝国产精品午夜看片| 国产精品丝袜视频| 高清码无在线看| 免费一级毛片| 国产中文在线亚洲精品官网| 国产天天色| 久久国产精品波多野结衣| 国产成人精品男人的天堂下载| 欧美成人免费一区在线播放| 呦女亚洲一区精品| 婷婷久久综合九色综合88| 欧美色综合网站| 91丨九色丨首页在线播放| 亚洲av无码牛牛影视在线二区| 国产精品人莉莉成在线播放| 一级毛片高清| 幺女国产一级毛片| 国产十八禁在线观看免费| 成人国产精品2021| 日韩毛片基地| 亚洲人成网站观看在线观看| 精品视频福利| 久久永久视频| 天天爽免费视频| 91精品在线视频观看| 国产女人18毛片水真多1| 国产福利一区在线| 91免费观看视频| 亚洲AV电影不卡在线观看| 成年人免费国产视频| 最新痴汉在线无码AV| 亚洲国产看片基地久久1024 | 色婷婷在线影院| 黄色网址免费在线| 色视频国产| 国内自拍久第一页| 72种姿势欧美久久久久大黄蕉| 在线不卡免费视频| 欧美色视频日本| 国产在线视频福利资源站| 国产精品99r8在线观看| 制服丝袜一区| 亚洲美女久久| 亚洲成人在线免费| 制服丝袜 91视频| 亚洲第一极品精品无码| 嫩草影院在线观看精品视频| 欧美丝袜高跟鞋一区二区| 国产成人夜色91| 99资源在线| 国产毛片基地| 日韩在线视频网| 精品一区国产精品|