999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

網(wǎng)絡(luò)爬蟲技術(shù)在大數(shù)據(jù)審計(jì)中的應(yīng)用

2019-05-31 01:43:59張露
合作經(jīng)濟(jì)與科技 2019年7期
關(guān)鍵詞:數(shù)據(jù)采集

張露

[提要] 在大數(shù)據(jù)審計(jì)面臨著諸多機(jī)遇和挑戰(zhàn)的大背景下,有效清晰的數(shù)據(jù)在審計(jì)過(guò)程中發(fā)揮著重大作用,本文分析不同的審計(jì)數(shù)據(jù)的特點(diǎn)以及采集審計(jì)數(shù)據(jù)的方法。在傳統(tǒng)數(shù)據(jù)采集方法基礎(chǔ)上研究如何基于Python利用網(wǎng)絡(luò)爬蟲采集審計(jì)數(shù)據(jù),以為大數(shù)據(jù)審計(jì)技術(shù)的發(fā)展提供支持。

關(guān)鍵詞:網(wǎng)絡(luò)爬蟲;數(shù)據(jù)采集;審計(jì)分析;Python

本文為2017年安徽財(cái)貿(mào)職業(yè)學(xué)院“內(nèi)涵提升全員行動(dòng)計(jì)劃”科學(xué)研究項(xiàng)目(人文社科):“大數(shù)據(jù)在審計(jì)分析程序中的運(yùn)用研究”(項(xiàng)目編號(hào):2017nhrwc15)

中圖分類號(hào):F239 文獻(xiàn)標(biāo)識(shí)碼:A

收錄日期:2019年1月18日

一、引言

無(wú)論是國(guó)家審計(jì)還是民間審計(jì),在當(dāng)今社會(huì)經(jīng)濟(jì)發(fā)展過(guò)程中都起到了十分重要的作用,為經(jīng)濟(jì)發(fā)展“保駕護(hù)航”。大數(shù)據(jù)目前也是各國(guó)研究的重點(diǎn)和熱點(diǎn),并將大數(shù)據(jù)的研究和應(yīng)用上升到了戰(zhàn)略層次。美國(guó)注冊(cè)會(huì)計(jì)師協(xié)會(huì)(AICPA)在2014年就對(duì)大數(shù)據(jù)可能對(duì)審計(jì)產(chǎn)生的影響進(jìn)行了分析。在全球信息化的大背景下,如何利用大數(shù)據(jù)降低審計(jì)風(fēng)險(xiǎn),提高審計(jì)效率仍然是一個(gè)非常重要的命題。2015年中共中央辦公廳、國(guó)務(wù)院辦公廳《關(guān)于完善審計(jì)制度若干重大問(wèn)題的框架意見(jiàn)》及配套文件中明確提出“構(gòu)建大數(shù)據(jù)審計(jì)工作模式,構(gòu)建國(guó)家審計(jì)數(shù)據(jù)系統(tǒng)和數(shù)字化審計(jì)平臺(tái),探索建立審計(jì)實(shí)時(shí)監(jiān)督系統(tǒng),實(shí)施聯(lián)網(wǎng)審計(jì)”。劉國(guó)城、王會(huì)金(2017)將大數(shù)據(jù)審計(jì)平臺(tái)分拆為采集、預(yù)處理、分析和可視化四個(gè)子平臺(tái),基于方法支撐、過(guò)程建模和運(yùn)行機(jī)理等方面對(duì)各個(gè)子平臺(tái)作以專項(xiàng)研究,旨在為大數(shù)據(jù)審計(jì)實(shí)踐提供建設(shè)性思路。秦榮生(2014)指出大數(shù)據(jù)、云計(jì)算技術(shù)的產(chǎn)生和發(fā)展,正在逐漸影響審計(jì)技術(shù)和方法的發(fā)展。

大數(shù)據(jù)具有數(shù)據(jù)體量巨大、處理速度快、數(shù)量種類多和商業(yè)價(jià)值高的特點(diǎn)。被審計(jì)對(duì)象的信息化促使審計(jì)人員在審計(jì)方法上更加的信息化,如果將這些大量的、散落的、無(wú)序的數(shù)據(jù)進(jìn)行集中化、結(jié)構(gòu)化,將其變成能夠方便獲得可讀取的審計(jì)數(shù)據(jù),并通過(guò)審計(jì)分析程序發(fā)現(xiàn)更加有效和清晰的審計(jì)線索,那么大數(shù)據(jù)將會(huì)發(fā)揮重大的商業(yè)價(jià)值。由此可見(jiàn),數(shù)據(jù)是審計(jì)分析的重要前提,獲取高質(zhì)量數(shù)據(jù)往往能夠幫助審計(jì)人員快速發(fā)現(xiàn)風(fēng)險(xiǎn)點(diǎn)進(jìn)行應(yīng)對(duì),大大提高審計(jì)的效率和效果。目前,尚未有成熟的審計(jì)大數(shù)據(jù)收集與整理技術(shù),這影響了大數(shù)據(jù)在審計(jì)中使用的效率。本文將基于目前大數(shù)據(jù)的研究現(xiàn)狀,主要探討審計(jì)人員應(yīng)當(dāng)如何利用網(wǎng)絡(luò)爬蟲技術(shù)從網(wǎng)絡(luò)渠道獲取所需審計(jì)數(shù)據(jù),從而擴(kuò)充審計(jì)數(shù)據(jù)的范圍,獲得更多的審計(jì)線索,提高審計(jì)分析效果。

二、審計(jì)大數(shù)據(jù)采集分析

(一)審計(jì)大數(shù)據(jù)類型。大數(shù)據(jù)審計(jì)區(qū)別于傳統(tǒng)的審計(jì)模式,傳統(tǒng)審計(jì)模式傾向于依據(jù)被審計(jì)單位提供的相關(guān)資料去鑒證其是否真實(shí)可靠。而大數(shù)據(jù)審計(jì)是一種實(shí)時(shí)審計(jì),強(qiáng)調(diào)審計(jì)人員應(yīng)當(dāng)主動(dòng)地去獲取企業(yè)內(nèi)部和企業(yè)外部的數(shù)據(jù),企業(yè)內(nèi)部的業(yè)務(wù)數(shù)據(jù)主要依靠被審計(jì)單位提供,而外部數(shù)據(jù),比如法律、銀行、稅務(wù)、供應(yīng)商、客戶、物流等其他數(shù)據(jù)需要審計(jì)人員去挖掘和分析。從目前來(lái)看,審計(jì)大數(shù)據(jù)可以分為兩類:一類是結(jié)構(gòu)化數(shù)據(jù),它由明確定義的數(shù)據(jù)類型組成,比如數(shù)字、貨幣、日期等,其模式可以使其易于搜索。這種數(shù)據(jù)一般儲(chǔ)存在數(shù)據(jù)庫(kù)里,比如企業(yè)ERP系統(tǒng)中的銷售數(shù)據(jù)、生產(chǎn)數(shù)據(jù)、財(cái)務(wù)數(shù)據(jù)等;另一類是非結(jié)構(gòu)化數(shù)據(jù),是指那些不方便用數(shù)據(jù)庫(kù)二維邏輯來(lái)表現(xiàn)的數(shù)據(jù),如辦公文檔、文本、圖片、HTML圖像等,審計(jì)人員需要的外部數(shù)據(jù)以非結(jié)構(gòu)化數(shù)據(jù)類型居多。

圖1 基于Python 的網(wǎng)絡(luò)爬蟲代碼示例

(二)審計(jì)大數(shù)據(jù)采集方法

1、直接拷貝讀取。審計(jì)人員首先判斷出自己需要的審計(jì)數(shù)據(jù),然后根據(jù)被審計(jì)單位使用的財(cái)務(wù)軟件(如金蝶、用友)的使用特點(diǎn),利用軟件數(shù)據(jù)庫(kù)已經(jīng)預(yù)設(shè)好的指令去提取轉(zhuǎn)換審計(jì)人員所需要的數(shù)據(jù),并將其保存為Excel等格式。

2、開放數(shù)據(jù)互聯(lián)(ODBC)。如果被審計(jì)單位與審計(jì)人員使用的是可以對(duì)接的數(shù)據(jù)庫(kù),可以通過(guò)相關(guān)的數(shù)據(jù)訪問(wèn)接口訪問(wèn)被審計(jì)單位所使用的業(yè)務(wù)系統(tǒng)數(shù)據(jù)庫(kù),并將數(shù)據(jù)進(jìn)行還原后轉(zhuǎn)出,成為審計(jì)人員可以直接利用的數(shù)據(jù)。

3、中間文件采集。指審計(jì)人員與被審計(jì)單位約定好數(shù)據(jù)的格式,被審計(jì)單位按照要求將自己的相關(guān)數(shù)據(jù)轉(zhuǎn)換成約定的格式,比如說(shuō)文本文件格式,這種大部分?jǐn)?shù)據(jù)庫(kù)都能夠直接讀取的格式,從而省去了兩種不同數(shù)據(jù)庫(kù)對(duì)接的問(wèn)題。

4、網(wǎng)上采集。除了被審計(jì)單位或者上級(jí)審計(jì)機(jī)關(guān)提供的相關(guān)數(shù)據(jù)以外,審計(jì)人員仍然需要從被審計(jì)單位外部獲得相關(guān)的工商、稅務(wù)、行業(yè)、媒體等公開數(shù)據(jù)以進(jìn)行多方面的審計(jì)分析,這些數(shù)據(jù)并不是被直接提供的結(jié)構(gòu)化數(shù)據(jù),需要審計(jì)人員采用一定的方法從網(wǎng)上進(jìn)行采集。

目前,審計(jì)數(shù)據(jù)采集大部分采用的是上述的前三種方法,往往依托一定的數(shù)據(jù)庫(kù)基礎(chǔ),能夠獲得的信息大多基于被審計(jì)單位,最后一種網(wǎng)上采集數(shù)據(jù)的方法由于沒(méi)有統(tǒng)一的方法和技術(shù),耗費(fèi)大量時(shí)間和經(jīng)歷,往往難以實(shí)現(xiàn),這大大限制了審計(jì)人員進(jìn)行審計(jì)分析的范圍,同時(shí)也使審計(jì)的取證率難以達(dá)到預(yù)期,從某種程度上提高了審計(jì)風(fēng)險(xiǎn)。在大數(shù)據(jù)審計(jì)背景下,審計(jì)人員執(zhí)行分析程序不能僅僅將眼光局限于內(nèi)部數(shù)據(jù),更應(yīng)當(dāng)從網(wǎng)絡(luò)公開數(shù)據(jù)中獲取更加全面的信息,但是這些信息大多以網(wǎng)頁(yè)等格式存在,難以被審計(jì)人員直接用于分析,所以本文提出可以利用網(wǎng)絡(luò)爬蟲技術(shù)抓取網(wǎng)頁(yè)上的信息,并整理成一定的格式,方便審計(jì)人員從海量數(shù)據(jù)中發(fā)現(xiàn)審計(jì)線索,使審計(jì)分析程序發(fā)揮更大的效用。

表1 基于Python 的網(wǎng)絡(luò)爬蟲結(jié)果示例

猜你喜歡
數(shù)據(jù)采集
CS5463在植栽用電子鎮(zhèn)流器老化監(jiān)控系統(tǒng)中的應(yīng)用
大數(shù)據(jù)時(shí)代高校數(shù)據(jù)管理的思考
科技視界(2016年18期)2016-11-03 22:51:40
鐵路客流時(shí)空分布研究綜述
基于廣播模式的數(shù)據(jù)實(shí)時(shí)采集與處理系統(tǒng)
軟件工程(2016年8期)2016-10-25 15:54:18
通用Web表單數(shù)據(jù)采集系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)
軟件工程(2016年8期)2016-10-25 15:52:53
基于開源系統(tǒng)的綜合業(yè)務(wù)數(shù)據(jù)采集系統(tǒng)的開發(fā)研究
主站蜘蛛池模板: 亚洲天堂日韩在线| 久久久久亚洲精品成人网| 日韩黄色大片免费看| 欧美曰批视频免费播放免费| 日韩无码精品人妻| 亚洲香蕉在线| 成人va亚洲va欧美天堂| 日韩精品无码免费一区二区三区 | 欧美成人一级| 国产精品熟女亚洲AV麻豆| 一本综合久久| 欧美亚洲一二三区| 亚洲国产欧美自拍| 婷婷午夜影院| 在线亚洲精品福利网址导航| 另类专区亚洲| 久久综合亚洲鲁鲁九月天| 亚洲欧美极品| 无码人中文字幕| 永久免费精品视频| 国产在线一区二区视频| 亚洲人在线| 一本久道久久综合多人| 国产人前露出系列视频| 5555国产在线观看| 欧美伊人色综合久久天天| 中国国产A一级毛片| 1769国产精品视频免费观看| 欧洲亚洲一区| 中文字幕 欧美日韩| 特级精品毛片免费观看| 色135综合网| 国产欧美自拍视频| 日韩高清一区 | 国产青青操| 香蕉蕉亚亚洲aav综合| 国产视频 第一页| 国产精品13页| 久99久热只有精品国产15| 国产精品吹潮在线观看中文| 精品欧美视频| 久久久精品国产SM调教网站| 美女视频黄频a免费高清不卡| 91精品专区| 成人无码一区二区三区视频在线观看| 婷婷中文在线| 欧美一级一级做性视频| 韩国v欧美v亚洲v日本v| 色综合狠狠操| 91在线国内在线播放老师| 婷婷99视频精品全部在线观看| 园内精品自拍视频在线播放| 蝴蝶伊人久久中文娱乐网| 国产精品视频白浆免费视频| 国产成人高精品免费视频| 毛片一级在线| 日韩精品无码免费专网站| 在线观看视频99| 亚洲中文字幕久久精品无码一区| 最新痴汉在线无码AV| 日韩无码真实干出血视频| 99成人在线观看| 亚洲一区二区日韩欧美gif| 91探花国产综合在线精品| 在线观看国产精美视频| 国产v精品成人免费视频71pao| 青青草原国产免费av观看| 欧美自慰一级看片免费| 女人毛片a级大学毛片免费| 中文字幕一区二区人妻电影| 久久性视频| 无码免费试看| 亚洲香蕉在线| 国产高清在线观看| 亚洲精品自在线拍| 日本欧美午夜| 国产乱人伦偷精品视频AAA| 青青草国产在线视频| 最新午夜男女福利片视频| 日本一区二区三区精品视频| 99在线视频免费观看| 亚洲国产在一区二区三区|