999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

大數據環境下審計取證定位及其方向選擇研究

2020-11-11 03:10:59李浩塵謝勁松
中國內部審計 2020年10期
關鍵詞:大數據研究

李浩塵 謝勁松

[摘要]本文通過開展大數據環境下審計取證定位及其方向選擇問題研究,旨在嘗試為人工智能審計軟件設計開發提供新思路,為審計證據定量研究提供新途徑,為快速準確獲取審計證據探索新方法。

[關鍵詞]大數據 ? ?審計取證 ? ?定位 ? ?研究

隨著計算機、物聯網等技術的應用與普及,網絡空間中人、機、物交互、融合產生和獲取的數據規模與速度極大提高,由此人類社會步入大數據時代。在這種情況下,如何在海量數據中挖掘到與被審計單位相關的各種有用信息,準確高效地獲取審計證據,是審計人員必須面對和思考的問題。由于研究范圍僅涉及證據收集切入點選擇等問題,因此,通過引入信息生成傳遞及決策樹模型,將重點放在對同一經濟活動信息集合中信息鏈環上的上/下位信息及其相互關聯等方面。

一、上/下位信息概念、成因及其表現形態

(一)從信息生成規律分析

審計中審計主體接觸到的各種信息,均屬于被審計單位相關經濟活動的自在信息、自有信息和記錄信息集合。其中,自在信息是經濟活動以信息方式向外部世界顯示的存在和特征,在轉化為人類大腦記憶或者機器智能、信息系統信息及通過一定載體記錄為文字、符號、電子數據等信息之前,人類意識不到它,更談不上認識它。這類信息遵循了物質世界物理學定律,在時空上位置指向唯一。如未經計量的用戶照明、動力等電能。這種隨時間變化處理的信息,是經濟活動信息集合中的底層信息(初始信息),是自有信息和記錄信息的唯一來源,是認識信息時空序列的客觀依據。在數字化時代,這些信息通過交互式應用系統(如Web系統、互聯計算機集群——云系統、電子商務系統等)、嵌入式應用系統(如移動電話中使用的軟件)、數據采集系統、批處理系統運行順序輸出生成記錄信息。如電網企業通過集中抄表終端(或公用變壓器采集終端)對低壓電力用戶電能數據和配電變壓器用電量及運行參數的實時采集的數據;通過單片機(主控MCU模塊,又稱中心單元)將實時采集數據經過處理、控制,輸出、上傳到采集終端器和主站數據庫等數據。這些數據保持了經濟活動發展蹤跡,體現了被審計事項的時序構成,組成了信息集合原子性(不可分割)、序列化鏈環。這種同一信息集合中含義相互關聯、相互承續,時空位置相鄰、生成順序鄰接的信息稱為鏈環信息。

當鏈環信息成為審計對象時,審計主體會根據審計假設或命題信息需要,將審計取證切入點或者審計觀察點前后相連的鏈環信息劃分為上位信息與下位信息。這種劃分是信息含義上的劃分,與信息載體獨立與否無關。其中,上位信息是下位信息的部分或全部來源,下位信息是上位信息含義的承續,是上位信息這個“因”或“前提”基礎上產生的“結果”。審計中,如果上位信息得到查實,那么與其相關聯的下位信息自然也就得到查實。反之,下位信息所蘊含的上位信息就不可能得到查實。查證屬實、符合經濟活動時空次序的上位信息屬于確定性信息,而確定性信息是形成審計證據的基礎;下位信息與當下審計命題或假設無關,是另一事項信息,相對于特定被審計事項而言,它屬于非相關信息,而非相關信息不能作為證據使用。如果下位信息可以證成上位信息,實質上就是錯誤預設了下位信息已經隱含了上位信息被證明的事實,用需要證明的事實去證明事實自身,其邏輯推理的結果必然是死循環,違背了邏輯規律。

為便于理解,舉例說明。如審計主體在審查某國有企業員工出差費用報銷的真實性時,記載這項經濟活動的記賬憑證以及相關的明細賬、總賬記錄等下位信息就不能作為證明員工出差的證據使用,作為證據使用的只能是員工出差申請單以及車船票、住宿費發票等上位信息。

從信息生成來源考察所獲得的上/下位信息,屬于實質性的上/下位信息,它是審計取證定位及方向選擇的客觀依據。

(二)從計算機軟硬件體系結構中數據流的規律分析

在現階段計算機的計算模型下,無論是傳統的控制流計算模型即計算機內的數據按指令循序操作模式,還是大數據處理平臺上以數據流為核心的數據流計算模型即新型數據驅動方式處理生成的數據,都是按上一個數據計算處理完成,將結果傳遞給下一個計算單元操作執行這一順序進行的。各種信息系統在需求描述、設計、開發以及運行中均遵循了經濟活動的規律,體現了實際業務流程,具有嚴密的邏輯性。編程語言也提供了相應的實現語句。例如,C++程序設計語言就提供了多種不同的控制流語句,其中順序執行的語句規定:第一條語句首先執行,然后是第二條語句,以此類推。現階段,被審計單位各種交互式應用系統、嵌入式控制系統、批處理系統、數據采集系統、集成式系統等,所采用的計算機語言和解決實際問題的算法,都是按經濟活動時序關系或程序設計語言事前確定的方向和有限規則操作步驟設計運行的,反映了被審計單位經濟活動數據處理的過程與流程,體現了經濟活動信息含義的遞歸關系,如貨幣資金=庫存現金+銀行存款+其他貨幣資金,總是從“庫存現金”到“銀行存款”和“其他貨幣資金”的值計算“貨幣資金”的值。

計算機軟硬件體系結構中數據流所形成的上/下位信息屬于形式上的上/下位信息,它是審計主體認識實質性上/下位信息的結構化、形式化載體。

(三)從智能化審計軟件推理過程分析

隨著人工智能(Artificial Intelligence,AI)技術的快速發展及其在金融、交通、商業、電信、電力等領域的廣泛應用,被審計單位生產經營活動過程中人、機、物交互、融合所產生的并在互聯網上獲得的數據也將越來越多。適應這些大容量、多類型、集中化存儲的海量數據的智能化審計軟件,也將得到快速開發與應用。智能審計軟件所采用的從初始事實(證據)出發,運用知識庫中特定領域的基本原理、常識或經驗知識,通過推理機逐步推出與審計命題或審計假設相關的審計結論的推理過程,系統性、結構化地體現了應用領域的規律和規則,反映了事實(前提)與結論、上位信息與下位信息的邏輯關系。如對某供電企業配網設備檢修工程設計變更(簽證)事項的真實性進行審計時,智能化審計軟件會依據知識庫中有關配網設備檢修工程以及設計變更(簽證)深/淺層知識,按以下步驟收集審查信息,固化相關證據:第一步,收集審查設計(簽證)工程名稱及變更卷冊號、圖號信息;第二步,收集審查設計(簽證)事項內容、相關施工措施、紀要或協議信息;第三步,收集審查變更圖紙、照片、示意圖信息;第四步,收集審查變更工程量信息;第五步收集審查變更費用計算書信息;第六步,收集審查設計變更工程安全質量稽查信息;第七步,收集審查設計變更工程監理、中間(隱蔽)工程驗收及工程竣工驗收等信息。至于該工程設計變更后續的結算(決算)、財務轉資等信息,由于屬于上述流程中的下位信息,因而不得作為證明本事項的證據使用。

這種基于實質和形式化上/下位信息,通過智能化審計軟件推理過程所確認的上/下位信息,屬于審計主體認識上的上/下位信息,是形成審計證據的基礎。

二、不同形態的上/下位信息及其含義遞歸關系分析

不同形態的上/下位信息之間既相互聯系又互相區別。實質性的上/下位信息真實地反映了被審計單位經濟活動實際,是審計證據取舍的依據;而形式上的上/下位信息則是審計主體實施審計搜索、識別的載體與對象;認識上的上/下位信息則是審計主體已經獲取到、最終能夠形成審計證據的相關信息,這類信息既可以證成審計事項,也可能因為與經濟活動不符,導致審計失敗。

信息的形成是從底層向高層聚合的,具有類似樹形的結構。從樹形結構底層的葉子節點所代表的信息源開始也就是信息生產者如文件或者傳感器采集設備生成的數據開始的上位信息,然后通過配準、匯集、關聯和計算等信息加工,將底層數據或信息融合成更加抽象的高層信息表示,逐次完成既定融合目標任務,直至根節點,形成某一經濟活動的信息集合,在融合的過程中形成自下而上的多叉樹形結構,如圖1所示。

多叉樹信息遞歸結構圖中,某一經濟活動信息集合組成的信息網中,任一獨立載體或載體中不同描述段所記載的記錄信息或自有信息可視為該信息網中的節點,節點之間的連接弧表示節點對節點的直接影響。葉節點與根節點之間的層次距離為節點深度。結構圖中含有的節點和弧越多,表明相應的經濟活動信息越復雜。結構圖中的信息節點主要由信息節點之間的上位/下位關系連接,這種關系體現了經濟活動各信息節點之間信息內容的承繼關系,表明信息是從上位節點逐層向下位節點加工融合傳遞的,上位信息是下位信息的具體呈現。同一事項的下位信息與所有的上位信息輸出點,構成下位信息因果網。而因果網具有上位/下位關系的兩個信息節點共享同一經濟活動部分信息,且下位信息繼承了同一經濟活動的全部或部分上位信息。葉節點與根節點之間的深度越大即與根節點的層次距離越遠,所蘊含的經濟活動信息就越具體且數量也越大,而越接近根節點信息量則越少。

在結構圖中,第四層9-18號葉節點(包括6號節點)均為上位節點信息又稱初始信息,這些信息均由其他系統(互聯網)提供或者本系統生成,在信息集合中最接近經濟活動真相,是經濟活動信息集合中信息量最大的節點。例如,通過傳感器從被審計單位經濟活動中采集并發送的各種實時數據;人們通過感覺器官感知后儲存、記憶的自有信息或自在信息發生時第一時間轉換為錄音、錄像、文字、數據等的記錄信息。第二層、第三層中2、3、4、5、7、8號非葉節點為中間層次節點,相對于1號根節點,他們為上位節點,而與第四層9-18號葉節點相比較又換位為下位節點。

上位信息和下位信息的分界點是通過人機對話方式輸入到智能審計軟件中的審計命題或審計假設相對應的信息。在一組描述同一經濟活動的信息集合中,上位信息是下位信息生成之前的信息,是形成下位信息的前提信息;而下位信息則是上位信息的后續信息,承續了上位信息的相關含義。之所以上位信息可以成為審計命題或假設的證據而下位信息不能作為證據使用,關鍵在于下位信息本身就是需要證明的事項,是未經核實(查實)的信息,如果使用未經核實(查實)的信息來推知上位信息,顯然違背了人類認知科學和邏輯推理規律。例如,審查某項固定資產計提折舊有無差錯時,某計提折舊業務序列中的下位信息為待證計提折舊的事實,而上位信息則是計提折舊的固定資產原值、折舊率等前端業務信息,折舊計提結果所影響的折舊、成本、費用明細賬以及總分類賬金額的變化則是下位信息。作為證明折舊計提事項真實性的審計證據,應該是引起折舊計提事項發生的原因——上位信息,而不是它的結果——下位信息。

三、審計取證定位及其方向性選擇

審計取證方向及其定位方法要點是:審計證據取證必須以確定的審計命題或者審計假設所需要收集的被審計事項信息為起點,從上(前)往下(后)或者由下(后)往上(前),通過對相關信息的正向或逆向溯源,收集上位信息,查清被審計事項真相的方法。審計取證定位及方向性選擇過程如圖2所示。

(一)確定被審計事項所需信息的位置特征

首先,以某一具體審計命題或審計假設定位切入點(觀察點),再根據切入點(觀察點)定義上/下位信息。具體做法就是在數據清洗、填充、修改、標準化、類型轉化等預處理基礎上,對照應用領域規則、業務流程或者范例庫中所記載的相同經濟活動相似情節、過程等特征,利用計算機檢索算法來確定。這一位置特征與同一經濟活動信息集中的對被審計事項起證明作用的信息相對應的字符位置相關,通常表現為上、下位兩種位置:表示在被審計事項所需信息的上(前)邊或者下(后)邊。上/下邊位置應根據經濟活動自在信息的順序而不是其記錄信息或者自有信息所記載(記憶)的順序來確定。其次,選擇被審計事項信息的各種鄰接節點字符特征,這樣做是為了能細粒度地提取所在上/下位節點信息,它有多種選擇方式,如上下兩個字符或上/下一個或多個字符以及下一個或多個字符。信息細粒度應根據審計范圍或審計目標甚至審計事項的重要程度靈活掌握。

(二)審計取證方向選擇

被審計事項信息位置特征確定后,接下來就要選擇審計取證方向。從信息定義考察,被審計事項上/下位信息都蘊含了信息,但下位信息只是被審計事項原有含義上的新增或重復信息,對于被審計事項來說是明確確定的,不存在未被消除的隨機不確定性因素。因被審計事項的下位信息不能作為證明其真實性的證據使用,因而被審計事項的上位信息可獨立或者相互印證地證明被審計事項的真實性。也就是說,被審計事項的上位信息,根據證明需要可以成為審計證據。在數據結構中與被審計事項無直接關聯的其他節點信息,由于違背了審計證據的相關性規定,也不能成為證據。仍以圖1為例,若節點4確定為被審計事項,那么葉節點9、10、11就可以用作節點4的證據節點,而與節點4相關聯的上層節點2,則不是節點4的證據節點,除此之外,其他節點也不能收集、固化為節點4的證據。

(三)審計取證路徑選擇

被審計事項自在信息通過一定工具和技術轉換為人們能夠理解和認識的不同系統性質的自有信息或記錄信息后,審計主體可以選擇不同的信息獲取渠道來查清相關經濟活動,但取證路徑必須遵循經濟活動內在規律。例如,制造企業生產與存貨活動發生領料、生產加工、銷售產品等業務后,相應地也會產生產品生產、材料(產品)出入庫、成本計算等信息,審計主體可以根據構成這些不同業務體系信息的時空次序,選擇性地收集相關證據。

(四)審計取證方法選擇

審計取證關鍵技術有關鍵詞提取、主題提取、內容抓取等,這里僅從思路上介紹幾種方法。

1.基于范例的推理方法。建立審計范例庫,根據關鍵詞索引,從審計范例庫中檢索出(聯想到)與審計中面臨問題最類似(相關)的范例,進行差別比較和解答改編,通過聯想(或類比),將解決過去問題的經驗包括解答和解決過程用于解決當前問題。

2.中文文本關鍵短語提取方法。基于統計的關鍵短語提取,如利用統計方法,用詞頻TF、詞權重TF-IDF以及首位置信息作為統計特征,對候選短語進行評估,提出文本中關鍵短語;基于混合模型的關鍵短語抽取,即一種在隱馬爾科夫模型和最大熵模型的基礎上提出的一種無向圖學習模型;利用決策樹進行中文文本關鍵短語的自動抽取;改進的Seg Phrase算法等。

3.對完整或非完整數據庫的查詢方法。如PSKYline-join算法、SQL Server數據庫T-SQL查詢方法、基于Key/Value數據庫的查詢方法等。

(作者單位:國家電網有限公司 ?國網湖北省電力有限公司,郵政編碼:430077,電子郵箱:xiejs19621xjs@sina.com)

主要參考文獻

蔡圓媛.大數據環境下基于知識整合的語義計算技術與應用[M].北京:北京理工大學出版社, 2018

高濟.人工智能高級技術導論[M].北京:高等教育出版社, 2009

謝亞妮,李響,黃兆坤,鐘鳴,雷鳴濤.一種基于Key/Value數據庫的查詢方法[J].信息化研究, 2019(3)

猜你喜歡
大數據研究
FMS與YBT相關性的實證研究
2020年國內翻譯研究述評
遼代千人邑研究述論
視錯覺在平面設計中的應用與研究
科技傳播(2019年22期)2020-01-14 03:06:54
EMA伺服控制系統研究
新版C-NCAP側面碰撞假人損傷研究
大數據環境下基于移動客戶端的傳統媒體轉型思路
新聞世界(2016年10期)2016-10-11 20:13:53
基于大數據背景下的智慧城市建設研究
科技視界(2016年20期)2016-09-29 10:53:22
數據+輿情:南方報業創新轉型提高服務能力的探索
中國記者(2016年6期)2016-08-26 12:36:20
主站蜘蛛池模板: 国产美女一级毛片| 女人毛片a级大学毛片免费| 91青青在线视频| 国产在线视频福利资源站| 国产精品天干天干在线观看| 男女性午夜福利网站| 91色在线视频| 国产欧美又粗又猛又爽老| av天堂最新版在线| 少妇人妻无码首页| 99精品福利视频| 久久综合一个色综合网| 国产理论精品| 中文字幕欧美日韩| 欧美劲爆第一页| 激情综合网激情综合| 日本国产精品一区久久久| 国产特一级毛片| 亚洲视频a| 伊人久久大香线蕉影院| 久久久久九九精品影院 | 久热99这里只有精品视频6| 婷婷亚洲视频| 免费看a级毛片| 真实国产乱子伦高清| 精品国产免费人成在线观看| 亚洲精品人成网线在线| 在线观看的黄网| 女人一级毛片| 色妞永久免费视频| 精品超清无码视频在线观看| 国产成人精品男人的天堂下载| 中文字幕无码制服中字| 国产91小视频在线观看| 99久久性生片| 99视频有精品视频免费观看| 欧美成人亚洲综合精品欧美激情| 鲁鲁鲁爽爽爽在线视频观看 | 国产美女在线免费观看| 国产在线第二页| 国产一在线| 亚洲美女一区| 全免费a级毛片免费看不卡| 国产激情无码一区二区免费| 99视频在线看| 亚洲国产精品国自产拍A| 成年A级毛片| 蝴蝶伊人久久中文娱乐网| 欧美区一区二区三| 国产成人综合久久| 亚洲成人精品久久| 国产亚洲精久久久久久久91| 亚洲欧美一区在线| 精品国产三级在线观看| 国产福利2021最新在线观看| 91视频99| 亚洲精品视频免费看| 亚洲第一页在线观看| 亚洲码一区二区三区| 特级精品毛片免费观看| 波多野结衣久久精品| 亚洲色图欧美| 91蝌蚪视频在线观看| 国产96在线 | 国产一区二区三区在线精品专区| 精品超清无码视频在线观看| 亚洲欧美日韩另类在线一| 91美女视频在线| 欧美国产菊爆免费观看| 视频二区亚洲精品| 国产精品99在线观看| 婷婷久久综合九色综合88| 中文字幕在线观看日本| 在线一级毛片| 国产在线精品美女观看| 亚洲 成人国产| 亚洲国产日韩在线成人蜜芽| 青青草原国产av福利网站| 免费看黄片一区二区三区| 全免费a级毛片免费看不卡| 国产不卡在线看| 亚洲成人精品|