999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

審計全覆蓋中大數據技術的應用

2018-07-26 03:53:40祁學棟
環球市場信息導報 2018年18期
關鍵詞:分析

祁學棟

此次研究將理論與實務有效融合,以醫保審計為例,在其間應用Hadoop、云計算等技術,對以往軟硬件技術處理大量數量慢、錯誤率高等問題予以解決,大幅提升了審計質量及效率。并且,還通過運用跨行業數據關聯、聚類等大數據挖掘技術,對審計組開展工作提供幫助,有效改進了工作效率,不但給審計全覆蓋給予了技術支撐,也為日后大數據審計的實施給予了新思路。

伴同我國社會經濟的迅猛發展以及改革的持續深化,便需對公共、國有資產與國有資源等落實經濟責任的狀況實施審計全覆蓋。但實際上,實施審計全覆蓋具有較大困難,其所應對的最大問題即需針對各大行業海量數據信息、圖片等加以處理,如此便對當前的審計技術運用、數據收集等帶來了較大抨擊。在此形勢下,經由應用大數據技術便可將上述問題有效處理,其不但與大數據時代發展需求相符,也屬于執行黨中央、國務院有關強化審計監督的關鍵。基于此,針對審計實務里面大數據技術的應用予以研討具備顯著的學術及運用價值。此次研究把計算機、審計學等相應理論和審計實務有效銜接,將大數據技術引進到醫保審計中,顯著改善了審計質量與效率,給大數據時代下審計工作的實施給予了新路徑。

一、創設醫保審計大數據體系

當前,醫保大數據審計需解決的最大難題即數據量巨大。為處理以往設備和方式收集難度大、資源損耗嚴重、數據處理分析效率不高等問題,此次研究應用Hadoop框架,構建形成了醫保審計大數據體系。

借助Hadoop集群技術以增強數據處理水平。依照審計署要求與醫保審計實際需求,此次研究對湖南省人社、衛計、民政與公積金四大部門設計了23張標準表,對醫保、新農合等部門數據加以采集,合計7TB。如此龐大的數據量借助以往的審計方式難以實施,加之醫保審計時間緊張、收集整理與分析任務繁重,故強化數據處理能力便成為了建設基礎設施層的關鍵。

Hadoop屬于以Java為基礎構建形成的開源軟件框架,主要是位于較多計算機構成的集群里面針對龐大的數據信息加以存儲、實施分布式計算。其意義在于由單一的服務器擴張至數千臺機器,所有單臺機均能夠實施本地計算與存儲。該框架的優勢即成本投入不高,用戶不受限制,不但可對大規模數據予以處理,還可以對程序員工作進行精簡,達成計算調度管理、負載均衡等目的。同時,該框架的主要設計即分布式文件系統( HDFS)與計算框架( MapReduce),前者主要適用到存儲大量數據的計算中。

在醫保審計里面先施行模擬壓力測試,經由當前數據加以復制、更改,模擬當地預期數據量,對服務器數據承載和計算壓力予以測試,依照結果借助Hadoop集群技術創設服務器集群,以處理海量數據分析效率不高的問題。結果表明,把5臺容量為512G的服務器經由Hadoop集群技術整合為1臺服務器,其處理數據的能力較之單臺服務器要上漲5倍。

借助分布式文件系統以強化數據容錯能力。針對湖南省醫保數據收集期間,由于各區域應用系統眾多且匱乏統一性,故依照分級采集市州匯總原則開展工作。抽取匯總上報數據統一創設數據庫期間,假設選擇以往關系數據庫的文件存儲方法,則一旦某一數據錯誤,那么便應編寫語句針對整個數據庫實施錯誤數據刪除,不但耗時且操作繁瑣。故而,為對數據容錯能力較差的情況予以處理,此次研究將選擇分布式文件系統(HDFS)為底層結構。其主要用于大量數據的分布式存儲,能把較多計算機借助通信網絡整合,在統一管理系統的控制下,協同達成大規模數據處理任務。并且,其在文件存儲寫入期間,把文件劃分為文件塊,分散存儲于所有子節點主機中,但文件基礎信息依舊存儲于主節點,其優勢即易拓展、容錯性好、經濟適用性高。通過HDFS把百余個區域的數據依照行政區域代碼自主分布存儲于4臺子節點服務器中,且基于此產生若干副本,假設其間某一數據發生錯誤,則其他副本經由便捷操作能及時恢復。

借助達夢數據庫與Hive數據倉庫處理工具以改善數據采集加載效率。對大量醫保數據抽取加載期間,為處理以往的關系數據庫僅能將數據存儲于服務器本地的文件系統、無法應用HDFS處理大量數據與審計工作者習慣選擇SOL分析數據等問題,此次研究嘗試選擇Hive集成國產達夢軟件創設數據倉庫。

Hive是以Hadoop為基礎構建形成的數據倉庫處理工具,在數據提取加載(ETL)方面極為便捷,是一項能夠存儲、查詢與分析存儲于Hadoop分布式文件系統里面的大數據機制。盡管較之關系數據庫而言,其具有擴張自身存儲性能的作用,以及較好的計算能力,然而在面向大量數據運用時,數據挖掘、實效性不足,故此次研究應用國產關系數據庫達夢軟件集成應用。

Hive達成了醫保數據的迅速分布式存儲,然而其間如果存儲表、字段名等元數據信息需持續更新、變動,因分布式文件系統里面的數據以多讀少改為主,故無法把元數據存儲到Hive里面。因而,為縮減檢索期間執行語義檢查的時間,且確保數據實時查詢,便可通過國產達夢數據庫對元數據予以存儲,其語法和SOL相似,且導入各類型表格、數據等極為便捷。

借助MapReduce、分布式SQL引擎處理技術以改善數據分析效率。對審計數據分析期間,審計工作者往往需應對如下問題:其一,審計工作者編寫的分析語句總需反復測試,依照結果多次修改SOL語句,但醫保數據量龐大,位于全庫中直接編寫語句、測試時間較長;其二,分析任務繁重,但Hadoop體系會損耗較多資源,單次僅可執行1條查詢語句。

為處理上述問題,此次研究借助MapReduce、分布式SQL引擎處理技術的同步應用并行計算對數據分析處理。其間,前者以HDFS為基礎針對存儲于分布式文件系統的數據實施分布式計算,該框架軟件位于彼此協同的并行計算機中把大的祭祀環任務劃分為若干小任務,經由一組計算機并行實施,提高計算效率;后者通過定制查詢、執行引擎、相應操作符對SQL語法提供支撐,數據分析迅速且具備實效性,數據處理位于內存中實施,且具有復雜查詢等功能。

在醫保審計數據分析環節,先要在所有市州標準SQL庫編寫測試語句,將大大任務區分成若干小任務協同分析,在語句更正后統計到全庫運行。因MapReduce計算框架主要以批處理任務為主,故伴同數據量的加大,應用其實施簡單的數據檢索便會耗費較長時間,故無法與交互式查詢需求相符,此時正好適用分布式SOL查詢引擎。因而,此次研究經由運用并行計算、依照分布式SOL引擎特性對分析任務通盤規劃,以節省數據分析時間。

定制開發實用型工具以改進審計質量及效率。醫保審計期間,審計工作者會具有如下問題:各區域應用系統匱乏統一性,導人數據不標準,基礎數據質量不足,使得分析效果較差;審計工作者語句編寫習慣有差異,合庫后會反復調整投入使用,浪費時間;分析獲知的結果需切分發放到若干審計組核實,任務量龐大、繁雜。

為處理上述問題,此次研究進行了實用工具的開發,具體為數據校驗工具,依據標準表要求針對其結構、值域檢驗,在市州數據上報前通過該工具對數據檢測、修改,以保障基礎數據質量;表名翻譯工具,其能把中文表、字段名編寫SQL語句變換成中文拼音的首字母版本,讓其能位于Hive里面直接應用;數據切分工具,通過行政區劃代碼為數據切分依據,把集中分析結果自主發放到所有審計組。

二、審計全覆蓋中大數據技術的具體應用

怎樣與目前的大數據環境貼合,于被審計單位龐大的數據中挖掘有效信息是審計過程中最需處理的問題。本章節依舊以湖南省醫保審計為例,對大數據技術的具體應用進行闡述。

應用跨部門、跨領域數據關聯分析,揭示醫保政策執行、管理問題。醫保審計分析思路強調醫保資金應用的真實有效性,具有的醫保待遇有無契合政策界定,經由各部門數據關聯分析,查找契合規制但不具備醫保待遇等問題。首先,把該省城鎮職工、居民醫保等和民政低保人員信息關聯對比分析,對特困人員沒有參保與反復資助等異常數據篩選;其次,把該省城鎮職工、居民醫保等信息和人社死亡人員信息等關聯分析,將死亡后依舊繳費等可疑數據篩選;最后,把該省社保經辦機構、定點醫療組織工作者信息與其配偶信息和工商登記信息關聯分析,將經辦機構等可疑數據篩選。經由此,不但能夠給審計工作者正確有效定位疑點提供了幫助,且還顯著提升了其取證率及審計質量。

借助聚類技術以發現非法騙取醫保基金等問題。將大數據技術應用到醫保審計能針對醫院收入真實可靠性予以分析,獲知離群結果,發現醫院非法騙取醫保基金的可疑數據。先通過R語言文本挖掘工具,針對醫院治療項目分門別類,此次審計囊括該省千余家醫院,治療項目稱謂具有較大差異,例如“床位費”,其將近兩千余種表述模式,通過R語言文本挖掘工具里面的醫學詞匯針對項目名稱實施文本分詞,均并入到“床位費”,依照此分詞方式,得出三千多個項目名稱。而后,經由聚類分析技術,對疑點醫院、治療項目予以鎖定,基于分詞結果數據,依照醫院與治療項目名稱劃分組別,把匯總數量、收入總數值當做觀測值,構建產生匯總矩陣,把離群醫院與治療項目和其有關的觀測值視為審計疑點,從而實施調查。借助該技術能給審計工作者獲知審計疑點提供幫助,且改善工作效率。

本文具體針對審計全覆蓋中大數據技術的應用進行了分析,以湖南省醫保審計為例,對大數據技術的具體應用進行了探索、討論,通過應用Hadoop軟件框架、HDFS、Hive等對大量審計數據存儲、分析。并且,為與被審計單位數據量驟增的態勢契合,通過大數據技術的應用能幫助審計工作者明確審計疑點,改善其工作質量與效率。

猜你喜歡
分析
禽大腸桿菌病的分析、診斷和防治
隱蔽失效適航要求符合性驗證分析
電力系統不平衡分析
電子制作(2018年18期)2018-11-14 01:48:24
電力系統及其自動化發展趨勢分析
經濟危機下的均衡與非均衡分析
對計劃生育必要性以及其貫徹實施的分析
現代農業(2016年5期)2016-02-28 18:42:46
GB/T 7714-2015 與GB/T 7714-2005對比分析
出版與印刷(2016年3期)2016-02-02 01:20:11
中西醫結合治療抑郁癥100例分析
偽造有價證券罪立法比較分析
在線教育與MOOC的比較分析
主站蜘蛛池模板: 国产精品亚洲综合久久小说| 又黄又湿又爽的视频| 日韩精品中文字幕一区三区| 国产精品任我爽爆在线播放6080 | 91丨九色丨首页在线播放| 91亚洲视频下载| 久久综合色天堂av| 国产无码精品在线| 92午夜福利影院一区二区三区| 中文字幕免费播放| 日韩亚洲综合在线| 亚洲无码高清一区二区| 国产精品手机在线观看你懂的| 亚洲啪啪网| 亚洲二区视频| 午夜毛片免费观看视频 | 国产Av无码精品色午夜| 国产黑人在线| 国产在线一区二区视频| 国内老司机精品视频在线播出| 欧美视频在线不卡| 国产一区二区三区免费观看| 草草影院国产第一页| 亚洲男人在线天堂| 国产亚洲精品va在线| 国产99精品久久| 二级毛片免费观看全程| 亚洲欧美自拍一区| 日本免费一级视频| 国产成人精品一区二区三在线观看| 亚洲天堂视频在线观看| 亚洲欧美在线综合一区二区三区| 日本精品一在线观看视频| 91福利片| 亚洲综合片| 农村乱人伦一区二区| 色视频久久| 国产正在播放| 一本一道波多野结衣av黑人在线| 伊人激情久久综合中文字幕| 日韩免费中文字幕| 久久中文字幕2021精品| 午夜精品久久久久久久无码软件 | 日本成人一区| 欧美成人精品一级在线观看| 国产极品美女在线播放| 国产av剧情无码精品色午夜| 在线播放国产99re| 久久99国产乱子伦精品免| 中文字幕亚洲专区第19页| 精品福利视频网| 国产精品 欧美激情 在线播放| 久久久久人妻一区精品色奶水 | 成人中文在线| 天天色综网| 精品少妇人妻一区二区| 91九色视频网| 国产成人综合在线观看| 91美女视频在线| 亚洲三级色| 91美女在线| 99re这里只有国产中文精品国产精品| 欧美日韩在线观看一区二区三区| 日本精品一在线观看视频| 青青草原国产av福利网站| 免费又爽又刺激高潮网址 | 国产一级精品毛片基地| 欧美一区日韩一区中文字幕页| 亚洲中文无码av永久伊人| 在线国产你懂的| 成人在线观看一区| 亚洲最大福利网站| 国产亚洲成AⅤ人片在线观看| 欧美在线天堂| 日韩视频精品在线| 欧美一区二区丝袜高跟鞋| 成人精品视频一区二区在线| 日韩最新中文字幕| 亚洲无线国产观看| 成人精品视频一区二区在线| 国产丝袜91| 丁香婷婷综合激情|