韋祚哲
[摘 要]目前,精準脫貧是我國政府3大攻堅戰之一。扶貧資金具有數量大、面積廣、影響深遠的特點,一直以來,審計系統都高度重視對扶貧資金的審計監督,近年來更是緊扣脫貧攻堅任務,把扶貧資金的審計任務擺在重中之重的地位?;诖耍疚脑敿毥榻B了筆者所在團隊在一次交叉審計任務中,面對海量數據時如何通過大數據審計分析,快速精準發現審計疑點,鎖定延伸審計對象,揭露重大問題,也是將數據挖掘技術應用于具體審計項目的一次探索。
[關鍵詞]扶貧資金;貧困人口;數據挖掘
doi:10.3969/j.issn.1673 - 0194.2019.08.005
[中圖分類號]F239.1;TP311.13 [文獻標識碼]A [文章編號]1673-0194(2019)08-00-03
1 案例背景
根據省審計廳的統一安排,某市審計局以市內交叉的方式對全市2014-2016年的扶貧資金進行專項審計,筆者作為審計組的一員有幸參與其中。按照精準扶貧政策的要求,扶貧資金對應貧困人口,有健全、規范的電子數據,有利于應用數據挖掘技術進行審計分析。
2 審計過程、方法
2.1 基本思路
對于精準扶貧來說,確保資金合理合規使用的基本原則是資金必須用在建檔立卡的貧困人口身上,幫助其脫貧致富,但由于審計時間和人手有限,不可能進行全方位的審計復核。因此,為了提高延伸審計的精準性,審計人員應在審計過程中挖掘分析扶貧對象的建檔立卡數據,找出基礎業務質量比較差的鄉鎮,并將其作為延伸審計的重點,以期發現更多的問題。
2.2 取得的資料
筆者從扶貧系統中查看目標數據的行數,采取分年度導出的方法,得到2016年未脫貧人口明細表(59 880行,31.3 MB)、
2015年已脫貧人口明細表(11 012行,9.32 MB)和2014年已脫貧人口信息表(14 948行,12.6 MB),并將上述3張表導入數據庫后合并生成一張表。觀察數據可以發現,除了戶主行,其他家庭成員行沒有包含戶主信息,通過下面的語句將戶主信息加入家庭成員行,方便以后對照戶主事項進行查詢。
Select h.*
,(select 證件號碼
from tb1 hh
where 序號=(select max(序號) from tb1 hhhwhere hhh.序號<=h.序號
and hhh.與戶主關系='戶主'))
into tb2
from tb1 h;
2.3 審計步驟與方法
2.3.1 扶貧對象建檔立卡數據初步分析統計
從扶貧信息系統中導出某地建檔立卡對象基本信息表,經過分析身份證號碼和表內數據邏輯查找異常數據,并分鄉鎮
統計。
2.3.1.1身份證號碼第18位校驗碼不符合規則情況
身份證號碼的第18位校驗碼是根據前17位數字按照一定的算法得出的數碼,筆者通過5個可讀性良好的小步實現目標。
(1)表中增加余數列
altertable貧困人口表add余數varchar
(2)余數賦值
update貧困人口表
set 余數=(substring(證件號碼,1,1)*7+substring(證件號碼,2,1)*9+
substring(證件號碼,3,1)*10+substring(證件號碼,4,1)*5+
substring(證件號碼,5,1)*8+substring(證件號碼,6,1)*4+
substring(證件號碼,7,1)*2+substring(證件號碼,8,1)*1+
substring(證件號碼,9,1)*6+substring(證件號碼,10,1)*3+
substring(證件號碼,11,1)*7+substring(證件號碼,12,1)*9+
substring(證件號碼,13,1)*10+substring(證件號碼,14,1)*5+
substring(證件號碼,15,1)*8+substring(證件號碼,16,1)*4+
substring(證件號碼,17,1)*2)%11
where len(證件號碼) in (18,20)
(3)在表中增加校驗碼列
alter table dbo.貧困人口表 add 校驗碼 varchar
(4)校驗碼賦值
update 貧困人口表 set 校驗碼='1' where 余數='0'
update 貧困人口表 set 校驗碼='0' where 余數='1'
update 貧困人口表 set 校驗碼='X' where 余數='2'
update 貧困人口表 set 校驗碼='9' where 余數='3'
update 貧困人口表 set 校驗碼='8' where 余數='4'
update 貧困人口表 set 校驗碼='7' where 余數='5'
update 貧困人口表 set 校驗碼='6' where 余數='6'
update 貧困人口表 set 校驗碼='5' where 余數='7'
update 貧困人口表 set 校驗碼='4' where 余數='8'
update 貧困人口表 set 校驗碼='3' where 余數='9'
update 貧困人口表 set 校驗碼='2' where 余數='*'
(5)比較證件號碼中的校驗碼和根據算法生成的校驗碼是否相符,并生成疑點表
Select鄉鎮,COUNT(*)校驗碼不符人數
into統計分析_證件號碼第18位不符合編碼規則
from dbo.貧困人口表
where LEN(證件號碼) in(18,20)
and substring(證件號碼,18,1)<>校驗碼
grou by 鄉鎮 order by 鄉鎮
2.3.1.2 貧困人員信息表中的“性別”與身份證號碼第17位奇偶性不符
根據身份證編碼規則,第17位為性別標識符,奇數為男性,偶數(含0)為女性,查詢并生成疑點表。
select鄉鎮,COUNT(*) 性別有誤人數
into 統計分析_證件號碼性別標識與標明的性別不符
from dbo.大別山縣貧困人員信息表
where ((substring(證件號碼,17,1) in(1,3,5,7,9) and 性別 like '%女%')
or (substring(證件號碼,17,1) in(0,2,4,6,8) and 性別 like '%男%'))
and 年度='2016'
group by 鄉鎮 order by 鄉鎮
2.3.1.3 貧困人員信息表中登記的“人均純收入”超過3 100元的對象
Select鄉鎮,count(*) 人均純收入超過標準人數
into 統計分析_人均純收入超過標準
from 大別山縣貧困人員信息表
where cast(人均純收入 as float)>3101 and 年度=2016
group by 鄉鎮
order by 鄉鎮
2.3.2 分鄉鎮統計各種情況的異常人數求和及總差異率
2.3.2.1 根據貧困人員信息表生成分鄉鎮異常人數統計表
select 鄉鎮,COUNT(*) 貧困人數
into 大別山縣建檔立卡數據異常統計表
from dbo.大別山縣貧困人員信息表
where 年度=2016
group by 鄉鎮
order by 鄉鎮
2.3.2.2 將異常人數數據添加到大別山縣建檔立卡數據異常統
計表
(1)校驗碼不符
alter table 大別山縣建檔立卡數據異常統計表 add 校驗碼不符人數 int
update 大別山縣建檔立卡數據異常統計表
set 校驗碼不符人數=b.校驗碼不符人數
from 大別山縣建檔立卡數據異常統計表 a join 統計分析_證件號碼第位不符合編碼規則 b on a.鄉鎮=b.鄉鎮
where a.鄉鎮=b.鄉鎮
(2)性別不符
alter table 大別山縣建檔立卡數據異常統計表 add 性別有誤人數 int
update 大別山縣建檔立卡數據異常統計表
set 性別有誤人數=b.性別有誤人數
from 大別山縣建檔立卡數據異常統計表 a join dbo.統計分析_證件號碼性別標識與標明的性別不符 b on a.鄉鎮=b.鄉鎮
where a.鄉鎮=b.鄉鎮
(3)人均純收入超過標準
alter table 大別山縣建檔立卡數據異常統計表 add 人均純收入超過標準人數 int
update 大別山縣建檔立卡數據異常統計表
set 人均純收入超過標準人數=b.人均純收入超過標準人數
from 大別山縣建檔立卡數據異常統計表 a join dbo.統計分析_人均純收入超過標準 b on a.鄉鎮=b.鄉鎮
where a.鄉鎮=b.鄉鎮
(4)差異人數求和
a.null 數據賦值
update 大別山縣建檔立卡數據異常統計表 set 校驗碼不符人數=0 where 校驗碼不符人數 is null
update 大別山縣建檔立卡數據異常統計表 set 性別有誤人數=0 where 性別有誤人數 is null
update 大別山縣建檔立卡數據異常統計表 set 人均純收入超過標準人數=0 where 人均純收入超過標準人數 is null
b.差異人數求和
alter table 大別山縣建檔立卡數據異常統計表 add 異??側藬?int
update 大別山縣建檔立卡數據異常統計表
set 異??側藬?校驗碼不符人數+性別有誤人數+人均純收入超過標準人數
c.求差異率
alter table 大別山縣建檔立卡數據異常統計表 add 差異率 float
update 大別山縣建檔立卡數據異常統計表
set 差異率=left((cast(異??側藬?as float )/cast(貧困人數 as float)),6)
2.3.3 將數據復制到Excel中圖形化并解讀
圖1是根據差異總人數和差異率繪制的雙縱坐標柱形圖,紅色柱代表差異率,黃色柱代表差異總人數,兩色柱的總高度代表該鄉鎮基礎數據差異疊加影響。
2.4 延伸審計建議
根據圖形化的結果,黃帝鎮和皖水鎮兩個鎮的數據差錯絕對數和相對數疊加影響最大,因此,本次審計將這兩個鄉鎮列為重點延伸審計對象。
3 延伸審計及部分成果
3.1 黃帝鎮
(1)精準識別中存在貧困人口動態管理滯后和假冒貧困人口的情況。2016年底,在皇帝鎮貧困人口數據中,10名未脫貧人員已經去世并火化,其中2名是大別山縣財政供給人員。
(2)到戶貼息中存在個人利用他人貸款憑證騙取到戶貼息資金。Z1用A、B兩人的貸款憑證和大別山縣××合作社的貸款合同騙取21 643元財農[2013]2408號文件指標中的到戶貼息資金。Z2用C等9人貸款憑證騙取25 363元財農[2013]2408號文件指標中的到戶貼息資金。
(3)項目貼息中存在的問題。安徽××開發有限公司用安徽××銀行的200萬元貸款申報獲取3萬元財農[2013]2408號文件指標中的項目貼息資金,又重復申報4萬元財農[2014]670號文件指標中的項目貼息資金,貸款合同編號為“20130098”。
3.2 皖水鎮
(1)精準識別中存在貧困人口動態管理滯后和假冒貧困人口的情況。2016年底,在皖水鎮貧困人口數據中,40名未脫貧人員已經去世并火化,其中,2名是大別山縣財政供給人員,4名是現任村干部(占全縣此類情況的一半)。
(2)到戶貼息中存在個別公司套取到戶貼息資金的情況。鎮政府在2013年到戶貼息資金中支付大別山縣××農產品開發有限責任公司19 170元,款項從三資賬戶轉至該公司法人個人賬戶。
(3)雨露計劃中存在個別單位利用培訓貧困人員的雨露計劃資金培訓原有工人。2013年,大別山扶辦字[2013]18號文件雨露計劃為大別山縣××職業培訓學校撥付勞動力轉移扶貧培訓資金4萬元,用來培訓100名車工。經審計培訓臺賬、勞動力轉移臺賬及培訓實施方案等流程,發現培訓時間為2013年10月11日-2013年11月16日,2013年11月16日就業,培訓對象為××廠今年新錄用車工專業員工100人。據審計延伸調查××廠,車工專業培訓的100人都是該廠2012年前的在職職工。
4 體會和啟示
通過本次審計,筆者認為利用數據庫技術進行數據挖掘,對提高審計深度、提高延伸審計的精準性有一定的作用,值得在今后的審計工作中積極探索、嘗試。
主要參考文獻
[1]洪天一.基于數據挖掘的計算機審計方法研究與實現[D].成都:電子科技大學,2011.
[2]梁雪琴,劉紅生,代秀梅,等.聚類離群點挖掘技術在內部審計信息化中的應用——一個來自商業銀行信用卡審計的實例[J].中國內部審計,2015(8).
[3]劉莉麗.數據挖掘技術在社保聯網審計中的應用研究[D].哈爾濱:哈爾濱工程大學,2009.
[4]張炳才,彭國林.基于歐式距離孤立點的數據挖掘方法在審計中的應用與研究[J].中國管理信息化,2008(13).
[5]蔣偉林.“云端”扶貧的貴州探索[J].決策,2016(11).