武民剛 曹靜波
如何加強金稅三期數據分析
武民剛 曹靜波
經濟建設為中心的現代社會,經濟活動的發生,業務數據在前臺生成后,數據分析就成為十分重要急迫的頭等大事。數據分析的作用有:數據質量監控。把住數據質量關,關系到整個數據分析工作的成敗。數據抽取挖掘。在各種代碼表、業務數據表的基礎上,關聯結合,抽取數據分析需要的相互關聯印證的數據,挖掘出有用信息,是數據分析的基礎。數據統計決策。對有用的數據進行再次的匯總統計,同期對比,供決策層面參考,提供日常業務預警、時段績效考核、關鍵決策支撐,是數據分析的核心。當代計算機存儲硬件的性能提升,數據集市、數據倉庫、商業智能技術的發展,為稅收數據分析提供了優良的硬軟件基礎。在本世紀頭十五年金稅一二期工作的基礎上,國家稅務總局整合各省市區、國地稅的稅收信息化,建設金稅三期,為大規模更加及時、全面、友好、精確的數據分析工作提供了可能。探討研究如何加強金稅三期數據分析,是擺在我們面前的重要課題。
稅收數據分析是一個老課題。很多數據分析相關的工作,以前依賴于納稅企業涉稅人員素質、稅務機關內部稅務人員掌握稅收政策業務水平,或者稅務代理機構的業務水平。當代先進的計算機硬軟件,可以把數據分析及時化,提供事中審核預警,及時反饋更正;事后監督考核,加強執法問責等,但目前稅務機關在應用數據分析中還存在不足。
1.數據質量有待提升。納稅企業涉稅人員待遇低、流動性大,稅收法律和稅收政策掌握執行水平參差不齊。普通的納稅企業尤其是占比相當大的中小企業,涉稅財會人員待遇低,工作崗位變動快,和稅收管理人員打交道的很多涉稅人員都是新面孔。往往很簡單的辦稅事宜,第二年要重新組織納稅人培訓。納稅企業向稅務機關報送的各種涉稅報表,往往數據質量達不到基本標準。一是錯報、漏報的現象相當突出。比如,免稅銷售收入的填報,企業所得稅年報的填報,都存在錯報、漏報,甚至瞞報的情況。二是表內表間業務數據邏輯關系的審核難以實現。很多表的數據要與后面的表的數據一致,不管是單機版填表工具還是網絡申報平臺,在解決這一問題上都存在不足。
2.數據提取有待完善。各種業務域的代碼表、數據表存放在不同的數據庫中,需要根據數據分析的需要,提前把數據提取挖掘,關聯到一起,提供多層級、多維度的分析。目前各業務部門往往開發了很多業務系統,存在一些相互關聯的數據,沒有及時比對,造成一些信息“孤島”。如果把各種數據庫中的數據表、代碼表的數據關聯到一起,就可以進行大規模的數據比對,一旦發現數據質量問題,可以及時糾錯,并為進一步數據分析提供可能。
3.預警平臺有待建構。稅收預警和風險防控十分重要。普通的數據質量,稅收業務風險,甚至稅收違法犯罪,都需要我們建構強大的稅收風險預警平臺。一是考核時間點之前的業務預警,二是考核時間點之后的過錯追責,三是確定涉稅違法線索,并移交稽查或移交公安經偵。不建構強大的預警系統,難以及時發現業務問題,跟蹤業務流程,處理涉稅違法犯罪。
要完善數據提取,要建構預警平臺,完成涉稅風險防控,就必須掌握金稅三期的業務流程,監控數據流,分析數據形成的機制,分析各種數據的完整性、冗余性、存儲在哪些具體的數據表中,各數據字段的含義,數據表與代碼表之間的層級和維度。只有在充分了解掌握數據的基礎上,才能實現復雜、及時、全面、準確、多維的數據分析。
(一)完善數據存儲利用和備份機制
進一步完善數據省集中、信息市抽取模式。并建立起強壯的數據災備恢復機制,為數據分析提供牢靠的硬件軟件基礎。
1.數據省集中。從稅收征管實踐多年的經驗出發,決策層面將數據生產機和集中存儲、備份、查詢機統一集中到省一級。省一級有相當充裕的信息化建設經費、可以集中全省的技術精英,搜集全省的業務骨干,可以與省會城市的計算機硬軟件公司建立長期合作關系,可以建設全省范圍內最可靠的數據機房設施,性能優良的服務器硬件和數據倉庫軟件、商業智能軟件,并建設一支作風過硬,技術過硬的數據分析隊伍,完成各業務部門交付的各種數據分析建設項目。比如,省國稅局抽調各地市區縣信息中心的技術人員、各稅種業務部門業務骨干、商業智能軟件公司的數據分析專家,共同組成數據分析項目小組,研究討論后,形成業務需求,完善業務邏輯,編制數據庫腳本代碼,生成各種預警指標,完善整體預警報表,或形成一整套涉稅風險防控機制。
2.信息市抓取。一是以地市或區縣為取數范圍,從省級集中數據倉庫中篩選關聯數據,建設各種數據視圖。以消費稅申報為例,從消費稅申報數據表和稅務登記表中提取關聯信息。二是層級信息抓取。在商業智能軟件中,根據多層級的代碼表,如稅務登記表,行業代碼表等等,進行層級信息抓取。如選中一個層級的稅務機關,查詢其管理的所有下級稅務機關的數據。
(二)運用數據倉庫和商業智能技術,大幅提升數據分析技術標準
1.建構事實表和維表。在調取數據倉庫中的代碼表、數據表,生成各種業務視圖的基礎上,我們把數據表、視圖作為物理表。在物理表的基礎上建立事實表,反映標準的業務流程。以代碼表為基礎,建立各種維表,反映單維、多維的復雜業務關系和歸屬關系。
2.建構數據查詢報表。數據查詢是直接服務于基層稅收管理需要,做好數據檢查、反饋、保障數據及時性、保障數據質量的基礎。在給定的時間區間、地域范圍、限定稅收管理人員,或模糊指定納稅人,快捷方便地查詢、展現業務信息。比如,查詢稅務登記、納稅申報、稅款征收、發票領用存、稅收優惠備案、行政許可和處罰、年度匯算清繳報表等。這些業務數據的查詢,能夠幫助基層管理人員監控、分析納稅人涉稅數據是否及時填報,業務是否按時發生,從而督促納稅人及時完成稅收義務,稅收政策執行不走樣。
3.建構數據審核預警系統。在中央和地方不斷推行簡政放權、稅收政策日新月異的大前提下,做好數據審核預警系統的開發和修訂,任務相當緊迫。每年的涉稅報表都會有或大或小的修訂,業務數據的口徑比如稅收優惠的上下限等種種參數,都需要經常做更改。這些情況都決定了數據審核預警系統是服務于稅收政策和稅收征管需要的,隨著稅收政策的變更,系統的開放完善也是一個長期的過程。對納稅人報送的涉稅報表、稅務機關內部各業務部門生成的各種業務數據、都需要根據法律法規和政策細則,及時建構和更新數據審核預警系統。
(三)企業所得稅年度報表審核預警系統
以企業所得稅年報審核預警系統為例,筆者簡要說明一種數據分析技術的實現過程。
1.確定業務需求。省局召集各地所得稅業務骨干、信息中心技術人員、軟件公司數據庫專業人員,多次會議,結合上級局下發的業務報表和征管實踐中的難題和常見錯誤,形成第一個版本的業務需求。包括了460個表內、表間的審核規則,涉及30余種業務報表。
2.制定開發方案。信息中心和商業智能軟件公司的技術人員一起,制定開發方案。(1)數據庫選擇。可以選擇ORACLE甲骨文數據庫,也可以在更高級的VERTICAL數據庫的基礎上上開發。最終選定普遍運用,與核心征管數據庫相銜接的ORACLE,開發人員普遍能夠掌握的ORACLE SQL腳本。(2)在數據庫中生成審核規則表、審核結果表。業務需求被整合成460個審核規則記錄,錄入審核規則表,并且在審核規則表中預留存儲SQL腳本的大字段。技術人員根據審核規則,編寫460個審核腳本,正確運行,對業務報表的表內數據、表間數據開展全面的數據分析,就象“體檢”一樣,把不符合審核規則的報表數據,提取相關字段,生成一條審核錯誤記錄,插入審核結果表。(3)服務器自動運行審核腳本,生成(刷新)審核結果表。利用審核規則表中的SQL腳本字段,編寫指令,把SQL腳本自動調取出來,在每天的20點之后,完整執行,用時三到六小時,完成計算機服務器端的自動審核過程。(4)運用商業智能技術,完成數據分析展現。對審核結果表進行分層級的多維展現,自動統計更新審核錯誤統計表,既包括省級、地市級、區縣級、基層稅源管理單位的分級預警審核統計,也包括以稅收管理員、納稅人限定的納稅企業報送的具體數據錯誤查詢。
3.完成開發計劃。經過業務人員和技術人員的共同努力,對460條審核規則進行了開發,在第一個開發階段,完成440個規則的腳本編寫,對全省數百萬戶納稅企業填報的年度申報報表,審核出四萬余個錯誤結果,修訂了5種審核規則,完善了110個腳本。第一階段的開發結束后,由業務骨干對審核結果進行會審,對審核結果不符合審核規則的,進一步提出處理意見:腳本不準確的,修改腳本;規則本身不合理的(如未允許零申報),修改規則。
4.試運行和申辯糾錯。審核規則和審核結果,本身的正確性,也需要業務部門初審,基層征管稅務機關和納稅人的試用、申辯、糾錯。具體的業務數據千奇百怪,有些數據要精確到小數點后兩位的角分,納稅人填報數據差一分算不算錯誤?有些業務規則要求填報的數據大于零,審核結果把零申報全部列為錯誤,必須修訂審核規則。在具體的數據分析中,允許錯誤的發生及錯誤的修改,反復地調試調整。
5.審核預警功能。經過試用單位的試運行,排除各種規則和腳本的錯誤后,開始在全省范圍內開展審核預警。納稅企業集中在每年的4-5月報送企業所得稅匯算清繳年度報表(主表和幾十種附表),通過網絡平臺報表,年報數據進入金稅三期省級生產服務器,生產服務器每天利用增量備份機制將數據備份到數據倉庫,通過后臺的服務器腳本運行機制,自動生成審核結果表,基層稅收管理人員根據自動更新的審核結果預警,通知有錯誤信息的納稅企業,在指定時點之前重新報送。
6.績效考核功能。審核規則生成的審核結果表,不僅在事中發揮預警監控、督促稅收管理員和納稅企業提升數據質量的作用,而且在年報終結時間之后,要發揮執法考核,績效考核的功能,對未能改正年報錯誤,未貫徹各項稅收優惠政策的基層稅務機關和管理人員,要加強過錯追責和考核通報,獎勤懲懶,供決策層面參考,改進人事管理工作。
金稅三期既是國家金字頭信息化工程的重要組成部分,也是國家推行簡政放權、依法治國方略的重要支點。稅務部門通過金稅三期數據分析,有兩大促進作用:一方面,落實好稅收優惠和便民服務措施,督促納稅企業提高申報質量和改進辦稅質效;另一方面,在稅務機關內部加強稅收法律法規的執法問責,壓實稅收管理責任,全面貫徹依法治稅的思想,進一步加強稅收征管。為此,稅務機關要切實加強金稅三期的數據分析,發揮其在稅收征管中的積極作用。
武漢市東西湖區國家稅務局征納活動掠影

▲區局聯合開展稅法宣傳。

▲區局召開國稅收入過百億暨第三屆億元企業懇談會

▲區局智能辦稅服務廳。

▲區局開展“兩學一做”支部主題黨日活動。

▲區局組織參加“青春喜迎十九大,不忘初心跟黨走”歌唱比賽。
(圖/文:區局辦公室)