■鐘緒林 王廬己
大數據時代下的稅收風險管理
■鐘緒林王廬己

(一)大數據的定義。
理論界對“大數據”概念有兩種比較權威的說法:一是旅美學者涂子沛在其所著的《大數據》一書中將其定義為:“大數據是指那些大小已經超出了傳統意義上的尺度,一般的軟件工具難以捕捉、存儲、管理和分析的數據”。而英國牛津大學教授維克托·邁爾·舍恩伯格則在其《大數據時代》一書中提出“大數據是人們獲得新認知、創造新價值的源泉,是改變市場、組織機構以及政府與公民關系的方法”。大數據被譽為“21世紀的新石油”,現在全球每年產生的數據信息量年增40%,數據信息總量每兩年就可以翻一番,而且有90%的數據信息內容屬于非結構化內容(視頻、圖片等)。根據國際互聯網數據中心預測,至2020年全球以電子形式存儲的數據量將達到32ZB。
“大數據”之“大”,不僅僅在于其“容量之大”,更多意義在于人類通過對大容量數據的交換、整合、分析,可以發現新知識,創造新價值,從而帶來“大科學”、“大知識”和“大發展”。大數據時代最大的轉變就是人們放棄對因果關系的探求,取而代之注重數據之間的相關性,不需要知道“為什么”,而只需要知道“是什么”。也就是說,所謂大數據就是要在海量、無序的數據中洞察規律、發現價值。數據已經滲透到每一個行業和業務職能領域,逐漸成為重要的生產因素,而人們對于海量數據的運用將預示著新一波生產率增長和消費者盈余浪潮的到來。世界上許多國家都已經認識到了大數據所蘊含的重要戰略意義,紛紛開始在國家層面進行戰略部署,以迎接大數據技術革命正在帶來的新機遇和新挑戰。
(二)大數據時代的特點。
大數據技術的核心是大數據存儲和處理技術、數據倉庫技術等,其戰略意義在于掌握和處理龐大的數據信息。大數據應用的核心是實時數據處理、實時決策支持,其戰略意義在于快速分析出數據的價值,讓價值發生作用,通過內嵌到業務流程中實現的數據價值的體現。
與傳統數據時代相比,大數據時代具有更為明顯的特征。一是數據體量巨大。從江西省核心征管系統數據情況來看,僅為TB級,是典型計算機硬盤的容量,而一些大企業的數據量已經達到EB量級。二是數據類型繁多。從稅務部門來看,大數據時代,不僅應包含征納信息、第三方信息等結構化信息,還應包括網絡、圖片等非結構化信息,不斷滿足稅收征管的需要。三是數據要求較低。稅務機關通過大數據平臺,對全體數據的分析,可以進行納稅人行為跟蹤、分析,進而獲取納稅人的納稅習慣、風險偏好等。因此,大數據時代數據量巨大,不完全依賴單一數據的利用價值,通過分析,既可以解決宏觀、中觀層面數據分析問題,還可以解決隨機抽樣解決不了的細節問題。四是數據處理速度很快。
(一)大數據時代稅收征管面臨的挑戰。
1.難以有效整合利用海量涉稅信息。
在大數據時代,信息資源日益成為重要的生產要素、無形資產和社會財富。近年來,稅收信息化建設取得了顯著成就,但是與日新月異的科技進步相比,與蓬勃發展的信息化浪潮相比,稅務機關面對海量涉稅信息常常顯得思路不寬、辦法不多、成效不大,甚至守著金山銀山般的信息也未能充分開發利用,運用信息管理稅收的能力明顯不足。
一是稅務系統內部各種信息整合不足。各種信息分散在核心征管業務系統、兩業管理系統、個人所得稅管理系統、行政辦公系統等各種系統中,缺乏有效整合。且各省之間、國地稅之間的系統都不相同,目前已在全國部分省市試點運行的金稅三期系統,將逐步實現全國稅收數據大集中,構建覆蓋各級國地稅、所有稅種、所有工作環節的全國性信息系統。該系統將于2016年3月在我省雙軌運行,要真正發揮大數據的作用尚需時日。
二是征納雙方信息不對稱日益凸顯。20世紀,美國三位經濟學家通過論證“檸檬模型”,得出了信息不對稱理論。按照這一學說,涉稅信息是征管的基礎和出發點,稅收征管中的信息不完整和信息不對稱會導致道德風險和逆向選擇的發生,進而導致稅款流失。由于相關制度的不完善及某些私人信息存在的必然性,稅務機關不可能掌握納稅人的所有真實涉稅信息。納稅人隱瞞收入甚至進行虛假的納稅申報的情況還在一定程度上存在,而稅務機關即使知道納稅人的申報不真實,但缺乏相關的舉證資料而陷入困境。
三是海量的第三方涉稅信息利用不夠。一方面,部門與部門之間數據和信息相互分割,形成信息孤島,財政、發改委、工商、房產管理、銀監會、證監會、保監會等相關部門和單位的各類涉稅數據不能有效共享互換;另一方面,對于互聯網上各類披露信息、媒體報道等缺乏系統的搜集、整合和分析,面對公開渠道的涉稅線索反應遲鈍。
2.傳統的征管方式不適應大數據時代的變化。
現行稅收制度和傳統征管模式難以應對企業生產經營的發展變化。一方面,工業經濟時代制定的稅收法律法規難以適應如今的數字經濟時代,跨國企業稅基侵蝕和利潤轉移(BEPS)問題日益嚴重。如目前多數高科技公司的主要收入已非實體產品銷售,更多的是專利授權等無形資產銷售。國內知名的互聯網BA T三巨頭(百度、阿里巴巴、騰訊),其大量利潤并不是來自于實體商品,而是來自互聯網增值服務、知識產權特許權使用費等。這些公司的產品本身就是數字化的。與實體經濟相比,高科技公司更容易將利潤轉移到低稅率國家或地區。在美國,屬于標準普爾500指數成份股的71家高科技公司在全球范圍內繳納稅收的比例平均比非高科技公司低1/3;另一方面,現有的管理手段與現代化、電子化、數字化時代特征不相適應。當前,由于社會信息化程度不統一,信息口徑不完整,既有結構性數據,又有非結構性數據,而稅務機關較為重視結構性數據,忽視非結構性數據,增大了稅收管理的難度。比如,網絡、微信、支付寶等電商信息還游離于稅務部門征管信息之外,稅務部門發票管理還難以包含項目、品名、規格、單價等字段,納稅評估、稅務稽查還更多的是依賴納稅人的紙質賬簿,許多地方納稅評估主要依靠經驗開展、流于形式。納稅服務還停留在較淺的層次,對納稅人的宣傳、咨詢、輔導,還處于單獨的、零散的狀態。但同時,由于信息來源、信息口徑不同,設備和信息的利用率極低,對信息只錄入、忽視分析整理和利用,造成信息嚴重堆積,共享性、開放性不足,管理效率較低,無法增值,成為死信息。
(二)大數據時代稅收征管面臨的機遇。
大數據時代背景下稅收征管面臨的機遇在于:隨著整個社會大數據時代的來臨,稅務部門的信息化水平和納稅人的信息化水平越來越高,納稅人網上申報與電子化申報的覆蓋率在逐步擴大,這為稅務機關在大數據時代背景下采集與利用納稅人數據提供了基礎,也為稅務機關信息管稅與征管模式創新提供了支撐。
1.運用大數據技術形成更為豐富的涉稅情報。
如果說信息欠發達是征管信息不完整和不對稱的主要原因,那么大數據有助于稅務機關全面掌握各類涉稅信息,進行稅源監控,實現稅收征管的目標。在大數據條件下,如果存在完備的涉稅信息獲取法律保障體系,稅務機關就可以對交易雙方、涉稅第三方乃至第四方的信息進行全面掌握分析,徹底解決信息不對稱問題。黨的十八屆三中全會提出要建立全社會房產、信用等基礎數據統一平臺,推進部門信息共享,這也為稅務部門獲取第三方數據提供了有利條件。
2.大數據幫助稅務機關實現管理的轉型升級。
數據價值在于它的使用,而不是占有本身。數據的價值也并非單純源于它的基本用途,而更多源于它的二次利用,其價值需要通過創新性的分析來釋放。稅務部門傳統數據模式下,由于數據處理速度慢,稅收數據分析具有滯后性和被動性,稅源監控和風險管理無法在事先和預前解決,往往事后進行懲處和補救,難以適應社會和納稅人的變化。而大數據時代,數據處理速度快,能夠較好地解決及時性問題,并且可以提前發現問題,及時向納稅人預警,防范稅收風險。稅收遵從度的高低,既與納稅人自身的稅收認知度有關,也與涉稅信息透明程度、稅收法治水平、社會氛圍等一系列問題密切相關。運用大數據構建的現代稅收征管體系應當是一個涉稅信息、數據沒有“死角”的征管體系。稅務機關可以對涉稅信息進行深度分析、對比、挖掘,從而有效提示風險、糾正偏差,使征納雙方間合作互信關系的建立成為可能。
大數據能夠為稅收風險管理提供詳盡的數據和技術支持,稅務機關運用大數據技術對涉稅信息進行過濾、分析、對比、甄別,避免稅款流失。此外,基于大數據應用實現風險管理智能化,通過納稅人“行為指紋”,可以對納稅人遵從行為進行預測,對納稅人遵從風險進行專業的分析識別,并提出及時的應對策略建議。因此,稅務機關要把握大數據時代的特點和機遇,推動稅收風險管理向縱深發展。
(一)將大數據理念融入稅收征管體系之中。
大數據不僅是信息技術的革新,更預示著稅收工作理念的轉變,必將對稅收征管工作產生深刻而廣泛的影響。為構建新的稅收征管體系,我們亟需樹立大數據的理念,將大數據理念貫穿于稅收征管改革和體系建設中。目前,各級稅務機關和稅務干部對大數據在稅收征管中意義的認知仍然有限,總體認識水平有待于進一步提高,需加強宣傳和引導,提升稅務機關和稅務干部對大數據戰略與相關技術的重視程度,從更深層次認知大數據。
大數據的應用能夠使稅務機關透過繁雜的征納現象甄別出深層次的稅收風險,有助于從整體上提高稅收征管質效。現代化的稅收風險管理必須以豐富的數據情報和先進的信息技術作支撐。龐大的涉稅數據是風險管理的基礎,涉稅信息越豐富,風險識別和風險評估的準確度就越高;功能強大、安全性高、操作性強的稅收征管信息系統是便捷化、智能化稅收風險管理的重要保障。從這一角度而言,稅收風險管理就是運用先進的信息技術系統從龐大的涉稅數據庫中找出存有疑點和風險的數據進行排除和應對,以防止稅收流失,提高納稅遵從度的過程。
(二)為大數據時代的稅收征管提供制度保障。
要發揮大數據優勢還需要完善征管法與相關針對涉稅信息的法律制度,為稅務機關獲取第三方信息提供法律支撐。《中華人民共和國稅收征收管理法》第六條對稅務機關獲取相關信息做了原則性規定:納稅人、扣繳義務人和其他有關單位應當按照國家有關規定如實向稅務機關提供與納稅和代扣代繳、代收代繳稅款有關的信息。但實際工作中,一些職能部門往往以保密為由,不給稅務部門及時提供第三方信息。當前必須以《稅收征管法》修訂為契機,在《稅收征管法》中對政府及社會職能部門向稅務機關提供的信息名錄進行細化,明確其范圍、內容、程序、方式、標準和時限,明確他們向稅務機關及時準確提供涉稅信息的法律義務和責任,為稅務部門獲取第三方信息提供法律保障,以便稅務機關充分地掌握納稅人生產經營情況,消除信息的不對稱,加強數據分析,強化稅收管理。
此外,為將電子商務有效納入大數據時代的稅收管理體系,還應適當補充電子商務方面的條款,明確電子商務模式中的稅制構成要素,厘清電子商務活動中征納各方的權責關系。
(三)大數據涉稅情報的實踐運用。
由于政府部門在占有數據上具有天然優勢,大數據技術受到各國政府的普遍重視和積極研究。不少發達國家已經在運用大數據,通過多渠道的數據采集和快速綜合的數據處理,增強治理社會的能力,實現技術創新、管理創新和服務創新。在美國,奧巴馬在入主白宮第一天就簽署了《透明和開放的政府》法案,之后又發布《大數據研究和發展計劃》,成立大數據高級指導小組,將大數據提高到國家戰略層面,投入超過2億美元資金用于研發“從海量數據信息中獲取知識所必需的工具和技能”。通過對各國政府部門大數據實踐的研究表明,大數據應用可以從5個方面提高公共管理水平:一是實現信息透明和共享,產生積極的經濟社會綜合效益;二是通過評估公共部門的績效,增強內部競爭、激勵工作表現,提升行政服務質量;三是增強公共服務針對性,提高工作效率和公眾滿意度,降低政府管理成本;四是用政務智能替代或輔助人工決策,提高行政決策效率,降低出錯成本;五是引導公共部門內外部創新,創造新的公共管理和服務價值。目前,絕大多數經濟合作與發展組織(O ECD)成員國均將大數據的手段和方法引入稅收管理領域,作為其實現稅收管理現代化的有效途徑。在美國,超過80%的聯邦稅收收入通過計算機系統實現電子申報和繳納。美國國內收入局(IRS)的分析師運用數據分析系統(D A S),可以同時選取并分析數百萬甚至上億個申報數據。通過觀察數據走勢、模擬環境和優化數據模型等方式選取審計案例,以往需要幾周或幾個月時間的審計選案工作,現在只需幾小時即可確定。在英國,皇家稅務與海關總署(H M RC)的分析師使用高端軟件程序Connect來識別和顯示風險。該軟件使用23個資源系統和81種文件格式,存儲著8億多個記錄。其數據收集和分析功能能夠排除地方差異的影響,揭示出全國性的趨勢和規律,使分析師輕松進行風險識別和排序,極大提高了選案成功率和單個案件產出率。澳大利亞國家稅務局(A TO)的稅源監控平臺與銀行、保險、海關等部門可自動進行信息交換、實現交叉稽核,并自動使用風險過濾器對所有大企業進行一年兩次的篩選。一旦風險過濾器篩選出風險目標,這些潛在高風險納稅人就會進入選案程序,由高級技術專家進行分析,運用他們的專業知識來預測潛在風險發生的可能性以及產生的后果。
2013年全國稅務機關利用外部涉稅信息通過評估查補等手段增加的稅收收入為1 048.12億元。其中,利用房地產業信息獲取稅收收入356.46億元,占34.01%;利用公共管理和社會組織信息獲取稅收收入352.71億元,占33.65%;利用金融業信息獲取稅收收入96.86億元,占9.24%;利用建筑業信息獲取稅收收入52.84億元,占5.04%;利用采礦業信息獲取稅收收入51.91億元,占4.95%。
(四)構建大數據平臺,實現對各類數據的綜合管理和應用。
數據分析界古老的“拇指法則”指出,數據分析工作至少有70%~80%的工作量花在搜集和準備數據上,僅有20%~30%的工作量花在分析本身上。因此要花大力氣加強基礎信息資源庫建設,全面搜集并整合納稅人基礎信息財務核算數據、生產經營數據、納稅申報數據、稅務管理數據和第三方涉稅數據,建立基于H adoop等分布式基礎架構的數據倉庫,發展云計算技術等高速數據處理技術。具體包括以下工作:
1.非稅務部門、非傳統渠道(主要是網絡分布數據)的數據收集、清洗。大數據時代稅收管理與政策分析的需求不僅僅限于稅務管理部門已有的信息系統獲得的征管和財務數據,而是需要整合更多來源的信息,包括其他政府部門等第三方提供的結構化數據和其他來源的數據,尤其是動態發展中的來自于信息網絡互動中的涉稅信息,以實現大數據時代所謂“數據”互聯的要求。
2.非結構化數據的結構化轉換。根據稅收政策和稅收管理的需要,按照工作中不同的數據粒度要求,對非結構化數據進行結構化轉換。
3.不同來源納稅人數據的匹配。不同來源的數據,必然存在著不匹配問題。數據匹配問題類似于經濟研究中數據的彌補和插值問題,以解釋不同來源數據的拼接,形成相對完整的數據信息全圖,并將最終形成大數據模式下的微觀納稅人稅收信息數據庫。
大數據時代需要對不同來源渠道的數據信息進行有效的采集、存儲、分析和應用,如果僅依靠手工導入和人工比對,勢必費時費力,而且對數據的采集、存儲、處理、分析和應用能力也存在不足,不能最大限度地發揮數據的作用。因此,需要搭建強大的信息處理平臺,對數據進行批量導入、集中存儲、自動關聯和分類應用,這樣可以實現第三方涉稅信息與稅收風險管理系統的有機融合,大大提高第三方信息的應用效率。這方面可以借鑒美國納稅人賬戶數據引擎的做法,充分運用大數據的理念和思維,在金稅三期工程中搭建一個功能強大的數據處理平臺,實現全國稅收征管數據大集中。
(五)創新數據挖掘分析方法,打造智能稅務。
對海量涉稅數據進行深度分析和挖掘,揭示數據當中隱藏的歷史規律和未來的發展趨勢,為稅收管理和決策提供參考。一般而言,常用統計分析方法分為關聯分析、序列模式分析、分類分析和聚類分析4種,這4種分析方法在稅收管理中都能發揮重要作用。例如,可通過關聯分析將財務核算系統與物流管理等生產經營系統進行群體比對,發現人為調節財務數據的問題;通過序列模式分析對納稅人歷年納稅數據進行線性回歸分析,預測下一年度的稅收收入,及時發現納稅人年度稅收收入異常情況;通過分類分析建立納稅人稅法遵從評價系統,結合納稅情況、生產經營狀況等信息對納稅人遵從度進行建模和識別,針對納稅人不同遵從狀況采取不同的風險應對策略;通過聚類分析將納稅人根據業務或者板塊設置分類型的數據參數進行數據分析,對稅收風險點進行分類管理。
(六)培養復合型稅務人員,滿足大數據稅收工作需要。
要根據大數據技術的需要,拓寬育人、用人視野。既要建立計算機、通信技術人才隊伍,又要建立信息管理、綜合規劃人才隊伍。前者為大數據提供技術支持,如構建網絡、開發軟件、維護系統,后者則負責統籌規劃、系統分析、管理制度設計等全局性工作。要進一步加大稅務系統內部計算機知識培訓力度,不斷進行新知識的培訓,以適應大數據征管的需要。
(作者單位:南昌市紅谷灘地稅局)