●胡曉北 岳書銘
淺析稅收風險管理中大數據技術的運用
●胡曉北 岳書銘
大數據(Big Data),又稱為巨量資料,指的是數據類別特別大的數據集,并且數據集無法用傳統數據庫工具對其內容進行抓取、管理和處理。狹義上來說,大數據也指舍棄隨機分析法或抽樣調查的捷徑,而對可能搜集采用到的所有數據進行分析處理。
隨著社會現代信息化步伐的不斷加快,大數據正逐步蛻變為現代社會基礎設施的重要組成部分,就像交通、水利、電力和網絡通信一樣不可或缺,并對經濟學、政治學、社會學和許多門類科學產生巨大的影響。目前,我國稅收風險管理的重要依據來自于大量的涉稅數據,稅收數據的采集和利用貫穿稅收風險識別、稅收風險評價等各個環節,將大數據理念引入稅收風險管理,確保數據信息的準確、完整、全面,并改變以往的數據應用思維,是提升稅務機關風險控制水平,提高稅收征管效率的必由之路。
提高數據準入要求,確保數據信息準確、完整,是開展大數據分析的基礎,海量數據的良莠不齊是大數據時代進行精確分析的一大難題。同樣,在稅收風險管理過程中,采集的數據信息是否準確和完整,直接影響著稅收風險分析的準確度和全面性,進而影響稅收風險處置和稅收風險評價的正確性,如果稅收風險識別所需的信息不完整、不準確,會使稅收風險管理的效率大打折扣。
目前,我國稅務部門釆集的涉稅信息主要來源于稅務機關征收采集和納稅人自行申報,涉稅數據信息采集范圍小,納稅申報表及附列資料的內容單一。在信息釆集的整個過程中,依靠的主要是納稅人自行填寫,稅務人員的指導很有限,因而納稅人的文化水平直接影響到涉稅數據的真實完整性。同時,稅務機關在工作過程中對歷史數據的導入、錯誤操作等行為也會產生大量的不規范數據、垃圾數據和缺失數據。部分辦稅員和管理員對涉稅信息的重要性認識不夠,稅收管理員隊伍老齡化現象較為嚴重,計算機應用水平十分有限,很多時候仍停留在紙上辦公,這與現代稅收征管工作的信息化要求有較大差距。這些不良因素帶來的涉稅數據采集不規范的問題,對涉稅數據的分析利用,乃至對征管質量都有不利影響,極易引發稅收風險。在實際工作中,數據信息采集不規范的問題時常發生,進入稅務機關核心征管系統中,如果查詢納稅人的登記信息,會發現有些納稅人的注冊資金空白或為0;有的納稅人的身份證號位數不對,14位、17位身份證號碼大量存在;有的納稅人的經營注冊地址不完整,沒有精確到街道門牌號等;有的企業法人或辦稅人員的聯系電話要么位數不對,要么為空,要么可以看出來明顯是編造的,甚至不同的納稅人用同一個電話號碼;除了以上這些納稅人填寫的基礎信息外,其他如車船產權、土地出讓、房屋產權、會計賬簿等附列信息采集也存在各種各樣的問題,這些信息基本上都是空白,沒有按要求填寫,甚至存在納稅人在后期辦理納稅申報時發現沒有稅種認定信息的現象。
大力推進稅源管理的科學化、精細化進程,要以全面、真實、準確的稅收數據信息為基礎。在稅收風險管理的實際工作中,高質量的基礎數據是工作的前提和關鍵。只有不斷提高基礎數據的準確、完整、可靠,才能保證稅收風險識別的精準性,為下一步的稅收風險評價和處置提供堅實可靠的依據。總體上看,可以從以下幾個方面努力把握好數據質量關:一是研究制訂科學合理的數據采集標準,提高信息接入質量門檻。嚴格的數據標準是確定數據是否合規的準則,是進行數據相關管理工作的基本規范要求。科學合理的數據標準對采集規范信息、錄入系統標準等具有實際操作指導性,有利于加強數據信息質量管理,也有利于數據交換和外部信息共享。當前正在運行的稅源征管信息系統對涉稅信息錄入要求較低,應逐步制定實施全省(市)統一的數據采集標準,用于規范和約束基層稅務機關工作人員的數據采集工作。二是完善征管數據審核審計子系統,建立數據審計平臺功能,總結歸納數據審計校驗規則,開發相應的數據審計軟件,加強對已采集數據邏輯關系的審核。通過該系統可以對已采集的數據進行完整性、全面性和邏輯性進行檢查,包括稅務登記、稅種認定、發票發售和驗舊、申報征收、稅務注銷等多個環節的數據審核,并制定統一數據格式標準,指定存放區域,全過程把好數據質量關。三是建立涉稅信息質量管理長效機制,加強涉稅信息考核管理。稅務機關電子稅務部門應安排專人對信息數據進行監控,并實行問責機制,將數據的準確性和完整性列入績效考核當中,切實引起稅務工作人員的重視。同時,加大對征管信息庫基礎數據的維護,及時清理垃圾信息,安排專人負責納稅人涉稅基礎信息的釆集和維護工作,建立電子數據信息釆集維護的長效跟蹤機制。
在過去很長一段時間里,準確分析大量數據是一種很難完成的挑戰,因為記錄、存儲和分析數據的信息化工具達不到要求,我們只能采集少量數據信息進行分析運用,即使目前突破了條件限制,在過程中仍會自然地將數據進行刪減,人為限制了數據量的搜集,但大數據時代中我們可以處理的數據量已經大大地增加,全面而龐大的數據可以讓我們對事情的看待更為準確和宏觀。同時,我們所處社會的關聯程度日趨復雜,個體不可能獨立于社會而存在,數據的記錄也是全方位全過程的,不存在任何死角,對蛛絲馬跡的線索運用將更為廣泛和普遍。
就目前稅務機關涉稅信息采集來看,普遍存在兩點局限:一是采集信息要求不高,納稅人填寫稅務登記表格時往往只需要填寫部分內容,大部分表格都是以空白形式存檔,對涉稅信息采集只求局部,不追求全面;二是采集信息途徑單一,信息來源往往僅限于納稅人本身,以及國稅、地稅、工商、銀行等少數部門之間簡單的信息交換,而不是實現真正意義上的信息共享。稅收風險管理從本質上來講就是對納稅人進行信息采集和審核,如果納稅人有關的所有信息很難采集完整,不利于對納稅人進行風險分析,極易引發涉稅風險。反之,稅務機關對企業的生產銷售情況了如指掌,運籌帷幄,將會不再局限于“管中窺豹”。以房地產行業為例,企業銷售未完工開發產品取得的預收收入,應按預計計稅毛利率(15%、10%、5%、3%)分季(或月)計算出預計毛利額,計入當期應納稅所得額。開發產品完工后,企業應及時計算結轉計稅成本,計算此前銷售收入的實際毛利額,同時將其實際毛利額與其對應的預計毛利額之間的差額,計入當年度企業的應納稅所得額中。如果房管局的信息可以與稅務機關共享,那么企業預售房屋收入的準確性就有保障,大大降低少計收入風險;如果國家土地儲備中心的信息可以與稅務機關共享,那么企業的土地成本就可以準確計算;如果銀行的信息可以與稅務機關共享,那么企業賬外收入的情況就有跡可查;如果自來水公司、供熱公司、電力公司的信息可以與稅務機關共享,那么企業配套設施建設費用就能一目了然,等等。
在歐美國家,信息化技術發展較快,信息采集和共享制度比較完善,稅務機關可以采集利用到比較全面的企業涉稅信息。如澳大利亞稅務局已經建立完善了納稅人的基本信息資料庫,這些數據的來源包括進出口管理部門、銀行等金融機構、移民管理部門、股票交易市場、房產土地部門、車管部門等,使得它的風險管理系統能夠運用大量的外部相關信息進行多角度、全方位的綜合性分析,風險評價的準確性得到極大的提高。因此,我國各級政府部門應借鑒國際稅收先進經驗,打破部門之間存在的“信息壁壘”,逐步建立以地方政府為主導,各相關部門協作配合的公共部門信息共享平臺,將住房與城鄉建設委員會、房屋管理局、人民法院、財政局、海關、審計局等政府機關,及銀行、各行業協會等機構,包括電視、網絡等新聞媒體吸納進來,制定規范統一的數據交換標準,建立便捷暢通的信息獲取渠道,充分利用電子網絡快速獲取所需的數據信息,確保各經濟實體的相關涉稅信息都能及時準確地納入稅收風險管理系統,為開展稅收風險識別和稅收風險評價提供可靠、有效的信息來源。同時,應不斷提高稅務機關內外部信息共享協作機制的運行效率,達到及時發現風險、及時處理問題的效果,更好地解決稅收工作中征納雙方涉稅信息不對稱問題。建議政府將第三方信息共享平臺納入各部門目標責任制考核內容,防止“自比自劃”的情況發生,確保責任單位間達成共識,保證數據的充分、及時、有效共享。同時,各稅務部門需要狠下力氣,從上至下打破內部之間職責相對獨立的弊病,整合辦公系統軟件,對信息采集進行統一規劃和科學分工,形成一種長效的交流反饋機制,努力拓展和暢通信息獲取渠道,做好稅務系統內部信息的比對工作,充分發揮已有涉稅信息的最大化采集利用。
一直以來,我們總是習慣把提取樣本、分析樣本、制定模型、模型運用等流程,當做分析和解決問題的基本思路。但是通過模型的制定,以部門代表全體的方法只是基于少數樣本的選取,代表性沒有根本保障,同時該方法的運用也會因為對象個體的差異性而受限,具有一定的局限性。如今,技術環境已經有了很大的改善,在大數據時代我們可以對每一個樣本進行分析,制定出針對個體的指標體系,從而進行精細化的監督和管理。當然,在某些特定的情況下,我們依然可以使用模板分析法,但它正逐步被“私人定制”散發出的光芒所掩蓋。
在稅收風險管理工作中,我們期望能夠通過部分企業的風險管理總結開發適用于某一行業或具備某些相同特征的企業的風險管理模型,對模型的制定往往投入很大的精力,模型建成后又以該模型為樣板,推廣應用到該行業的風險管理中,并期待著良好的效果,以求達到畢其功于一役的目的。這種以樣本推測總體,以部分代表全部的思維模式,已經逐步顯露弊端。同一行業中的每個企業都是獨立的個體,出現的問題各不相同,均有其自身的特殊性。以房地產行業為例,僅其未按預計計稅毛利率確認收入一項,各企業的處理就存在很多差異:甲公司將預收房屋款項計入其他往來款中,未按計稅毛利率計入當期應納稅所得額;乙公司預售收入2010年仍按15%計稅毛利率計入當期應納稅所得額,而法規規定2010年應按25%預征利潤率計算應稅利潤,出現10%的差額未計入企業所得額;丙公司的情況則是自2004年至今一直按照預計毛利率進行預繳,開發產品完工后仍未結轉成本收入。相比而言,不同的行業之間則更加沒有可參照性,所得稅法規定房地產企業銷售未完工開發產品取得的收入計入預收賬款,這與其他的行業企業的稅務處理有著天壤之別。
前任蘋果公司總裁喬布斯治療癌癥的過程對這種“私人定制”思維在現實生活運用十分具有代表性。醫生將喬布斯身上所有DNA和腫瘤DNA進行排序,進而得到了整個基因密碼的數據文檔,然后基于他的特定基因組成,按所需的效果有針對性地進行治療。在治療過程中,如果癌癥病變導致所用藥物失效,醫生就及時更換另一種藥物繼續救治。雖然最終沒能治愈,卻已將他生命延續多年,這已然取得了巨大的勝利。同樣的,作為稅務部門,我們所做出的每一個行業模型不可能完全適用于每一個企業,就像是產生于樣本實驗中的醫療藥物不一定適用于相同癥狀的病人一樣。我們應該尊重企業情況的特殊性,在行業特征的指導下,對所有企業的信息進行系統分析,制定出適用于該企業自身的稅收風險管理體系,而不是單單依靠模型中的通用指標測算。假設稅收風險管理工作單純按照某種特定模型去進行工作流程,結果必然會出現因為忽視企業特殊性的存在而忽視更大的稅收風險點。這就需要我們在稅收風險管理過程中,注重不同企業的特殊性,考慮到更多的因素,在充分利用大數據的情況下尋找更具客觀性、實用性、針對性的數據分析方法,樹立更具開創性的數據使用理念。
(作者單位:山東農業大學經濟管理學院)