張 翼,陳清晰
(廈門市同安區國家稅務局,福建 廈門 361100)
關于稅收大數據深度分析應用的探索
張翼,陳清晰
(廈門市同安區國家稅務局,福建 廈門 361100)
近年來,隨著大數據技術的普遍應用,國稅機關結合稅收工作也開始涉及大數據處理分析。國稅系統將原來的單機報表逐步調整到現在的省局集中處理,實現了信息的充分共享,隨之而來的就是數據的激增。在這種情況下,對稅收數據進行大數據的深度分析應用,可以為決策者提供數據支撐,輔助決策。
稅收;大數據;分析;思考
稅收信息系統經過了四個發展時期,逐步趨于完善,分別是單機報表處理、分局集中征收、市局集中征收和省局集中征收處理(上海和西藏除外),目前正處于大數據集中管理這個階段[1],隨著稅收數據的激增,其利用度將得到大大的提高。
進行稅收大數據的深度分析應用需要滿足兩個基本條件:一是稅收數據在數量上要形成規模,這樣才能在大量離散的數據中找到規律;二是大數據的分析技術要成熟,可以對海量數據實現深度的分析應用。結合信息發展的情況來看,這兩個條件已經具備,稅收大數據實現了省局的高度集中,為深度分析提供了基礎的海量數據;大數據分析挖掘技術的快速發展,為稅收大數據的深度分析提供了技術保障[2]。因此,稅收大數據深度分析應用是稅收信息化發展的必然要求。
王向東和王文匯[3]等人指出隨著大數據時代的來臨,我國現行的“管事制”模式受到了嚴峻的挑戰,逐漸陷入困境,面臨轉型壓力。因此,數據處理成為了現階段著重要解決的問題,沙亞清等[4]和張社安[5]在大數據的環境下,分別構建了稅收應用的新格局和稅收共治格局,對大數據分析有借鑒意義。孫開和沈昱池[6]更是將大數據看作是現代稅收征管體系構建和完善的助推器,任東飚[7]和白子千[8]等人利用大數據的技術手段對稅收管理進行了探析。除此之外,周詠琦[9]還對電子商務的稅收管理進行了剖析,在大數據的背景下,不僅許多互聯網企業信息都可得到共享,而且可運用大數據思維,對電子商務稅收征管通過大數據進行統籌管理。
(一)內涵
大數據分析,不是采用抽樣調查法來分析數據,而是分析所有掌握的數據,從中得到有序的、可信的、有效并能被應用主體理解的高級數據處理技術。大數據分析的過程主要包括前期的數據收集,數據整理和后期的定量和定性分析。
稅收大數據的分析就是依照科學管理的要求,結合大數據分析技術,實現用數據來分析指導稅收工作,通過對海量數據的挖掘,總結現有的稅收管理現狀和存在的問題,預測發展趨勢,為稅收管理提供數據支持,改進稅收管理工作[10]。
(二)方法
1.數據質量檢測分析。數據質量檢測分析方法主要有關聯分析法、聚類分析法等。關聯分析法是根據數據之間的關系,建立數學模型,篩選出異常的數據,可以用在對納稅人申稅情況、納稅人入庫級次核定、逾期申報和辦理稅務登記等問題的分析。聚類分析法是對所有得到的數據進行歸類,建立分析模型,從而發現有問題的數據,可以用在對納稅人進行年審時等問題的分析。
2.稅收收入分析。稅收收入分析方法主要有三種,分別是:回歸模型預測、時間序列預測和對比分析,這三種方法相結合可以判斷納稅人收入的相關增長情況與經濟發展的協調關系,指導納稅組織收入工作。
3.宏觀經濟稅收分析。宏觀經濟稅收分析方法主要有三種,分別是彈性分析法、同行業稅負比較法、宏觀稅負分析法,通過這三種宏觀層面的分析,可以了解到較長時間內稅負的變動情況,分析研究行業稅負的不同,更好地把握稅收來源情況,為宏觀調控提供數據支持。
4.微觀稅收分析。微觀領域的稅收分析一般有三種,分別是:單一指標預警法、多項指標預警法和數量經濟規模估算法。通過微觀領域的稅收分析,可以發現存在問題的企業,在稅務稽查方面發揮了重要作用。首先是單一指標預警,為稅收分析的各項指標設定預警值,然后用被分析企業的各項指標與預警值逐一對比,找到存在問題的數據,也就意味著被調查企業在這項指標所反映的稅務方面存在問題。多項指標預警與單一指標預警的方法很相似,同時選取了多項分析指標建立綜合分析體系,可以從多方面進行分析,并找到其中的關聯性。數量經濟規模估算是典型的定量分析法,利用微觀經濟學的相關數學模型對企業的經營情況進行模擬,估算出企業應繳納的稅額,與企業實際繳納的稅額進行比對,尋找存在偷稅漏稅情況的企業,但同時這種方法的工作量巨大,需要大數據技術的保障[11]。
(三)稅收大數據深度分析的意義
稅收大數據深度分析應用主要有四方面的重要意義:一是科學指導稅收工作,通過稅收大數據的深度分析與應用,可以發現稅收工作中存在問題的薄弱環節,從而制定相應的改進措施,將以往靠政策監管的現狀改為靠“數據說話”,提高稅收管理的科學性。二是加強稅源管理,通過微觀領域的估算,可以對主要企業的稅收總額進行估算,從根源上加強對企業的監控管理,為納稅評估和稅務稽查提供基礎數據,提高稅源管理的精細化。三是加強執法監督,通過稅收大數據的深度分析應用,可以及時總結稅收工作中的不規范問題,從而實施責任追究,加強執法的規范性,提高稅收服務水平。四是加強質量考核,通過稅收大數據深度分析應用,可以對數據收集質量、處理質量和執法質量進行量化,使稅收管理向數字化的方向發展,為稅收評估和工作績效考核提供依據。
(一)數據挖掘的主要步驟
1.數據收集。海量豐富的數據是進行數據挖掘的首要條件,所以數據收集是數據挖掘的第一步,數據可以從現有的稅務系統中直接獲得,也可以通過數據倉庫獲得。
2.數據整理。收集到的數據中,可能存在有問題的數據,所以要簡單地進行處理,從而在原始的數據基礎上得到更為可信的數據信息,為下一步的工作做準備。
3.數據挖掘。這是最重要的一個環節,要對收集整理后的數據通過各種方法進行深度分析,常用的方法有遺傳算法、神經元網絡、決策樹和OLAP聯機分析等。數據挖掘的的工具主要有兩類:一類是專用數據挖掘工具,可以針對某個特定的領域充分考慮數據需求的特殊性,提供優化解決方案;另一類是通用數據挖掘工具,可以處理常見的數據類型,提供通用的處理模式,如回歸模式、時間序列模式和關聯模式等[12~14]。
4.數據挖掘結果評估。進過數據挖掘得到的結論很多,但是有些跟我們要研究的內容不符,所以要對結果進行評估,進而調整數據挖掘模型,重復進行數據挖掘。
5.分析決策。數據挖掘的最終目的是幫助決策者做出決策,決策者可以根據數據挖掘的結果,結合實際情況,做出戰略決策。
(二)數據挖掘的主要任務
1.數據總結。數據總結是對數據的一個濃縮整理過程,對數據進行綜合描述,將數據庫中關聯的數據從個體總結到總體層次上,實現對原始數據的總體把握。
2.數據分類。通過分類器(分類函數或者分類模型)將基礎數據根據屬性分到不同的組中,并找到同組數據的屬性模型,利用該模型分析已有的數據并預測新數據將屬于哪一組。
3.關聯分析。關聯分析可以找到一組數據隱藏的關聯網,但這種關聯度具有不確定性,所以在進行關聯描述時要確定置信度,從而反映數據的關聯強度[15]。
4.聚類分析。當某些數據通過分類器分不到任何已有的組中時,可以選擇聚類分析,將這些數據按照某種相近程度聚類成一類有意義的子集合,每一個子集合的數據屬性相似,但不同子集合之間的數據屬性相差很大。
稅收管理已進入大數據時代,要想在海量數據中尋求規律,為稅收管理工作提供數據支撐,就必須掌握科學的分析方法,再結合數據挖掘技術和大數據思維模式,實現用數據說話,從根本上加強稅源管理和稅務監督。
[1]王海森.關于稅收數據深度分析應用的思考[J].信息技術與信息化,2007,(8):25-28.
[2]和家鳳,何少武.大數據時代的納稅評估信息采集模式[J].財經理論與實踐,2015,(3):98-98.
[3]王向東,王文匯,王再堂.大數據時代下我國稅收征管模式轉型的機遇與挑戰[J].當代經濟研究,2014,(8):92-96.
[5]張社安.依托大數據,構建稅收共治格局[N].中國稅務報,2016-03-23.
[6]孫開,沈昱池.大數據——構建現代稅收征管體系的推進器[J].稅務研究,2015,(1):96-99.
[7]任東飚,費銘海,袁明昌.稅收數據在大數據中的利用探析[J].稅務研究,2015,(10):25-28.
[8]白子千,李晶晶,杜嘉.試析大數據時代的稅收管理[J].企業改革與管理,2016,(4):11.
[9]周詠琦.大數據對電子商務稅收征管的影響[J].經營與管理,2016,(4):15-17.
[10]李淵.大數據時代強化稅源管理的思考[J].經濟論壇,2016,(3):123-128.
[11]Power DJ.Using“Big Data”for analytics and decision support[J].Journal of Decision Systems,2014,(2):222-228.
[12]夏琰.基于數據挖掘技術的稅務數據倉庫應用平臺建設[D].杭州:浙江工業大學,2012.
[13]許藝.基于數據挖掘的零散稅收預測研究[D].武漢:武漢理工大學,2013.
[14]張升文,張少仲.數據倉庫、數據挖掘和OLAP分析及其應用實例[J].危機發展,2002,(1):22-23.
[15]劉以堂,張述成.關聯規則在稅收征管中的應用[J].科技創新導報,2012,(17):27-28.
[責任編輯陳麗敏]
F810.42
A
1673-291X(2016)22-0073-02
2016-07-16
張翼(1966-),男,福建惠安人,局長,工程師,碩士,從事大數據開發與應用、稅收理論、稅收籌劃研究;陳清晰(1974-),男,福建廈門人,政策法規科科長,碩士,從事大數據開發與應用、稅收理論研究。