【摘 要】 隨著移動互聯網不斷發展,大數據時代的到來,信息量不斷增加,利用數據挖掘技術從大數據中實現對個人、企業有意義的信息挖掘具有重要的現實意義。本文介紹了數據挖掘技術的邏輯,結合我國現在稅務管理發展存在的問題,對數據挖掘技術應用于稅務管理的可行性進行分析。同時根據我國在稅務管理發展過程中數據挖掘技術應用的實際情況提出了相應的對策與建議。
【關鍵詞】 數據挖掘 大數據 稅收管理
一、數據挖掘的邏輯
數據挖掘的邏輯結構是在數據挖掘過程中,首先對數據進行預處理,然后實現數據挖掘,并通過相應的算法對結果進行評估和表達,然后提取有價值的信息。
一般來說,數據挖掘的數據分析過程分為五個步驟:(1)數據準備。在此階段,用戶將從操作環境中提取和集成數據以解決語義歧義問題。(2)數據選擇和預分析。對用戶的歷史行為數據和當前操作數據進行集成,刪除無用數據并對其進行預處理以進行數據挖掘。(3)數據挖掘。在此階段,綜合使用四種數據挖掘方法來分析預處理數據并提取相關特征和規則。(4)表達。捕獲的特征和規則以易于理解和觀察的方式反映到系統中。(5)評價??梢栽u估數據挖掘后的情況。如果可以有效地評估它,則表明它是成功的。否則,可以重復上述過程直到獲得滿意的結果。
二、大數據時代我國稅務管理中存在的問題
1. 納稅人數據收集意識淡薄。在大數據時代,經濟社會的信息化水平高度發展,這雖然促進納稅人的生產經營活動,但是部分企業對稅收數據信息收集的重要性的認識仍然不夠,從而使得企業的財務管理部門對稅收數據收集和組織意識不強,而且沒有足夠的稅收數據統計、分析能力,從而對政府的稅收管理能力提出挑戰。
2. 專業從事稅務管理人員的缺失。當今時代最缺乏的資源是人才,當今我國社會的高速發展使得對各種專業人才的需求力度加大。但是目前我國專業從事稅務管理的人員數量與我國經濟發展速度不匹配,從而不能有效、及時地貫徹最新政策。同時,信息化時代的發展,要求從事稅務管理的人員要不斷的學習新知識才能跟得上時代發展的要求。但是目前我國稅務管理人員素質參差不齊,不能完全滿足這一要求。
三、數據挖掘技術應用于稅收征管的可行性分析
數據挖掘是在人工智能的基礎上不斷發展起來的。數據挖掘系統中使用的技術越多,結果就越準確,從而對問題的分析就越透徹,就越能抓住問題的本質和關鍵。然而,無論采用哪種技術,數據挖掘分析方法都可以在功能上分為四種方法:關聯分析,序列模式分析,聚類分析和分類分析。
1. 關聯分析。關聯分析的主要目的是挖掘潛藏在數據之間未被發現的關系。在給定一組項目和記錄集后,通過分析記錄集來推斷項目之間的相關性。金稅工程和綜合征管軟件中的每個應用模塊都有相應的管理關系,但不能直接相互間的關聯比較。我們可以根據征管業務的不同需求,針對異常發票繳銷,小規模納稅人備案狀況,納稅人倉儲類審批,納稅人逾期申報和辦理稅務登記等問題, 利用不同的工具軟件和技術手段,將兩組數據進行對比,從而增強對納稅人的管控能力。
2. 序列模式分析。序列模式分析的主要目的也是挖掘數據之間的潛在關系,但序列模式分析側重于分析數據的前后關系。在做出決策之前,決策者通常需要從歷史數據中了解相關對象的規律和趨勢,并對未來做出預測。
3. 聚類分析。聚類分析的輸入集是一組未標記的記錄,即此時輸入記錄未被分類。目的是根據集群分析工具定義規則合理劃分記錄集,并以顯式或隱式的方式描述不同的層次。由于聚類分析法可以采用不同的算法,因此可以將同一組記錄劃分為不同的類別。
4. 分類分析。分類分析以一組記錄和一組標記作為假設。在分類分析時,首先為每個記錄分配一個標記,即根據標記對記錄進行分類,然后檢測這些標記的記錄以描述這些記錄的特征。
四、對策與建議
為了更好地將數據挖掘技術應用到稅收管理工作中,除了現有的各項物質和技術條件外,在大數據時代我國稅務管理的發展應當從以下幾個方向開展,以期發現各種稅務數據深度蘊藏的價值信息,更好的支持稅務管理工作。
1.加強數據質量管理,搭建數據挖掘平臺。要想運用數據挖掘技術深化稅務管理的改革與發展,就要保證被挖掘數據的真實性和完整性。針對我國稅收征管信息系統數據庫中現有部分數據不全不實的現象,要加強對數據質量的管理,為稅務管理工作搭建有效的數據挖掘平臺。
2.設計新型稅收管理體系,使數據挖掘流程標準化。現行稅收征管系統已經很難滿足信息使用者對稅務信息的一般使用要求。信息使用者往往需要對可以方便獲得的稅收信息進行再次加工和更深層次的挖掘。此外,由于不同的信息使用者之間的信息資源不能共享,造成了資源的浪費。因此從社會經濟的角度出發,大數據時代的稅務管理的發展應該要考慮到使用者對于稅務信息的需求,在稅收分析模塊中引入適當的數據挖掘流程。
3.增加數據挖掘模塊,完善稅收信息系統建設。當前我國建設完成并推廣使用的金稅工程系統和稅收征管信息系統均著眼于稅收收入的征管監控,金稅三期決策支持子系統中有關稅收分析的模塊有待加強。為了加強稅收管理工作,在我國稅收信息系統的不斷完善和發展的過程中,包括稅收分析在內的各個管理環節終將成為稅收信息系統的重要組成部分。
從稅收征管的角度出發,為方便稅收征管工作人員,提高其工作效率,降低稅收征管工作成本,可以在金稅三期的管理決策平臺中嵌入數據挖掘的子模塊,裝入適當的數據挖掘算法,需要時可調用其進行數據處理和管理。將數據挖掘算法固化到稅收征管系統的模塊中還有助于進一步標準化稅收征管工作中的數據挖掘流程。
【參考文獻】
[1] 朱林,周鈺桐.大數據時代下企業稅務管理工作創新研究[J].金融經濟,2018(20):201-202.
[2] 陳星潼.區塊鏈技術在稅務管理中的路徑分析[J].上海管理科學,2018,40(06):105-109.
[3] 邵鐵如.試論企業稅務管理中存在的問題及優化建議[J].現代經濟信息,2017(23):208.
[4] 天津市地方稅務局課題組,于眾,陳杰,劉穎,張磊,于學深.數據挖掘方法在稅收風險管理中的應用研究綜述[J].天津經濟,2016(06):51-60.
作者簡介:陳靜宇(1997—),男,江蘇盱眙人,安徽大學經濟學院碩士。