今年3月5日,李強總理在政府工作報告中提出:“深化大數據、人工智能等研發應用,開展“人工智能+”行動,打造具有國際競爭力的數字產業集群。”面對新要求,稅務部門應積極應對人工智能對于經濟活動和涉稅行為的影響,并踐行“人工智能+稅收”模式以提升征管服務水平。本文從“人工智能+稅務”內涵,及其對稅收征管的變革影響、存在的挑戰、運用場景等方面提出前瞻性思考。
“人工智能+稅務”模式的內涵
(一)人工智能的內涵
廣義的人工智能指計算機和程序“學習和理解事物、處理問題并做出決策的能力”,通俗地說就是“學習知識”和“應用知識”的能力。中國科學院院士、清華大學教授張鈸提出:“……第二代人工智能則主要用了數據、算法和算力三個要素。為了克服人工智能的固有缺點,唯一的辦法是把知識、數據、算法和算力這四個要素同時運用。”據此,從構成看,人工智能應包含知識、數據、算法、算力四個要素。
(二)當前開展“人工智能+”行動的現實基礎
目前以自然語言大模型為代表的第三代人工智能,使人類看到了通用人工智能(AGI)的曙光,即計算機具備了遷移學習、推理規劃、自然語言等能力。這種“類人”和“通才”的基礎大模型,使人工智能的實用門檻降低到可普及的水平,同時使應用效果和成本可明確預期,這是開展“人工智能+”行動的先決條件。
從技術成熟度看,目前的人工智能已部分具備達到甚至超過人類的能力,達到了大規模應用的標準。按目前的技術發展速度,未來2至5年將誕生通用“專家”(在多數任務中超過90%的人類),并產生與之匹配的“世界模型”和具身智能(智能機器人)。
(三)“人工智能+稅務”模式的定義淺析
“稅務+人工智能”模式指采用人工智能技術提升稅務工作效率和服務水平,關注人工智能技術在某些場景、某些環節起到降本增效的作用。“人工智能+稅務”模式指以人工智能技術為基礎建立全新的稅收管理和服務體系,更關注人工智能技術的基礎性作用和對現有管理模式進行重塑。以定義的方式來說,“人工智能+稅務”模式是以人工智能技術為基礎稅收管理體系,它圍繞“數據”和“知識”建立人工智能學習和應用的框架,在各類場景中通過應用程序形成人和智能系統的分工合作,依托新的分工方式配置管理資源。
“人工智能+稅務”模式對稅收征管的變革影響
(一)方法變革
人工智能與傳統的信息化方法有本質區別。“數據+規則”方法以人總結和提出的“規則”驅動程序運行;而人工智能既包含了產生“規則”的過程,也包含程序運行的過程,甚至程序的形態也不再是“崗位、環節、表單”,而是智能體和人的交互和協作。
按技術劃分稅務部門人工智能的應用領域,大致可分為自然語言處理和與數據分析兩方面。自然語言處理領域包括咨詢服務、法規庫檢索、業務辦理和審核、數據統計和查詢、系統運維和網絡安全等。數據分析領域包括風險分析和建模、稅收收入預測、政策效應分析、宏(微觀)經濟分析等。
自然語言處理領域,主要是優化基礎大模型以適配具體業務場景,結合知識圖譜進行“知識生產和應用”,將“通才”變為“專才”。稅務部門無必要也無能力訓練專有的自然語言大模型,應基于研究機構開發的大模型進行適配。
數據分析領域,由于還沒有蘊含較全面的經濟活動數據的基礎大模型,稅務部門作為“開拓者”需要自行開展人工智能建模工作。從計算和應用效率看,通過建立時間序列數據類型的“稅收—經濟”大模型,采用大模型的“預訓練+優化”模式,賦能宏觀的收入預測、經濟分析和微觀的風險識別和分類管理,能更充分發揮海量數據價值,為稅收管理、經濟治理等提供實證工具和動態感知能力。
(二)管理變革
從管理變化的趨勢看,大數據和互聯網技術破除了“數據孤島”,數據不再專屬于某一部門,稅收數據體系優勢逐漸被發掘;而人工智能技術將破除“知識孤島”,政策標準和管理知識也將不再專屬于某一部門,稅收管理集成的優勢將逐步顯現。
從分工上看,將有部分人員專門從事“知識生產”活動,如構建政策知識圖譜、對涉稅風險進行數學建模、分析專家經驗并嵌入智能模型等;一部分人員專門從事數據準備活動,根據智能模型訓練的需要標注數據;另一部分人員則偏重應用智能化應用完成工作,同時需要提出優化意見。這種以人工智能建設和應用為中心的分工方式,將逐步改變現有的管理格局。
“人工智能+稅務”模式對稅收征管的挑戰
可以預期的是,“人工智能+稅務”模式對傳統稅收征管將帶來顛覆式變革,未來一段時期,稅收征管改革實踐中需要克服很多困難,而認知和行動決定了實踐的進程。
(一)需要人才支撐
人工智能是一個以計算機科學為基礎,由計算機、心理學、哲學等多學科交融的交叉學科。開展人工智能實踐工作,首先需要具備豐富的業務經驗,能夠準確定義有待解決的問題;其次需要具備與業務有關的學科知識,包括會計、法律、經濟、管理等,能夠提出解決問題的科學路徑;再次需要具備一定的數學基礎,能夠理解、應用或建立數學模型,將解決路徑抽象為數學問題;最后需要具備人工智能知識和經驗,能夠選擇或創造人工智能模型,找到應用數據解決數學問題的方法。
(二)需要自建算力
出于數據安全的要求,稅務部門需自建算力(目前國產化算力設備基本可以滿足需要)。算力是開發和使用大模型的基本條件,部分算力需求是相對可控的:一是自然語言處理領域,大模型需要在適配不同業務場景時進行優化和裁剪,單次訪問算力需求較小,總體訪問需求與同時使用的用戶數量直接相關,即需要滿足高峰時段的運行;二是數據分析方面,“稅收—經濟”大模型預需求算力較大,且模型建成后還需要持續更新數據,但適配到單一場景后算力需求較小,用戶數量較少并可分時段運行。
(三)需要可控運行
大模型幻覺問題是目前的技術硬傷,與知識圖譜融合是實現可控的主要手段。以大模型為代表的深度學習技術基于連接主義的原則,過程是“黑箱”,能力靠“涌現”(不能完全解釋原因),結果有概率,更適合處理隱性知識、發掘潛在規律、生成創新成果。以知識圖譜為代表的本體語言技術基于符號主義的原則,抽象且明確的實現邏輯推理,過程可見可追溯,能力有上限但可控,結果明確可再現,更適合處理顯性知識,應用已知規律推演確定結果。以稅收法律為主建立知識圖譜,或者融合到大模型預訓練過程中,或者作為顯性知識在過程中調用,都能一定程度上實現大模型結果可控、政策推理可溯源。
(四)需要配套機制
目前的自認語言大模型的智能化水平在初級到中級階段,在各類稅收場景中不可能直接使用,需要根據場景的具體要求分別適配,形成小而靈的專用模型,或者再合并形成混合專家模型。由于建立、維護、優化人工智能模型是一種全新的工作模式,需要配套的工作目標和管理方法。
目標方面,需要將知識圖譜建設和數據標注積累作為重要工作事項。知識圖譜是可控的前提,而數據標注是機器學習的基礎。圖譜和標注的質量非常依賴業務專家的能力和數量,專家需具備長期積累的經驗和知識結構化的能力,并在標注中能夠理解模型的特點和需求。在模型運行過程中,持續的迭代優化也需要新增標注數據以完成遠程監督和強化學習。
管理方面,需要建立一套創新機制和工作方法,源源不斷的產生大批模型的研究和實驗成果,以替代現有的工作模式,甚至創造全新的工作理念。為使這一進程更規范、更可控,應建立人工智能創新平臺進行管理,尤其是對用于深度學習和大模型訓練的數據進行管控,但同時也需要提供各類安全可控的模型開發工具。為激發稅務部門創新活力,還需要相應的機制鼓勵有序的創新,并對模型的實用性進行交叉評估。
“人工智能+稅務”模式征管應用場景展望
“人工智能+稅務”模式是一個以創新持續推動業務變革的過程,需要在現有各類業務條線建立示范型的應用,兼顧業務需求與技術方向,“優中選優”確定總體實施路線。筆者從相對宏觀的視角將業務場景分類下列類型,并作以下初步展望。
(一)以“人工智能+法規”建立核心知識圖譜
法規知識圖譜是“人工智能+”體系的知識樞紐和控制中心,一個涵蓋全稅種、全政策的圖譜是提升執法能力的關鍵。從業務角度看,在場景中完成業務識別和定性后,按政策邏輯推理和取得結論均需在圖譜上完成。從技術角度看,應用圖譜可降低程序中大模型的占比,增強結果的確定性。就法規部門工作來說,知識圖譜的管理過程與日常工作密切相關,如重案審理中涉及到稅務以外的法律銜接,可表現為知識圖譜的知識融合和語義消歧過程,這一過程可發現條款沖突和概念差異。
(二)以“人工智能+納服”優化辦稅咨詢
辦稅方面,業務融合和自動計算是自動辦稅的頂點,智能辦稅則可以再進一步,即納稅人的部分業務不再需要填寫表單,而是直接上傳附列資料(包括視頻、圖像、語音、文字等),由人工智能工具完成資料類型判斷和內容識別,結合知識圖譜完成數據結構化后嵌入自動辦稅所需的表單。咨詢方面,結合大模型的多輪對話能力和知識圖譜的政策推理能力,可建立響應及時、答復專業、能力全面的咨詢問答體系“第一道陣地”,滿足全社會對于稅收知識的“面”上需求,與精準服務的“點”上需求形成互補,優化納稅服務資源配置。
(三)以“人工智能+工作助手”建立工作新模式
采用人工智能體(Agent)技術,為稅務人員建立工作助手,在各類工作場景中提供多樣化的支持。如在政策檢索時提供與納稅人相似的問答和圖譜推理,在審核時提供智能識別和判斷,在跟蹤納稅人行為上(如更正申報)及時提醒,在日程安排上提供規劃和統籌建議,在文稿撰寫方面提供輔助等。智能體的使用記錄,也有助于分析一線工作中的政策熱點、難點,各類工作對時間的占用等情況,可用于優化工作部署和人力資源配置。
(四)以“人工智能+代碼助手”提升數據資產應用
運用自然語言大模型的生成代碼能力,在已有的數據管理平臺上,建立智能化查詢和分析工具庫。如實現一句話經濟分析、一句話風險分析等功能,降低數據資產的應用門檻,激活“從數據尋找規律、用數據創造價值”的思考和實踐。
(五)以“人工智能+征管”建立動態感知體系
運用大模型和知識圖譜技術,綜合宣傳、審核、評估、稽查等多種管理行為,針對單一主體、相關主體、分類主體、地區主體等進行全面動態跟蹤,通過征管知識圖譜建立行為關聯和風險評價,建立人工智能動態感知和長期跟蹤各類工作事項的全周期管理體系。
作者單位:國家稅務總局武漢市洪山區稅務局