中圖分類號:F812.423 文獻標識碼:A 文章編號:2095-1280(2025)02-0040-10
內容提要:新生的經濟業態、復雜的征管邏輯以及倍增的稅收征管業務量,給稅收監管工作帶來巨大挑戰,尤其是全面數字化的電子發票(簡稱數電發票)的普及對發票管理產生極大的影響。傳統涉稅風險評估僅關注企業經營活動的特征屬性,忽略了企業間關聯關系,導致風險識別的精準性較差。文章針對數電發票應用管理的現實問題,從風險擴散視角出發,圍繞發票流構筑企業關聯拓撲網絡,提出基于ImprovedGraphSAGE的涉稅風險評估模型,在考慮企業行為特征的同時引入企業間拓撲信息。基于S市的數據驗證結果表明,使用ImprovedGraphSAGE模型進行涉稅風險識別的性能顯著優于傳統算法。
一、引言
2021年3月,中共中央辦公廳、國務院辦公廳印發《關于進一步深化稅收征管改革的意見》(以下簡稱《意見》),成為指導“十四五”時期推進稅收征管現代化的綱領性文件,對推進精確執法、精細服務、精準監管、精誠共治進行了全面部署,明確“穩定實施發票電子化改革”“基本實現發票全領域、全環節、全要素電子化,著力降低制度性交易成果”的工作要求。與此同時,依法嚴厲打擊涉稅違法犯罪行為作為《意見》“精確實施稅務監管”的一項重點工作,明確要求“充分發揮稅收大數據作用,依托稅務網絡可信身份體系對發票開具、使用等全環節即時驗證和監控,實現對虛開騙稅等違法犯罪行為懲處從事后打擊向事前事中精準防范轉變”。
發票電子化改革自2021年12月1日啟動以來,率先在廣東、上海、內蒙古三地開展數電發票試點工作。稅務部門著力構建覆蓋領票、開具、交付、查驗及入賬歸檔全流程的數字化管理體系,在前期試點取得積極成效的基礎上,于2024年12月1日實現全國范圍推廣應用。值得關注的是,數電發票在提升納稅服務便捷性的同時,其技術特性也引發新型涉稅風險。據公開案例顯示,2023年5月四川公安機關成功偵破部督“ i1?23′′ 特大虛開數電發票騙取出口退稅案,涉案金額高達20億元;2024年3月18日四部委聯合新聞發布會披露,2023年全國公安機關共立案查處涉數電發票犯罪案件232起。有研究表明,數電發票的自動化核定機制、總額動態調整功能及可信身份認證體系,對傳統稅收風險評估模型形成多維沖擊,尤其在發票自動核定、開票總額動態管理、數字身份驗證等環節,對稅務監管的時效性、精準性提出更高要求,亟待構建智能化風險識別體系以應對新型違法手段(張郁和樊麗瑛,2023)。
在現行監管實踐中,基于事前預警機制的涉稅違法風險評估體系面臨多方面挑戰:其一,違法手段隱蔽性強,犯罪主體多采用多層嵌套、虛擬交易等復雜操作模式;其二,作案方式迭代迅速,犯罪技術手段隨監管政策調整持續更新;其三,企業關聯網絡動態演變,股權交叉、資金往來等關聯路徑呈現非線性變化特征;其四,企業經營指標持續波動,納稅行為相關特征屬性呈現實時動態變化;其五,犯罪周期壓縮明顯,從風險生成到實際作案的時間窗口顯著收窄。值得關注的是,現行涉稅風險識別模型普遍缺乏對關聯關系的建模討論,而企業間動態關聯網絡蘊含的拓撲結構信息對精準識別涉稅違法風險具有重要的研判價值。
針對現有研究的技術局限,本研究創新性構建基于ImprovedGraphSAGE 框架的企業涉稅風險評估模型。該模型通過融合企業交易行為特征與關聯拓撲特征,運用圖神經網絡技術實現涉稅關聯復雜網絡的多維度建模。針對涉稅場景的固有特性,本研究對經典GraphSAGE算法實施雙重優化策略:首先,設計信息雙向傳播機制,通過構建“前向一逆向”雙向特征傳播路徑,在增強拓撲信息捕獲能力的同時有效緩解圖神經網絡的過平滑效應(Over-smoothing);其次,創新開發基于門控注意力機制的特征聚合器,通過動態調節鄰居節點信息權重,實現關鍵涉稅特征的有效萃取與融合。值得注意的是,與傳統GNN算法的直推式學習(TransductiveLearning)范式不同,本研究采用的歸納式學習(InductiveLearning)框架通過鄰居節點采樣與特征聚合技術,既可規避全圖節點信息加載的計算瓶頸,又能確保模型對新出現企業節點的泛化能力。這種技術特性使訓練完成的評估模型能夠對轄區內企業實施周期性動態評估,特別是針對虛開發票等涉稅風險的實時監測與預警具有顯著應用價值。
本研究在涉稅風險識別領域實現了以下創新:針對傳統模型忽視企業關聯網絡拓撲信息的局限,突破性構建基于圖神經網絡(GNN)的復雜關聯網絡建模框架,首次將企業間動態拓撲關系納入風險識別體系,顯著提升模型在真實場景中的準確性與穩健性;針對經典GNN模型存在的過平滑缺陷,創新設計信息雙向傳播機制,通過“前向一逆向”特征交互路徑增強網絡結構解析能力,有效突破復雜涉稅網絡的信息捕獲瓶頸;針對傳統特征聚合器信息利用率低的問題,研發基于門控算子的動態聚合模塊,通過自適應權重調節實現關鍵涉稅特征的深度萃取與融合。基于ImprovedGraphSAGE的評估模型經S市數據實證驗證后發現在風險識別準確率、時效性及動態評估能力等核心指標上均展現顯著優勢,這意味著本文的研究為破解涉稅風險隱蔽性高、關聯性強、動態演變快的監管難題提供可落地的技術路徑。
二、文獻綜述
(一)涉稅風險識別
在稅務預警模型研究領域,朱潤喜等(2022)基于數字經濟產生的稅收數據藍海,提出應立足新發展階段構建創新型稅務稽查體系,通過理念革新提升數字化征管效能。在理論構建層面,Goerkeletal.(2014)通過逃稅犯罪理論推導出基本威懾模型,揭示其理論邊界與應用彈性,為實證研究提供方法論框架。在方法創新領域,Korndrferetal.(2014)開發的橫向模型(CM)突破了敏感問題數據采集技術瓶頸,拓展了逃稅行為研究的實證路徑。Simpson(1996)建立的綜合分析模型,通過量化公司違規成本收益、個體行為偏差及組織背景特征,構建了企業稅收遵從度的多維評估體系。技術應用層面,Rad和Shahbahrami(2016)研發的高風險納稅人識別系統,運用機器學習算法構建納稅評估量預測模型,實現稅收風險的動態預判。
在風險等級評估模型研究領域,Harris(2015)構建了基于群集支持向量機(CSVM)的信用評分等級模型,為量化風險提供創新算法支持。Hirketal.(2019)提出多元序數回歸模型架構,通過引入潛在變量規范與相關誤差項,在保持鏈接函數靈活性的同時展現出顯著的樣本適應性和評估效能。
在風險預警模型研究領域,鐘政等(2015)提出構建大數據背景下多發性侵財的犯罪預警模式,實現對時段、區域和個案的預警。劉尚希等(2015)提出基于BP神經網絡的納稅評估選案模型,利用通用風險指標、稅種特異性參數以及定性分析三類指標對高納稅風險企業進行識別。樓文高等(2013)在企業稽查選案研究中,開發了廣義回歸神經網絡(GRNN)算法架構,通過非線性關系建模有效優化稽查對象的篩選精度。孫璐等(2023)基于動態博弈理論構建“稅務一企業”雙主體演化模型,揭示稅收遵從度與國家治理效能間的動態均衡機制。楊慧和程建華(2024)依托增值稅全鏈條數據特征,從基礎征管數據與發票信息中提取24個虛開風險指標,創新應用Transformer 深度學習模型構建虛開行為識別系統。
(二)圖神經網絡
在圖神經網絡理論研究領域,呼延康等(2018)系統闡釋了圖神經網絡處理圖結構數據的深度學習機理,揭示了其在復雜關系建模中的核心價值。Kipf和Welling(2016)開創性提出的圖卷積神經網絡(GCN)與Velikovietal.(2017)研發的圖注意力網絡構成了兩大主流架構,在節點分類等半監督學習任務中展現出顯著優勢。面向無監督學習場景,Hamiltonetal.(2017)構建基于“Skip一gram”機制的損失函數約束模型,但其局部信息提取特性限制了全局特征整合能力。針對這一局限,Velikovi等人受互信息最大化理論的啟發,研發出深度圖信息最大化框架(DGI),通過協調全局特征抽象與局部表征的互信息優化,實現圖表示學習的突破。本研究將該框架拓展至歸納學習與動態網絡場景,針對網絡異常檢測需求創新設計最大距離讀取函數。在圖神經網絡應用研究領域,Weberetal.(2019)研發了EvolveGCN動態圖學習架構,通過整合圖卷積網絡(GCN)的拓撲特征提取能力與循環神經網絡的時序建模優勢,實現對金融交易網絡異常模式的動態檢測。鄒長寬等(2022)基于GraphSAGE框架創新設計節點度加權與重要性評估融合機制,提出GraphSage一Degree增強模型,使節點分類任務準確率獲得系統性提升。
三、基于ImprovedGraphSAGE的企業涉稅風險識別模型
鑒于企業涉稅風險識別的重要意義以及現有研究成果存在的不足,本文在Hamiltonetal.(2017)提出的GraphSAGE 模型基礎上,構建Improved GraphSAGE 驅動的企業涉稅風險識別模型。本文將首先介紹企業涉稅關聯網絡構建方法,繼而系統解析Improved GraphSAGE 算法并完整呈現該算法在涉稅風險識別場景中的實現路徑。
(一)融合關聯關系的企業涉稅風險識別
1.問題定義
企業涉稅風險在本文中主要指企業虛開發票問題,即企業在交易過程中開具與真實貨物信息不符的發票,包括在無真實貨物交易情況下的暴力虛開發票行為和洗變票行為。近年來涉稅違法行為逐漸呈現“團伙化”和“跨域作案”特點,涉案企業之間具有密切交易關系符合復雜網絡中的局部密集特點,即風險企業的上下游企業具備較高的涉稅風險概率,企業的風險概率與其上下游企業所具備的風險程度密切相關。企業涉稅違法風險傳播主要指的是涉稅風險在企業間的傳遞和擴散,這種傳遞和擴散是通過企業之間的交易行為和關聯關系實現的。
2.企業涉稅關聯關系網絡構建
在風險識別建模過程中,本文引入企業之間的關聯關系信息并構筑企業涉稅關聯網絡。其中企業是指已注冊且處于正常狀態的一般納稅人企業,企業之間的關系是指企業之間的交易關系,交易關系由參與雙方的發票流動顯性體現,發票由銷方企業流向購方企業。為充實風險識別建模過程中的有益信息,本文為企業構造特征向量,提出了包括企業經營、企業申報、企業登記三大類共計120個特征指標,基于上述特征構建120維的特征向量(見表1)。

至此,本文構建了包含節點特征的企業關聯關系網絡,企業以及企業之間的關聯關系所構成的網絡由G(V,E,X)表示,如圖1所示。第 i 個企業由網絡中的節點 Vi∈V 表示,V表示網絡中節點集合。企業i與企業j之間的關聯關系由網絡中節點之間的邊 eij∈E 表示,其中E表示網絡中邊的集合。節點特征 xν∈X 表示節點v的特征向量,X表示網絡中節點特征向量集合。

(二)改進的圖采樣聚合網絡
1.圖采樣聚合網絡
GraphSAGE的本質思想是假設網絡中節點的嵌入表征向量應該由節點自身的特征向量與其鄰居節點的特征向量共同確定,其中節點特征向量蘊含了節點自身的屬性信息,在與鄰居節點特征向量融合過程中將節點在網絡中的拓撲信息嵌入到表征中。GraphSAGE算法首先對中心節點的鄰居節點進行采樣,然后采用特定的特征聚合器對采樣獲得鄰居節點的特征向量進行聚合生成聚合向量Vagg,最后將中心節點特征向量V與聚合向量Vagg進行聚合生成中心節點的嵌入表征,完成中心節點特征向量的更新。不斷重復上述過程K次,則表示完成了中心節點的K階拓撲信息聚合。算法計算流程如算法1所示:
算法1:GraphSAGE algorithm
Input:拓撲網絡 G(V,E) 輸入特征
:網絡深度 K; 權重矩陣 Wk ,k∈
;非線性激活函數 σ; 聚合算子 AGGREGA ?TEk ;采樣算子 N:ν2V Output:嵌入表征 zv for all vEV
1. h0ν←xν,ν∈V :
2.for k=1...K do
3. for vE
do
4. 
5.
6. end
7. hkν←hkν/|/hkν/|/2,ν∈V
8. end
9. (204號 zν←hνK vev
2.拓撲信息雙向傳播機制
GraphSAGE算法在拓撲信息傳播過程中沒有考慮不同鄰居節點對中心節點的影響差異,其基本原理假設中心節點的全部鄰居節點對于中心節點表征學習的作用是相同的。上述假設導致中心節點不同鄰居節點之間的關聯信息部分丟失,降低了中心節點嵌入表征學習的有效性。本文針對上述問題提出了拓撲信息雙向傳播機制,分別從拓撲信息傳播過程中的發出節點和接收節點視角出發學習不同鄰居節點對于中心節點的重要程度,以進一步提升中心節點嵌入表征的有效性。

拓撲信息雙向傳播機制的本質思想是在節點嵌入表征學習過程中鄰居節點對中心節點的重要程度由鄰居節點的輸出能力以及中心節點的接收能力共同決定的思想,而鄰居節點輸出能力和中心節點的接收能力則由節點間關聯強度與自身強度決定。圖2展現的是拓撲信息雙向傳播過程,中心節點 V2 針對節點 V1 的接收能力可由 ω12 表示,其值由節點1和2之間的關聯強度 L12 和節點 V2 的自身強度 C2 計算所得,其數值越大表示中心節點2對節點1的風險接收能力越強,對節點1的輸入型風險抗干擾性弱。計算公式如下所示:
ω12=L12/C2
其中,企業關聯強度 L12 表示企業間的交易金額,金額越大表示企業間聯系越緊密,關聯強度越大。在涉稅風險領域使用中心企業在指定檢查所屬期內的進銷項金額總和作為中心企業的自身強度 C2 ,企業進銷項金額總和越大表示企業自身規模越大,同時對交易中輸入型風險的抗干擾能力越強。中心節點 V2 針對鄰居節點 V1 的輸出能力 ω21 可由節點1和2之間的關聯強度 L12 和節點 V1 的自身強度 C1 計算所得,計算公式如下所示。
ω21=L12/C1
其中在涉稅風險領域使用鄰居企業在指定檢查所屬期內的進銷項金額總和作為鄰居企業的自身強度 C1 。
因此,在圖2所示的簡單拓撲網絡中中心節點 V2 的嵌入表征學習過程如下所示:
從鄰居節點輸出能力視角計算鄰居節點聚合向量如公式(3)所示:

其中, Xagg0 表示鄰居節點嵌入表征聚合器,本文采用均值聚合算法執行鄰居節點嵌入表征的聚合操作。
從中心節點接收能力視角計算鄰居節點聚合向量如下所示:

其中, Xaggi 表示鄰居節點嵌入表征聚合器,本文采用均值聚合算法執行鄰居節點嵌入表征的聚合操作。
利用上述計算獲得的中間聚合向量和中心節點特征向量進行中心節點嵌入表征的更新,從而獲得融合拓撲結構信息與節點屬性信息的嵌入表征向量。
3.基于門控算子的節點特征更新機制
在GraphSAGE算法中對鄰居節點中間聚合向量 Xagg 和中心節點特征向量進行聚合采用的是拼接方式,然后利用全連接模塊將上述信息進行融合,生成中心節點的嵌入表征。在上述方案中,中心節點表征更新過程中對節點前一時刻的自身表征和當前時刻的鄰居節點聚合表征在聚合過程中沒有進行篩選,隨著圖神經網絡深度的增加,多輪次的節點表征更新將會導致嚴重的過平滑問題。針對上述問題,借鑒Cho etal.(2014)將門控算子應用于RNN 網絡模型的思路,本文提出將門控算子應用于GraphSAGE節點嵌入表征更新操作,提出基于門控算子的中心節點表征更新操作,充分利用門控算子強大的信息提取能力和時間維度上的平穩性,提升模型信息抽取能力和模型的穩健性,進而提升節點嵌入表征學習的有效性。
門控算子主要包含重置門和更新門兩部分,重置門的主要作用是對網絡節點歷史表征中所蘊含的信息進行選擇與保留,更新門的主要作用是對鄰居節點聚合表征的信息進行選擇和保留。基于門控算子的網絡節點表征更新操作,可實現在網絡節點表征更新過程中對節點自身表征信息和鄰居節點聚合表征信息進行權衡,在實現鄰居節點聚合信息的有效提取的同時緩解圖神經網絡訓練過程中的過平滑問題,提升網絡參數學習的有效性。
重置門的計算過程如公式(5)所示,其中 r 表示重置系數,o表示sigmoid激活函數,W表示模型參數, Xt 表示當前時刻鄰居節點聚合向量, ht-1 表示網絡節點前一時刻表征向量。
r=σ(Wr*ht-1Xt)
更新門的計算過程如公式(6)所示,其中z表示更新系數,o表示sigmoid激活函數,
表示模型參數, Xt 表示當前時刻的鄰居節點聚合表征向量, ht-1 表示前一時刻的網絡節點的向量表示。
Δz=σ(Wz*ht-1Xt)
基于門控算子的網絡節點表征向量更新過程如公式(7)(8)(9)所示。首先通過重置門對網絡節點前一時刻的向量表示所蘊含的信息進行選擇,其中“.”表示哈達瑪積,然后通過雙曲正切函數計算鄰居節點聚合向量,最后通過更新系數實現對網絡節點向量表示的更新。
ht-1′=ht-1?r

ht=(1-z)?ht-1+z?h′
ImprovedGraphSAGE算法運行邏輯如算法2所示:
算法2: Improved GraphSAGE algorithm
Input:拓撲圖: G(V,E) ;節點特征:
;網絡深度: K; 非線性激活函數: σ ;聚合算子:AGGREGATE;采樣算子: N:ν2V ;節點輸出能力權重
;節點接收能力權重
Output:嵌入表征 zν for all v∈V
1. hν0xνν∈V
2. (20號 fork=1...Kd0 (204
3. forvEVdo
4. 
5. (204號
6.
7. end
8. 
9. end
10.Zv←hκ,v∈ν
四、驗證實驗與分析
(一)數據集合構建
本文基于S市稅務數據構建了企業涉稅關聯網絡數據集合,該數據中節點表示注冊在S市的一般納稅人企業,數據集共包括節點17820,節點自身強度表示該企業在指定檢查所屬期內周期為1年進項增值稅專用發票總金額,為每個節點構建了120維的特征向量。節點之間的關聯關系表示企業之間的交易關系,共包含關聯關系230471條邊,邊上關聯強度表示交易金額。涉稅數據集合中包含類別標簽共2類,即正常企業(專家認定,共計17035戶)和風險企業(稽查案件數據獲取,共計785戶)。本文采用隨時抽樣的方式將數據集合劃分為訓練數據集和測試數據集合,其中訓練數據集與測試數據集的節點數占比為1:1。企業涉稅數據集合統計概況如表2所示:

(二)驗證實驗設置
在表3中列出了實驗中一些重要的超參數,使用交叉熵作為損失函數,用精確率和召回率來評價模型推理性能。在本文研究場景下,涉稅數據的樣本在類別分布上是極不平衡的,因此采用Focalloss作為損失函數,其中參數α和 γ 取值分別是0.17和2。采用ADAM優化器作為模型的優化函數,RELU作為隱藏層神經元激活函數,門控模塊中分別使用sigmoid和tanh作為激活函數。所有模型基于Pytorch框架實現,采用單卡TeslaV100進行訓練推理。

(三)實驗結果分析
本研究采用橫向對比分析方法,選取LogisticRegression、RandomForest等經典機器學習模型,以及近年來圖神經網絡領域的代表性算法 DeepWalk、集成學習方法(Ensemble-method)和GraphSAGE。本文提出的Improved GraphSAGE方法是對已有GraphSAGE方法進行的改進,通過改變特征聚合方式和信息傳播機制優化模型計算效果的同時加快了模型收斂,對比實驗結果見表4。


由上表可知,基于S市的真實稅收數據集合,融合企業間關聯關系的企業涉稅違法風險識別方案(Deep Walk、GraphSAGE、ImprovedGraphSAGE)在識別有效性方面均優于未考慮企業關聯關系的傳統涉稅風險識別方案(Logistic Regression、Random Forest),進一步證明在企業涉稅風險識別過程中融合企業間的關聯關系可有效提升涉稅風險識別的有效性與及時性。此外,在表4結果中,本文提出的Improved GraphSAGE 模型在企業涉稅違法識別任務上比原始的GraphSAGE 模型表現更加優異,在F1-score上高出原始GraphSAGE模型 2.53% ,進一步證明本文對GraphSAGE模型的改進是有效的。為進一步驗證圖神經網絡的模型深度對推理效果的影響,本文對GraphSAGE 和Improved GraphSAGE就網絡深度展開了對比實驗。由圖3實驗結果可以看出,圖神經網絡模型隨著網絡深度的增加推理性能不斷提升,但是超過2層之后GraphSAGE模型推理性能明顯下降,說明隨著網絡深度的增加,模型過平滑問題不斷惡化進而影響模型推理性能。然而Improved GraphSAGE模型推理性能下降的轉折點是3層,且超過臨界點之后推理性能下降劇烈程度也比較緩和,說明本文提出的基于門控算子的節點表征更新機制可有效緩和圖神經網絡模型的過平滑問題,進而提升模型的擬合能力。
五、研究結論與優化建議
(一)研究結論
本研究針對傳統涉稅違法監管模式中“事后監管”的局限性,從復雜網絡的理論視角出發,深入分析了企業間關聯拓撲特征及其在涉稅風險擴散中的動力學行為。基于此,本研究創新性地提出了ImprovedGraphSAGE 算法,并將其應用于涉稅風險的動態評估模型構建中。具體而言,本研究構建了一個反映企業間涉稅關聯的網絡數據集合,該集合不僅體現了復雜網絡的節點多樣性(即不同企業的涉稅信息)和連接多樣性(即企業間的關聯強度各異)。通過S市稅務數據的實證分析,驗證了該模型在風險識別準確性和時效性方面的顯著優勢。研究結果表明,本文所提出的模型能夠有效捕捉涉稅風險的動態傳播機制,即涉稅風險企業間擴散既與節點自身強度有關,又與企業間關聯強度有關,揭示了復雜網絡中關鍵節點在風險擴散中的重要作用。這一發現不僅為數電發票普及背景下的涉稅風險“事前監管”提供了強有力的技術支撐,還為未來的風險防控策略制定提供了新的思路和方法論啟示。此外,本研究還揭示了復雜網絡特性在涉稅風險監管中的應用潛力,為進一步探索復雜網絡在其他領域的應用提供了參考。
(二)優化建議
為保持和提升本文提出的涉稅風險評估模型風險識別性能,實現對虛開騙稅等更多涉稅違法犯罪行為事前、事中精準防范,助力稅務部門實現稅務風險精準監管,可以從建立模型動態更新機制、擴展企業關系分析維度、引入時間序列圖神經網絡等維度優化完善模型。
建立模型動態更新機制是持續保持和提升涉稅風險評估模型風險識別性能的關鍵步驟之一。通過實時監測稅務數據和風險指標的變化,及時反饋到模型中進而調整更新模型參數,可以保持模型的時效性和適應性。模型動態更新機制能夠有效應對稅務征管環境的變化和新型涉稅違法手段的出現,使模型始終保持在對當前稅務風險形勢的最佳適應狀態。
在提升涉稅風險評估模型風險識別性能方面,擴展企業關系分析維度是一項關鍵策略。通過引入更多關系因素和變量,如企業間投資關系、主要人員任職關系以及行業間潛在關聯風險因素等,可以使模型更加全面地捕捉潛在的涉稅風險。通過擴展企業關系分析維度不僅可以提高模型的預測準確性,還能夠更準確地識別潛在虛開騙稅等違法犯罪行為。
時間序列圖神經網絡是一種結合了圖神經網絡和時間序列分析的方法,探索構建基于時間序列圖神經網絡的涉稅風險評估模型,可以更好地捕捉到企業涉稅風險數據的時間依賴性和動態變化規律。圖神經網絡可以有效捕捉時間序列數據中的時序信息和模式,更好理解企業涉稅風險的演變趨勢和周期性變化,從而增強模型對于涉稅風險的識別和預測能力,為稅務部門提供更精準的風險預警和決策支持。
參考文獻:
[1]朱潤喜,馮東,趙福順.數字經濟背景下稅務稽查工作面臨的挑戰與應對[J].稅務研究,2022,(1).
[2]Goerke L.Tax Evasion by Individuals[J].IAAEU Discussion Papers,2014,(1).
[3]Korndoerfer M,Krumpal I,Schmukle S C.Measuring and Explaining Tax Evasion:ImprovingSelf-reports Using the Crosswise Model[J].Journal of Economic Psychology,2014,(12).
[4]Simpson S.Sanction Threats and Appeals to Morality:Testing a Rational Choice Model of Corporate Crime[J].Law amp; Society Review,1996,(3).
[5]Rad M S,Shahbahrami A.Detecting High Risk Taxpayers Using Data Mining Techniques[C].international conference on Signal Processing,New York:IEEE,2016.
[6]Harris T.Credit Scoring Using the Clustered Support Vector Machine[J].Expert Systems with Applications,2015,(2).
[7]Hirk R,Hornik K,Vana L.Multivariate Ordinal Regression Models:an Analysis of Corporate Credit Ratings[J].Statistical Methods and Applications,2019,(3).
[8]鐘政.大數據背景下多發性侵財犯罪預警模式研究[J].河南司法警官職業學院學報,2015,(3).
[9]劉尚希,孫靜,王亞軍.大數據思維在納稅評估選案建模中的應用[J].稅務研究,2015,(10).
[10]樓文高,婁元英,尹淑平.基于廣義回歸神經網絡的稅務稽查選案實證研究[J].廣東商學院學報,2013, (6).
[11]呼延康,樊鑫,余樂天,羅鐘鉉.圖神經網絡回歸的人臉超分辨率重建[J].軟件學報,2018,(4).
[12]Kipf T N,Welling M.Semi-Supervised Classification with Graph Convolutional Networks Published as a Conference Papar at ICLR,April 24-26,2017[C].Toulon:DBLP,2017.
[13]Velikovi P,Cucurull G,Casanova A,Romero A,Liop,Bengio Y.Graph Attention NetworksPublished as a Conference Paper at ICLR,April 30-May3,2018[C].Vancouver:PBLP,2018.
[14]Hamilton W,Ying Z,Leskovec J.Inductive Representation Learning on Large Graphs[C].Advances in Neural Information Processing Systems,Long Beach:NIPS,2017.
[15]Weber M,Domeniconi G,Chen J,et a1.Anti-Money laundering in Bitcoin:Experimenting withGraph Convolutional Networks for Financial Forensics.In:Proc.of the 25th ACM SIGKDD Int’1 Conf.on Knowledge Discoveryand Data Mining(KDD),Workshop on Anomaly Detectionin Finance,2019.
[16]鄒長寬,田小平,張曉燕,張雨晴,杜磊.基于GraphSage節點度重要性聚合的網絡節點分類研究[J].科學技術與工程,2022,(11).
[17]孫璐,王妍文,孫偉.國家治理,稅收遵從與小微企業課稅——基于稅務部門與小微企業演化博弈分析[J].財經理論與實踐,2023,(1).
[18]Cho K,Merrienboer B V,Gulcehre C,Bahdanacl F,Schwenk H,Bengio Y.Learning PhraseRepresentations Using RNN Encoder-Decoder for Statistical Machine Translation[J].ComputerScience,2014, (6).
[19]張郁,樊麗瑛.電子發票犯罪問題分析及偵防對策[J].遼寧警察學院學報,2023,(6). [20]楊慧,程建華.基于Transformer模型的“暴力”虛開發票風險識別[J].安徽工程大學學報,2024,(1).
(責任編輯:子奕)