湯燊淼 廉小親 張琪琦 陳秀新
(北京工商大學計算機與信息工程學院 北京 100048)(中國輕工業工業互聯網與大數據重點實驗室 北京 100048)
自我國實施“放管服”改革以來,就不斷強化稅務機關要嚴格規范公正文明執法,樹立誠信推定、風險監控、信用管理的現代稅收管理理念,建設“實名辦稅制+分類分級+信用積分+風險管理”的閉環管理新體系,提高稅收征管效能,充分維護納稅人合法權益,優化納稅服務[1]。
長期以來,“人證分離”現象是困擾基層稅源管理的難題。為切實推進“實名辦稅”制度落實,2017年,國家稅務總局北京市海淀區稅務局上線了稅務“人臉識別”系統,該系統通過“身份證掃描+人臉識別”檢測的方式實現實名辦稅[2]。但針對人臉識別采集的數據進行深度分析,建立疑點企業庫和自然人風險名單庫,自動識別高危人員等全新功能還未完善。
本文為解決風險預警等問題,設計基于人臉識別的稅務風險防控系統來實現辦稅大廳內人臉抓拍識別、高危人員自動預警,同時繪制廳內人員的軌跡圖和區域熱力圖,還可查看人員企業畫像、辦稅人員風險等級等,提高稅務人員的服務水平,保障合法經營的納稅人的合法權益,維護法律的公平、正義[3]。
自2016年至今,某市稅務局通過采集辦稅人員人臉圖像,已有18萬辦稅人員的人臉庫,并將庫中辦稅人員的風險等級分為Ⅰ、Ⅱ、Ⅲ三個級別,Ⅲ為最高風險等級,目前,該庫位于市局的數據中心。本系統利用高點動態相機對辦稅人員人臉進行抓拍,然后通過人臉識別算法與18萬人臉庫進行識別比對,進行辦稅人員風險等級推送,同時繪制廳內人員軌跡圖、區域熱力圖、人員企業畫像,為導稅人員對廳內擁擠區域的人員疏導提供參考。
系統采用B/S架構,由數據采集層、算法層、數據庫層、應用層[4]四部分組成,其架構如圖1所示。

圖1 系統架構
應用層中用戶通過瀏覽器查看人臉抓拍實時識別結果、辦稅人員軌跡、區域熱力圖及人員企業畫像等。數據服務層由一個總體數據庫構成,該數據庫包含三張表,數據庫設計如圖2所示。

圖2 數據庫設計
基于人臉識別的稅務風險防控系統主要功能包括:人臉抓拍實時識別、辦稅人員行為軌跡、大廳區域熱力圖、辦稅人員企業畫像等,系統功能模塊組成如圖3所示。系統對軟硬件的性能具體要求如表1所示。

圖3 系統功能模塊組成

表1 軟硬件配置方案
傳統人臉識別算法在復雜場景下人臉識別率低、計算時間長、抗干擾能力差,不能滿足實際應用的基本需求[5]。因此,本文提出基于Gabor小波、LBPH方法和PCA降維方法相結合的人臉識別算法。首先通過直方圖均衡化對輸入圖像進行預處理,再利用Gabor小波提取多方向和多尺度的局部圖像特征,然后使用LBP算子對人臉空間進行編碼,生成LBP直方圖,通過PCA算法降維,建立特征臉向量,利用皮爾森相關系數[6]計算抓拍圖片的人臉特征與18萬人臉庫中人臉特征之間的相似度,最后給出識別結果。
Gabor小波能夠很好地提取目標圖像不同空間位置、頻率和方向上的特征,同時Gabor變換對曝光度、表情、角度變化具有魯棒性,因此能夠很好地提取人臉特征。二維Gabor小波的表達式為[7]:
(1)

wk(z)=I(z)*φ(k,z)
(2)
式中:*表示卷積;wk(z)為Gabor小波人臉,可表示為wk(z)=Αkeiφk,Ak和φk分別是wk(z)的幅值和相位。文中提取wk(z)幅值特征Ak,Gabor內核大小為35×35。
文中通過Gabor小波提取抓拍照片的人臉特征,然后在人臉特征空間中,使用半徑R=1、數量P=8的圓形LBP采樣,得到一個二進制數[9]:
(3)
式中:s為定義的一個參數,表示將中心像素的灰度值gc與周圍像素的灰度值gp作對比,若中心像素的灰度值大于周圍像素的灰度值,s為0,否則s為1。
對像素按照不同位置進行加權,賦予2P的當量值,p為計算LBP值時像素的編號,從而得到與領域點的LBP值[10]:
(4)
然后,將人臉特征空間分為64個子空間,每個子空間分別統計其LBP直方圖,連接這些子空間的LBP直方圖生成人臉特征向量。以Hμ,v表示人臉特征向量,該特征向量的定義如下[11]:
(5)

由于特征提取后,獲得的LBP直方圖向量維數過高,所以利用PCA算法對于LBP向量進行降維處理,挑出主要特征。
最后在識別階段,將特征LBP向量向PCA特征子空間進行投影,得到投影向量X,Y為18萬人臉庫的人臉特征向量,計算識別的相似度[12]:
(6)

基于人臉識別的稅務風險防控系統通過在辦稅大廳入口位置部署DS- 2CD7A27FWD-IZ型??低?00萬星光級泛智能抓拍網絡攝像機對于進入大廳的所有人員進行實時人臉檢測。利用人臉識別算法對抓拍的人臉照片進行人臉特征提取,提取的人臉特征與MySQL數據庫中的18萬人臉特征進行比對,返回相似度。將抓拍照片及人臉特征保存在MySQL數據庫中,并利用WebSocket技術,創建服務器與瀏覽器間的持久性連接,將匹配的人員信息、風險等級返回到瀏覽器端,如果風險等級高,則在Web頁面彈窗預警,實現實時抓拍預警??紤]到18萬人臉特征庫中人臉特征數量大的問題,所以在識別時,本系統創建三個線程,每個線程有6萬人臉特征,將抓拍圖片的人臉特征與每個線程的人臉特征進行一一比對,返回相似度并選取最高的相似度作為該線程的人臉識別相似度,再選取三個線程中最高的相似度作為最終相似度。
同時,某市辦稅大廳共有6個區域,包括入口驗證區、非嵌入式終端區、自主辦稅區、視頻咨詢區、培訓學習區、終端辦稅區,每個海康威視智能抓拍網絡攝像機為圖中的一個坐標點,根據現場勘測,每個區域布置兩臺??低曋悄茏ヅ木W絡攝像機分別負責左半區域和右半區域的人臉抓拍,同時對6個區域的網絡攝像機進行編號。通過讀取數據庫中的攝像頭編號和人臉信息,繪制辦稅人員的軌跡圖。再通過網絡攝像機定時拍照,然后檢測人臉、計算區域人數,利用Echart圖庫進行辦稅大廳的辦稅人員軌跡圖及區域熱力圖繪制。辦稅人員抓拍、軌跡流程如圖4(a)所示,區域熱力流程如圖4(b)所示。

(a) 辦稅人員抓拍、軌跡流程 (b) 區域熱力流程圖4 人員抓拍、軌跡及區域熱力流程
當辦稅人員進入大廳后,通過??低曋悄茏ヅ木W絡攝像機檢測人臉并抓拍,經過實驗室多次實驗以及現場實驗,當相似度的閾值為0.8,即可認為識別成功。目前,本系統于2019年10月開始運行,每日識別人數大概在800人,經過統計,每月的平均識別準確率為95.6%,單人的識別速度為143 ms。基于人臉識別的稅務風險防控系統的實時抓拍圖如圖5所示。風險等級推送如圖6所示。單人人臉識別時間如圖7所示。

圖5 基于人臉識別的稅務風險防控系統實時抓拍圖

圖6 基于人臉識別的稅務風險防控系統風險等級推送圖

圖7 基于人臉識別的稅務風險防控系統單人人臉識別時間圖
同時大廳內的高點動態攝像實時抓拍可實現軌跡跟蹤定位,繪制辦稅人員軌跡圖,辦稅人員進入大廳的行蹤都可實時掌握?;谌四樧R別的稅務風險防控系統人員軌跡如圖8所示。

圖8 基于人臉識別的稅務風險防控系統人員軌跡
熱力圖可以顯示辦稅人員熱衷的頁面區域和辦稅人員所在的大廳位置圖示,以便提醒大廳內導稅人員及時進行引流,使大廳空間得到合理利用,同時也可以展現人群聚集地?;谌四樧R別的稅務風險防控系統熱力圖如圖9所示。

圖9 基于人臉識別的稅務風險防控系統熱力圖
通過高點攝像機實時進行人臉檢測與選取最佳人臉角度進行抓拍比對,識別成功后可以查看辦稅人員的身份信息與企業畫像?;谌四樧R別的稅務風險防控系統企業畫像如圖10所示。

圖10 基于人臉識別的稅務風險防控系統企業畫像
本系統對人臉識別采集的數據進行了深度分析,利用了人臉識別技術、WebSocket技術、Echart圖庫對大廳數據集中管理與交互,實名辦稅,風險預警。
本文所設計的風險防控系統已應用于某市的一個辦稅大廳,有效地解決了虛假辦稅的問題。該系統的設計思路易于擴展到其他大廳,但是該系統的人臉識別算法還需優化,識別率還有待提高,后續還可以考慮在該系統中加入辦稅人員行為分析、人員軌跡聚類分析、辦稅人員每日辦稅情況等功能,使之更加完善。