婁澤黎++沈斌



[摘要]大數據目前在海關風險管理中的運用已相對普遍,但其帶來的管理效益卻見仁見智。這需將“厚數據”思維引入海關風險管理進行深度數據挖掘,讓大數據開口說話。文章從我國海關風險管理的研究現狀談起,分析其存在的不足,在對“厚數據”與“大數據”進行比較的基礎上,分析了其在海關風險管理運用中的優勢,提出了未來以“厚數據”為核心的我國海關人工智能風險管理新思路。
[關鍵詞]海關風險管理;“厚數據”;智慧風險管理
[DOI]1013939/jcnkizgsc201730154
隨著AlphaGo對世界圍棋高手的圍剿,人工智能成為當前最熱門的話題,這就是“大數據”時代。但是,人工智能也存在著“大數據”思維下注重數據相關性而弱化因果關系等局限性。因此,人們很快意識到在現代管理學中應盡可能地把“人”的因素融入到數據分析中去,這就是本文所要討論的“厚數據”思維。希望“厚數據”思維下的中國海關AlphaGo誕生,其目的是為中國海關風險管理提供一條更具前瞻性的新思路。
1我國海關風險管理現狀與國內研究概述
我國海關系統的風險管理起步于1999年海關總署綜合統計司的海關執法評估系統,成型于2004年。迄今為止,風險管理在我國海關管理中的運用已超十年,逐漸形成了以海量數據為基礎,設定參數下達指令為方法的風險管理模式。但在技術不斷更新的今天,信息數據來源將更加分散、格式將更加多樣,這就對我國海關的風險管理提出了新的挑戰。特別是與歐美國家相比,我國的海關風險管理模式仍停留在“初代防火墻”水平,即根據“已知”去管理“未知”,根據已發生的違法情況來防范未來可能發生的相同違法情況。這樣的模式在監管環境日益復雜的今天顯然是既缺乏動態性、立體性,更缺乏靈活性的。
國內學界對我國海關風險管理的探討,從最初借鑒歐美等國風險管理定義對我國“海關風險”“海關風險管理”等概念進行界定,到后來以天津、青島等地為例,從直屬海關層面分析海關風險管理模式,再于近年大數據興起后,將雙因子分析法與風險管理結合提出新方法。目前我國海關風險管理的各種平臺與手段也是基于該理念而設計開發的。
2目前我國海關風險管理存在的不足
十幾年來,我國海關的風險管理從無到有,取得了一系列令人矚目的成就。但從風險管理理論本身的價值看,其效能遠未在我國海關管理實踐中充分發揮。
21數據規模效應初現,但數據研究缺乏深入
隨著海關信息化建設的加速發展,近年來全國海關積累了海量的數據。由此我們初步形成了通過對海量報關單申報價格進行統計、分析,然后計算出海關的可信價格置信區間。
但這種方法也存在明顯缺陷。當大量樣本數據不符合實際時,基于錯誤數據的分析就會與貿易實際情況發生偏差。例如某些企業為了逃避海關正常估價,集體性對申報價格進行加工,導致申報價格失真;又如由于一些欠發達國家對外匯進行嚴厲管制,逐漸形成了官方和黑市兩種匯率。導致相關企業在向中國海關申報時價格存在較大的風險。于是這種僅停留在“數據分析”層面的風險分析,只能讓數據展示出“是什么”,卻揭示不了其背后的 “為什么”。
22管理理念相對保守,技術支持升級緩慢
一直以來,海關風險管理的理念是以“穩”為主,設置固定的參數與硬性考核指標。這樣的做法在風險管理實施之初,不失為一種從易而難、避免犯錯的方法。但是十多年過去了,這種考核模式仍未發生改變值得我們反思。
目前我們的風險管理主要是兩種思路。一是在發現某些違規、違法行為后總結其特點,然后在海量的進出口數據中去比對較為類似的記錄。例如發現某個商品歸類錯誤后對其他同品名的商品進行歸類復核;二是在未知風險的情況下,某些進出口數據違背了正常邏輯或者游離于置信區間時,判定為存在風險的記錄。例如在打擊虛假貿易時,新成立的企業一旦有較高的出口值,就容易被判定為存在風險。
上述風險管理的基礎是管理對象向海關申報的數據,因此提煉出的各類風險參數有滯后性,海關無法主動在第一時間發現風險。
與此同時,海關對風險的處理技術也相對保守。一是內部風險信息平臺功能少、升級慢。二是外部風險信息平臺建設推進慢、阻力大。三是風險管理手段少,缺乏專業第三方科技支撐。
23數據來源口徑單一,數據評估缺乏途徑
我國海關系統的數據主要來源于H2010,對進出口貨物的統計由接受申報的海關負責。這樣確實可以保證從總署到隸屬海關所擁有的數據是一致的,不存在外界的干擾。但這就導致海關系統的數據來源過于單一,與“多口徑”統計的地方政府數據相比,海關數據缺乏評估驗證。例如出口貿易中的虛假貿易,因特殊關系而低報的價格、涉及退稅而高報的價格,雖然均在海關統計的數據庫中,但是由于缺乏相關的法律法規,目前海關幾乎無法對進出口貨物的數據進行全面審核,也沒有技術支持來剔除無效數據樣本,這就使得海關數據的科學性大打折扣。
大數據目前在海關風險管理中的運用已相對普遍,但其帶來的管理效益卻越來越值得商榷。顯然,這就為將“厚數據思維”引入到海關的風險管理中提供了機會。
3“厚數據”概念新解與大數據之比較
簡言之,厚數據是指針對被研究對象顯著特征的,體現其更深層次的、對其內涵更精確定位的數據。它是由已故人類學者Clifford Geertz最早提出的。它強調用定性研究的方法來闡釋數據,旨在揭示數據背后的感情、故事及意義。大數據是以宏大的量為支撐,不具有深刻性,所以又稱其為“薄數據”。而“厚數據”則是在揭示大數據背后的更深刻的場景與故事。二者的關系是大數據是面,范圍廣;厚數據是點,范圍相對較窄;厚數據包含在大數據內,只是層次與角度不同罷了。二者的區別如下表所示。
4“厚數據”思維在海關風險管理中的優勢分析
“厚數據”是一個全新的數據挖掘理念,未來在我國海關管理中其優勢不可小覷。endprint
41“厚數據”思維已在歐美國家的風險管理中成功運用
KeyCrime是一家意大利軟件預測公司,它們主要服務于米蘭警方。利用“厚數據”算法,針對商店的搶劫和偷竊做預測。這套系統用了幾年后,有了大量的數據和神經網絡學習算法,在不同罪案中建立聯系也變得更加方便,目前在意大利很多家警局推廣使用。PredPol是一家加州圣克魯茲的警力軟件公司,運用“厚數據”思維編程,供部分警局進行風險預測。芝加哥警局表示,用了PredPol程序幾個月后,槍擊案件發生概率下降了 13%,謀殺案件數量降低了49%。洛杉磯警局也表示,使用這套提高效率的模型,一年光一個分局就能省下 200 萬美元。“厚數據”在發達國家執法機關的成功運用,表現出了低成本、高效率等優勢,這樣的嘗試為我國海關引入厚數據思維,提供了良好的參考與借鑒。
42“厚數據”思維契合了我國海關風險管理的需求
421契合風控中心建立要求
全國通關一體化改革下,海關系統將建立以海關總署風險防控中心為一級風控中心,直屬海關風險防控中心為二級風控中心的風險管理框架。這樣的框架類似于“專家集中制”。然后利用“厚數據”良好的融入環境,為海關風控中心服務。其基本思路是:假設原有風險管理1000人,其中10人為專家,990人為一般管理者,那么1000位水平不一、領域不同的風險管理者各自為政,效率較低。現將10位專家集中到一起,并根據領域劃分配備合理數量的助手,結合厚數據思維對數據進行質化研究,將契合風險防控中心管理要求。
422契合嵌入式管理訴求
日益復雜的貿易環境使海關風險管理不得不將視角放眼于整個貿易鏈,將個性化貿易行為嵌入到數據分析中去,而非單純通過簡易標準化方差計算得到的數據去評判企業行為。以貿易國為非洲的進口貿易為例,存在官方、黑市兩種匯率,企業若以黑市匯率成交付匯,在進口申報時以實際成交價格申報,則會引起現有風險管理的預警。如果不將非洲的實際貿易環境嵌入到風險批判中,那可能造成企業如實申報卻仍被布控、審價,這對企業來說是有失公允的。未來的海關管理更需兼顧服務與把關,在最大限度上促進貿易公平,這便需要厚數據思維來滿足嵌入式管理的訴求。
423契合倒查式挖掘需求
未來的風險行為將更具隱蔽性,海關風險管理對數據的挖掘要在線索少、數據少的情況下開展。例如市場上的“神戶牛肉”,海關數據中并未出現過日本神戶牛肉的進口記錄,那么在排除虛假廣告的前提下,這些神戶牛肉必定是通過走私進境的。對于這類風險,需從終端銷售者倒查,挖掘數據后再建立模型。對于這類高挖掘需求的小數據樣本,厚數據思維是理想的選擇。
43“厚數據”思維是實現我國海關人工智能管理的優選之路
未來我國海關風險管理發展的趨勢一定是向人工智能方向發展的。實現智慧風險管理也需要像AlphaGo一樣經歷數據思維的更替。第一代AlphaGo的思路是大數據思維,輸入大量棋譜,根據已知招數與棋手下棋。第二代AlphaGo的思路是厚數據思維,在已有棋譜基礎上進行重組深挖,計算出多種人類從未使用過的招數以取得完勝。海關的風險管理亦是如此,第一代智慧風險管理建立在大數據技術之上,第二代突破的優選之路便是“厚數據”思維的廣泛應用。
5對我國海關“智慧風險管理”的思考
51業務再造,建立海關風險管理工作回路
海關(Customs)根據企業的行為(Behavior),利用組織行為學等相關理論,進行分析(Analysis)組成行為分析小組(Unit),簡稱CBAU,以環形的工作機制來支持厚數據理論在風險管理中的落地。建立工作回路,實現事前、事中、事后分析,動態防范風險,變滯后為超前,將風險管理的重心安排在企業風險行為發生之前。其工作回路圖1為:
圖1工作回路
其中PLAN代表精準收集數據,分析典型樣本,編寫程序算法,預測行為發生;DO表示根據厚數據算法得到的結論,警告重點企業,提示現場關員,下達布控指令;CHECK表示檢測命中情況,反饋執行結果;ACTION為修正模型,調整算法。
52分層共享,打造立體海關風險情報信息系統
打造“分層共享+多元融合+公眾參與”的智能化風險信息共享平臺,打破層級、部門、關區、領域的壁壘,實現內外部風險資源的互通,為厚數據模型的個性化分析提供數據支持。借助云平臺,建立海量、動態、多元的“風險信息池”,豐富非結構化信息的種類,建立文本圖像分析機制,構建多樣化信息框架。使風險信息的外延不斷延伸,視角向整個物流鏈條拓展。情報信息系統分為海關、其他政府部門、社會、專家智囊團四個層面,將外部信息資源作為內部信息資源的有益補充。開展自動采集、定向采集及個性化采集,提高信息采集智能化水平。如圖2所示。
圖2立體海關風險情報信息系統
53“由企及企”,釋放海關風險管理新活力
在海關風險管理的思維中,是以絕大部分企業都是守法的,僅有小部分企業容易發生違法行為為基礎的,而海關的職責就是找出已經違法的企業和有潛在風險的企業。所以我們需要把目光聚焦在企業上,而不是物品上,將傳統的“由企及物”思想轉變為“由企及企”,建立企業行為模型。首先,通過“厚數據”模型篩選出高風險企業。其次,根據企業基本情況再建企業風險模型。最后,根據企業后續的申報行為及違法行為完善模型。在這個方面,美國的COMPAS人工智能值得我們借鑒。在美國,如果犯罪進了監獄,COMPAS就會接管罪犯的個人數據。入獄者填寫一份個人情況調查問卷,綜合犯罪的嚴重程度,COMPAS會計算出一套“未來罪犯”的評分機制,預測其未來再次發生違法行為的概率、地點及形式。
54建立“海關風險管理厚數據模型”
海關還可與專業的人工智能公司簽署合作備忘錄,聘請技術顧問與海關風控中心專家合作,篩選出第一批高風險企業,建立起第一代風險企業行為模型。日后的完善調整,均以第一代模型做基礎,所以第一代樣本對象的確定十分關鍵。各現場海關可將各自數據發送到風險防控中心進行專業評估,再結合各現場實際情況進行數據完善,做合理的參數調整,建立模型后在不斷的互動中預測風險,實現“以企管企”的風險管理模式。算法運行初期可以重點預測企業高風險行為發生的“概率”,中期重點預測高風險行為發生的“地點”,后期達成企業高風險行為發生的精準預測。如此,建立在厚數據思維模式下的我國風險管理水平必將很快實現從“粗線條預測”到“精確化查處”,再到“定制化提醒”的飛躍,為我國海關風險管理水平再上臺階而做出其應有貢獻。
參考文獻:
[1]錢錦我國海關風險管理發展趨勢研究[C].海關風險管理論文匯編集,2016
[2]段景輝海關風險管理分析與評價方法[J].上海海關學院學報,2012(3)
[作者簡介]婁澤黎,杭州海關下轄嘉興海關在職關員;沈斌,杭州海關下轄嘉興海關在職關員,副科長。endprint