摘要:犯罪隱語是犯罪分子用來隱藏真實意圖和行動計劃的手段,具備隱蔽性、多義性、變化性等特點。現階段,新型網絡犯罪隱語識別主要面臨犯罪技術治理不均衡性、語言學方法應用不足以及犯罪治理與人權保護沖突三大困境。對此,實踐中應以數據挖掘、機器學習等技術手段和信息共享機制為基礎,建立多層次、跨專業、跨文化的語言分析技術,同時要保障公民隱私安全、言論自由,明確數據保護和數據使用的法律規范,強化跨國犯罪治理中的犯罪隱語識別規范,逐步探索完善犯罪隱語識別的制度體系。
關鍵詞:網絡犯罪;犯罪隱語;識別機制
中圖分類號:D917.9
DOI:10.13784/j.cnki.22-1299/d.2024.04.006
一、引言
隨著互聯網的普及和技術的不斷進步,新型犯罪呈現出日益復雜和隱蔽的特點,并且主要表現為網絡犯罪。網絡犯罪危害的性質、數量與傳統犯罪在本質上無異,但是通過信息這一媒介的疊加效應,其危害性會呈現質變和量變。[1]同時,信息時代中網絡犯罪本身的跨境性和匿名性增加了打擊和追究犯罪的難度,而犯罪隱語在網絡犯罪中的廣泛使用,使犯罪行為更難以被準確識別。“隱語是特定的社會集團或組織為了交際和保密的需要而采用的一種秘密語言”[2],這種秘密語言會使對于犯罪的任何事前防范措施失效,亦會導致事后的還原和追溯難以展開,極大影響了犯罪偵破和追訴。因此,針對網絡犯罪建立有效的犯罪隱語識別機制意義重大。實踐中,廈門市針對電信網絡詐騙犯罪建立三級聯動的合成反詐“云體系”,充分運用了犯罪隱語識別技術,2022年第一季度廈門市電信網絡詐騙刑事警情同比下降19.74%,精準預警勸阻7.5萬余人,避免群眾財產損失約1.25億元。[3]然而,網絡犯罪隱語識別的實踐雖然效果顯著,但也面臨技術識別準確性、公民隱私和個人信息保護等諸多技術和法治難題。本文將歸納并分析網絡犯罪隱語識別機制構建之價值與現實困境,并提出未來機制構建可行的實踐路徑。
二、網絡犯罪隱語識別機制構建的多重挑戰
●技術困境:犯罪技術治理的非均衡性
構建有效的犯罪隱語識別機制首先面臨的是技術上的挑戰,表現為偵查部門的偵查技術和犯罪分子的隱語技術在犯罪治理中的非均衡性。
犯罪隱語一般涉及復雜的加密手段和編碼形式,而傳統偵查手段無法適應這一變化。大數據驅動的偵查模式是時代的必然選擇,調查訪問等傳統手段受到人腦信息準確性穩定性差的制約,而信息書面存檔面臨提取困難的缺陷。[4]雖然我國執法部門內部和部分學者會制定一些犯罪隱語識別手冊,但對于較少出現的隱秘性較高的犯罪隱語需要綜合運用自然語言處理、數據挖掘等技術手段,以應對不同形式的隱語表達,同時需要進一步研發針對特定特征的算法和模型,以便高準確度地進行識別。
犯罪隱語可能會圍繞上下文展開,需要考慮特定語境和背景信息才能解析,現有的關鍵詞識別機制難以勝任,因此在識別技術上仍然缺乏一些有效工具。現如今偵測網絡犯罪的主要手段是對特定關鍵詞的識別,然而犯罪分子逐漸使用帶有歧義性質或者生活化氣息的詞語,導致同樣的詞語在不同的上下文中可能具有不同的含義。例如,在日常用語中可能是正常的表達,但在犯罪隱語中可能暗示著非法行為(如“數據維權工具”暗示“勒索軟件”),或者是不同日常用語片段拼接成犯罪隱語(如將“賬戶”和“密碼”拼接成“賬密”)。因此,急需研發具有上下文理解能力并準確識別隱語背后真實邏輯的算法模型。
犯罪隱語的迭代和更換速度較快,需要及時更新識別模型。這種犯罪隱語更新頻繁的現象主要體現在話術變更,例如MBI、SMI、暗黑幣、馬克幣、百川幣、貝塔幣等傳銷騙局的內部用語十分類似游戲用語,并且更新頻繁。為應對此類隱語,我們需要建立一個持續更新的數據庫,以及分析犯罪隱語迭代變化的機制,及時調整和優化識別模型,以保持對犯罪隱語識別的有效性。也有學者認為應當構建一個毒品犯罪隱語數據庫以應對不斷變化的毒品治理問題,[5]但是如何進行及時更新尚無可行方案。
●語義困境:犯罪隱語識別的語言學方法闕如
犯罪隱語識別不僅需要關注隱語表面含義,而且還需要關注潛在語義。有些犯罪隱語會經歷反復變化以及重重加密以達成隱秘性,傳統的基于一般情形下的識別方法在識別以上類型隱語時面臨困難,常常需要經過多方面的整合后才能進行推斷。有學者在研究涉毒隱語時發現,“現有涉毒隱語變化形式多樣,辦案人員難以在諸多信息中及時發現可疑的線索”[6],說明犯罪隱語可能會脫離其一般意義上的表象意義,對其進行識別需要對隱含意義有更加深刻的理解,需要具備對大量語言學變化的整合和推理能力,才能夠從文字背后推測出真實的犯罪意圖。
同時,犯罪隱語的識別還需要考慮跨語言和跨文化的語義差異。從世界范圍來看,不同的語言文化環境會衍生出一系列不同犯罪隱語,這些隱語也是帶有特定性質的文化符號暗語。這意味著在構建犯罪隱語識別機制前,研究者們需要通過多方協作的方式充分了解和整理不同區域文化和社會背景下的隱語樣本,同時還需要充分運用多種語言和文化的現有學術成果,才能在語言學上實現突破,最終確保識別機制構建后的實踐可靠性和適用的廣泛性。
●法律困境:犯罪治理與人權保護之沖突
構建有效的犯罪隱語識別機制不僅面臨技術、語義層面的挑戰,而且在技術運用和機制構建中還存在著一定的法治困境。
個人隱私權保護是難以回避的焦點,也是一個重要的法律挑戰。一方面,犯罪隱語的識別必然需要對大量公眾個人通訊信息進行讀取和甄別,以確保犯罪隱語在更大范圍內不會被忽視。另一方面,大數據等先進技術的應用導致個人信息的保護變得愈發困難,個人信息逐漸地虛擬數字化,難以被個人有效控制。[7]構建犯罪隱語識別機制,遵循隱私保護理念和原則,如何平衡和抉擇犯罪隱語識別和隱私保護值得進一步探討。
犯罪隱語識別與言論自由權保護之間的矛盾是另一個需要探討的問題。犯罪隱語的識別面臨誤判的風險,由于犯罪隱語的復雜性和歧義性,識別機制可能存在誤判,最終會造成對言論自由的不當侵犯。例如,傳銷話語被包裝成正常用語的情形,指代邀請加入傳銷組織的隱語有“請客”“帶客”“邀約”“招新”“納賢”“做市場”“放線”,指代給新人洗腦的隱語有“喝湯”“燒開水”“喝咖啡”“講思想”“除舊”,此類話術如果都加入識別關鍵詞欄,勢必造成大面積的誤判,不利于社會穩定。更為重要的是,“網絡言論不被輕易犯罪化”應當成為法治之基礎,言論自由既具有個體屬性,又具有公共屬性,但即便是公共屬性也不能違背國家對自由權保障需要恪守中立的原則性要求。[8]因此,在構建犯罪隱語識別機制時,研究者需要思考如何建立一套針對隱語識別結果進行判斷的機制,以防止濫用和不當侵權的情況發生。
跨國犯罪的隱語識別也存在諸多法律挑戰。為了有效識別和打擊網絡犯罪,加強國際合作和信息共享本身已成為一種國際社會的潛在的共識。然而,由于網絡犯罪的跨境性,相關研究不僅需要面臨隱語自身性質的復雜化,而且還要破解各國相關法律制度差異問題。比較突出的難點是,跨境犯罪使用英文等外語進行溝通聯絡增加了犯罪隱語識別難度,此外,不同國家法律體系由于隱私保護標準的差異,會導致數據交換環節的合法性出現重大差異。因此,國際社會需要思索如何建立一套務實的跨國法律協調機制,以解決不同法律體系之間的沖突和差異,同時思索如何通過隱語識別機制應對猖獗的跨境網絡犯罪。
三、網絡犯罪隱語識別機制構建的實踐進路
●技術應對進路:加強大數據識別能力并完善合作機制
針對隱語的語義多變和需要聯系上下文分析的特點,應強化對網絡通訊平臺中大數據挖掘分析的技術能力。首先,建立并完善基于文本特征的犯罪隱語識別模型。基于犯罪隱語的上下文本內容和語言學特征,構建相應的特征表達,結合特征表達利用機器算法進行模型訓練,以總結犯罪隱語體系。其次,引入深度學習技術,構建基于大數據的犯罪隱語識別模型。現有的偵查數據模型中包含六大板塊的應用:數據庫搜索;互聯網搜索;數據碰撞;數據挖掘;數據畫像;犯罪網絡關系分析。[9]前兩者是基礎的數據檢索,數據碰撞與數據挖掘是對已有數據檢索的資料進行再解析,數據畫像和犯罪網絡關系是通過數據碰撞、挖掘得到的再解析數據,對犯罪人、犯罪行為進行整體性描述,并將這一整體性描述再回饋到數據庫中,形成一整個數據鏈路。未來需要將語言分析模型融入到現有的偵查數據模式中,從數據碰撞和挖掘中深度學習語義表示的多樣化,以此更有效地構建犯罪組織的結構圖和數據圖景。
為保障識別機制能夠有效更新并適應不斷變化的犯罪隱語樣態,應促進多主體協同和信息共享機制以配合科學技術的合理運用。需要指出的是,我國在數據共享方面尚存在嚴重不足,“一方面政府掌握著大量核心數據,占數據總量95%以上的非結構化數據被束之高閣;另一方面,一些企業擁有專業數據分析應用技術,卻只能望寶山興嘆”[10]。為解決這一困境,首先,需要建立多主體多層面的信息技術合作機制,共同研究和解決犯罪隱語識別中的技術性問題。其次,除了在不同執法部門之間建立隱語數據共享平臺之外,執法機關和技術公司之間可以共享犯罪隱語信息,學術界可以分批次有計劃地提供研究成果,逐步形成更完善的犯罪隱語識別技術,避免出現信息孤島,對新出現的犯罪隱語進行快速反應。
●語義分析進路:建立多層次、跨文化、專業性的語義模型
隱語識別中的語義挑戰面臨著深層次解讀的困境,這需要更為創新的解決思路。第一,針對可能深藏的隱含意義,建立多層次的語義模型,包括詞級、句級、段落級和篇章級的語義。這種多層次語義分析的重點是針對文本、對話不符合邏輯之處進行特征識別。例如,2021年某地傳銷案,嫌疑人的微信中有“風”“刮風”“起風”“風來了”“被風刮跑了”這類隱語[11],這里的“風”出現的較為突兀且頻繁,多層次語義分析便能夠進行甄別,快速且準確地判斷出此處“風”的含義為“警察”。第二,隱語為追求不斷變化的加密性,通常會變更犯罪相鄰行業的專業術語,為此可以以專業知識為背景,建立犯罪隱語的語義解釋器。第三,引入跨語言和跨文化的語義分析技術。為應對犯罪隱語的迭代性和跨文化特點,通過構建跨語言、跨文化的語義關系圖譜,可以更好地解釋不同語言和文化相互交融背景下的犯罪隱語,這涉及對不同語言的犯罪隱語進行區別和映射。總之,通過建立多層次的語義模型、結合專業領域知識、引入跨語言和文化的語義分析技術,可以有效應對語義分析困境,為犯罪隱語識別提供準確和系統性的分析工具。
●法治完善進路:數據運用合法化與國際協作規范化
構建合理的法律框架,以確保隱私安全與言論自由。構建犯罪隱語識別機制應當制定相關法律規范,明確隱語識別的規范和邊界。一方面,法律法規中應直接明確犯罪隱語的概念、識別機制的使用領域和限制條件,確保識別機制的合法使用,保護個人隱私權。另一方面,為避免濫用和侵犯言論自由的情況發生,應當加強對識別結果的審查,確保最終結果的準確性和可信度。基于大數據的此類偵查活動,除了遵守程序合法原則的要求之外,必要性原則和最后手段原則也應成為犯罪隱語識別機制的適用前提,“限制無犯罪嫌疑情況下漫無目的、漫天撒網式的大規模數據比對,同時要求大數據偵查以前期常規偵查獲取的信息為基礎,在科學合理的信息模型上開展針對性地偵查任務”[12]。
為保障隱私安全與言論自由,還需要進一步完善數據保護和數據使用的相關法律法規。首要的便是制定明確的數據收集、存儲和使用機制,明確數據的獲取方式、安全保護措施等,確保數據的匿名性和非標識性,確保犯罪隱語識別機制符合隱私安全要求,包括數據加密、訪問控制等措施,防止未經授權的人員獲取和使用相關數據。為限制數據過度濫用的可能,應當明確數據使用的合法目的,確保數據只用于犯罪預警、偵查和治理等必要范疇。另外,偵查機關應建立獨立的審查機制,著重對數據使用進行合法性評估,保障隱語識別機制在合法的框架下運行。
●完善執法、司法合作中犯罪隱語識別規范
通過建立定期溝通和信息共享機制,促進國內外不同地域、不同國家執法機構之間的合作與交流。通過完善國內相關立法和簽署多邊或雙邊協議,共同制定行動計劃、協商偵查方法和共享情報,加強對區域犯罪活動的打擊和追捕。大力推進國際司法合作規范的完善。加強國際司法合作機制的建立,包括引渡、證據交換和法律協助等方面的合作,確保識別機制所得的證據標準符合國際法律以及對應國家的相應要求,為跨國犯罪的訴訟案件提供合理有效的證據支持。國際合作相關部門應當加強技術交流和經驗分享,使得一線偵查人員的專業素養在比較中得以提升,最終反向激勵司法合作的深入開展。第三,促進犯罪隱語識別的國際標準化規范制定。在規范制定過程中,參與方應當制定共同行為方案,明確各自的職責和義務。通過這種分工合作,能夠形成一種對犯罪分子和犯罪網絡的打擊合力,從整體上提高跨國犯罪偵破效率。
四、結論
在“互聯網+”時代,通過大數據等技術手段可以有效識別和監測網絡中的隱蔽語言。犯罪隱語識別機制對事前事后的犯罪預防、偵查和治理有著重大意義,能夠帶來諸多社會效益。當然,構建犯罪隱語識別機制仍然需要直面如隱私保護、言論自由、數據安全和合法使用等法律挑戰,此外還需要綜合考慮技術、語義等現實因素,確保犯罪隱語識別機制的合規運行與可持續發展。可以說,犯罪隱語識別機制在網絡安全、社會治理領域具有廣闊的應用前景,期待相關研究能為持續推進機制建設提供幫助。
基金項目
2023年度重慶市語言文字重點項目《成渝雙城經濟圈新型犯罪隱語語匯分析與識別機制研究》(yyk23103);2019年度重慶市社會科學規劃一般項目《重慶市中小學校園欺凌治理機制研究》(2019YBFX028)研究成果。
參考文獻
[1]劉憲權.從傳統到現代:網絡犯罪刑事規制對策的建立與完善[J].政治與法律,2016,(09).
[2]歐陽國亮.近年來涉毒隱語的新特點及識別思路[J].中國刑警學院學報,2015,(01).
[3]張天培.各地公安運用大數據打擊治理電信網絡詐騙[EB/OL].https://www.mps.gov.cn/n2253534/n4904351/c8495777/content.html.2022-5-18.
[4]何軍.大數據與偵查模式變革研究[J].中國人民公安大學學報,2015,(01).
[5]歐陽國亮.言語識別視角下廣西地區毒品犯罪隱語初探[J].廣西警察學院學報,2017,(06).
[6]馮曉瑾,張黎.“互聯網+”背景下的涉毒隱語發展趨勢與識別路徑[J].政法學刊,2021,(03).
[7]陳冉.論大數據背景下隱私權的刑法保護[J].中國刑事法雜志,2017,(03).
[8]姜濤.網絡謠言的刑法治理:從憲法的視角[J].中國法學,2021,(03).
[9]王彬.犯罪偵查中的大數據應用分析[J].中國刑警學院學報,2017,(04).
[10]新玉言,李克.大數據:政府治理新時代[M].北京:臺海出版社,2016:66.
[11]歐陽國亮,祁維超.傳銷犯罪隱語分析[J].北京警察學院學報,2023,(04).
[12]程雷.大數據偵查的法律控制[J].中國社會科學,2018,(11).
作者簡介
施鑫,西南政法大學法學院講師,重慶市新型犯罪研究中心研究員,碩士生導師,法學博士、博士后。主要研究方向:犯罪學。
蔣志偉,重慶市新型犯罪研究中心研究人員,西南政法大學法學院刑法學碩士研究生。主要研究方向:犯罪學。
責任編輯 李冬梅