李蕤
摘要:大數據時代,信息的探索挖掘和聯系分析愈發加強。作為公安機關最重要的偵查方式之一的串并案偵查需要獲取足夠的關注和進步。傳統的串并案方法耗費大量的人力物力。如果依托人工智能大數據的進步,偵查人員借助高效的串并案分析方式,將為打擊犯罪勢力,守護人民群眾的美好生活作出巨大的貢獻。
關鍵詞:串并案;大數據;偵查
引言:
一、迎接大數據時代下的司法領域革新
25年前技術變革是信息通訊技術的開端。電子信息技術的普及和應用推開了第五次科學技術革命之門。歷史上每一次技術變革其實都分兩個階段。第一個階段是導入期,這是技術的引入階段,在這一時期新技術得到快速發展,并在主要領域得到廣泛應用。繼而進入第二個階段,拓展期,在這個階段,人們會在這個技術的基礎上,部署很多創新應用,新技術的潛力得到充分發掘[]。如今我們正處于這次革命的轉折點,從導入期到拓展期的轉折點。而導入期中收集的大數據將成為推動拓展期到來的核心動力。
深化大數據應用,已經成為穩增長、促改革、調結構、惠民生和推動政府治理能力現代化的內在需求和必然選擇。[]司法領域是打擊犯罪,維護社會穩定的重要環節。把人工智能、大數據與司法體制改革相結合,將會給司法領域注入強大的創造力,給司法工作帶來極大的突破。大數據時代,我們可以通過去量化過去不能量化的信息,使用精妙的統計學方法分析這些信息成為可能。尋求先進的科學技術倒逼出新的工作方式,讓司法領域工作人員不能報守傳統工作模式的殘缺,而是以積極的心態應對大數據與人工智能帶來的新型犯罪方式等問題的挑戰,并積極利用新技術解決遺留問題,攻克難關。
二、打好大數據下串并案件的基礎
(一)串并案偵查的含義
串并案偵查,指的是對系列案件中的相關信息特征,包括作案手法、痕跡、物證、時間和空間等的對比、評估和分析后,認定為是同一犯罪主體所為,從而將系列案件串聯起來進行偵查的方法。其中認定兩個案件為同一主體所為,則稱為并案;兩個以上系列案件為同一主體所為,則稱為串案。與串案和并案相聯系的還有一種是“窩案”。所謂挖出一個,帶出一窩。所以窩案一般指的是群體性作案。這一群人在一個群體組織里具有相關關系、利益分贓等特點。同時,其作案往往是一串,所以又被稱為窩串案。如貪污賄賂窩案、串案的典型表現形式為案中有案、案后藏案、案案相連。
串并案偵查并不是一種固定的偵查方式,而是公安機關在長期的實踐中摸索和總結的一種有效的方法。做好串并案偵查能夠收到抓一人破多案、以小案破大案、破一案帶一串、破一串掃一片的良好效果。
不要將串并分析與相似但仍有所不同的“并案分析”混淆。并案分析在這種系統中就像分析者之筆記本,在各個姓名、電話號碼、交通工具等間核查它們之間的聯系和各自內部的聯系,而串并分析只是考慮犯罪之間相似的可能性[ ]。隨著案件形式的多樣性,犯罪分子反偵察能力的提高,大數據信息的復雜度的增加,串并分析也應打破傳統的方式,與時俱進。
(二)轉變大數據下串并案件的思維模式
大數據時代,人們的思維方式逐漸發展形成網狀,向總體思維、容錯思維過渡。與精確性思維、因果關系相比,容錯思維和相關思維更能夠對數據的搜索、挖掘以及進行可視化的描述分析更有利。
轉變思維模式,重要的是充分利用潛在相關關系。正如維克托所說:“大數據時代,我們的思想發生了轉變,不再探求難于捉摸的因果關系,轉而關注事物的相關關系。’’因此,偵查人員由研究因果關系轉向學習相關關系數據的研究與應用方法,善于從相關關系數據中尋找案件偵破切入點或突破口,是串并案件乃至偵查數據思維方式實現過程中的一項重要任務。相關關系又被稱為聯想關系,在相關關系中,每一方的數據變更都可能會影響到對應數據的變化,不同于因果關系的確定性的分析結論,相關關系主要應用于預測各種可能性的有無。大數據下的串并案分析也主要是通過這種相關度鑒別與推送,將精確與容錯相結合,幫助偵查人員獲取與案件相關的更多線索,多方位收集零星的證據,為打開案件的突破口找到通道。
洛卡德物質交換原理是由法國著名的刑事偵查學家、司法鑒定學家和警察技術實驗室的先驅埃德蒙.洛卡德于20世紀初撰寫的《刑事偵查的方法》一書中提出。洛卡德認為,犯罪行為本質上來說是一個物質交換的過程,犯罪行為人作為一個物質實體在實施犯罪的過程中總是跟各種各樣的其他物質實體發生接觸;因此,犯罪案件中物質交換是廣泛存在的,是犯罪行為的共生體,并且不以人的意志為轉移。簡單來說,就是但凡兩個物體發生接觸,必將產生物質轉移現象,會帶走一些東西也會留下一些東西。但是這些證據并非存在于數據空間之中。我們不僅要在物理空間找傳統的證據,更重要的是在數據空間中尋找案件進行的各個階段的存在痕跡,并進行串并案分析。對任何工具和地點在數據的系統中都有可能成為串并案的潛在關聯點。互聯網+司法,將會碰撞出新時期的案件偵破途徑驅動模式,司法工作的效能。
(三)切實打好硬件和軟件基礎
公安部金盾工程與公安網相結合進行的全國公安快速查詢綜合信息系統和城市公安綜合信息系統建設、公安業務系統包括治安管理、刑事案件、出入境管理、監管人員、交通管理、進度信息系統等為依托,為串并案偵查提供了一定的硬件和軟件支撐。但是難題依舊存在。一是,跨系統跨數據庫的關聯分析難度很高;二是,共享機制缺乏,數據信息的應用仍存在邊界,整合效果不佳。收集數據,建立模型,完善串并案分析的系統設施仍任重道遠。
收集數據,搭建大數據平臺,進行智能檢索。運用知識圖譜技術實現數據關聯,提供智能檢索多維數據關聯展示。可以根據姓名、電話、特征等關鍵詞,檢索出組織、案件、圖片等信息進行主題分析。還可以進行人員甄別:制定用戶標簽體系,構建人員全景畫像及關系圖譜。
建立多維度模型。以洗錢罪為例,除了海量的交易數據,還可以結合社交鏈行為數據,根據其發生的時間、交易特征、刷卡商戶附近居住的人群社交量的數據,以及一些涉案人員發生交易的特定客戶的行為特征。不過總會有一些漏網之魚,不法分子將零散的把錢存入銀行,最后匯總到一個賬戶上。但如果洗錢網絡足夠龐大的話,支點的存錢人員相互之間可能沒有任何關系和交際。這就需要利用多維度數據反復驗證、比較、不斷優化。并且,借助機器學習、深度學習技術,不斷訓練、完善模型,加入新緯度的數據來提高模型的準確性。比如案件串并,將案件數字化,形成每個案件的多維向量特征。對每個案件的多維向量特征進行維度約簡;計算待分析的案件與向量約簡后的數據庫每個案件的相似度,找出數據庫中和待分析案件有關聯的串并案件。建立異常聚集模型,通過曾涉案的人員的上網的信息迅速定位到其地點,這個地址可以幫助我們很快地匹配人口統計數據。如果多個曾涉案人員突然聚集,或者有出境行為,即可預警,提前進行部署排查。高科技犯罪背景下,無論是在刑偵中的緝毒、反恐,還是經偵中的反洗錢、反詐騙等領域,無不需要大數據解決方案來支撐。公安大數據,會越來越精準地找到“他”。
三、逐步加強應用大數據串并案的實踐探索
公安偵查串并案件的數據挖掘技術,也越來越引起國內外學者的顯著關注,以文本字段為主逐漸演變為關鍵字識別,進行數據分析,對案件進行可能的串并聯分析。同時,隨著高科技的發展和科研學者們辛勤的努力,視頻圖片中人臉技術識別和通訊痕跡辨析進行的串并案偵查也取得顯著發展。
(一)簡單模型的建立
根據不同類型的案件分析建立不同的子根據不同類型的案件分析建立不同的子系統模型。以多發性侵財案件自動識別串并平臺處理的簡單流程為示范。但數據庫應致力于建立綜合總括的跨系統數據信息系統。
1. 數據采集
偵查人員日常接警、處警,將案件相關信息錄入系統平臺。
2. 數據預處理
將輸入的條件轉化成為計算機能夠識別計算的數字編碼。
3. 聚類分析
對輸入的規范化數據進行分析,得出一個或多個具有若干相同或相近的規范化數據條件的簇。
4. 人工決策
對聚類的影響因子進行調節,也就是要選擇相似度有多高的數據可以作為一個聚類的分類標準。
(二)大數據串并案實踐探索成效
廣東省中山市民警張福輝利用自身的實踐經驗與大數據分析相結合,創建了張福輝串并案分析模型,在實踐中做到了將大量隱藏不易被發現的信息和證據線索挖掘分析出來,以可視化的方式高精準度高效率的展現出來。福輝模型分為:從人到案、從案到人、從人到人、批量串并、自由串并、任務串并、跨區域串并等多個功能模塊。與以往的串并案耗費大量的人力物力財力進行人工比對不同的是,新的模型以關鍵字為核心進行數據采集和分析,大大提高工作效率的同時降低了使用門檻,與人工智能結合的過程中,大數據源隨著實踐發展不斷擴展,也能夠基于統一的數據模型拓展收集更多的情報線索,擴大案件潛在的串并案范圍,增強使用效果。以廣東省中山市的大幅度推廣為起點,福輝模型已經在廣州多個市縣,以及甘肅等省份進行推廣試用,已破獲眾多案件,取得顯著成效。
(三)相互配合中大數據偵查串并案效用發揮最大化
更好的串并案是各部門的相互配合。某市原國稅局曾對轄區的企業開展大數據分析后發現,有十幾戶經營塑料的公司都取得了失控發票,數額巨大。表面資料顯示,這十幾家的企業法人不同,地址也不一致。但經過數據比對,部分企業取得的失控發票的開票企業相同,一些企業向同一家企業開具發票。摸排后,發現這十幾家企業實際上由一人控制,有虛開發票的重大嫌疑。原國稅局啟動稅警合作機制,提請公安部門提前介入,聯合專案組制訂了統一部署、統一開展檢查行動的方案。稅務與公安部門發揮各自專業優勢,利用國家稅務總局的云平臺及電子底賬系統,分析涉案企業的納稅申報、發票流等信息,挖掘受票企業更多虛開增值稅專用發票的線索,及時跟蹤,并從貨物流、運輸流、資金流等方面調查取證,固定證據,確定了收網抓捕范圍。
四、樹立正確的大數據串并案價值觀
(一)積極學習創新,尋找串并案新路徑
大數據偵查是偵查機關順應信息社會發展潮流的明智選擇,其深度應用既有助于提高犯罪預防的精確性,提升警力配置效率,也有助于增強偵查取證的科學性,提高破案效率與破案能力,帶來用信息換安全的社會效果。從權利保障的角度看,大數據技術的應用將無所不在的記錄與數據經過分析、挖掘得出更為客觀、精確的證明犯罪過程的材料,客觀上有助于改變長期以來偵查機關對口供的嚴重依賴,可以降低對嚴重干預公民隱私權的技術偵查的依賴,帶來用信息換權利的法律效果。對于大數據偵查帶來的偵查效能提升與偵查模式轉型的積極效果,應當充分肯定。
(二)大數據偵查法律控制的必要性
大數據偵查尚處于初始應用階段,其雙刃劍效應亦同時凸顯,執法司法實踐中已然暴露出一些問題,對一些基本權利和法律價值形成挑戰,及時對其進行法律控制具有必要性。首先,大數據偵查的推廣適用標志著隱私逐漸受到限制,甚至有消亡的危險。大數據偵查植根于公民為參與信息社會生活而不得不交出并匯集的海量信息,必然帶來大規模監控的效果,即全體公民的各種信息都成為了其分析對象,這是一種不以犯罪嫌疑為前提的廣泛監控,全體國民甚至全球民眾都可成為潛在的偵查對象,大量無罪公民的個人信息在大數據偵查的過程中被儲存、比對、挖掘。大數據偵查的廣泛應用促使偵查權干預權利的類型發生轉換與升級,偵查行為的對象由傳統上的人身權、財產權轉向平等權、隱私權、人格尊嚴、精神自由等基本權利和自由,權利干預的類型更加無形化、抽象化,在權利體系中的地位更接近權利構造的頂端。權利本身的無形性、抽象性令干預權利的偵查行為更難識別與感知進而導致權利的救濟困難;權利位階具備更強的政治性,則意味著與國家權力的沖突會更為劇烈。在這個意義上,對大數據偵查進行法律控制是維系國家治理體系正當性的必然要求。如果任其發展,此類偵查方法將會加劇社會不平等的裂痕,抑制社會的活力與創造力。
(三)避免大數據串并案偵查避免偵查誤區
數據也可能犯錯,錯誤原因主要源于兩個方面:一方面大數據技術通過機器學習與人工智能,根據偵查人員設計的各種模型對數據進行挖掘,而各種算法與分析模型的來源只能是偵查經驗的人為積累。人類偵查經驗的局限性會照搬給機器算法,大數據的預測功能同樣會產生錯誤。在模型建構過程中,偵查人員的自由裁量類似問題在大數據應用程度較強的美國普遍存在,大數據偵查過程中,對于社會底層人群特別是有色人種的執法歧視被進一步放大,比如在大麻毒品犯罪打擊過程中,盡管白人與黑人具有相同的吸食比例,但黑人犯罪嫌疑人的犯罪數據更多地被收集并存入數據庫,其結果是更多的黑人犯罪嫌疑人被警察抓捕。
避免偵查誤區。無論是警方自建的各類數據庫,還是利用社會第三方機構的數據庫,司法實踐已經反復證明,數據瑕疵與質量低下的數據經常導致錯誤的關聯,甚至對公民自由帶來直接損害。依靠大數據進行串并案絕對不是分析員能夠使用的精確的工具,只是在找出案件的相似之處后,對相似點的重要性進行評估時使用的一種技巧。案件是否相似,是否需要進行串并還需要放在案件之間前后的聯系性中,綜合考察,客觀評價。在對相似性的重要性進行評價的時候,外界影響因素也應該被考慮在內。例如,電話登記人分析結果表明,相關案件中被聯系的人都姓陳,這一結果在歐洲是十分有價值的,但在中國恐怕就毫無意義了。
四、結語
馬云說,互聯網還沒搞清楚的時候,移動互聯就來了,移動互聯還沒搞清楚的時候,大數據就來了。依靠數據挖掘等技術發現數據之間的關聯關系和隱含規律,找到合適的關聯物,然后通過關聯物的變化來判斷現象之間關聯關系的強弱,依照關聯性強弱對關聯進行賦值,建立加權算法模型,最后輸出結論。是大數據下互聯網加司法的重要手段。公安部的案件統計中發現,案件主要分為兩類,一類是重大惡性案件,已經形成了多部門聯合作戰的趨勢。二是小案,主要是侵犯財產類案件,每年上升10%,成員分析,80%案件職業犯罪是由20%慣犯所為。大數據把數據整體的連接和呈現出來,通過實踐部門和技術部門的聯合作戰,對案件進行相似性分析,尋找串并案分析的可能性,找到案件突破點。認識到大數據的局限性,勇敢的追求和運用大數據進行串并案分析,是現代司法偵查的應有之義和必然追求。
參考文獻:
【1】黃勇主編,科學先鋒叢書? 科技創新,廣西美術出版社,2013.12,第32頁
【2】2015年8月 國務院 促進大數據發展的行動綱要
【3】 [美]迪·金·羅斯姆著,地理學的犯罪心理畫像,中國人民公安大學出版社,2007.4,第58頁