沈臻懿
作為信息處理的一大利器,人工智能技術在云計算和大數據的驅動下發展迅猛,并可從海量數據中獲取重要的情報。即使是一些粗看起來較為尋常的開源數據,在人工智能的“火眼金睛”下亦可從中發現違法者的蛛絲馬跡。
2021年1月6日,發生在大洋彼岸的美國“國會山淪陷事件”,令世人為之愕然。正如該國國會歷史學會專家塞繆爾·霍利迪所指出的那樣,這一令人震驚的場面,是自1814年8月英國軍隊襲擊并縱火焚燒美國國會大廈后,國會山在200多年間第一次被“攻陷”。
當時,正值美國國會參眾兩院聯席會議清點確認拜登當選總統的選舉人團投票結果之際,大批特朗普的支持者包圍華盛頓國會山,強行闖進國會大廳,攻陷了國會大廈這一美國最具辨識度的建筑。沖擊者在大廈內與美國國會警察發生激烈沖突,樓內的議員被緊急疏散,總統選舉計票工作也一度暫停,最終導致包括一名國會山警察在內的五人死亡。這些沖擊者在國會大廈內打砸、游蕩,大肆掠搶,還破壞了大量藝術品、家具和文件。
不少現任和前任美國執法部門人士坦言,“國會山淪陷事件”實乃美國安保史上最大的失敗,警方從示威者手中收繳了燃燒彈、雷管和槍支等物品。數千名國民警衛隊隊員到場驅散人群,并對現場進行清理。之后,美國聯邦調查局(FBI)展開了針對沖擊者的“全美大搜捕”。據《紐約時報》報道,涌入華盛頓并包圍國會大廈的人數雖有數十萬,但真正沖入大廈內的人員僅有數百人。在茫茫人海中搜尋幾百名沖擊者,無疑是大海撈針。為了能夠將其鎖定,FBI的“全美大搜捕”自然需要技術“加持”。
“國會山淪陷事件”的沖擊者多為美國時任總統特朗普的支持者。此前,由于推特(Twitter)等社交媒體封停特朗普賬號,并封禁諸多可能存在進一步煽動暴力行為風險的關聯賬號,特朗普的追隨者旋即將社交軟件帕勒(Parler)作為推特的替代品。帕勒擁有人數眾多的特朗普支持者、陰謀論者以及右翼極端主義者,發布的帖子中有著大量煽動暴力的內容。其中就包括了不少參與國會山沖擊的人員和“炫耀”國會山淪陷的帖子。
互聯網的高度普及,使得各類社交媒體上的開源數據成了相關情報分析的重要來源。帕勒上的這些公開帖子,即是在“國會山淪陷事件”調查中尤為重要的開源數據。面對海量的開源數據,若是文本信息,通常可利用關鍵詞來進行檢索;但對于視頻、圖片或地理坐標等數據,則需要借助人工智能技術,來準確找尋到所需信息。“國會山淪陷事件”后,谷歌、亞馬遜網絡和蘋果應用商店相繼取消并下架了帕勒。不過,技術專家通過對帕勒上的開源數據挖掘,已獲取了約60TB容量的數據信息。其中就包括了帕勒上的每篇公開帖子,以及含100萬個視頻和1.5億張照片在內總共4億多個文件。這些文件中都嵌有GPS定位坐標、日期、時間等元數據。
較之其他一些社交媒體,帕勒并不會從用戶上傳的數據信息中剝離元數據,這為執法人員的案件調查和分析提供了極為有利的條件。作為信息處理的一大利器,人工智能技術在云計算和大數據的驅動下發展迅猛,其可從海量數據中獲取重要情報。即使是一些粗看起來較為尋常的開源數據,在人工智能的“火眼金睛”下亦可以從中發現潛在風險。此外,通過對開源數據的挖掘以及人工智能分析,相關部門還可開展風險識別、分析、預防等網絡安全方面的工作。
美國“國會山淪陷事件”中,沖擊者在沖進國會大廈的同時,將許多在大廈內部拍攝的帶有潛在罪證的視頻和照片上傳帕勒等社交媒體平臺。由于帕勒上的數據皆為公開,調查人員在抓取、捕獲網站平臺上的所有內容并進行存檔后,即可從中對元數據進行提取,并檢視照片、視頻的設置時間以及特定的GPS坐標,進而有助于執法部門確認這些帕勒用戶在事件發生期間是否就在國會山以及是否參與了此次沖擊。
除了對于已發生的事件進行調查外,開源數據的挖掘還可用于對即將發生的犯罪予以預防和制止。比如,某些不法分子為了所謂的“出名”,往往會在犯罪之前將相關信息發布在社交媒體上。若相關部門通過開源數據挖掘,并對收集到的信息進行梳理和分析,即可提前制止犯罪的發生。
“國會山淪陷事件”發生后,美國聯邦調查局在一份聲明中稱,“FBI正在收集2021年1月6日發生在華盛頓特區美國國會山及周邊地區與該事件相關的數字信息和情報”。結合這一事件的調查進展情況,美國警方陸續公布了一些涉案人員的照片,其中就包括了可能導致國會山警察布萊恩·斯尼克死亡的嫌疑人照片。據照片顯示,這名頭戴藍色針織帽、留有灰白胡須、身穿格紋外衣及迷彩長褲、身背雙肩包的男性,因與國會山警察謀殺案有關已被通緝。結合另一段視頻資料,該名男子向現場警方人員拋擲了消防滅火器,滅火器從一名警員頭盔上彈起后,擊中了另一名警察,并導致其向后倒地。在這些影像資料的支持下,執法部門和技術專家得以對其中的涉案人員行為進行調查,并結合人臉識別技術鎖定嫌犯。正是在人臉識別技術的幫助下,美國聯邦調查局鎖定了在國會山淪陷當天闖入美國眾議院議長辦公室,并帶走其筆記本電腦的嫌犯。同時,美國警方還在人臉識別技術和數字化跟蹤技術的幫助下,逮捕了一名叫理查德·巴雷特的男子,正是這名被美國媒體稱之為“畢哥”的沖擊者,把腿蹺在眾議院議長辦公桌上的照片在媒體上被一度瘋傳。
沖擊事件中留下的大量數據信息,包括現場監控、互聯網信息,甚至是沖擊者的自拍及其“直播”等,都可為執法部門通過人臉識別技術和數字化跟蹤技術持續追查國會山沖擊人員提供條件。為此,美國執法部門連續發布公告,呼吁并尋求公眾提供與國會山沖擊者有關的信息。自當地時間2021年1月6日晚間起,FBI就在其官網、華盛頓分局官方推特以及華盛頓各公交站貼出通告和字幕,并提供了表格鏈接,以接受社會公眾提供的數字媒體信息。
在互聯網時代,尤其是各類移動端的即時通信和社交媒體較為普及的時代,全世界已被數十億的攝像頭、傳感器和微處理器等覆蓋。正是由于數字信息的特點,美國“國會山淪陷事件”中的各類蛛絲馬跡,才得以成為數據信息被留存。因此,對數字信息以及開源數據的挖掘、人臉識別以及數字化跟蹤等數字技術的應用,在此次美國國會山沖擊者鎖定過程中發揮出了獨特的作用。
編輯:黃靈? yeshzhwu@foxmail.com