生猛海鮮
如果你是閱片無數的刑偵劇資深鐵粉兒,那你一定對《犯罪心理》《24小時》《疑犯追蹤》這樣的美劇如數家珍。從最早的全靠自身能力破案,到現在的高科技引入,相信你一定也從這些美劇中深深體會到了科技帶來的變化。隨著犯罪分子們撲朔迷離的身份與難度超高的犯罪手法不斷進步,探員、特工們的工作難度也在不斷增加。不過,好在有先進的人工智能,能夠幫助他們在調查過程中提前預測到犯罪分子的動向,查出他們的真實身份。
數據挖掘不是事兒
數據挖掘(Data Mining)是人工智能比較常見的應用方向之一。數據挖掘,顧名思義,是一種在海量并且看似毫無關聯的數據中尋找出大量也許有用也許沒用的發展規律,應用于新的數據并且得出結論的人工智能應用方向。在給定大量數據的情況下,機器能通過對已有數據進行學習得到一個量化或者非量化的模型,并將其應用于新得到的數據中。
在美劇《疑犯追蹤》里,人工智能The Machine就運用了典型的數據挖掘,而兩位男主人公前期也基本是依靠The Machine提供的社保號碼來尋找救助對象,預防犯罪。不過這個人工智能,從始至終都沒有對獲取的信息進行過單純的判斷,它只是在一個模型中通過大量的計算和分類,從而選出權重最高、特征最明顯的一個號碼。這種僅僅提取最明顯特征而不涉及任何智能化判斷的應用,就是典型的數據挖掘技術。
在這里,數據挖掘成為了統計分析方法學的延伸和擴展,它能夠在預測犯罪方面起到令人滿意的準確度,但同時也對使用者的要求很高。不過隨著計算機能力的不斷增強,人們也能完成難度較高的數據挖掘工作。而一些新興的人工智能技術在數據挖掘領域也取得了很好的效果,如神經元網絡和決策樹,在足夠多的數據和計算能力下,它們幾乎不用人的關照,就能自動完成許多有價值的功能。數據挖掘利用了人工智能和統計分析這兩門都致力于模式發現與預測的學科所帶來的好處,將這些高深復雜的技術封裝起來,使人們不用自己掌握這些技術也能完成同樣的功能,并且能夠更專注于自己所要解決的問題。
學習思維來輔助
除了簡單的數據挖掘,還有一些人工智能則或多或少運用了“學習”的思維在里面,比如《黑鏡》第三季“全網公敵”中的AI。在這種情況下,人工智能不再是單純作為“計算模型”的角色,它會通過不斷地學習和歸納發展擁有自己的價值觀,并在調查過程中起到很大幫助。
事實上,人工智能的所謂價值觀從某種程度上來說,也是計算得出的產物,人工智能就像智商卓越但是沒有任何善惡觀的小孩子。人們必須通過不斷輸入大量數據并且監督人工智能學習到的答案,從而不斷修正人工智能本身,最終才會得到一個具有自主判斷力的智能程序。
從《黑鏡》“全網公敵”一集中,推特上被投票“必須死”的人在控制人造蜜蜂的人工智能程序看來,就是被打上了“必須死”標簽的人。因為有這個標簽,他們就是人造蜜蜂的攻擊對象。這個人工智能是不會考慮這些有標簽的人是在什么環境因為什么被打上標簽的,程序也不會考慮這些人做出了哪些對周圍人對社會有好處的東西。延伸一下,一個老實本分溫柔善良的人因為意外(比如網絡意外,同名同姓)錯誤地被貼上了“必須死”的標簽。那么哪怕這個人平時再樂于助人、行為再完美無瑕,對于控制人造蜜蜂的程序來說,這個錯誤的受害者和之前那些被殺死的人一樣,沒有什么區別。
這種擁有自我價值判斷的人工智能也是目前研究的熱門之一,而且“是否有自我判斷功能”這個界限其實并不是特別清晰。雖然像“全網公敵”中的人工智能目前離我們還遙遙無期,但是利用數據挖掘和人工智能對犯罪進行預測和偵察已經不是什么新鮮事情了。911之后,美國國土安全局已經開始著手建立相關的研究機構和預警系統。無論是預警系統還是研究機構,都是基于收集到的有關民眾的大量活動信息數據。此外,互聯網每天產生大量的信息,如何通過對這些數據和信息進行挖掘從而發現可疑的人物和行為,也一直是信息安全科學家們的研究方向之一。而針對大量數據的實時分析也一直是數據科學家們面臨的挑戰之一。
從總體來看,美劇中無論是單純的“給出人物,讓執法者自己判斷是犯罪嫌疑人還是潛在受害者”,亦或者是“程序針對給定人物判斷是不是犯罪嫌疑人”,這二者目前都沒有完全得到實現。但隨著科技的不斷發展,這樣的人工智能出現在世界上只是早晚的問題。不過,面對這樣的程序,我們做好了制定善惡的準備了嗎?作為一個普通研究者,能夠承擔程序判斷“失誤”的后果嗎?畢竟這個世界上很多的事情,是不能簡單的一分為二的。或許就連機器自己,都需要一個灰色地帶來容忍判斷的失誤呢。