劉敏
“任何先進的技術,初看都與魔法無異。”
當科技持續發展的時候,就不會因為人的意志再停下了。
兩個月前,一位叫亞當(Adam Jakowenko)的普通網友在YouTube上上傳了一段視頻:“打算調戲一下我的Echo和Google Home。”
Echo和Google Home,分別是亞馬遜在2015年、谷歌在2016年推出的兩款智能家居助手,簡單講,這是兩款智能盒子,能用語音直接激活,下達查詢天氣、播放音樂、開關燈等語音指令。順暢的時候,用戶能和它們就美國國家航空航天局(NASA)的火星計劃、紐約未來天氣走向、晚上到底去哪家餐館更方便等話題聊上幾個來回,看上去有點像一個藏在機器里的家庭管家。
兩個產品代表著目前智能家居產品的最高水平,它們反應靈敏,只要一叫它們的名字,機器上的LED燈瞬間亮起,開始捕捉用戶的指令。也正因為這種忠實的反應,包括我在內的用戶,很容易就升起捉弄它們的念頭。

美劇《西部世界》劇照
亞當找到了一個無限循環的點子——視頻里他對著Echo問:Alexa(Echo語音助手的名字),我今晚的日歷里有什么計劃?
Echo的環形燈立刻亮起,朗讀起日歷記事的標題:“今晚6點,說,‘嗨,Google,我今晚的日歷里有什么計劃?”
句子中的“Google”一詞瞬間點亮了Google Home,可憐的機器人把后面這句當成了對自己的召喚,一板一眼地念起了日歷里的信息:“你今晚6點的計劃標題是:‘Alexa,我今晚的日歷有什么計劃?”
Alexa、Google……日歷標題里的名字,變成了兩臺機器互相喚醒對方的指令。正因為機器對人類語音的高度靈敏,又因為機器自帶著高度仿真的機器語音,它們分辨不出對面是一臺機器在給自己下達反復無效的指令,這種喚醒不停地來回進行,而且會無限循環下去。
亞當其他視頻只有不到100的播放次數,這段調戲Echo和Google Home的視頻已經有近84萬的點擊。
網友在評論里哈哈大笑:“好蠢啊!”
等等,你為什么要用這個“蠢”字?這是兩臺機器啊。
更多的留言在說:“別看樓主現在笑得開心,等到機器統治人類,第一個捕殺的就是你。”
“人工智能”這個詞,在去年又一次熱了起來。互聯網在這一點上跟時尚界有點像,風水輪流轉,不知道哪個風尚又會重新時髦起來,夾在大數據、云計算、VR、區塊鏈、物聯網等熱詞里,人工智能算是個老面孔了。2016年之所以再次被大眾社會熱議,一是因為3月份AlphaGo戰勝了圍棋世界冠軍、職業九段選手李世石;二是由于10月份HBO制作的美劇《西部世界》熱播,10集電視劇塑造了一個高度逼真的機器人主題公園,游客在這里無限制地滿足殺戮和性欲的需求,最終機器人喚起了自主意識,開始反抗。
《西部世界》其實是一部老片新拍,早在1973年,科幻作家克萊頓就籌資自導了同題電影。其中有一段場景,是從機器人的角度出發拍攝的主觀鏡頭,這短短幾分鐘是世界首次在電影制作中應用數字成像技術,因為技術太過粗糙,導致視頻的像素不夠,畫面看上去就像是打上了馬賽克。但也正因為這段圖像模糊不清,帶著數字氣味兒,反而契合了當時人們對于機器人視覺的想象——1973年,距離人類第一次登月剛剛過去4年,世界上第一臺家用電腦Kenbak-1剛剛誕生兩年,普通觀眾對電腦技術所知甚少,無法想象機器人攝像頭里的世界,同樣,人類眼中的機器人智能,也是模糊而不確定的。

俄羅斯加里寧格勒市的著名景點“蘇維埃樓”
在科幻故事里,有智慧的人造機器人,是貫穿于各大文明中的文學母題。《伊利亞特》里希臘神祇赫菲斯托斯(Hephaistos)有眾多金子打造的女仆,幫助他完成各種工作;《列子·湯問》中西周工匠偃師造出的歌舞藝人,“領其顱,則歌合律;捧其手,則舞應節。千變萬化,唯意所適”。從內臟到皮毛,無意不栩栩如生;到了20世紀,科幻小說及電影開始塑造出更具象的人工智能形象,1927年的德國電影《大都會》、1968年的《2001:太空漫游》、1982年的《銀翼殺手》,1984年的《終結者》、1999年的《黑客帝國》、2001年的《人工智能》……到如今的《超能陸戰隊》《她》《機械姬》《復仇者聯盟2:奧創紀元》,觀眾們已經默認為人工智能的終極發展,會是一個有人形的、智慧與人類相當甚至超過人類的并對人類的存在具有威脅的機器人。
真正的人工智能概念,是在1956年被第一次提出來的。那年夏天,在美國達特茅斯學院舉行的一次會議正式確立了Artificial Intelligence“人工智能”的名稱,并討論了人工智能的研究領域和相關問題,同時也出現了一批最早的研究人員。因此這一事件被廣泛認定為人工智能誕生的標志。
在科幻和科學中,人工智能呈現出兩種面相,一個正沿著完美的設定轟轟烈烈地前進,另一個經歷了數次炙手可熱-灰心失望-冷卻-東山再起的浪潮。至今講起“AI”兩個字母,很多人的第一反應要么是圖靈測試,要么是斯皮爾伯格的同名電影。然而科學與科幻,講的從來不是同一個人工智能,二者相互塑造。
著名科幻小說家阿西莫夫給科幻下過一個極端純粹的定義:“科幻小說涉及的是科學家在未來科學領域中的工作。”
在科技急速發展的20世紀里,阿西莫夫的這個定義反復被證明。例如著名科幻作家阿瑟·克拉克在1945年發表的小論文《地球外的中繼——衛星能給出全球范圍的無線電覆蓋嗎?》中提出同步軌道通信衛星系統的設想,基于這個幻想,1967年,科學家們真正制造出僅用3顆衛星便覆蓋全球各個角落的衛星通信系統,據說此后世界通信衛星組織每年都會象征性地給克拉克支付1美元的版權費。
在美國成功登月前一年,1969年,斯坦利·庫布里克執導、與阿瑟·克拉克合作編劇的《2001太空漫游》上映,這部史詩巨作至今都因晦澀沉悶而讓一代又一代的新觀眾感到不解,然而在觀影后,聯系到這50多年里空間技術的發展,又能給觀眾屢屢帶來恍然大悟的感受。電影中科學家與女兒視頻通話,就是今天的FaceTime;宇航員在太空中收看新聞的平板屏幕,看起來就是今天的iPad。電影里的太空飛機、太空站的構想,后來成了多國太空總署設計太空站的參考來源。美國斯坦福大學物理學家、1996年諾貝爾物理學獎獲得者道格拉斯·奧舍羅夫也是恍然大悟的一員:“當時,我并不認為它是我看過的最好的影片,但直到今天,我仍然認為,我們今天對太空人如此迷戀,在某種程度上是這部影片的功勞。”
阿西莫夫自己的機器人系列小說里,出現過的陪伴機器人、采礦機器人、農業機器人等,現在都已經變成了消費級產品,或者工業界的常用設備。美國科幻電影中經常出現將人體與機械組合起來的“賽博格”,也就是“電子人”。《機械戰警》的主角警員梅菲被兇徒殺死后,被改造成電子機械人,至此刀槍不入;《星球大戰》中,黑武士肉體被毀,變成一個穿戴黑色笨重的盔甲和維生系統的機械化人。現實生活中,已經有為殘障人士設計的機械義肢,用腦電描記法或綁定肌肉上的神經單元等方法操縱。2014年的巴西世界杯開幕式上,一位截癱青年就憑借一雙腦控外骨骼,開出了世界杯的第一球。
在人工智能領域,科幻正在描繪著未來科學發展的可能性。1818年的《弗蘭肯斯坦》被認為是世界第一部真正意義上的科幻小說,提出了人造人的具體想象,但真正的人工智能開發,還是在1950年之后,經過計算機技術真正興起,隨著控制論、信息論等學科開始萌芽,到21世紀,隨著現在機器學習、深度學習、機器視覺、語音識別、自然語言處理、生物特征識別等算法和技術不斷完善。
在2016年這一版的《西部世界》里,電視劇展示了一個全新的機器人制作邏輯:3D打印的骨骼、灌注的人造血漿、可以語音喚醒關閉等種種技術,這些技術已經離現實科技極度接近了,以至于觀眾明明知道是科幻,卻又帶著隱隱危險的興奮感。
說回開頭的兩個家用裝置,Echo和Google Home目前并沒有超出用戶的想象。自從2010年Siri通過蘋果手機問世,人們開始接受有一個人類聲音藏在手機里,能隨時隨地召喚出來,幫助我們定鬧鐘、查找電話號碼。但這些年微博、微信上每次關于Siri的熱門話題,基本上都是各種啼笑皆非的段子,讓Siri唱beatbox、問Siri種種刁鉆的問題,因為回答在邏輯之外,而產生了各種幽默效果。
Siri是語音識別和語義識別的結合,是一個真正人工智能的產物,可她能做到的無非是一些初級外部服務應用,問世6年之后,大家開始只把她當作一個普通的語音助手,一個會做簡單對話的軟件而已。
人工智能和軟件的分界線沒那么明顯,如果硬要做區分,對于人工智能系統而言,它的特點就是在有限的范圍或領域內具備認知能力,而軟件系統的主要特征則是具備普遍的問題解決能力。
“認知能力”是目前最難的部分,這也是目前人工智能尚未突破的瓶頸。而在大范圍計算這個量變上,除了Siri,其實我們日常生活里已經發生了無數的變化。
在過去兩年里,我們創造的數據要多于人類歷史上創造數據的總和。這主要是由于傳感器(2013年平均為100億個,預期到2020年達到1萬億個)和連接設備(2016年為64億個,預期在2020年達到208億個)的使用。這些傳感器和設備每年生成數百澤字節(Zettabyte)的數據,每秒生成上拍字節(Petabyte)的數據。
幾年前熱炒的“大數據”概念,如今已經變成了非常成熟的實際應用。大型互聯網企業每天都在吸納急速增加的海量信息,人工智能算法正在提高處理數據的效率,同時,這些數據也是人工智能自我進化的依據。
2016年10月18日,微軟宣布對話語音識別技術在產業標準Switchboard語音識別基準測試中,已經達到了低至5.9%的詞錯率,由專業速記員組成的人類對照組的最低詞錯率同樣是5.9%,這意味著微軟的語音識別系統的語音識別能力已經與人類專業高手持平。而在20多年前,20世紀90年代中期,微軟剛剛組建語音團隊時,這個錯誤率是80%。微軟首席語音科學家黃學東稱,在過去20年里,基本上每年錯誤率都會較上一年下降15%左右,按照這樣的速度推下去,語音識別達到人的水平指日可待。
阿里2016年的各種發布會上,已經開始使用阿里云ET人工智能做現場速記,直接在大屏幕上顯示演講者的說話內容。杭州市西湖區人民法院已經開始用ET人工智能代替書記員做庭審筆錄,如果事先給ET足夠的卷宗學習時間,做好人名、術語等儲備,現場速記的準確率可以達到96.2%。
阿里云iDST自然語言研發團隊負責人初敏在2000年開始從事語音分析與合成方面的研究,像Siri這樣的應用,早在世紀初,就在研究界有過雛形,但持續改進算法并沒有什么意義:“這條路一直沒走通。第一,沒有網絡流量。當年上網費用太貴,網速也慢,如果放在客戶端上做數據處理,速度和容量又下去了;第二,缺少外部服務。現在你問Siri天氣、訂外賣,直接去外部服務里調取數據就可以了,當年配套應用一無所有,即便研究出來了也沒用武之地。”
現在初敏的開發成果正應用在螞蟻金服的客服監督上。過去用抽樣、人工聽錄音來做外包客服的監督,這遠遠跟不上客服規模擴張的速度。現在用人工智能的語音分析系統,把呼叫中心的錄音文件100%自動轉化成文字,再用自然語言的處理手段判斷服務質量:接電話后有沒有問“您好”?客服有沒有罵人說臟話?在顧客沒有主動告知的情況下,客服有沒有誘導顧客報電話號碼,刺探對方隱私?——原來只能按照概率抽樣調查的問題,現在通過人工智能整體抓取+人工團隊核查,問題大幅度減少,花掉的人工時間反而更少了。
但是跟科幻小說里的單一場景相比,現實社會還是要復雜得多。即便是全球科技都在飛速進步的語音識別,各家的軟件在嘈雜環境下的錯誤率就高得驚人了,這又是此前提到的“認知”問題:機器認不出不同的音色,而最笨拙的速記員也可以分清楚錄音中不同的聲音來歷。當有高噪音、方言、有重疊說話,或出現不熟悉內容的情況下,機器6%的詞錯率,就會迅速飆升至20%、30%甚至更高。
另一個常見的問題是,人工智能過于忠實于人類,但它并不能充分理解人類。比如在今日頭條APP里,軟件用協同過濾+基于內容推薦的方法,給用戶做個性化內容推薦。你也許是一個醫學界人士,對癌癥治療新動向、新型醫藥、行業大會等消息感興趣,但當你無意間點開一個明星八卦,機器會自動認定你對這次劈腿新聞有濃厚興趣,隨后孜孜不倦地向你推送這次輿論熱潮里的各種相關信息。我已經聽不下三四位科學界人士提到,去年夏天如何因為自己的一個好奇心,拇指一點,就被裹挾到無窮無盡的王寶強離婚新聞里。在這種內旋封閉式的新聞旋渦里,人們一旦開始滿足內心最直接的興趣,又很難再把自己拔出來了。
在電影《機械姬》里,程序員加利抽中了大獎,被邀請到老板納森家中度假,同時幫助他測試最新研發的智能機器人艾娃。到了影片結尾時,一切懸念全被揭開,加利才發現自己中了一個圈套:實際上,艾娃完全是針對他設計的,老板利用大數據分析,在員工中找到了這個26歲的男青年,加利父母早亡,缺少感情慰藉,又情感豐富富有同情心,懂計算機邏輯,同時又性格單純沒有女朋友,是完美的測試對象。最后連艾娃的長相,都是根據加利私下看色情片的喜好,有針對性地人工合成出來的。
與其說是加利參與了一場圖靈測試,還不如說是機器人在測試他,隔著透明的玻璃房子,人與機器人觀看與被觀看的方向隨時可以轉換。
屏幕外的我呢?就在我用家里的互聯網電視,打開優酷APP看這部電影的時候,我順手發現出差的丈夫昨晚剛用這個賬戶看了一集國產電視劇;手機上朋友一直用微信發來照片、語音和文字,和我討論要不要做眼部整形,發達的醫學美容技術已經能讓人像艾娃那樣修改自己的容貌,購物一樣選擇自己喜愛的雙眼皮寬度和鼻梁形狀;我同時檢查當天的PM2.5指數,驚恐地發現紅色預警是真的,外面正是年度最嚴重的霧霾大爆表,趕緊打開空氣凈化器制造干凈空氣……電影里,納森把機器人形容為迷宮里的小白鼠,可是屏幕外面,像我一樣的小白鼠其實已經生活在層層迷宮之中而不自知了。
在2017年,科技依然會沿著既有的軌道運行,科學發展到今天,很難突然出現類似相對論、互聯網、天文望遠鏡、心臟移植這樣顛覆性的巨大創新了。更多的發展是潛移默化的,對于人工智能,就是無數更新的算法從方方面面把人類的工作變得更便捷、更自動化,流暢得甚至讓人意想不到。
人工智能垂直新媒體“機器之心”的主編羅松告訴我,他的編輯部正在用一個自己編寫程序,可以從幾百個類似網站、公眾號、推特賬戶、YouTube賬戶等渠道抓取最新關于人工智能的新消息。經過不斷調整權重,程序能自己分析出消息的重要性,編寫成當天編輯需要看的信息匯總。大量英文消息的閱讀在未來也可以通過工具縮短時間,結合谷歌翻譯剛剛通過神經網絡機器翻譯系統取得的大幅質量提升,羅松覺得“未來語言屏障都會被機器消滅”。
這反而讓我有點心事重重:一方面,我期待有一個記者專用的程序,輸入待采訪對象的名字,電腦就飛快地抓取到對方方方面面的信息,編寫出一份詳略得當的背景資料集,這個工作至少能節省我一天半的準備時間。采訪之后,把錄音上傳到語音整理網站,一小時錄音不到5分鐘整理完,又能解放出我至少半天的時間(而且現在很多同事就是這樣做的,花不到30塊錢整理出1小時錄音,盡管錯誤率極高,也足夠回憶起交談時都說了些什么)。
三分之一的資料搜索,三分之一的采訪整理,都交出去了,如同阿西莫夫所說:“電腦看上去能偷走人的靈魂。它們熟練地解決我們日常工作中的問題,我們漸漸發現自己帶著越來越多的信任把問題交給它們去解決,并且帶著越來越多的謙卑去接受它們給出的答案。”那我存在的意義是什么?
但這又像是一個偽問題:放在100年前,我和我的女同事們最大的價值應該是洗衣做飯帶孩子,今天這一切都已經被洗衣機、洗碗機、烘干機、掃地機器人解救了出來。為什么一些機械化的程序性工作不能再交給機器呢?
在苦苦思索的過程中,我隨手發了一條微博,表達了自己對養貓的渴望,那條微博很快收到了上百條評論,人們用手機拍下家里貓咪的照片,免費一鍵上傳到留言中。看到那近100張家貓照片的瞬間,我仿佛變成了3年前的谷歌大腦,正在被投喂各種非標準的貓咪照片,高速訓練“什么是貓”這個圖片識別問題。
2012年,谷歌大腦做了一個著名的實驗:1000臺計算機組成了超過10億個“突觸”連接的神經網絡,研究者輸入了1000萬個靜態圖像,通過3天的密集尋找重復出現的模式后,谷歌大腦終于可以憑借無監督學習,識別出一些特定的重復類別:人類面孔和人類身體,以及貓。
“認出貓”,這個過程變成了當年最為轟動的一篇人工智能論文,科學家們把這一成果當成是深度學習復興的里程碑。這又說回到那個認知的問題——我點開微博上的圖片,幾乎不需要反應時間,我就能認出圖片里有一只貓,這是人類在兩三歲就能飛快習得的辨認技能。我們還能認出貓的顏色、品種,立刻辨識出它在睡覺還是撒嬌,是一只剛出生的奶貓,還是壯年做過節育的大家伙。讓計算機去做那些成人能夠做到的事情很容易,但是讓它們去做那些1歲孩童做的事情幾乎是不可能的。谷歌大腦想做到這一步,恐怕還要用上若干年時間。至于這個“若干”是多少,恐怕要根據這個任務能帶來多大的商業收益來決定了。
人工智能什么時候能達到科幻小說的水平?我對初敏博士提出這個問題,她的回答很直接:要看資金的投入和實際需求是什么。
初敏認為,AlphaGo的能力飆升,背后是Deepmind被谷歌收購后,獲得了充足的研究資金和龐大的數據庫。在《2001太空漫游》里,智能計算機HAL9000能閱讀宇航員的唇語,發現自己即將被關閉而發起復仇,事實上唇語識別在現在已經沒有多少技術性問題了,只是因為用戶群體太小,科研上很難拿到足夠資助,才一直沒有發展起來。
如此說來,人工智能的發展,背后依然是經濟基礎決定上層建筑的這一樸素邏輯。在60多年里,技術、經濟、政治背景,都在影響著人工智能研究的起起落落,正如上一次人工智能的春天還是在20世紀80年代,日本發起了第五代計算機系統工程,為人工智能的實現搭建平臺。因為日本戰后經濟重建的神話,西方計算機精英們對此次人工智能的復興充滿信心,合力促成了一次繁榮的小高潮,最后卻因為計算機技術的掣肘,又再一次暗淡收場。
在2017年的今天,運算能力、資金、數據的現狀已經今非昔比,人工智能的發展形勢遠遠比過去更樂觀。當《黑鏡》這樣的科幻電視劇出現,人們發現,科技也許只是一個小小的變化,就能大幅度地改變社會的行為方式,比如想想微信這一個小軟件,如何顛覆了我們的社交和閱讀習慣,即便認識到自己如何被這個軟件異化,恐怕絕大多數人也都回不去過去的生活了。
當人工智能繼續進步,許多職業將一個一個地受到沖擊,速記員也許首當其沖,翻譯、司機、天氣預報員、人工客服、體育新聞記者、股票分析師、雜志編輯……也許這些職業很快被機器取代,也許人們會發現還是同類更靠得住。當技術不斷發展,人類的悲觀主義和樂觀主義總是交織夾雜,被前進的車輪所裹挾,就像瓦爾特·本雅明的比喻:“從天堂吹來了一陣風暴,它猛烈地吹擊著天使的翅膀,以至于他再也無法把它們收攏。這風暴無可抗拒地把天使刮向他背對著的未來,而他面前的殘垣斷壁卻越堆越高直逼天際。這場風暴就是我們所稱的進步。”
更大的擔憂,還是那個永恒的題目:當人工智能發展到一定程度,會不會超越人類的智慧,進而取代人類在地球上的位置?
阿西莫夫的機器人三定律,聽上去很像是摩西十誡,神站在山頂向人類宣示圣諭,最后卻只不過是一個行為參考指南而已。現在看起來笨拙的Echo和Google Home,代表著互聯網公司對我們私人生活空間的爭奪,所有大公司都在做智能家居,搶占客廳的入口,爭先恐后地取悅消費者,獲得幫人開燈關燈的殊榮。
在可以預見的未來,當你進入家門(智能鎖認臉開門),脫下鞋子,邁入客廳的一瞬間,各種AI已經感官全開,他們已經提前為你打開了空氣凈化器,放好了溫度適中的洗澡水,喜愛樂隊的最新專輯正在播放,家庭中樞開始與你寒暄。
今日笨手笨腳的語音助手,在那時也許已經變得跟HAL9000一樣,并沒有一個實際的形體,又因此無處不在,它會與你聊天,取悅你,談論它(虛擬)的煩惱,甚至像電影《Her》一樣變成你依賴的戀人,無論心理還是生理上。
當你身處在這種全方位的照顧下,一舉一動都被人工智能溫柔地注視,你的體溫、排卵期、指紋、虹膜……都已經上交給了這些AI,到哪個時候,又到底是誰在豢養誰?作為一個交出隱私、交出勞動能力的人類,此時是否被取代,又對地球會有什么區別?
人工智能是人的一種追求,也是一種自我反省,永遠有一類人在孜孜以求地推動著技術進步,也永遠有一類人在杞人憂天,但這種杞人憂天不無價值。當科技持續發展的時候,不會因為人的意志再停下了,未來所有擔憂的問題,也許還是需要科幻小說來解答,在《銀河星系漫游指南》里,那個“宇宙目的是什么”的終極問題,早已有了答案:“42。”