還記得《終結者》、《黑客帝國》、《變形金剛》等好萊塢科幻大片中電光火石的場景嗎?一些由金屬機械構成或者直接以人形出現的機器人在打打殺殺,他們是由人類制造出來,但有著像人類一樣的意識,能夠思考、判斷—除了感情之外,他們的理性和智商與人不相上下;他們中的一部分,甚至超出設計者的構想而意外地具備人性。
機器人以及人工智能常常是科幻片熱衷的選材,但現實中相關技術的研發并非是為了戰爭,而是更多地扮演人類助手的角色,就像善良的瓦力一樣。
超級電腦“沃森”同樣在2月的一場電視直播的智力競賽中戰勝了人類對手,但人類并不需對此感到擔憂。這個由IBM和美國德克薩斯大學花了四年時間開發出來的電腦系統,比1997年同樣由IBM開發的、戰勝國際象棋大師的“深藍”進步很多。它可以直接理解人的語言(目前只包含英語),包括大部分模糊性、歧義性的言辭甚至諷刺、嘲笑,并能根據存儲的信息進行快速、大量的計算分析,還可以判斷自己即將給出的答案的勝率。這一過程已經不再是像深藍一樣所有行為只限定在國際象棋規則之中。參與沃森開發的IBM中國研究院資深經理潘越說,沃森應用的機器學習藝術,已經讓它具備了一定的學習能力。這些進步,都讓沃森更進一步接近于有意識的機器人。
計算能力超過深藍1000倍的沃森,并不是一個炫耀技術而毫無用處的家伙。馬里蘭州大學醫學院已經開始將其應用在醫療診斷系統之中。比如一個罕見病例,如果需要醫學專家在眾多資料中篩選過往信息需要漫長的時間,但沃森可以很快“閱讀”完資料并給出判斷。其中的難點在于,包括醫療等現實世界的問題并非能簡單用是或否來回答,沃森可以自己判斷給出答案是有九成把握還是只有五成。
相比計算機的計算速度,沃森的這一進步更多是得益于算法能力的提升。實際上,我們每天面對的電腦及互聯網背后都是由無數計算機算法構成。比如當你搜索關鍵詞“iPhone4”的時候,百度的廣告系統計算之后可能認為你需要購買手機而為你推薦一家電子商務公司,也可能認為你收入不錯而呈現一款汽車的廣告。比如在谷歌地圖中,從A點到B點路程最短路線,與耗時最短路線可能并不一致,前者為簡單計算,后者則依靠更為復雜的算法。一些開心網或新浪微博用戶會驚訝于系統自動推薦的好友,往往是自己相熟或感興趣的人,背后同樣有著關于關系鏈條、個人資料、談論話題等信息的分析計算。
沒錯,像瓦力一樣具有感情的機器人還未出現,但像沃森這樣的超級電腦已經開始為人類服務,越來越懂你的互聯網已經每天就在你身邊了。這是一個更加智能的時代,也是一個更加感受不到機器外形的時代,他們融進了生活和商業細微的毛孔中,你摸不到它們的金屬外殼,看不到它們的線路,它們在原有基礎上更加人性化,經過對比你會發現,原來人工智能一直在進化,更加懂用戶的需求,不再像昨天那樣機械和笨拙。
智力比拼
人工智能能否在某些方面超過它們的創造者人類本身?實際上對于人工智能的看法,學界一直存在著兩種觀點,一種是強人工智能觀,認為機器會最終達到人類智能的水平;另一種是弱人工智能觀,認為機器是在按照人類指令行動,人工智能與人自身的智力是本質不同的東西。后者目前獲得絕大多數的支持,而前者的研究突破很少見,只能在電影院里通過科幻大片快速提前觀看其影響。
相比人腦的物理局限,機器有強大的存儲、運算能力,穩定性強,不受心理作用影響,但創造性差,按照程序設置執行既定的行為,凡是程序員教它了條件和反應,它就會相應執行。深藍的勝利并不能全面說明人工智能真正超過了卡斯帕羅夫,深藍獲得榮譽得感謝IBM的研制者,因為他們向深藍輸入了百年來所有國際特級大師的開局和殘局的下法。在下棋通用法則之外,那些具有個人智慧結晶的東西實際上賦予深藍成為一個“專家系統”,它依靠強大的存儲運算,以百位大師之力戰勝卡斯帕羅夫。
人機對弈現在已經很普遍了,最新的成果是應用更為廣泛的自然語言識別,沃森即為代表。沃森在《危險邊緣》(Jeopardy!)中面對的兩個人,都堪稱是絕頂高手,一位是連贏74場的答題王,創下連贏場數最多紀錄,一位是獲獎金額最高紀錄。
沃森的工作流程是,識別人類的語言,按照設定的算法搜尋資料、計算結果,再以人類的語言輸出結果。比如提問:中國的首都是哪里?沃森會經過問題分析、信息檢索和答案提取三個步驟來得出最終結果,比如他至少要通過模糊算法得知這是問一個國家,而不是問一個叫做“鐘國”的人的問題。沃森通過攝像頭掃描問題,用一些列算法將問題關鍵字拆解,之前它被輸入了結構化(百科全書等)和非結構化(互聯網網頁)的知識源,在這些數據中搜索加工,最后將結果輸出。潘越說,沃森實際上是一個平臺上搭建了100多個程序和算法,最初算一道題耗時長達2小時,后來IBM研究團隊發現很多程序可以并行,最終將它的答題時間縮短到了3秒鐘。
載體無處不在
計算機帶動的人工智能的應用,不僅僅體現在你所能看到的成型的機器和計算機上。各種并不成為電腦的計算機也在以巧妙的方式延展著人類的智能,這些也許你生活中每天都在用,但沒有想到它們除了功能之外,也在以一種不可思議的悄無聲息的方式改變生活和商業。
比如你的身份證、公交卡、門禁卡等可以讀寫記錄信息的設備,就可以通過算法來推斷出用戶的一些行為。其中除了用戶需要其記錄的對用戶有用的目標數據外(比如你的身份信息、公交余額、上班打卡時間),芯片在某些方面也積累了用戶的行為數據。比如公交刷卡也會根據交易地點來分析出你的行進線路,門禁卡記錄你離開辦公室外出的頻率等。
去年12月,在美國一個叫做Anthony Carleo的男子從 Bellagio賭場盜取了價值 150 萬的籌碼。他所盜取的籌碼都帶有RFID標簽,實際上是一種芯片。這場盜竊案讓外界知道,賭場用這些籌碼可以很方便地跟蹤錢的流向,實時監控每臺賭桌的輸贏情況,看莊家是否有算錯交易數額。當然他們由點及面,也能通過數據挖掘出顧客的一舉一動,比如顧客的輸贏情況和消費習慣。比如當你剛心里想需要吃點什么東西的時候,會發現服務人員已經將餐食送至身邊—在這個時候,籌碼已經是機器人的載體。
同樣記錄顧客消費行為數據的實驗也在我們身邊進行。在MeCity上海試點門店內,RFID芯片被植入到吊牌中,顧客在選購衣服時隨手的一個動作,都在創造價值。某件衣服被顧客拿起幾次;拿起后立即放回,還是會試穿;試穿后決定購買,還是放棄……諸多信息都會被服務器記錄下來,并經過梳理提供給設計、市場、門店等環節參考,以求洞悉顧客的喜好。
實際上,這樣的硬件開發已不再具有太高門檻,運用效率的高低更多是在于算法的描述能否更加精準。比如購物潮流參謀或者交通付費的作用,更在于它也記錄人們無意識產生的那些自己都不明確的動作并分析著其中的意義。人們通過人工智能來做一些人類智能可能根本不會注意到的小事情,將其積累運算,提煉價值。
盡管很難由此說計算機算法會超越人類的感知,但它的確會知道一些你自己尚未意識到的信息。當海量無意識行為的微數據長期積累匯集,那將是一座信息金礦,即使你自己也不如這些人工智能系統對你了解深刻。
改變生活
相比商用的超級電腦、內置芯片設備,個人電腦及互聯網是更為普及的算法承載體。早期門戶網站時代,信息是由網絡編輯整理提供,用戶看到的那些新聞都是網編基于對用戶口味和新聞專業判斷選擇出來的。而門戶之后以Google為代表的搜索則顛覆了這個信息提供模式。搜索是用戶輸入關鍵字來主動獲取信息,在搜索框背后則凝聚了大量的程序和算法。
Google搜索引擎的爬蟲機器人,實際上是一種搜集互聯網海量信息的程序,爬蟲到各種網站網頁上將信息收集回來進行編碼處理,根據算法將網頁標上PageRank等級,分數值高的網頁將會在關鍵字搜索結果中顯示在優先的位置上。目前有250億的網頁可以被檢索,可以想象,這將是一個多么龐大的信息網,利用搜索引擎,我們已經能在短時間內找到結果,是不是需要的答案則另外考慮。評價一個網頁的好壞,不憑人的主觀印象,而是將其數學化。算法正在以它特有的形式拆解和重組我們生活的世界。
當然,如何在這250億的網頁中挑選出最應該推薦給你的,依然是一個難題。如果你會抱怨搜索引擎給出的答案還是太過冗雜、不夠準確,那有理由相信未來會產生更精準的算法。在未來,一個25歲、此前搜索過如何減肥的女性,與一個45歲、數天之內在谷歌地圖中搜索過不同城市機場到酒店路線的男性,搜索“午餐吃什么”得到的結果會是不同的。
在社交網站中,通過記錄、挖掘大量用戶的數據,這樣精準的推薦將更容易實現。在個性化推薦引擎的算法上,一部分是基于用戶個人行為數據積累挖掘來向用戶推薦,另一部分是基于一群用戶的共同行為來向用戶推薦。也許你沒有注意到,個性化推薦引擎已經運用到很多互聯網網站中,比如視頻推薦、網絡電臺對音樂的推薦、購物推薦直到好友推薦等。
在亞馬遜或者淘寶上,當你購買了某一商品,系統會根據相關性算法,向你推薦與該商品相關的其他商品。比如你曾經購買了很多本村上春樹的作品,基于用戶個人數據的算法會為你推薦村上春樹其他的作品,而基于其他用戶購買行為的社會化推薦則向你推薦村上龍的作品,也許是因為和你有同樣喜好購買了前者作品的用戶特別多,系統才會推測你喜歡后者的概率比較高,將其顯示出來。
從機器到芯片到程序中的算法,人工智能正在從各個方面滲透到我們的生活中,過去你也許沒有發現,但將來它們會以更加人性化的面貌出現,即使你面對它也不一定能認出它。而商業也將隨之而改變。