撰文/丁海驁
人工智能:開啟智能時代
撰文/丁海驁
2014年初,微軟第三任CE0 Satya Nadella上任,此后的10個月內,微軟股票漲了30%,超過谷歌成為僅次于Apple的全球市值第二高公司。到底是什么原因讓微軟在10個月的時間股票上漲30%?“我想可能與微軟基于人工智能的產品和服務有一定的關系”,微軟亞洲研究院副院長芮勇說。
2014年12月16日,在《數字商業時代》雜志與中國人民大學出版社聯合舉辦的“2014智造中國高峰論壇”上,人工智能引起了廣泛的討論。
人類社會的每次跨越,都源自技術的發展。而每項技術能否被廣泛應用,都始于對關鍵環節的突破。人工智能技術的關鍵環節是交互,也就是要讓計算機能通過更直接的方式,了解人類的想法和意圖,例如,人類的語言。
“把一個數學公式敲入計算機,然后得到答案,這沒有什么了不起,因為計算機比人類算數學的水平高得多,難的是如何讓計算機解決用人類語言表述的數學問題。”芮勇認為,人類的語言對于計算機來講之所以難以理解,在于計算機并不了解人類語言當中所蘊含的豐富內容,例如常識(最簡單的例子就是雞兔同籠問題,其中所隱含的兩個物種有不同數量腳的信息,計算機在沒有學習這些常識之前,根本沒有能力解決)。但是計算機的優勢在于其超強的存儲、記憶和運算的能力。因此,通過海量的信息庫和人類語言解析算法,計算機就可以具有學習的能力,從而能夠更有效率地了解人類用戶語言的真實含義。
“現在大家都已經習慣了2014年5月開始公測的微軟小冰,很多人通過微信和微博,向小冰咨詢各個學科的問題、同小冰討論個人的情感問題,將其當成人來對待。”芮勇認為,小冰的出現證明:計算機不僅可以理解人類的語言,甚至通過學習可以理解人類某些情感方面的感受。這也讓更多的人意識到:人工智能或許并沒有想象中的那么遙遠。
在與人的交互方面,IBM的超級電腦“沃森”(Watson)也頗具代表性。因為其最初的開發宗旨就是要完成一項艱巨挑戰:建造一個能與人類回答問題能力匹敵的計算系統。
20年前,IBM用深藍打敗了人類的國際象棋冠軍卡斯帕羅夫。20年后的2011年2月14日,沃森在美國ABC廣播電視臺的電視智力競賽節目《危險邊緣(Jeopardy!)》中,戰勝了兩個歷史上最成功的人類競賽冠軍。

芮勇
“2011年,人類進入了認知系統時代。”IBM全球副總裁兼中國開發中心總經理王陽親歷了整個過程,在接受采訪時,對當時的情形記憶猶新。
那次人機大戰最吸引人的,不是其中問題所涉及的范圍非常廣,而是在整個比賽的過程中,人與計算機采用搶答的方式,以人類語言的形式回答問題。在不依賴網絡的前提下,沃森只能通過自身存儲的數百萬份資料,在盡可能短的時間內搜索、推理出其自認為最正確的答案,并將答案還原輸出成人類的語言。
沃森贏得比賽后不久,花旗集團就開始應用沃森進行證券組合投資風險管理。隨后,沃森又與癌癥研究機構德州大學安德森癌癥中心展開密切合作。
“經過簡單的學習,沃森可以在3秒鐘之內閱讀并理解2億頁的信息,不僅能夠單詞和短語,而且能夠理解句子和段落。”王陽告訴記者,通過對大量數據的讀取和學習,沃森能夠對結構數據和非結構數據進行整理分析,因此可以應用在金融、醫學,甚至餐飲等領域。從海量數據中發掘出有價值的信息,給金融分析師、醫生和廚師提出自己的建議。
要計算機作出正確的判斷,需要有非常強大的數據支持——無論是微軟的解決方案還是沃森,對大數據的應用,使得人工智能系統具備了更強的分析能力和推理能力。
“北京有20多個空氣的監測站,那么我們是否有辦法知道每一平方公里的空氣質量?我們能否預測未來24小時的空氣質量?”芮勇告訴記者,這看似簡單,但其實是一件很難解決的問題,因為需要在空間和時間兩個維度上進行分析和預測。“基于空氣檢測站有效的讀數,再結合交通流量的數據,道路結構的數據,樓房、餐館、旅館和公園等的數據,以及氣象數據等各種數據所構成的大數據,微軟可以讓計算機通過機器學習方式,得到一些有效的數據模型。即使在一個沒有站點的地點,同樣可以通過該模型估計出此地的空氣質量。”這就是人工智能技術當中的機器學習與大數據結合所表現出的強大分析能力(相關應用Urban Air已于2014年5月推出)。
事實上,人工智能技術的應用前景不僅僅是預測空氣質量或在網絡上創造一個可以聊天的虛擬人,其最大的價值在于正在改變人類認識世界的角度和解決問題的方法。
“到了認知計算時代,計算機能夠像我們人類一樣去思考、學習和掌握人類想掌握的知識。”王陽認為,大數據時代的到來,數據量的驚人膨脹,人類已經沒有方法掌握所有的數據,或者去認知這些數據。但是人工智能的計算機則具有解決這類問題的絕對潛力。因此,人工智能與大數據的結合,或許會帶來一次意義非凡的改變:人類的生活、未來的社會秩序、工業的發展軌跡,也許都將因此而發生某種程度的改變。
“基于現在的大數據環境,沃森很容易就可以獲得一些與設計相關的必要信息:用戶對哪些產品更偏好,對哪些功能更喜歡,這些產品的價格如何?有多大的市場會有這種消費預期……經過這樣有目的性的分析,沃森就可以給出它對下一代工業產品的判斷,從而完成對產品雛形的設計。”展望人工智能技術在工業領域的應用,王陽認為其將深刻影響工業設計前端的決策方式,從而改變一直以來都是由人主導的產品誕生過程。
經歷了數字記錄、可編程系統以后,計算機的能力已經不再局限于重復執行人類既定的指令。人工智能的持續研究和技術的不斷突破,已經使計算機在某種程度上,開始具有了某種人類所特有的生物屬性:學習、成長、分析和預測。加之,計算機原本就具有的超越人類的某些能力(如計算、存儲和記錄等),就使得計算機與人類之間的交互、計算機對人類生活的融入能力,不斷加強和深入。

王陽
“微軟亞太研發集團主席兼微軟亞洲研究院院長洪小文博士寫過一篇很好的文章,談到人工智能研究有四個臺階,分別是功能、智能、智力和智慧。”芮勇告訴記者,目前人工智能的發展階段,處在第一個階段末和第二個階段初,現在的人工智能應用基本上還停留于功能的水平,而各大公司和研究機構都在努力地使自己人工智能的研究具備某種智能的部分。“至于智力,我們必須承認,人工智能和人類相比還少了創造力的部分,這就是我們所說的智力,人類所具備的創造力短期內還不是人工智能能夠學習的。至于智慧,人工智能顯然還有很長的路要走。”芮勇說。
對于支撐人工智能技術發展的IT技術本身,進步的空間依然巨大。
“無論如何,用計算機模擬我們人類的大腦是非常難的一件事情,雖然人類大腦的體積僅為兩升,但是里面含一千億或者幾千億個神經元,每一個神經元一千到一萬個突觸,從而就形成了百萬億個神經突觸。”在王陽的計算中,每當人類的大腦消耗20瓦,那么模擬人類大腦運行的計算機就需要有150萬個處理器、63億個線程、消耗800萬瓦,“即使這樣做,這樣的模擬人類大腦的計算機仍然會比人類慢1500倍。”
顯然,固有的計算機體系架構已經不能滿足人工智能對計算能力提出的要求,“IBM已經研發出所謂的人腦芯片,或者是說模擬神經元芯片。這個神經元芯片在一個蜂窩型的空間里,有4096個這樣的處理單元,每個處理單元跟外界有2.56億個突觸點。我們把他們集成在一起,用這樣的芯片就可以模擬出人腦思考的過程,至少,是一部分人腦功能。”王陽告訴記者,IT技術本身的進步事實上為人工智能的進步提供了更加廣闊的空間和想象力,“就好像我們給計算機植入了一種智慧。”
在遠古時代,人類的出行都要騎馬。“乘騏驥以馳騁兮,來吾道夫先路。”對速度的向往,使人類非常重視培育馬匹中的良種。后來,汽車的出現徹底取代了馬,培育馬匹的良種,就顯得沒那么重要了。這就是改良技術和劃時代技術在人類歷史當中不同的作用:前者可以優化現在,而后者將開創未來。
人類的歷史總是因為劃時代技術的出現和應用而得到質的變化。
現在,我們再次來到了從“馬背”到“汽車”的關口,無論是工業界還是科技界,都面臨著如何將科幻故事變成現實的問題。技術上的突破交給科學家,但是作為更普遍的用戶,能做的或許不僅僅是關注,也應該從技術、應用上,給予其更多的投入。畢竟,無論所處何種領域,技術對我們現在和未來的影響是共同的。