尹穎堯
2017年年初,美國新媒體聯盟(the New Media Consortium,簡稱NMC)頒布了《地平線報告》(2017年大學版),首次將人工智能(Artificial Intelligent,簡稱AI)列入其中。這份報告從短期、中期和長期三個時間軸,預測未來將改變高等教育的六大科技。今年的人工智能被標注在長期時間軸上。
人工智能時代真的到來了?它都要顛覆知識象牙塔高等教育了?前不久,記者采訪了人工智能創業者、海知智能CEO謝殿俠。
“我叫謝殿俠,大家都喊我老謝。”
老謝說,從AI角度解釋第一次見面和這句寒暄,就包括AI的三大基礎領域:人臉識別、語音識別和語義理解。為了解釋地通俗易懂,老謝科普了人工智能的三大技術要素:數據、計算能力和深度學習(deep learning)。此前受困于這三大技術要素,AI一直無法獲得巨大突破。近年來,數據量不斷增大,計算能力不斷提高,深度學習得以良好運用,AI迎來第三次浪潮。目前,AI的人臉識別能力已經超過肉眼,語音識別接近人的語音識別,而語義理解與人的還有一段不小的差距。
早在2015年,在實驗室場景下,AI的人臉識別準確率已經超過了人類肉眼。肉眼識別準確率大概是95%,而AI的準確識別率已經超過這個數字。老謝說,假如記者戴著AI眼鏡,雖與他初次見面,AI眼鏡也會準確地告訴記者:對方是海知智能CEO謝殿俠。
在語音識別方面,人的語音識別準確率大概是96%,而在理想實驗室場景下,AI的語音識別準確率目前在94%~95%之間,AI的語音識別準確率已與人的相差無幾。有數據預測,在未來一兩年內,AI的語音識別準確率將會達到99%,超過人的水平。那時,記者一邊采訪老謝,AI一邊將聲音轉化成文本,真正實現同步操作。而目前雖然市面上已有類似的語音轉寫軟件,但實際應用場景下準確率不夠高,仍需人工核對和修改。
AI雖聽得懂“謝殿俠”,也知道他是海知智能CEO,卻很難把“老謝”與“謝殿俠”對號入座。語義理解,仍是AI目前亟待攻克的方向。這是因為語言表達非常復雜,而且一定要結合當前使用環境、上下文來綜合判斷。
目前包括斯坦福大學、微軟亞洲研究院等在內的大學和研究機構,都在研究語義理解,其中,閱讀理解是前沿中的前沿。在限定了條件的話題討論中,人的閱讀理解能力大概85分,而AI也許只有70分,15分的差距需要很長一段時間才能趕上。
AI的閱讀理解能力一旦與人的一樣,將會產生顛覆性革命。
AI的優勢在于能抓取網頁上所有信息的意思,掌握古往今來的所有顯性文明。未來,各行各業解決問題的過程和方式也將與我們現在的不一樣。比如醫療領域,當患者把癥狀告訴AI,AI能根據描述和檢查數據指標,結合此前學習的診療案例詳細解釋病情,乃至開藥方。AI可以看做一個超級大腦(superbrain),當這臺超級大腦被細分到各個領域后,各個領域的歷史人物將被復活。比如孔子,AI可不是僅僅收集了儒家學說的所有知識,而是真正掌握了知識,能夠判斷、洞察、推理,還能與大家交流。
“孔老師,有人罵我怎么辦?”
AI會以儒家的觀點,回答提問者。
總之,AI不僅能聽清和聽懂,還會讓機器有知識,甚至自我學習。
學語言的方式也將發生顛覆性變化,真正擺脫“人機交互”,實現“人人交互”,AI能夠完全替代native speaker(說母語的人)。
老謝說,這僅是他自己大膽的預測,不過AI對人類社會的顛覆性革命太劇烈、太徹底,我們無法想象未來三十年、五十年的AI時代的樣子。他認為,若第一次工業革命對人類的影響是1的話,那么AI革命將是100萬。
在未來很多工作,比如傳統的分析報告師、客服將被機器替代,但同時AI時代一定能提供更多新的崗位。老謝建議,愿意展望AI時代的同學,不妨讀一讀牛津大學歷史學博士尤瓦爾·赫拉利的《人類簡史》和《未來簡史》兩本書,從中構思自己的AI時代,找到自己的AI定位。
作為一名AI創業者,老謝當下所做的就足以震撼。
雖然通用人工智能還不能實現,但在“特定用戶、特定場景、特定服務”之下,語義理解還是能極大地為人們帶來便捷。比如音樂點播這件事,以“搜索周杰倫的歌”為例。海知智能抓取了網頁上所有有關周杰倫的信息,分門別類,組成一個“周杰倫”的音樂知識圖譜,以便AI能夠理解。這個就相當于給AI“學習”了一個強大的知識庫。當輸入“我要聽周董的歌”時,海知智能不會像其他音樂網站的軟件說“沒有”,因為它知道周董就是周杰倫。目前,老謝的AI已經儲備2000萬個音樂知識圖譜。
像音樂這樣的特定領域,還有很多很多,比如天氣、交通、銀行客服、中小學教育。老謝還有一個更大的夢想,打造知識圖譜開源平臺,讓大家編寫、共享自己的知識圖譜,打造屬于自己的機器人(Bot)。endprint