文‖《上海國資》記者 孫一元整理
谷歌的人工智能
文‖《上海國資》記者 孫一元整理
人工智能將是Alphabet在未來新市場中的殺手锏
在所有大型科技公司中,谷歌(Google)被認為擁有最先進的人工智能。
自1998 年在加利福尼亞州門洛帕克的一間車庫變成一家公司以來,谷歌已經發展成為了后“.com”時代企業創新的火炬手。
谷歌目前最成熟和最盈利的業務線是谷歌搜索和廣告。但其已從核心的搜索和廣告業務擴展到了更為廣闊的業務領域,涵蓋了從消費硬件到汽車到電信到醫療到風險投資等眾多領域。去年10月的 Alphabet 組織架構重組就是為了這個龐大的規劃網引入更大的結構、透明度和財政責任。現在的谷歌包含搜索、地圖、云和企業、谷歌品牌的硬件和操作系統(Chrome、安卓等)和YouTube。
10月初,谷歌發布首款“谷歌制造”的手機Pixel,其中不但搭載最新安卓操作系統Nougat 7.1,更重要的是,這也是首款搭載了谷歌人工智能助手的手機。
谷歌的首席執行官稱,谷歌手機和其他設備將作為谷歌助手(Google Assistant)的載體,全行業正在將重點從手機本身轉向底層的AI領域。谷歌助手與蘋果Siri及亞馬遜的Alexa類似,谷歌希望它成為未來許多智能設備中人工智能的“靈魂”。
同時,谷歌宣布,戰略從Mobile First(移動先行)轉向AI First(人工智能先行)。“過去10年,谷歌一直在建立mobile-first的世界,將手機轉向對生活的遠程控制。但在接下來10年中,將轉向建立AI-first的世界,這樣一個世界計算將普遍可用,在家里、公司、汽車中,或者在奔走過程中都能使用到計算能力,并且與這些界面的交互將變得更加自然、更加直觀,尤其是更加智能”。
谷歌在人工智能領域的拓展,手段之一是收購。
2010年谷歌收購了Metaweb公司,該公司主攻語義理解、語義網絡。2012年,谷歌正式發布“知識圖譜”,拿下knowledge base高地,也讓谷歌搜索變得更加智能。同年,谷歌建成超大型的神經網絡系統Google Brain,無監督情況下識別貓臉。
2013年谷歌從多倫多大學收購了深度學習公司DNNresearch,公司雖小,只有3個人,但創始人是Geoffrey Hinton,正是他一步步把“深度學習”從邊緣課題變成Google等網絡巨頭仰賴的核心技術。
2014年,谷歌以4億美元價格收購了人工智能Deep Mind公司,當時這家公司成立僅3年,專注于機器學習和神經精神科學的研究。該公司不產出產品,但其中包括了非常多的神經網絡和神經學科尖端人才,截至2016年10月5日,該公司擁有140多位科學家和工程師,發表207篇頂尖期刊論文。
2016年9月底,谷歌宣布收購了聊天機器人創業公司API.AI,進一步加強語音識別技術,該公司提供的API(應用程序接口)能進行語音識別和語境管理,而開發者還可以向自己的聊天機器人提供某一領域的專業知識。
實際上不僅僅是在語音識別等技術上收購,在人工智能重要應用領域機器人上也是如此,谷歌曾一口氣收購了7家機器人公司——Schaft、Industrial Perception、Meka Robotics、Redwood Robotics、Bot&Dolly和Holomni,以及最著名的波士頓動力(BostonDynamics)。
谷歌在人工智能領域廣泛為普通人熟知,當歸功于阿爾法狗(AlphaGo)。
2016年3月,2014年被谷歌收購的Deep Mind公司開發的阿爾法狗,與圍棋世界冠軍、職業九段選手李世石進行了扣人心弦的人機大戰,以4:1的總比分獲勝。
當圍棋對弈下到第3 7步時,AlphaGo選擇將黑色棋子放在了一個看似荒誕的位置。在一場圍棋比賽中,一個微妙的錯誤可能就意味著喪失對整盤棋局的控制,AlphaGo的這一步棋看起來明顯是要放棄棋局上的大量領地。兩家電視頻道的現場評論員都懷疑自己是否把這步棋看錯了,甚至還懷疑機器人AlphaGo出了故障。實際上,AlphaGo這一步大智若愚的棋正是要幫助自己奠定了控制整盤棋局的基礎。
圍棋的規則其實特別簡單,參賽雙方在一個畫有垂直交叉平行線形成的交叉點棋板上輪流放黑白兩色棋,與此同時,設法圍困對手的區域最終讓對手失去領地。然而,要想把這項活動玩得非常好非常困難,因為圍棋一直被看成是與選手直覺能力的比拼。在象棋比賽中,選手往往可以提前預判對手所要下棋的位置。但是在圍棋比賽中,提前預測對手下棋的位置是幾乎不可能的。因為比賽很可能會進入一籌莫展的階段,而且圍棋幾乎沒有經典的棋譜套路可言。
AlphaGo壓根就沒有被告知應該如何玩圍棋,而只是在自身程序中分析了數十萬場的圍棋比賽,并且與程序自身對弈了大概成千上萬場的圍棋。實際上,贏得這場比賽的正是AlphaGo的主要工作原理——“深度學習”。
“深度學習”是指一層神經網絡把大量的矩陣數字輸入,通過非線性激活方法取權重,再產生另一個數據集合輸出,通過合適的矩陣數量,多層組織鏈接一起,形成神經網絡“大腦”進行精準復雜的處理。這個程序通過數個小時的練習來訓練自身,漸漸形成自己的策略思維方式。
谷歌用來開發AlphaGo的深度學習系統名為Tensor Flow。2015年谷歌開源了該深度學習框架。這讓從業者欣喜若狂,因為Tensor Flow與MXNET、Caffe等開源框架一起,為深度學習算法提供了基礎計算框架。至今,已有超過50個谷歌產品已采用了Tensor Flow 。無人駕駛汽車、人工智能手術機器人、人工智能攝像頭、人工智能回復郵件、Google Search緩解交通擁堵……
但是,至今人工智能仍不具備理解語言這一基本能力,他們無法進行有效的人機交流,因為人類語言的結構難以理解。
但谷歌已在此方面進行了多次嘗試。
谷歌已經開始教他們的計算機學習基本語言。今年5月該公司發布了一項名為Parsey McPareface的新系統,這款系統可以依據語法來識別名詞、動詞和一些文本中的其他元素。不難看出有價值的語言理解對一個公司意味著什么。
谷歌公司研究員Quoc Le正考慮讓機器可以進行一場得體的對話。Le想運用機器來模仿人進行思考,一旦機器能模仿人的思考,人類才可以了解機器自己的想法。Le建立了一個能夠從容應對開放式問題的程序。這款程序搜集了大約18900篇視頻的對話,其中一些回答看起來恰到好處。比如,Le會問:“生活的意義是什么?”隨后程序會回答說:“就是讓我們的生活更加美好?!盠e認為,這款程序的回答結果出乎自己的預料。
谷歌Google X神經網絡項目Google Brain團隊表示,近日他們的人工智能研究出現了重大進展,兩個獨立的AI系統之間不僅可以相互交流,而且可以把他們相互交流的信息進行加密。這樣的AI系統可以確保信息的安全,并能夠互相交換信息。
目前,谷歌正以更為集中的方式應對競爭對手的挑戰,它已選擇了一個主要武器:人工智能。人工智能將是Alphabet 在未來新市場中的殺手锏。但深耕人工智能是否能為谷歌帶來成功仍有待觀察。這主要取決于執行,以及人工智能的應用能否在運輸,云服務,醫療和消費級硬件等各項領域中同時展現出競爭力。