沈凌莉

在討論Siri遇到的問題時,我們首先要理解Siri究竟是什么。現在對它最大的誤解可能就是,認為 Siri這類語音智能助手產品是由前端的語音識別、語義解析技術和后端的搜索組成的。事實上并不全是這樣。
簡單地說,智能助手產品是由三部分組成:前端的交互方式,也就是信息輸入和輸出的方式,比如語音是其中一種;中間的智能分析,相當于人的大腦;后面是數據庫或者是獲取方式,包括自有的數據庫、第三方的數據庫,以及搜索引擎等。
蘋果的Siri目前是把語音作為前端的交互方式,這是和Nuance等合作來實現的。而蘋果收購的Siri公司更核心的能力是在后端的智能分析上。
這確實是件很復雜的事,所以當最初投資 Siri項目之一的風險投資公司摩根塔勒合伙人Gary Morgenthaler說,“Siri的創始團隊看到了未來、定義了未來并且順利地邁開了通往未來技術的第一步,但被收購之后(蘋果)Siri緩慢的商業化進程讓我們這些創始團隊感到非常失望”時,我不禁要問:這真的僅僅是個商業化的問題嗎?
“對于人工智能來說,現在談商業化還為時尚早,”小i機器人的創始人袁輝這樣認為。他下這個判斷是因為他在10年前就在人工智能領域做過了艱難的商業化嘗試。
小i機器人是國內最早的智能機器人平臺運營商,成立于2001年。據其官方發布的數據,2004年到2007年倚靠微軟MSN平臺,小i的用戶超過1億,交互量達到100億次以上,覆蓋100多個國家。2007年小i機器人獲得了包括英特爾投資、IDG在內的5家風險投資機構的千萬美元投資。但是大量的用戶并沒有給公司帶來太多收入。
有用戶沒收入,袁輝在很長一段時間內一直把原因歸結為“小i沒找到好的盈利模式”。后來發現,用戶的快速增長實際上掩蓋了小i最根本的問題——究竟滿足了用戶的什么需求?
袁輝說,“小i當時的目標和如今的 Siri一樣,希望做成一個無所不知、無所不能的變形金剛。但這幾乎是很難實現的”。首先,語音識別不是完全靠算法能解決的,無論是Nuance還是科大訊飛都花了很多年去研發。而后邊的智能分析和數據庫密切相關,二者的匹配和系統構建是非常核心的,既包括開發互聯網的信息還包括機器學習,這需要大量的整合和多年的積累。“時間是智能機器人最大的壁壘,而這不是靠開放平臺、靠人多、錢多就能解決的,必須先知道要怎么做才行”。2009年,小i機器人全面轉型到公司(B2B)業務上。
或許,這樣一款產品,真的不能等在實驗室里進行完各種微調和全面測試再推向市場,起碼第一步它必須接觸到從音質到自然語言解讀的盡可能多的變化。
敗給Google Now?談勝負還早了點
但既然推向了市場,總免不了比較。Google推出語音數字助理Google Now,用戶發現,暫且不提人工智能,僅從語音搜索來看,Google Now的準確率比Siri更高。于是,問題來了——誰能代表移動搜索的未來? 在這一點上,面對PC端搜索的老大,且Google有多年積累的知識圖譜做后盾,確實讓人為Siri捏一把汗。但移動搜索和PC搜索能一樣嗎?
“移動搜索有很強的場景性,不像桌面搜索是用關鍵詞搜索大量資料,然后慢慢看。所以并不需要很深的知識圖譜,反而對非結構化的、實時產生的數據有更大的需求。”智問創始人朱勝這樣總結移動搜索的特征。
為了建立非結構化數據庫,國內另一家語音助手類產品“蟲洞語音助手”除了通過網絡抓取、第三方合作,還開設了社區。蟲洞的聯合創始人郭家的總結是,“作為助手類的產品,長尾信息的組織是一大關鍵,它很難通過通用型搜索產品獲得。”
顯然,在非結構化數據上,蘋果 Siri和Google Now都在以不同的方式發力。Siri與很多不同的服務集成在一起提供搜索結果,包括Yelp、OpenTable、Wolfram Alpha、Yahoo,以及Twitter和微軟推出的搜索引擎Bing;Google Now也做出了重大革新,用戶不再需要主動去搜索信息,谷歌會在適當的時候把信息提供給用戶。這相當于搜索引擎在幫助人們做出決策。
從這一點來看,Google Now和Siri的目標都不僅僅囿于移動搜索,而是智能交互,搜索只是其中的一部分表現形式。最終,二者將殊途同歸——整合數據庫,提高智能分析能力,讓機器主動學習理解人、服務人——只是他們依托各自現有的優勢從不同角度在往前做。在這個目標下,目前二者都發展得比較初級,談勝負還為時過早。
千萬別把Siri僅僅當成一個語音助手
其實,Google Now也有難題,就是落地難。對于Google來說,谷歌的手機廠商和運營商總是很難及時向用戶提供Android系統更新。而對于蘋果這樣一個軟硬件結合的公司,并擁有封閉的生態系統,將Siri的能力落地并推向消費市場正是其優勢所在。
“千萬不要把Siri僅僅當成一個語音助手,它是蘋果整個產品線包括操作系統演進的方向。”正如朱勝所說,蘋果在逐漸把 Siri整合到iOS操作系統和硬件產品中去。2012年6月,蘋果公司發布了iOS6,這一操作系統對汽車行業最大的意義在于將地圖、車輛控制和 Siri語音功能相集合。蘋果為Siri 打造的 Eyes Free駕車系統也已經日趨完善,目前已經有多家知名汽車廠商加入 Eyes Free陣營。
可見,蘋果一定會充分發揮其硬件的優勢。相信不久以后,Siri會橫跨蘋果整個產品線。以Siri和iCloud為依托打穿不同的設備間的連接,與App Store一起組成蘋果的生態系統。
同時,蘋果會發揮渠道和入口的作用。Siri將不僅僅是一款應用程序,它同時也是一款自然用戶界面系統,占據用戶與數字設備和互聯網的第一觸點,它使得服務器端可以整合大量開放API的數據。而這些數據是無法通過網絡抓取的方式獲得的。被整合進蘋果操作系統中的Siri,可以方便被第三方調用。
對于蘋果來說,最重要的是通過 Siri把人工智能帶進了現實生活中。蘋果更可能走的一條路徑是,打造智能交互的底層架構,由它來提供人工智能助手通用層面的支持。在此之上,將產生更細分、垂直的智能化應用和服務,將人工智能助手滲透進生活的方方面面,而這將是中小創業者的機會所在。而基于Siri的智能大腦和數據庫,智能服務前端的交互方式也會變得更加多樣,除了聲音,比如圖像、視頻、腦波等都可能成為信息采集和輸出的方式。