
8月18日,在“百度技術創新大會”上,百度CEO李彥宏首次對外公布了“框計算”平臺的理念和構想。該平臺以百度的搜索框為核心,用戶只需要輸入服務需求,系統就能明確識別這種需求,并將需求分配給最優應用或內容資源提供商處理,最終返回給用戶相匹配的結果。本文對百度“框計算”進行了全面深入地剖析,并首次提出“智能機”的概念,并預測這將是繼“上網本”之后未來PC的重要趨勢。
“框計算”帶來人機界面的革命
李彥宏說,“‘框計算’對于老百姓的意義就是說,未來你打開電腦,一秒鐘就可以看到一個框,而且電腦的屏幕就只有這么一個框,你不管干什么,你告訴這個框,完全用自己的語言告訴它就可以,你不需要學習一個新的操作系統,不需要有各種各樣復雜的語法。”
從這個“框”,已經可以看出未來智能化的人機界面,這個界面為未來的語音界面打下了基礎。語音界面肯定是要替代Windows圖形界面的。現有圖形界面的輸入和輸出主要是靠鍵盤。從純粹的圖形界面轉向語音輸入圖形輸出,從純粹的圖形界面向語音輸入和輸出,這兩種轉變需要有語音介入的人機對話,從技術上不難實現。
這兩種界面組合的實現,是一種巨大的飛躍。而這種飛躍需要做兩件事:一是底層的后臺的智能系統,二是語音轉化。筆者相信,后者是水到渠成的,這是系統的創新。前者是這種革命性轉變的核心任務。這需要做長期的探索和積累,需要做好知識儲備。百度長期積累的中文分詞技術是具有核心商業價值的,現在又開始做界面升級的創新,百度將具有先發優勢。“框計算”奠定了新的人機界面的基礎。如果百度充分認識到這一點,“框計算”的未來會走得更好。如果微軟認識到這一點,必然會采取應對措施。
“框計算”是搜索的更高級形態
百度的“框計算”是在“框”(搜索框)的簡易入口基礎上發展出一系列的后臺的智能化處理的新搜索。“框計算”必須具備兩個基礎條件:一是對用戶意圖的具體分析,這實則是需要建立一個百度的局部語義網;二是做好后臺的智能化匹配。這兩個條件明顯反映出,“框計算”與原來的搜索不是一回事,這是一種更高級的搜索形態,是智能化的搜索。
傳統搜索引擎的原理是利用被稱為網絡蜘蛛(Spider)的自動搜索機器人程序來連接每一個網頁上的超鏈接而搜集信息,然后保存搜集的信息并進行整理和建立索引,最后接受用戶查詢并向用戶輸出信息。現在“框計算”是圍繞用戶的需求給出最終答案,這就是一種更高級的新的搜索形態。
傳統的搜索引擎在輸出結果時會有“排序”的重要環節,而“框計算”則不再存在“排序”的必要性。在“框計算”的后臺具有很強大的自組織能力,能夠甄別出信息的重要性、相關性、完整性等,這都是在后臺完成的,是一項龐大的工程。
“框計算”的索引將發生兩個轉變。第一,“框計算”在建立索引時,將從單索引向雙索引轉變,同時還將新建立一個答案庫。“框計算”的索引實際是二次索引,納米化的索引。傳統的搜索以語詞為索引并且是單向的索引,現在僅僅依靠語詞索引已經不夠了,語詞本身就是很復雜、龐大的。“框計算”在利用現有的語詞庫的基礎上再建立一個“答案庫”,也就是維基(wiki)化的搜索。“框計算”對索引進行了一次疊加比對處理,是“或”和“且”的關系,這里有一系列復雜的處理。“框計算”從單索引向雙索引轉變,建立答案庫,將會需要引用很多的維基和知識問答網站,尤其會整合百度百科和百度知道。
第二,“框計算”在建立索引時,將更多地增加“人機協同”的成分。“框計算”的索引是建立在百度知道的基礎上,這個索引庫有些部分具有人工的構成,因此,“框計算”在響應用戶查詢時,不再是傳統搜索那種由機器完成,也不純粹是由人工完成,而是由機器和人工共同作出的綜合響應。“框計算”是人機協同的系統。根據百度“框計算”官方網頁披露的“框計算”技術架構顯示,在分析用戶需求時使用了語義分析、行為分析、智能人機交互、海量計算。在這個過程中,就增加了“人機協同”。人的成分包括傳統搜索的核心技術分詞技術,“框計算”還將深入地把握在哪些關鍵領域和環節需要有人的接手,比如從搜索引擎的現有信息庫中找不到答案,這時,就需要有人工的加入。
“框計算”的“框”是語法框
“框計算”讓筆者想起了生活搜索——結構化的搜索。“框計算”就是框架搜索,也就是結構化的搜索。百度的“框計算”就是要對用戶需求進行語義分析,否則肯定不能實現從“反饋信息”向“告訴答案”的轉變。
“框計算”的“框”實際是語法框。搜索一般是“謂賓結構”,如哪里可以買到二手自行車、火車站在哪里;“是”和“不是”也是一種“謂賓結構”;所有的搜索其實都隱藏了一個“問”字,只給用戶顯示了一個搜索框。當然,語法框內也會出現定語、狀語、補語,以及主語。
人的需求往往都跟動作有關,工作、學習、戀愛、交往等人在生存中的動作行為都必然可以作為謂語。框中的某一個語法項就是謂語項。框計算的“謂語項”要建立一個庫,就是把漢語中的所有的動詞建立一個庫,并且把同義詞、近義詞進行分析、“合并同類項”,這樣就建立了一個語法結構的索引庫。所有的賓語、狀語、定語放在一起,而且可以有好幾種排列組合,在用戶輸入的時候,百度需要完成智能化的分析。“框計算”的秘密就是:框是建立在語法庫的基礎上的索引庫的“理解”。百度把最常用的語詞已經在后臺儲備好,它往往是一次性的。而任意取幾個語詞組合,維基上查不到,就需要人工的參與。首先在百度知道里找問過相關語詞的問題,如果百度知道里有這樣的問題,就會立刻把百度知道的答案頭一個反饋給用戶。
此外結構化的知識庫如火車車次價格、租房信息等,這種知識庫是非常有限的。語法框引導的結構化搜索就是對輸入、輸出、后臺都要結構化。傳統的搜索只有后臺結構化,而現在搜索的“頭”和“尾”都結構化了。智能化就是對話,所有的一切都是在語法的前提下實現的。
語法框是可以擴展、排列組合的。搜索庫一般是矩陣式的,可擴展的,現在在框里也是可以擴展的。語法框的結構是可以疊加的,可以進行邏輯處理的。如果發展得更好,可能會引入數理結構。語法框里可以加入很多注釋、補充、約束性的條件,這些注釋以后可以成為標準語言。從這個角度看,語法框是傳統結構化的升級版。
“框計算”迎來智能機時代
李彥宏表示,未來上網的需求都可以通過這個“框”來實現,今后打開電腦或許不再需要經過打開操作系統、打開瀏覽器、登錄百度網頁這樣的程序,而是在打開電腦或手機之后,就可以直接利用“框”實現各種應用。
通過“框”可以進入各種應用,如文字處理、影音播放、排版、游戲等,通過“框”可以完成多項任務,這給人的啟示是,事實上這個“框”已經在改變現有的操作系統的架構:“框”已經代替了開始菜單。“框”對用戶的需求結構化,菜單就是將不通的運用的結構化。在“框”里面就可以實現這種結構化,如在“框”的右側就可以彈出讓用戶選擇進入。把搜索人、搜索事物進一步詮釋就是對話,這是最基本的對話。操作系統在中英文輸入、對運用進行選擇,這也是最基本的人機對話。所以說,“框”成為操作系統不是危言聳聽。現在已經可以整合各種應用,要發展出一個全新的操作系統,技術上不存在障礙。
在操作系統上增加了智能化,對Windows而言,“框”帶來的操作系統就是有生命的“Windows”。有生命的“Windows”包括技術層面的底層的“Windows”和智能化的構成。兩者一結合,就是智能化的操作系統。安裝智能操作系統的PC不再遙遠,可以說,“智能機”的時代,必然來臨。
“框計算”與“云計算”不具備可比性。“云計算”是對用戶資源、對儲備資源的分享,改變了互聯網的宏觀結構;而“框計算”改變了互聯網和操作系統的結構,增加了一個計算和互聯網中的智能構成成分在互聯網和操作系統的構成。