近日,國外一則關于谷歌的消息引起廣泛關注。報道稱,谷歌將在數(shù)月內對其搜索引擎進行“有史以來最大的改動”,今后的搜索結果呈現(xiàn)的不僅是一系列網(wǎng)絡鏈接,還將在頁面頂部展示更多的“事實和直接答案”。
消息進入國內后,一些輿論的反應也非常有趣,其中一個下意識的舉動,就是將谷歌與當前國內搜索引擎的代名詞——百度進行比較。他們的結論是:谷歌的下一代搜索引擎理念是讓用戶需求在搜索的呈現(xiàn)頁面即被滿足,而不必進行二次點擊進入相關網(wǎng)站,這與百度力推的“框計算”類似。因此,這一次谷歌是“山寨”了百度的模式。
如果這是事實,當然值得高興,遺憾的是,經(jīng)過仔細比對之后,就會發(fā)現(xiàn)谷歌的“下一步”與框計算存在本質的差異:百度追求的是信息應用的聚合,而谷歌則專注于將信息轉化為“知識”。
筆者曾經(jīng)采訪過谷歌搜索引擎科學家阿米特·辛格哈爾,他表示現(xiàn)在的搜索引擎已經(jīng)將“數(shù)據(jù)轉化為信息”做得足夠好,比如鍵入“青海湖”進行搜索,你就能獲得幾乎所有關于青海湖的信息。“但是,用戶的需求不止于此。未來的搜索結果體現(xiàn)的應該是‘人對世界的理解’,是真正的‘知識引擎’,而不是將一堆信息扔給用戶去挑選。”
身為谷歌負責搜索引擎技術研發(fā)的高管,阿米特·辛格哈爾這段對于未來搜索技術的描述,應該可以被認為是谷歌下一代搜索引擎將要解決的事情。舉例來說,當用戶鍵入“中國最深的10個湖泊”,如果是當前基于“爬蟲”系統(tǒng)進行字符串匹配的搜索引擎,返回的結果很可能解決不了這個問題,除非有人曾經(jīng)統(tǒng)計過這個問題,并上傳到某個頁面上。而在新一代的“知識引擎”中,用戶鍵入相同的字符串或許就能直接在搜索頁面上得到想要的答案。
很顯然,這樣基于理解語義的搜索引擎需要將前端用戶的搜索請求與后端數(shù)據(jù)庫內海量的“Entity(實體)”進行匹配,包括人物、時間、地點以及它們之間的關聯(lián)性,也需要從搜索算法結構層面進行大量的改進。而以谷歌一貫的“極客”企業(yè)文化來看,新一代搜索引擎也應該體現(xiàn)在算法本身的改進。
再看百度的框計算,其理念是打造一個開放的生態(tài)系統(tǒng),拉攏合作者在其中投放應用,再利用百度的搜索引擎進行流量導入、推廣,“所搜即所用”,進而為用戶提供一站式服務。綜上所述,框計算使用的還是字符串匹配的形式,并未從根本上改變搜索算法本身,而只是將搜索引擎這一工具平臺化了。
所以,說谷歌要做框計算,無從談起。