Google等的巨大成功推動了整個行業(yè)的競爭者把搜索技術提升到一個更高的水準,而個性化搜索將是其中最迫切的一次技術變革。
2003年2月,Google 收購了全球最大的Blog 服務之一Blogger.com 的提供商Pyra Labs;2003年9月,Google收購了一家制作個性化和上下文關聯(lián)搜索工具的新興企業(yè)Kaltix;2003年10月,Google收購在線廣告網(wǎng)絡公司Sprinks;2004年7月,Google宣布收購加州的數(shù)字相片管理商Picasa;2004年10月,Google收購了數(shù)字地圖服務商Keyhole;2004年12月,Google宣布同世界領先的研究圖書館及牛津大學達成協(xié)議,開始把其搜索內(nèi)容向數(shù)字文件轉(zhuǎn)移……這些僅僅是Google推出個性化搜索的序曲。
現(xiàn)在,Google的股價已經(jīng)飚升至197.60美元,該公司的市值也因此達到540.27億美元(截至2004年12月31日),可見市場對Google的良好預期。而此時Google對個性化搜索技術的偏好似乎預示著個性化搜索將會再創(chuàng)奇跡。
搜索技術的新戰(zhàn)場
“個性化”往往是許多商家的制勝法寶,它總是能締造一個又一個的神話,而這條規(guī)律對搜索引擎企業(yè)也同樣適用。搜索引擎已經(jīng)改變了我們使用互聯(lián)網(wǎng)的方式,甚至形成了一種“搜索式”的使用習慣,但這遠遠不夠。搜索個性化的風暴即將來臨,用戶需要的不僅是能搜尋到信息的搜索引擎,他們更希望做信息消費的主人,讓搜索引擎以“我”為中心。
但目前的現(xiàn)狀是,在搜索引擎面前,各類用戶別無選擇。對個人用戶而言,搜索引擎服務提供商顯示什么樣的信息內(nèi)容,排列什么樣的搜索結(jié)果,利用什么樣的訪問設備,個人無權(quán)選擇;對企業(yè)用戶而言,員工不能有效獲得適應業(yè)務需求的特定信息,尤其是整合了內(nèi)部知識信息資源和互聯(lián)網(wǎng)信息資源的個性化信息;對廣告客戶來說,結(jié)合產(chǎn)品的優(yōu)質(zhì)、定向、可追蹤的誘導信息淹沒在蕪雜的信息中;而對于網(wǎng)站,無法控制搜索引擎以提供適合網(wǎng)站特點的信息源,只能選擇千人一面、千篇一律的搜索結(jié)果,因為提供搜索服務的主動權(quán)壟斷在霸氣十足的搜索引擎巨頭的手中……
不過搜索巨頭們已經(jīng)意識到,搜索引擎?zhèn)€性化是在品牌忠誠度以外留住用戶的主要方法,個性化搜索將成為搜索技術的新戰(zhàn)場,微軟、雅虎、Google等都在加緊開發(fā)個性化的搜索引擎技術。
有智慧的“網(wǎng)絡蜘蛛”
個性化搜索的應用需要先進的理念和過硬的技術保障,才能博得用戶的好評。搜索引擎技術的焦點就是提升用戶的體驗度:精、準、全、快。搜索速度是搜索技術商和服務商入行的門票,不會存在問題,但“精、準、全”無一不是與個性化相關的。網(wǎng)絡蜘蛛的個性化對搜索引擎的查全和查準都有重大影響,它決定了搜索引擎數(shù)據(jù)容量的大小,而且網(wǎng)絡蜘蛛的好壞還會直接影響到搜索信息資源庫的質(zhì)量。
目前的網(wǎng)絡蜘蛛基本上是“瞎眼蜘蛛”,依據(jù)著簡單可數(shù)的幾個規(guī)則爬行著,從來就不知道自己要到哪里去,只會毫無目的地抓取雜亂的信息,雖然很勤懇但毫無個性。而個性化搜索引擎則需要有智慧的網(wǎng)絡蜘蛛,有方向、有目的、有計劃地抓取信息,同時肩負著尋找、發(fā)現(xiàn)、定位、提交符合要求的信息的任務。它不僅能自動自發(fā)地自我管理,而且能感知自身所處的環(huán)境并作出反應;不僅具備專業(yè)的知識,而且具有學習能力;對信息的處理不僅有廣度,而且有深度;不僅有預處理也有后處理。
無論是智慧的網(wǎng)絡蜘蛛,還是搜索引擎的個性化,想解決的最根本的問題就是能讓用戶DIY出來一個屬于自己的獨一無二的搜索引擎。而真正的個性化搜索則需要做到信息類型的個性化、信息內(nèi)容的個性化、信息設備的個性化和搜索過程的動態(tài)化。
需求技術兩重天
雖然個性化搜索引擎的新鮮出爐吸引了許多用戶的目光,但目前的搜索引擎技術還和用戶的期望相去甚遠,它并不能智能化地理解人類的想法,并與人類的生活完全結(jié)合。需求的前瞻性與技術的滯后性在任何領域都是一對雙生兒,如何找到這兩者的平衡點,是我們不得不面對的問題。目前,個性化搜索引擎面臨的技術挑戰(zhàn)還有很多:
基于語義的多媒體搜索技術還不成熟,比如搜索圖片時還只能通過周圍相關的文字進行判斷,而無法根據(jù)圖片本身的信息提供檢索。
關鍵詞只能輸入一個或很少的幾個,搜索引擎無法理解用戶真正的需求,因此只能將各種結(jié)果全部排列出來。自動聚類技術雖然進行了一些嘗試,但并沒有帶來太大的改觀。
由于網(wǎng)絡上更多的資源和有用的資料以數(shù)據(jù)庫的形式存在,而搜索引擎的蜘蛛在爬行這些動態(tài)網(wǎng)站的過程中很容易陷入死循環(huán),很多搜索引擎都對深度進行了限制,因此搜索引擎能獲得的數(shù)據(jù)量還達不到整個網(wǎng)絡數(shù)據(jù)量的30%。
搜索引擎現(xiàn)在仍然需要依賴于瀏覽器作為提供檢索服務的載體,這大大限制了搜索引擎?zhèn)€性化的范圍。雖然Google已經(jīng)開始測試無線的購物搜索服務,聯(lián)索科技也開始提供通過手機來搜索商品及優(yōu)惠券派送的服務,但要完成的工作還有很多。
差別創(chuàng)造價值
未來的個性化搜索技術會將用戶的主觀能動性發(fā)揮到登峰造極的地步。與其它服務最大的差別就是,搜索服務完全出于用戶的主觀意愿,當互聯(lián)網(wǎng)第二階段的特征由被動的“注意力”上升為主動的“搜索力”時,中外搜索技術提供商各有特色的商業(yè)模式和企業(yè)戰(zhàn)略便不得不圍繞這個主觀性很強的技術展開。
不管商業(yè)競爭多么激烈,商業(yè)運作如何各有千秋,關鍵的一點還是只有“差別”才能創(chuàng)造價值,技術是關鍵出路之一。表面的個性化并不能代表技術的全部,像博客、新聞聚合器、郵件及即時消息等也都只是搜索領域里個性化意識復蘇的可喜變化,深入的問題亟待業(yè)內(nèi)高手精心研磨,終究會有人推出新的技術或搜索工具重新創(chuàng)造信息返回的途徑。
但不可忽視的事實是,許多曾經(jīng)風光無限的搜索引擎逐漸淡出人們的視線,這一過程中,技術的重要性被極大地凸顯出來,所以多數(shù)市場參與者無不重視搜索技術的研發(fā)投入,以期能在將來的市場發(fā)展中取得優(yōu)勢。
《王者之舞》是天才舞王邁克·弗萊利風格的又一次上演,是他以每秒30次的空中雙腳交叉絕技創(chuàng)造的《大河之舞》之后的又一個奇跡。Google的鏈接算法、百度的“人氣定律”僅觸及了互聯(lián)網(wǎng)的表層特征就上演了網(wǎng)絡版的“大河之舞”,而且成就了互聯(lián)網(wǎng)的傳奇。當個性搜索真正觸及“人物”以及“時間、地點、事件”的深層綁定規(guī)律時,它的魅力將與網(wǎng)絡傳奇如影相隨。步入新的一年,個性化搜索已經(jīng)上路,人們期盼著個性搜索中有更加精彩的“王者之舞”的表演。 (作者來自于北京聯(lián)索科技有限公司)