搜索技術從第一代目錄模式升級至第二代頁面排序模式,產生了全球霸主Google; 而在第三代智能搜索技術演進的路上,暗中早已遍布金戈鐵馬。

7月底,全球搜索市場隨著天氣的日漸炎熱愈加躁動不安。微軟剛推出名為BrowseRank的搜索理論,劍鋒直指Google賴以成名的PageRank算法。Google馬上還以顏色,宣布推出個性化的搜索服務,可以根據用戶地理位置以及其他多種因素來提供個性化的搜索信息。另一搜索巨頭雅虎也不甘寂寞,表示開始實施搜索結果改進技術,以期為用戶提供關聯更加緊密、更加及時的爆炸性新聞。
互聯網公司如此熱衷于搜索引擎市場,主要原因還在于市場蛋糕誘人。以美國市場為例,即使只占領1%的市場份額,也可獲得1億美元的廣告收入和10億美元的市值。
要想搶到蛋糕,手里還得有把鋒利的刀。誰能在代表第三代搜索技術的智能搜索領域率先取得突破,誰就可能成為下一個時代的“Google”。數路人馬,早已在暗中奔著這一目標疾馳而去。
烏龜如何絆倒大象
在商業世界,烏龜絆倒大象的故事并不少見,尤其是當這只烏龜居然像兔子般敏捷靈活時。美國語義搜索引擎Powerset就是這樣一只有著遠大夢想的“烏龜”,而它想絆倒的“大象”,就是全球搜索巨頭Google。
當Google于1998年誕生時,雅虎已在互聯網界享有盛譽,但Google提出了根據鏈接數量來評估網頁重要程度的PageRank算法,從技術上顛覆了雅虎在1994年提出的目錄搜索模式,從而一舉成為全球搜索霸主。轉眼時光過去10年,搜索技術依然處于第二代模式,Google的關鍵詞搜索依然橫行天下。而作為一只有理想的小“烏龜”,Powerset則希望能夠率先取得代表第三代搜索技術的智能搜索領域的突破,從而再次上演“美國夢想”。
“智能搜索領域的研究,目前主要發展方向還是集中在語義搜索,通過對自然語言的理解,來解決‘問題式’搜索的難題,從而突破單純的關鍵詞搜索模式。”中科院計算所人工智能專家史忠植告訴記者,要實現這一目標,智能搜索引擎不但要能夠分析頁面內容,還要能夠理解自然語言的邏輯。
而盡管Powerset的自然語言檢索還不成熟,最近的軟件也只接近兩歲小孩的智力,但它在某些方面已經超越了第二代搜索引擎。比如同樣是輸入“哪里有最新款的聯想電腦賣?”,第二代搜索引擎提供的首先是聯想集團的網址,而Powerset則能夠提供具有價格優勢的賣場信息。
放眼全球,其實與Powerset有著同樣“夢想”的企業不在少數。國外的智能搜索引擎Blekko、Autonomy、Xerox,以及國內的Aisou、GHunt 、雷搜等,都渴望通過突破智能搜索技術,在搜索領域占領一片天空。
不過這些弄潮新手并不可能在市場中一帆風順。“新的搜索引擎在資金和商業運作方面與Google等巨頭有著很大差距,即使這些小公司真的在某些方面技術領先,也不一定具備商業化運作的能力。而技術是有時效性的,時機稍微延誤,就可能被Google等趕上。”智能中國網工程師馬瓊雄認為,盡管涌現的新搜索引擎眾多,但真正能對Google、百度等巨頭構成威脅的卻只是少數。
不容小覷的微軟
但微軟卻是搜索巨頭們不容小覷的對手。上個月,離開微軟的比爾#8226;蓋茨留下了一個未竟的夢想,就是將微軟由一個軟件巨頭培養成互聯網世界的強人。也許是為了滿足比爾#8226;蓋茨這一愿望,此前半年時間,微軟一直與雅虎斗智斗勇,希望能將老牌搜索巨頭雅虎招致麾下。可是最終雅虎投向了Google的懷抱。無奈之下,微軟轉身以1億美元收購價把Powerset收歸麾下。
記者從微軟內部員工處了解到,微軟在自然語言搜索方面的研究目前已經取得一些重要進展。微軟亞洲研究院公布的研究報告也證明了這一點。同時,業內人士認為,微軟在音頻和視頻研究方面的優勢,也將有助于微軟多元化搜索技術的發展。在一年多前,微軟就曾在一次會議上展示音頻搜索技術,而且準確性相當高。
不過馬瓊雄認為,微軟最大的優勢還是在于商業運作能力。無論是收購Powerset,還是希望收購雅虎,都顯示出微軟希望借他人之力,超越Google的愿望。
“Google們”的危機感
面對后來者咄咄逼人、寸土必爭的氣勢,Google、百度、雅虎等搜索霸主,不得不絞盡腦汁想對策。
“搜索技術的研究,與各個公司技術的傾向和業務主體有很大關系。Google崇尚技術服務受眾,更喜歡推出一些技術上具有先鋒性的產品,而雅虎和百度的技術研究主要還是在支持自身業務發展上。”雅虎搜索產品部門經理王梅分析道。
3家公司之間,Google發展智能搜索引擎的積極性最高,推出產品的密度也最大。“Google非常重視用戶體驗的改進,其把用戶搜索記錄的cookie保存18個月,也是為了便于追蹤用戶的搜索偏向。” 正望咨詢公司總裁呂伯望說。
2006年7月,雅虎中國曾推出國內第一個具有高智能模糊匹配功能的搜索引擎———雅虎IMatch。其最大特點就是用戶在使用雅虎搜索信息時,系統可以根據用戶搜索習慣和意圖,智能匹配相關搜索結果,貼近用戶的實際需求。而現在,“在雅虎與口碑網合并之后,雅虎搜索的發展方向已主要轉向生活服務、餐飲娛樂等方面,以更貼近口碑網原有的服務。”王梅向記者透露。
“自然語言檢索一大難點,在于句子中詞語的切分。英文詞語因為單詞之間等距,對英文文本的標引已經自動化并完善,而中文的切分詞技術尚未很好地發展。”艾瑞咨詢公司咨詢師田欣認為,百度作為最大的中文搜索引擎,必須跨越這一難題。不過百度似乎并未將重點放在自然語言搜索這一方向,而是社會化搜索模式。
據業內人士分析,也許是限于資金實力的關系,雅虎和百度走的都是非主流的路子。“百度在過去兩年的百度世界大會上,都沒有推出像樣的搜索技術產品,對于一個搜索引擎公司來說,這是很危險的。”呂伯望說。