黃自昌
大家知道,可口可樂是美國文化的象征,它幾乎征服了全世界,100多年來創造了巨大的財富。不過,成就可口可樂傳奇的卻是一個小小的配方。據稱,這個配方價值40億美金。可口可樂公司老板自負地說,假如一場大火燒毀了公司,憑著這個配方,他們第二天就會又有一個可口可樂公司。不過,現在有一樣東西比可口可樂的配方還要保密。其價值更是難以估量,它就是著名的搜索引擎谷歌的核心算法Page Rank。
20世紀90年代初期,互聯網方興未艾,新網站如雨后春筍般涌現。面對浩如煙海的網頁內容,網民們要找到自己所需要的內容,真像大海撈針一樣。他們急需一個工具,幫助他們在網絡上找到有用的內容,于是,雅虎應運而生,給網民們帶來了很大的便利,受到了廣泛的歡迎。隨后,其他一些搜索引擎如Altavista、Ex-cite、LyCOS等相繼推出。這些搜索引擎雖然能夠幫助用戶找到有價值的信息,但也有一些不足,比如搜索自動化程度不高,難以適應網絡爆炸式發展的局面:搜索結果的質量不盡如人意,往往是一長串毫不相干的結果,沒有任何一個搜索引擎能對搜索結果進行科學準確的分類排序。
此時,谷歌公司的創辦者拉里·佩奇和塞吉·布林,正在斯坦福大學讀書。雅虎的飛速發展讓他們看到了網絡搜索的前景,他們堅信,搜索引擎會對整個世界產生影響。于是他們把大部分精力都放到了網絡搜索的研究上,決心開發出一個更好的搜索引擎。
佩奇和布林分析研究了現有的搜索引擎和許多學術著作,他們發現,這些搜索技術都局限于網頁內部,局限于對網頁內容的分析和評價,而對于海量的網絡數據這是很難做到的。佩奇逐漸認識到,應該跳出網頁內容,尋找一種更客觀、更簡單的評判標準。在此基礎上,佩奇提出了一個革命性的想法,這種想法是谷歌搜索引擎的核心。
作為谷歌搜索引擎的核心內容,它的原理卻很簡單,它受到了學術論文評價方法的啟發。一般情況下人們認為,一篇論文被引用的次數越多。它的權威性就越高。在網絡上也是這樣。網絡上的引用就是鏈接,如果一個網頁被很多其他網頁所鏈接,說明它受到了普遍的承認和信賴。通俗地說,每個鏈接都好像是對頁面的一次投票,被鏈接得越多,就意味著獲得的選票越多,說明這個網頁更有價值,應該被排在前面。佩奇還對來自不同網頁的鏈接給予區別對待,被重要網站鏈接,說明這個網頁更有價值,正像被名家引用表明論文更有權威一樣。
按照這個原理,佩奇和布林設計出了復雜的算法,用一系列方程式來計算網頁的價值和排名,這些方程式考慮了眾多的影響因素,使佩奇的原始想法得到了很好的實現,它第一次使人們可以迅速地在互聯網中進行搜索并找到有用的結果。這些方程式是谷歌的核心機密,世界上沒有幾個人知道,被稱為最昂貴的方程式。他們把這些方程式的集合命名為Page Rank(網頁等級排名),其中不僅嵌入了拉里·佩奇(Larry Page)的名字,還表明了這些方程式的功用。
算法有了,還需要為搜索引擎起一個響亮的名字。佩奇的同事肖恩建議叫“coogol”,它的意思是10的100次方,表示互聯網信息無窮無盡的特點,也喻示搜索引擎挑戰極限的能力。可是枉后來注冊的時候,不擅長拼寫的肖恩卻寫成了“Google”。對于這個因失誤而產生的名字,佩奇十分嘻歡。同“雅虎”和“亞馬遜”一樣,這個名字很有互聯網公司的氣質。
1997年9月15日,“google.com”正式注冊。憑著獨特的算法,谷歌成了互聯網搜索領域的霸主。目前Coogle旗下雇員有兩萬人,市值達1500億美元。