GoogIe是我最喜歡的搜索引擎,我被Google的精神而折服,被Google的文化而感染,是Google的超級粉絲之一。今天看了一些東西。與Google的愛好者,以及想了解Google的人分享一下。Google,真不愧為世界最強的搜索引擎。下文是Google搜索引擎在網民搜索時的服務過程。
搜索框
一切以任何人在網絡上展開搜索為起點。任何關鍵詞,比如:計算機應用文摘。
域名服務器
Google域名服務器上的軟件,運行于公司在全世界租用的或自有的數據中心上,其中包括在曼哈頓老港務局的一臺電腦。它們惟一的目的,是計算出哪些集群此刻最不繁忙,然后盡可能高效地“指引”這些搜索請求進入這些Google集群。
集群
這些搜索請求會一刻不停地流入Google分布在全球的各地數據中心的至少200個集群中。Google的技術優勢之一就體現在它的網絡軟件上,它的集群控制器能幫助一個集群中的成千上萬臺廉價的電腦像一臺巨型電腦一樣工作。Google可以在不停止整個集群運轉的情況下替換某臺廉價的電腦:如果一臺電腦死機了,至少有兩臺其他的電腦做好了替代它的準備。
網絡服務器
這個程序把—個查詢分攤給成千上萬臺機器,以便它們能在同一時刻為此次搜索服務這種差異好比以前是你自己一個人去雜貨店買東西,現在有100個人同時幫你找東西,然后把它扔到你的手推車里。
索引服務器
Google所收錄的一切都存儲于一個巨大的數據庫中。Google有上百臺電腦同時掃描它的“卡片目錄”以找到每一個相關的條目,而不是僅用一臺電腦篩選這些十幾億的字節。熱門的搜索詞語會被緩存在內存中幾個小時,而不是重新再搜索一遍。
檔案服務器
在索引服務器把所有的結果匯編整理后,檔案服務器開始提取所有相關的文件——巨大的數據庫里的鏈接和文章摘錄。Google其實不是在互聯網上即時幫用戶搜索頁面,它派遣的無數搜索機器人已經將許多網頁的數據采集回家,保存在Google已經建立了索引的檔案服務器中。這些資料都已經分門別類,做好了被使用的準備。
容量:基于一些Google發布的極有限的數據,專家猜測,Google服務器至少存儲了20個Perabytes的數據(1Pb等于100萬Gb)。不那么保守的《連線》雜志則說,Google可能有200個Pb的容量。如果你的iPod有lPerabytes的存儲空間,你就能存儲大約2億首歌。如果你要在高速互聯網上下載1Perabyte大小的東西,你的曾曾曾曾孫可能在2514年時仍守在電腦旁邊。
拼寫服務器
Google并不閱讀詞匯,但它會分析詞匯。如果它根據你的搜索請求得到1000個結果,但—個的類似搜索請求卻能夠得到—百萬個結果,它會將兩者聯系起來,并禮貌地詢問你是否原本想要查詢這些詞語——如果你的肥手指可能把“對沖基金”錯打成“對蔥基金”。
廣告服務器
每一個查詢都會同時進入一個廣告數據庫,與此查詢詞相匹配的廣告數據會被送至頁面服務器,以便它們能出現在搜索結果顯示頁。廣告團隊在跟搜索團隊賽跑——如果廣告匹配的結果所花費的時間比搜索結果用時更長,它就不會呈現在搜索結果頁面上,Google也就無法在此項搜索上賺到錢。
頁面生成器
Google的頁面服務器的任務,就是將某一項查詢的成千上萬次搜索結果收集起來,組織所有的數據,然后把這些精簡的搜索結果根據Googk的排序算法呈現在你瀏覽器的窗口中,整個過程比你讀這句話所花的時間還要短。
顯示搜索結果
熱門詞的搜索一般在0.25秒內完成,甚至更短。