當(dāng)你使用搜索引擎時(shí),它不是直接從網(wǎng)頁(yè)中為你網(wǎng)羅信息,因?yàn)檫@樣如同大海撈針,無(wú)法為用戶提供快速而準(zhǔn)確的反饋。
以谷歌搜索引擎為例,你搜索的其實(shí)是它的索引數(shù)據(jù)庫(kù)。谷歌使用一種名為“蜘蛛”(spider)的程序(網(wǎng)絡(luò)爬蟲(chóng)),它會(huì)先抓取少數(shù)網(wǎng)頁(yè),然后跟蹤其中的網(wǎng)頁(yè)鏈接,再由這些鏈接提取出更多網(wǎng)頁(yè)信息存入數(shù)據(jù)庫(kù)中,就像蜘蛛由一個(gè)中心點(diǎn)織出一張張網(wǎng)一樣,形成一個(gè)相互聯(lián)系的索引網(wǎng)絡(luò),包括數(shù)十億網(wǎng)頁(yè)。
當(dāng)你輸入關(guān)鍵詞后,搜索引擎算法會(huì)分析你輸入的內(nèi)容,再進(jìn)入索引尋找?guī)в嘘P(guān)鍵字的網(wǎng)頁(yè)。但含有這些關(guān)鍵字的網(wǎng)頁(yè)依然可能多得數(shù)不清,因此就需要由算法根據(jù)關(guān)鍵詞的匹配程度、出現(xiàn)頻率、位置、網(wǎng)頁(yè)質(zhì)量等信息,評(píng)估網(wǎng)頁(yè)內(nèi)容是否有幫助,并計(jì)算出排名分?jǐn)?shù)。另外其他網(wǎng)頁(yè)鏈接到該網(wǎng)頁(yè)的次數(shù)也是分?jǐn)?shù)評(píng)定的重要依據(jù)。算法最后會(huì)得出網(wǎng)頁(yè)的總積分,排出等級(jí),再以此決定搜尋結(jié)果顯示的先后順序。盡管這些步驟看起來(lái)相當(dāng)繁瑣,但搜索引擎能在半秒之內(nèi)將相關(guān)網(wǎng)頁(yè)以相對(duì)合理的順序?yàn)槟阏{(diào)出。
不同的搜索引擎有不同的算法來(lái)建立各自的索引數(shù)據(jù)庫(kù),目的都是為了方便用戶查找信息。雖然有時(shí)候也可能恰好避開(kāi)了所有你想要的資料。總之不論如何廣告總是躲不過(guò)的。