李大為 王京春 趙兵兵
摘要:調研了目前網絡流量計量的發展狀況,列舉了常用的流量指標和應用特點,分析了Alexa網站排名的機制和提供的流量數據,并使用實際數據驗證了Alexa的排名。提出了數據的估算方式來分析中國地區的排名情況,對Alexa中國排名75~125名的流量指標數據進行歸納處理,提出排名處于該區間的網站的特點,給出提升排名在數據指標上應達到的目標和改進建議,為新聞、門戶網站建設及網站評價提供參考,為網站提升Alexa排名提出建議。
關鍵詞:網站排名;流量指標;Alexa;數據分析
中圖分類號:TP391.4文獻標志碼:A文章編號:1008-1739(2018)18-64-3
Analysis on Characteristics and Performance of Website Based on Alexa
LI Dawei, WANG Jingchun, ZHAO Bingbing
(China Science and Technology Museum, Beijing 100012, China)
0引言
隨著互聯網的不斷發展,各式各樣的網站層出不窮。網站作為一個展示信息的渠道和用戶交互的平臺,已經成為當今最重要的媒體形式之一。作為媒體的網站,其目的是希望信息本身得到有效的傳播、擴散及反饋,或者是希望借助用戶瀏覽信息而獲得大量的訪問,從而推動其他業務的發展。而無論哪一種目的,其實現同樣都建立在用戶對網站的訪問這一基礎之上,因此作為網站的發布者,一個重要的關注點就是網站的外來訪問量,根據各頁面的訪問情況來改善網頁的內容和質量,并按照用戶的行為特點調整網站的結構[1-2]。
和傳統媒體有所區別的是巨大的網站數量以及實時的更新速度使得網站提供的信息規模和涉及范圍十分龐雜。另一方面,網絡媒體又具有傳統媒體所不具有的靈活性,網站可以根據用戶的個人信息和瀏覽歷史呈現個性化的頁面,同時也提供記錄用戶訪問行為的能力。這些因素的綜合影響,使得網站的流量分析較之傳統媒體,在數據上有著規模、精度和時效上的優勢。因此,網站是否覆蓋到了目標用戶,以及信息是否被有效的訪問,這些問題的解答在網站流量分析中擁有更加堅實的數據基礎。
1網站流量分析及排名
網站流量泛指網站的訪問量,可以使用多種指標來描述[3]。網站流量分析是對網站訪客行為的統計學研究,包含選取指標評價網站的流量和獲取有效指標的數據。
1.1流量指標
為了評價網站的流量狀況、活躍度和影響力,一系列的流量指標被提出來[4-5]。①頁面瀏覽量(Page View,PV):就是服務器收到的頁面加載請求數,通常每打開一次網頁就會被計入一次PV,同一個用戶在一定時間內(一天)對同一個頁面的重復訪問可以僅計入一次PV。PV反映了網頁被瀏覽的頻次,從而體現了網站的活躍程度,但對于存在大量圖片頁面的情況會更有利,例如瀏覽組圖時可能每張圖片都是單獨的頁面。另外不同的時間可能造成訪客群體分布不同,進而使PV產生較大的波動。
②獨立訪客量(Unique Visitor,UV):是網站以IP地址或其他唯一標識的網絡ID進行區分的訪問者數。同一訪問者對所有網站的訪問僅計入一次UV。UV是衡量一個網站用戶數量的重要指標,反映了網站的影響力,但對于瀏覽行為頻繁和極少的用戶并不進行區分考慮[6]。
1.2 Alexa排名機制
Alexa公布的排名計算方法依賴于UV(按照IP地址區分)和PV。Alexa會使用3個月的數據計算這段時間的排名。UV按照使用Alexa工具欄的用戶總數正規化,計算PV時剔除同一用戶在同一天內對同一個頁面的重復訪問部分。正規化的UV和PV計算幾何平均值,依據該值進行排名[7]。
幾何平均值意味著排名先后取決于2個網站正規化的UV和PV的相對比值,多1倍用戶訪問和多1倍頁面的瀏覽對于排名的影響是相同的。實際上Alexa排名的難點在于數據的獲取而非排名算法,正規化的UV和PV均由Alexa工具條用戶群體中相應數據估算,即認為在所有互聯網用戶中,存在著相同比例的用戶訪問該網站,并且網站間PV的倍數差距較之真實情況沒有明顯區別。
Alexa通過2種方式獲取互聯網網站的流量數據:①Alexa工具條:收集用戶端瀏覽器的訪問數據,它在用戶訪問每個Web頁面時都向Alexa后臺服務(data.alexa.com)發回一串代碼,代碼數據中包含十幾個核心信息參數,這些參數包括當前網頁地址、頁面打開時間、用戶端顯示分辨率及Alexa工具條版本號等。②Alexa網絡嗅探程序:收集網絡服務器的流量數據,Alexa通過與網站和DNS服務方合作,部署分布式的嗅探程序主動監測分析Web和DNS服務器的流量信息,從而獲取網站被訪的統計數據。
2 Alexa實際數據分析
2.1數據選取
主要分析Alexa中國排名100名左右的網站,分析數據均取自Alexa中國排名75~125名,共計51個網站,網站及其排名如表1所示。
從Alexa上可以獲取到的網站數據包括全球排名、中國排名、美國UV、Visit、PV、美國訪客平均訪問數、訪問平均頁面瀏覽數、訪客平均頁面瀏覽數、各地區訪客占比和排名、蹦失率、訪客日均頁面瀏覽數、訪客日均瀏覽時間、搜索引擎流量數據、鏈入鏈出數據及訪客分布等。
雖然Alexa公布了網站的全球排名和各地區排名,但能夠取得UV和PV數據的僅限美國等幾個地區,中國并不在列。對于上述網站,除了其中9個以外,都在美國有一定的訪問量,可以獲取到在美國區域排名以及UV和PV數據。通過美國的數據以及各地區訪客占比數據,可以對這些剩余共計42個網站中國區域的UV和PV進行粗略估算。
為了估計中國區域的UV,假定各地區訪客占比數據保持穩定,可以直接通過美國和中國的訪客占比以及美國的UV,計算這42個網站在中國區域的UV。
在估計中國區域的PV時,由于這42個網站中的38個網站的訪客幾乎全部來自中國,可以認為訪客日均頁面瀏覽數和中國區域內的數據相同,另外假定該數據保持穩定,可以將估算的中國區域的UV和訪客日均頁面瀏覽數相乘再乘上30,作為過去一個月的PV估計值。按照Alexa說明的網站排名機制,名次與UV和PV的乘積應當呈現相關關系,UV和PV的乘積越大,排名越靠前[7]。
2.2 Alexa美國排名情況
在美國區域訪問數據的網站中,網站的Alexa美國排名范圍在3~35 967名,將其與美國區域的UV和PV乘積進行比較。考慮到名次跨度較大,訪問量差距明顯,使用冪函數進行擬合,相關系數達到0.939 2,可以認為相關性顯著。
UV和PV的乘積并沒有嚴格按照網站排名遞減,原因可能來自排名計算使用的是最近3個月的數據,而UV和PV值來自于最近1個月的數據,部分網站在這段時間內流量有所變化,導致分布有所波動。
2.3 Alexa中國排名情況
38個有美國區域訪問數據且中國訪客占絕大多數的網站如圖1所示,估算的中國UV與PV乘積同中國排名的關系。圖中橫坐標為網站的Alexa中國排名,范圍在75~120名,縱坐標為中國區域的UV和PV乘積。
由于中國區域的UV和PV采取了大量假設和估計,數據的波動較大,而網站的中國排名又較接近,因此這些波動可能導致某些網站之間的排名關系和UV與PV乘積關系不符。但使用周期為5的移動平均線已經可以看出明顯的相關趨勢,基本可以說明Alexa排名確實是按照其宣稱的算法計算的。
2.4 Alexa中國排名網站流量分析
中國區域UV特征,如圖2所示。顯示了Alexa中國排名75~125名的網站估算的1個月內的UV指標數據。可以看到,絕大部分網站都達到了1E+7量級,即百萬量級的UV。
中國區域PV特征,如圖3所示。顯示了Alexa中國排名75~125名的網站估算的1個月內的PV指標數據。可以看到,所有網站都達到了1E+9量級,即億量級的PV,相當一部分網站達到或接近十億量級的PV。
與百度的關聯,如圖4所示。顯示了Alexa中國排名75~125名的網站最近的百度反鏈、收錄、索引的數量。圖中標出了各項指標的中值,反鏈中值1 710 000,收錄中值2 725 000,索引中值26 098 111.5。百度作為國內份額最大的搜索引擎,對于流量的引導作用非常強,以上3項值基本反映了這一排名區間的網站和百度的聯系程度。
3結束語
通過以上分析,可以發現Alexa中文排名75~125名的網站在某些重要的流量指標上的特征。這一區間的網站的Alexa流量數據通常包括百萬量級的月累計UV、億量級甚至接近十億量級的月累計PV、訪客日均頁面瀏覽數及訪客日均瀏覽時間。除此之外,考慮到搜索引擎的流量情況,如果能夠達到逾百萬的百度反鏈和收錄條目,并擁有逾千萬的索引,對于網站獲得大量的入口流量進而達到一定的Alexa排名也有很大的幫助。
參考文獻
[1]葉靈.網站網絡計量學實證研究———以35所高校網站為例[J].中國集體經濟,2015(7):51-52.
[2]程慧平.鏈接分析指標在大學網站排名評價中的有效性分析[J].信息資源管理學報,2012,2(3):46-51.
[3]林山.利用關鍵詞提升網站排名的方法[J].計算機與網絡, 2014,40(23):45.
[4]張平.如何利用關鍵詞提升網站排名[J].計算機與網絡, 2015,41(24):44-45.
[5]鐵生.網站排名不穩定原因及解決辦法[J].計算機與網絡, 2014,40(14):44.
[6]馬達.網站數據分析中的誤區探討[J].硅谷,2013,6(11):165.
[7]馮濤.基于SEO技術提高網站訪問量的策略研究[J].網絡與信息,2010,24(12):40.