張如云
摘 要: 分析了基于內容組的訪問者路徑分析的內涵,闡述了進行基于內容組的訪問者路徑分析前需做的準備工作,提出了進行基于內容組的訪問者路徑分析的具體步驟,最后得出了進行網站路徑分析的相關結論。為廣大用戶分析網站路徑提供參考。
關鍵詞: 內容組; 網站; 訪問者; 路徑; 分析
中圖分類號:TP311 文獻標志碼:A 文章編號:1006-8228(2014)05-23-02
Abstract: The connotation of visitor route analysis based on content forms is analyzed. The necessary preparation before analyzing is illustrated. The concrete steps of carrying out the visitor route analysis are introduced. The analytical relevant conclusion of carrying out website route is obtained. It offers reference for users to analyze website routing.
Key words: content forms; website; visitor; route; analysis
0 引言
對網站而言,用戶更多關注網絡流量來源渠道和轉化這兩部分內容,而對于網站內容分析則提及的較少。例如,如果網站的商業目標是銷售商品獲利,那么幫助潛在的購買者在網站中快速找到其所需商品信息就是路徑分析的一個目的,那么如何通過最短的路徑找到用戶所需要的內容,這是本文所要討論的。
1 概述
所謂基于內容組的訪問者路徑分析,就是在開始分析之前先對網站的內容進行分組,如圖1所示。那么,應如何對網站的內容進行分組;有沒有可依照的標準;是按網站頻道分組,還是按內容類型或者頁面層級分組;每個內容組劃分到多細的粒度才合適。所有的這一些問題都沒有標準答案,劃分內容組沒有統一的標準。每個網站,甚至每個人的劃分方法都不一樣。這里沒有對與錯和好與壞之分,只要劃分的內容組能夠滿足分析需求,達到分析目的即可。因此,在劃分內容組之前,需要先明確分析的目的是什么。
分析的目的是要通過分析來解決問題。例如,對于個人博客來說,要解決的問題是如何增加訂閱量,而如何增加訂閱量反推到網站的內容中可分解成如下具體的問題:①網站的首頁布局合理嗎? ②文章列表頁中的信息是否有效?③站內搜索提供的結果有效嗎?④文章頁的推薦有效嗎?
以上問題還可以再繼續分解為更具體的問題,例如:①訪問者從首頁去了哪些頁面?②列表頁的排序規則合理嗎?③選擇翻頁的訪問者有多?④沒有點擊站內搜索結果的訪問者去了哪里?這些具體的問題就是網站的分析目的。在了解了分析目的后,就可以開始創建內容組。
2 創建內容組前的準備工作
創建內容組的過程中,經常需要反復地調整,網站創建內容組不會一次就能夠順利完成的,其中遇到的主要問題有兩個。①網站URL規則混亂,層級劃分不清晰。這主要是因為最初的URL規劃問題,或者是SEO為了優化URL結構造成的。②內容組對URL的覆蓋不全面,總會發現規則之外的新URL出現。這主要是因為對URL的整理不全面。
根據網站管理的經驗,在開始創建內容組之前,必須進行如下三項準備工作,從而可以最大限度地避免內容報告中的混亂。
2.1 整理并理解網站URL
準備工作的第一步是整理網站中所有的URL,獲得網站所有URL的方法有三種:①從技術或網站管理員那里導出網站URL列表;②從現有的分析工具中導出最大時間段的URL列表;③按照URL規則生成URL,并逐一驗證。
前兩種方法可以快速獲得網站的大部分URL,但在后期整理和分類時比較麻煩;第三種方法在開始階段比較復雜,但分類時簡單,并且可以避免URL遺漏,當然前提是網站的URL規則層級清晰。
2.2 對網站URL進行分組
在獲得了網站大部分URL后,可以開始對URL進行分組,并為每個分組設置一個名稱。分組的標準是具體的分析需求,也就是通過分析想要解決的問題。最基礎的問題有多細致,分組就要有多細致。例如,針對前面例子中的分析目的,需要將網站首頁單獨作為一個分組,用來分析首頁的分流情況;將列表頁首頁作為一個分組,分析列表首頁的排序規則;將列表的后續頁面作為一個分組,分析訪問者在列表頁的翻頁情況,等等。這時候,可能會發現已經創建了很多分組,并且每個分組的規則都不太一樣,有些分組中只有一個頁面,有些分組則包含一個頻道,有些分組中只記錄了訪問者的某些特定的行為,比如翻頁、按鈕點擊、留言或訂閱等,而有些分組記錄了網站中的錯誤,例如404頁面、搜索失敗頁面等。這些都沒有問題,只要分組可以滿足分析需求就可以。
2.3 化為正則表達式
完成網站所有URL的分組后,需將每一個分組轉化為一條正則表達式。這個工作有些復雜,必須保證每條正則表達式不遺漏分組內所有的URL,又不能錯誤匹配到其他分組的URL。這里沒什么經驗可談,從每個分組中挑選一個典型的URL,然后放在一起進行測試。一個非常好用的正則表達式工具Rubular就可提高創建正則表達式的效率。
3 使用濾過器創建內容組
內容組是通過搜索和替換過濾器將現有URL進行聚合生成的。新生成的內容組將會覆蓋Google Analytics熱門內容報告,接下來需要為內容組單獨創建一個新的重復配置文件,這個配置文件中的頁面數據將只以內容組的名稱顯示,可稱為“內容組路徑分析報告”。
3.1 創建新配置文件
創建重復配置文件的方法非常簡單,但需注意以下幾點:①與主報告應用相同的配置,包括時區、過濾器等設置;②有子域的網站必須設置增加主機名過濾器;③按照具體的分析需求,有選擇地過濾URL中的參數;④不要開啟站內搜索報告,也不要過濾掉站內搜索或類別參數。
3.2 逐一創建內容組
通過對網站URL的整理和分組,已將整個網站的內容按照分析目的分為了不同的組。現在要做的工作就是在Goog1e Analytlcs中創建這些內容組,并獲得數據。創建內容組的工具是Goog1e Ana]ytcs的搜索與替換過濾器。整個過程很簡單,將分組的正則表達式輸入到搜索字符串中,將分組名稱輸入到替換字符串中。過濾器將對URL進行過濾,與正則表達式的規則匹配的URL將被替換為替換字符串中的分組名稱。
4 檢查并優化內容組
創建完內容組后,并不能馬上進行分析。因為這時的數據并不準確,需要對內容組進行行檢查。檢查的方法很簡單,就是通過查看配置文件中的熱門內容報告,尋找是否有被遺漏的URL,整個檢查過程大概要持續3-5天。
4.1 通過熱門內容報告檢查內容組
在創建好內容組的第二天,通過熱門內容報告檢查內容組數據,檢查是否有遺漏的URL,如果內容組報告中顯示了某個頁面URL,則說明這個頁面沒有被匹配到對應的內容組中,需要分析原因,對這個內容組的正則表達式進行調整。如圖3所示,可明顯發現,網站地圖的翻頁沒有匹配到內容組中,需要檢查這個內容組的正則表達式設置。如果創建的內容組比較多,可選擇一個快速檢查的方法,按頁面瀏覽量對報告進行排序可以很快發現那些沒有匹配到內容組中的URL。對內容組報告的檢查是一個持續的過程,因為新增加的外部流量經常帶有各種奇怪的參數,這些參數隨時可能破壞現有的URL規則。
4.2 優化過濾器的順序
在檢查內容組的設置時,除了遺漏URL的檢查,還需要對存在沖突的內容組進行檢查。這種情況并不常見,只在URL規則混亂時才會出現。例如在同一級目錄中包含多個信息,當需要對每個信息分別創建內容組時,正則表達式可能會發生匹配錯誤,這時需要通過調整過濾器的前后順序來保證正確匹配至此,網站內容組的創建和檢查工作都已經完成,然后通過Google Analytics中的訪問者流功能,并將創建的內容組與訪問者流功能配合使用,就可以對訪問者的瀏覽行為進行詳細分析。
5 結束語
本文詳細討論了基于網站的內容組的路徑分析,首先要對網站的內容有個規劃和分類,然后再借助Goog1e Ana]ytcs這個強大的過濾器進行內容組的分析,這樣就可以最大程度地提高網站用戶的訪問量,進而提高網站的社會效益和經濟效益。
參考文獻:
[1] 張玉梅.公共數據開放的國際經驗——基于公共數據開放的門戶網
站分析[J].信息系統工程,2013.7:88-90
[2] 汪傳雷,張莉莉,胡瀟瀟.基于鏈接分析的安徽省A級物流企業網站
分析[J].物流工程與管理,2012.2:15-17,33
[3] 孔菊芳.基于語音識別技術的英語學習網站分析[J].哈爾濱職業技術
學院學報,2012.5:65-66
[4] 張皓,王玉龍.一種網站分析系統的設計方案[J].電信網技術,
2013.10:37-42
[5] 孫丹鵬.基于訪問者信息行為的網站分析探究[J].科技信息,
2012.24:275