魏 娟
(山東省林業信息中心,山東 濟南250014)
AWStats是一個免費的并可以根據用戶進行個性化設置的一個強大工具,它可以對網站等產生的大量日志檔案進行分析,輸出直觀的統計圖。AWStats是眾多日志分析軟件中發展勢頭較快的Web日志分析工具之一,它基于Perl,支持windows或GNU/Linux系統(安裝了ActivePerl后),可跨平臺運行。用戶可以依照瀏覽器不同調用不同語言界面,有簡體中文版本。支持Apache格式日志,效率很高,AWStats相較于開源日志分析工具Webalizer,它輸出的統計項目足夠豐富,固然執行速度弱于Webalizer,但足夠應對某個日訪問量百萬級的網站。結果精確,可將很多搜索引擎的機器人訪問過濾掉。配置簡單易操作,擴展性強,有很多統計功能參數。
AWStats日志分析是通過服務器分析指定格式的web運行日志進行實現。
首先是獲取分析數據,這是日志分析的前提條件。如何獲得日志數據,可以通過該兩種方式進行:一是通過在網頁中進行代碼植入,二是對網頁沒有任何修改,直接從web服務器端日志文件中獲取數據。通常來說,不推薦在網頁中植入代碼的方式,隨意增減代碼給網站服務器帶來一定安全隱患的同時,也無形中為網頁維護工作增加了工作量。因此一般選擇第二種方式,即通過獲取網站log文件的方式來獲得數據進行分析。
以某林業政府網站域名www.xxlinye.gov.cn,使用Tomcat6.0為例。在web服務器上找到Apache服務。在服務運行過程中,logs文件是無法拷貝的,因為它要隨時根據運行情況實時更新,必須停掉Apache服務。鍵入以下命令找到服務器管理器
servermanager.msc
找到Apache服務,停止以下幾項服務:
Apache Tomcat6.0 Tomcat6cms
Apache Tomcat6.0 Tomcat6platform
Apache Tomcat6.0 Tomcat6search
然后在appApachelogs下找到日志文件。
在服務器端找到了林業網站的相關日志文件dummy-host.example.com-access_log與dummy-host.example.com-error_log,發現日志文件已達到十幾個G,如果直接進行日志分析,速度不能保證的同時,分析也很困難。
因此,為了今后更好的實現該網站的日志分析工作,通過對Apache進行相應的配置,對目前的日志文件進行之日分割,實現按天存儲訪問日志文件,方便以后使用,同時將之前的超大日志刪除。
在Apache安裝盤上conf文件夾下找到apache的配置文件httpd.conf。
打開文件,查找 CustomLog,將 CustomLog“logs/access.log”common改成
CustomLog"|e:/app/apache/bin/rotatelogs.exe
e:/app/apache/logs/access_%Y_%m_%d.log 86400 480"common
其中,rotatelogs通過它的offset參數表示中國標準時間與UTC的時區差異。我國是東八區,比零時區早8個小時,也就是480分鐘,86400秒則是表示1天。若沒有480這個參數,日志記錄時間和服務器時間會相差8小時。
錯誤日志也是一樣,進行如下操作。
查找ErrorLog,將ErrorLog"logs/error.log"改成
#ErrorLog"|e:/app/apache/logs/bin/rotatelogs.exe
e:/app/apache/logs/_error_%Y_%m_%d 86400 480"
設置完畢后重啟Apache服務。以上操作可以實現產生1個日志文件/每日,1個錯誤日志/每日。
下載perl5、cronolog、awstats 3個工具,其版本都是支持在windows平臺上運行的。
首先對perl5進行安裝,然后從cronolog的壓縮包中把cronolog.exe提取出來,之后 對awstats壓縮包進行解壓縮,假設目錄結構如下:


將以下代碼增加到apache的配置文件末尾,目的是讓apache可以訪問到awstats的目錄

在awstats安裝目錄下找到以下目錄E:/awstats/awstats-6.9/wwwroot/cgi-bin找到默認的awstats.model.conf文件,拷貝兩次到當前目錄,
第一份拷貝取名為:common.conf即可。
另一份拷貝根據分析網站的域名而有所區別,取名為:awstats.www.xxlinye.gov.cn.conf,分析的網站不同,取名相應改變。
然后打開awstats.www.xxlinye.gov.cn.conf,將原本內容情況,換成如下:
#包含通用的配置文件


配置完成,測試一下配置成功與否。
在開始輸入"cmd"打開命令提示符,用命令行方式操作,
進入到E:/awstats/awstats-6.9/wwwroot/cgi-bin目錄,
然后輸入:
E:/awstats/perl5/bin/perl.exe awstats.pl-config=www.domain.com,
回車執行。
部署成功則顯示如下信息:

在E:/awstats/awstats-6.9/wwwroot/cgi-bin目錄下有兩個pl文件,分別為awredir.pl和awstats.pl。按照如下修改這兩個文件:
將第一行的:#!/usr/bin/perl都修改成:#!E:/awstats/perl5/bin/perl.exe
打開web瀏覽器,輸入:
www.xxlinye.gov.cn/awstats/awstats.pl?config=www.xxlinye.gov.cn
就可以看到AWStats的統計界面了。
隨著社會對政府網站的逐步重視,政府網站績效評估已成為政府工作重點之一。林業政府網站作為一個部門的門戶網站,每日發布大量政務信息,包括涉及林業方面的重大方針政策、工作動態、文件辦理結果、行政審批公示、咨詢問題回應等等,是社會公眾了解林業工作的重要窗口。
加強對林業網站的日志分析,比如分析公眾對不同欄目的訪問量,訪問速度,在線咨詢問題數、網站訪問人數等指標,可以很容易的看出不同時間節點,公眾的關注熱熱點是在哪里,政府可以根據訪問熱點及時作出公眾回應,引導輿情發展,從一定程度上為推進網站信息內容建設,提升林業網站在線服務水平提供依據,為網站管理決策提供參考,使網站以更高的效率和更貼心的親和力服務于公眾。
AWStats作為可以運行在Windows服務器上的日志分析軟件,對很多有著Linux服務器困難癥的技術工程師帶來了更加友好的操作,實現起來也更便捷。所以用AWStats日志分析工具的對政府網站的評估有著良好的促進作用。