蘇芳荔
(鄭州航空工業管理學院信息科學系,河南 鄭州 450015)
近年來,期間我國政府網站建設成效顯著,截至2009年底,我國政府域名(GOV.CN)注冊量達到49730個[1]。數量如此龐大的網站,質量卻參差不齊,因此網站健康度檢查(Website Health Check)這一概念便被提出。網絡信息計量方法在網站健康度檢查中得到了廣泛應用,尤其是鏈接分析法,能夠從結構角度對網站健康度作出判斷,并為網站設計提供建議。
河南省的電子政務發展和政府網站建設在國內一直處于中等水平,2010年1月國務院信息辦發布的《2009年中國政府網站績效評估報告》顯示,2009年河南省在省級政府網站績效得分排名中居第18位,在地市級政府網站績效得分排名中僅有6個城市居前100位[2]。筆者將以河南省所轄18個市級政府的門戶網站為對象進行健康度檢查測評,以期能夠掌握各地市政府門戶網站的建設現狀,認清發展中存在的問題和不足,為日后網站的優化和完善提供依據。
國外專門的網站健康度研究處于起步階段,相關內容及提法散見于論文案例和部分工具之中。國內對于網站健康度的研究也只局限于網站評價中,有一部分工具能夠針對網站健康度檢查進行優化,但總的來說,仍沒有形成一個完整的理論體系。網站健康度的確切內涵是什么,目前也沒有一個正式的定義,但大致可以從以下幾個角度來理解。
網絡影響力(Web Impact)是網站健康度的一項重要指標,主要體現在網絡鏈接方面。網絡鏈接的作用是組織網絡信息,表達其間的關系。“入鏈數”可以作為評價網站網絡影響力的指標[3]。M.Thelwall在《LinkAnalysis:An Information Science Approach》一書中對西班牙的64所大學網站進行了健康度檢查,他從鏈接的角度進行分析,度量的指標包括:網站規模、網站入鏈數、網站出鏈數、網站指向的頂級域名分布等[4]。
網絡影響力的另一體現是網絡流量(Network traffic)指標。可以從3個方面來度量網絡流量:①訪問人數,指在某一時刻或時間段中,瀏覽該網站的人數;②網站訪問量,指該網站一段時間內被用戶訪問的總的頁面數[5];③人均訪問頁面數,指每個用戶在一次訪問時間內所瀏覽或獲取的該網站的網頁數。
網站可見度(Website visibility)是網站健康度的另一個重要指標,它是指特定網站中的信息被搜索引擎獲取和索引的數量,一般以頁面數作為計量單位[6]。根據《第25次中國互聯網絡發展狀況統計報告》顯示,目前3.84億網民中使用搜索引擎的比例是73.3%。由此可見,網站對于搜索引擎是否可見,可見度高低,都直接影響著它的使用率,因此,網站可見度也成為網站健康度的一項重要指標。
網站權威度(Page Strength)可理解為網站的重要性值、信任級別或者強度。PR值(PageRank)是一個典型的網站權威度指標,它可以反映一個網站被Google引擎收錄的狀況。一般來說,具有較高PR值的網站會有較高的健康度。但PR值不是網站權威度的唯一指標,SEOmoz開發出一個測量網站權威度的工具,即trifecta,它能給出網站一個分數,這個分數代表了網站的重要性和流行度[7]。
筆者選擇河南省所轄18個市級政府門戶網站作為研究對象。本案例使用的主要工具和方法有:使用搜索引擎AltaVista獲取網站總鏈接數;使用Alexa工具檢查網站的流量指標和排名;選擇Google和百度兩大搜索引擎檢查網站相應的可見度指標;使用Google PR值來測度網站的權威度。

表1 河南省市級政府門戶網站
2.2.1 網絡影響力
①鏈接指標
在搜索引擎AltaVista中,使用“link:www.***.gov.cn”語句獲得18個市級政府門戶網站的總鏈接數,結果如圖1所示。總鏈接數是評價網站網絡影響力的重要指標。鄭州市、洛陽市、信陽市和安陽市在該指標中居于前4的位置,表明這4個市級政府門戶網站在鏈接指標上擁有較大的關注度和影響力。許昌市、周口市和平頂山市在這個指標上則表現不佳,這表明它們的業務宣傳和網絡影響力還不夠好。

圖1 Alta Vista獲取的市級政府門戶網站總鏈接數
②流量指標
Alxea提供全球范圍內權威的網站流量查詢,圖2和圖3分別是18個市級政府門戶網站日均IP訪問量、日均頁面瀏覽量(PV)指標周均示意圖。鄭州市、濟源市和鶴壁市居于日均IP訪問量的前3位,處于日均PV瀏覽量前4位的網站為鄭州市、洛陽市、新鄉市和南陽市。根據表2的Alxea排名可以看出,鄭州、洛陽和南陽這3個門戶網站的排名靠前。從這些結果可以看出,鄭州、洛陽、南陽的幾個門戶網站比較能吸引大家的注意。而濟源和鶴壁雖然IP訪問量靠前,但排名和頁面瀏覽量都不占優勢,表明用戶對這些網站都是匆匆瀏覽,不能吸引大家進行更細致的了解和訪問。

圖2 市級政府門戶網站日均IP訪問量(周均)

圖3 市級政府門戶網站日均PV瀏覽量(周均)

表2 18個門戶網站的Alxea排名
2.2.2 網站可見度
使用“限定要搜索指定的網站”選項,分別獲取各網站被百度和Google收錄的頁面數。圖4給出了18個門戶網站在Google和百度兩大搜索引擎中的可見度。三門峽市和安陽市門戶網站在Google中擁有絕對優勢的可見度,焦作市、三門峽市、鄭州市和信陽市在百度中擁有絕對優勢的可見度,這表明這些網站的搜索引擎利用效率較高,其影響力也必然較高,因而具有良好的健康度。駐馬店和商丘市在網站可見度指標中表現不佳。
同時,由于搜索引擎本身算法的差異,同一個網站在不同搜索引擎中也有不同的可見度。百度所能獲取到的網站網頁數要遠遠大于Google。

圖4 18個門戶網站在兩大搜索引擎中的可見度
2.2.3 網站權威度
我們這里使用PR值來測定網站的權威度,18個門戶網站的PR值如圖5所示。其中鄭州市、安陽市、南陽市、信陽市和濟源市的PR值為7;其他門戶網站的PR值均為6,焦作沒有測出。

圖5 18個門戶網站的PR值
河南省電子政務建設已經初具規模,廣域骨干傳輸網絡已連接到18個省轄市,省直城域網絡基本建成并得到較好應用。21個縱向業務系統依托省電子政務網向下延伸,省直單位電子政務外網接入率已達85%。18個省轄市政府、90%的省直單位和87%的縣級政府開通了門戶網站[8]。但是,本研究結果顯示,多數市級政府門戶網站影響力極低,網站健康度檢查結果不盡如人意。這表明政府部門存在重網站建設而輕利用的現象,這是對資源的極大浪費,應引起有關部門和領導的高度重視。
基于網站健康度檢查的網絡測評還存在以下問題:
①缺乏成熟的理論指導。網絡計量學是在上世紀90年代中后期逐步形成的一門學科,對其研究不過10多年的時間。相比非網絡的傳統信息的生產、傳播和利用規律的研究已經取得大量成果,網絡信息在形式、數量、手段、內容等各方面與非網絡信息都存在極大的差異,因而,難以直接借鑒和使用已有研究成果。
②缺少完善的研究工具。筆者所作的分析都是基于商業搜索引擎的,但是,商業搜索引擎不像SCI那樣是專門為引用分析而設計和開發的,被用于網絡計量學分析時,存在著覆蓋率低和穩定性差等缺陷。
③研究工具功能不完善。雖然AltaVista、Google、AllTheWeb等少數搜索引擎提供了類似link、domain、host等指令,可以利用這些功能對簡單的網絡鏈接關系進行分析,但對于聚類等復雜的鏈接現象仍缺乏有效的工具。
④數據獲取存在不確定性。網絡數據呈動態分布,這種不斷變化著的網絡信息內容,使得研究中所獲取的網絡數據反映的只能是某一時刻的情況,增加了研究結果的不確定性。
如何設計網站才能保證網站具有較高的健康度?這是進行網站健康度檢查的出發點和根本目的所在。一般來說,網站設計擁有固定的原則,這是保證網站健康度的基礎;從網絡信息計量學角度來說,網站的鏈接結構對網站健康度意義重大,所以這也是必須要考慮的。
在關鍵字的選擇上要注意以下幾點:①從用戶角度出發選擇關鍵字;②需要對核心關鍵字進行擴充和重復排列,保證網站對用戶的可見度;③避免使用涵義太寬泛的關鍵字,否則用戶可能會迷失在數量龐大的網頁信息中而找不到所需內容,降低網站原有內容對用戶的可見度;④確定合適的網頁關鍵字數量。
影響搜索引擎排名的一個重要因素是網站的導入鏈接,搜索引擎認為,如果網站質量較高,就會吸引更多的入鏈,而吸引的入鏈越多,則網站質量越高。另外,需要注意垃圾鏈接問題,搜索引擎僅對高質量的外部鏈接予以重視。
信息構建技術并不是針對網站健康度設計而提出的,但它在網站設計方面的理念,能夠有效地提高網站健康度。Rosenreld和Morvile對信息構建進行了詳細的解釋:①信息構建是在信息系統內組織、標識與導航規劃的結合。②信息構建是對信息空間的結構化設計,以方便任務完成和直接獲取內容。③信息構建是對網站和企業內聯網進行結構化和分類以幫助人們查找與管理信息的藝術和科學。④信息構建是集中應用設計科學和建筑科學之原理的新生科學和實踐領域[9]。
[1]中國互聯網絡信息中心.第25次中國互聯網絡發展狀況統計報告,2010.
[2]2009中國政府網站績效評估報告[EB/OL].[2010-07-09].http://www.echinagov.com/gov/special/special36/page1.html.
[3]Almind,T.C.,Ingwersen,P.Information analysis on the world wide web:methodological approaches to“web metrics”[J].Journal of Document,1997(4):404-426.
[4]Thelwall,M.Link Analysis:an information science approach[M].New York:Elsevier,2004:119-134.
[5]王偉軍.電子商務網站評價研究與應用分析[J].情報科學,2006(6):641-642.
[6]劉偉,段宇鋒.基于網絡影響力的電子政務建設績效評價[J].情報科學,2006(11):1705-1706.
[7]SEOmoz’s Page Strength tool[EB/OL].[2010-07-09].http://www.seomoz.org/trifecta.
[8]河南省電子政務發展規劃(2009-2012年)[EB/OL].[2010-07-09].http://www.drcnet.com.cn/DRCnet.common.web/DocViewSummary.aspx?docid=1978005&leafid=3090.
[9]潘梅.國內外信息構建(IA)研究綜述[J].圖書情報工作,2004(6):8-12.