

摘要:文章運用主成分分析法和相關分析法,對我國35所大學網(wǎng)站的鏈接指標和流量指標進行研究,探索了關于高校網(wǎng)站評價的方法。研究結果表明:鏈接指標分析法與流量指標分析法均是網(wǎng)站測度的有效方法,流量指標分析法的效度要高于鏈接指標分析法,然而鑒于鏈接指標和流量指標對網(wǎng)站評價各有側重,有必要將二者綜合;對于一些單一指標,指出了網(wǎng)絡影響因子作為網(wǎng)站測評指標的不足,Alexa流量排名作為網(wǎng)站評價的指標具有很高的效度。
關鍵詞:網(wǎng)絡計量;鏈接分析;流量分析
隨著網(wǎng)絡技術的發(fā)展和信息資源的數(shù)字化,網(wǎng)絡已成為人們工作生活中不可或缺的工具。然而網(wǎng)絡信息魚龍混雜,給人們獲取高質量的信息帶來了一定的障礙,如何客觀地評價網(wǎng)絡信息成為了研究的熱點之一,并由此引出了一個新的研究領域——網(wǎng)絡計量學。網(wǎng)絡計量學是采用數(shù)學、統(tǒng)計學等各種定量研究方法,對網(wǎng)上信息的組織、存儲、分布、傳遞和開發(fā)利用等進行定量描述和統(tǒng)計分析的一門學科,其主要研究網(wǎng)站的鏈接指標和流量指標。近年來,我國信息化水平不斷提高,各高校的信息化水平也逐漸成為衡量高校核心競爭力的重要標準之一。而高校的網(wǎng)站建設狀況是其信息化水平的直接反映,運用網(wǎng)絡計量學的方法研究高校網(wǎng)站的建設狀況與其整體實力之間的關系,對于高校網(wǎng)站評價方法的研究及以后高校評價體系中引入網(wǎng)站建設情況都有很大的幫助。
一、研究對象與指標數(shù)據(jù)
(一)研究對象
為了方便研究,本文選取中國校友會發(fā)布的《2014中國大學評價研究報告》中排名前50的高校為研究對象,研究網(wǎng)站指標與排名得分之間的關系。
(二)研究指標與獲取方法
本文運用網(wǎng)絡計量學中的鏈接指標分析法和網(wǎng)絡流量指標分析法,選取了7個鏈接指標,包括總網(wǎng)頁數(shù)、總鏈接數(shù)、外鏈接數(shù)、內(nèi)鏈接數(shù)、總網(wǎng)絡影響因子、外部網(wǎng)絡影響因子、內(nèi)部網(wǎng)絡影響因子。流量指標選取Alexa官方網(wǎng)站中關于某網(wǎng)站最新(2014)呈現(xiàn)的流量指標,包括網(wǎng)站的流量排名、網(wǎng)站的蹦失率、網(wǎng)站的平均訪問頁面數(shù)、網(wǎng)站的平均訪問時間。
鏈接指標數(shù)據(jù)通過搜索引擎的高級搜索語言獲取。本文選用必應作為鏈接指標的獲取工具。以北京大學為例,只需在檢索框內(nèi)輸入表1中的高級檢索式,即可獲取鏈接指標數(shù)據(jù)。
流量指標是通過Alexa網(wǎng)站(www.alexa.com)進行搜集,Alexa網(wǎng)站是美國亞馬遜公司旗下的一個網(wǎng)站,提供網(wǎng)站流量監(jiān)測和排名,是目前比較權威的第三方流量統(tǒng)計工具。
二、數(shù)據(jù)的處理與分析
(一)數(shù)據(jù)的預處理
由于網(wǎng)絡上的信息每天都在不斷地更新,因此搜索引擎在不同時間上獲得的數(shù)據(jù)不同,為了保證數(shù)據(jù)一致,本文將所有檢索任務統(tǒng)一在2014年8月10日上午8點至12點之間完成。50所高校中,中國地質大學有北京和武漢兩個分校,兩所分校均具有自己的學校網(wǎng)站,得到兩組鏈接指標數(shù)據(jù),為了方便研究,本文剔除中國地質大學樣本。廈門大學、大連理工大學、北京協(xié)和醫(yī)學院、重慶大學、電子科技大學、南京理工大學的總網(wǎng)頁數(shù)小于100,作為排行前50的知名學校,其學校網(wǎng)站的網(wǎng)頁數(shù)如此之少,與本文的認知是不相符的,所以將這6所學校剔除。對于總鏈接數(shù),北京師范大學、南開大學、南京農(nóng)業(yè)大學、中國海洋大學的數(shù)據(jù)都比其他大學高出數(shù)個數(shù)量級,本文將這幾所大學剔除。外鏈接數(shù)是指某網(wǎng)站范圍之外的搜索引擎搜索到的鏈接到該網(wǎng)站的網(wǎng)頁總數(shù),高校網(wǎng)站的外鏈接數(shù)小于零是不可能的,因此我們將外鏈接數(shù)小于零的學校也剔除。綜上所述,對于特殊數(shù)據(jù)的處理共剔除了15所高校的數(shù)據(jù)。
(二)數(shù)據(jù)的分析與討論
1. 鏈接指標分析
(1)主成分分析
利用spss19對鏈接指標數(shù)據(jù)做降維因子分析,得到兩個主成分F1、F2,方差分別是75.217%和21.386%,累計方差為96.602%,兩個主成分累計方差超過80%,能夠很好地反映所有信息,因此得到的主成分計算公式和鏈接綜合得分公式如下。
F1=0.1×總網(wǎng)頁數(shù)+0.942×總鏈接數(shù)+0.968×外連接數(shù)+0.885×內(nèi)鏈接數(shù)+0.939×外鏈接網(wǎng)絡影響因子+0.939×內(nèi)鏈接網(wǎng)絡影響因子+0.939×總鏈接網(wǎng)絡影響因子
F2=0.958×總網(wǎng)頁數(shù)+0.291×總鏈接數(shù)+0.091×外連接數(shù)+0.454×內(nèi)鏈接數(shù)-0.306×外鏈接網(wǎng)絡影響因子-0.306×內(nèi)鏈接網(wǎng)絡影響因子-0.306×總鏈接網(wǎng)絡影響因子
z鏈接=0.75217×F1+0.21386×F2
(2)相關分析
將各鏈接指標、鏈接總分與網(wǎng)站的排名得分之間進行相關性比較,得到如下結果。
從表2中可以看出,Z鏈接、總網(wǎng)頁數(shù)、總鏈接數(shù)、外鏈接數(shù)、內(nèi)鏈接數(shù)與排名總分之間,在雙側置信度為0.01下顯著相關,說明排名總分越高的學校,實力越強,網(wǎng)站的規(guī)模趨于更大,指向網(wǎng)站的鏈接數(shù)越多,這與邱均平、段宇峰等的研究結果一致。網(wǎng)絡影響因子與排名總分之間的相關性并沒有得到理想的結果,本文認為其原因有以下兩點:首先,網(wǎng)絡影響因子的提出來源于期刊影響因子,期刊與學術性網(wǎng)站在很多方面的特征相同,但目前國內(nèi)大學網(wǎng)站主要是介紹性、發(fā)布性的內(nèi)容,真正純學術性的內(nèi)容較少,完全照搬期刊影響因子的應用勢必得不到理想的結果;其次,商業(yè)搜索引擎的抓取能力有限,無法搜集到全部的鏈接數(shù)和網(wǎng)站下所有的網(wǎng)頁數(shù),用平均年每頁的被鏈接率來評價大學網(wǎng)站并不合適。因此,將網(wǎng)絡影響因子作為大學網(wǎng)站測評的指標,還有待探究。
2. 流量指標分析
(1)主成分分析
蹦失率是指用戶瀏覽一個頁面就離開的訪問次數(shù)占該入口總訪問次數(shù)的比例,蹦出率越高,網(wǎng)頁越不受用戶歡迎。流量排名和蹦失率是兩個“負概念”,流量排名和蹦失率數(shù)值越大,網(wǎng)站的質量越差,所以在進行主成分分析前,本文將這兩個負概念轉為“正概念”,得到新的關于流量排名和蹦失率的兩組數(shù)據(jù)。然后進行主成分分析,得到兩個主成分F1、F2,貢獻率分別為56.409%和27.620%,累計貢獻率為84.029%>80%,F(xiàn)1、F2的成分矩陣如表3所示。
同鏈接指標的主成分分析,根據(jù)F1、F2的因子得分,計算出各高校的流量指標綜合得分Z流量。
(2)相關分析
用spearman等級相關數(shù)檢驗流量總分、流量排名、蹦失率、平均訪問頁面數(shù)、平均訪問時間與排名總分之間的相關性,得到結果如表4所示。
流量總分、流量排名、平均訪問頁面數(shù)、平均訪問時間均與排名總分顯著相關,流量指標可以較好地反映大學的綜合實力。其中流量排名與排名總分最相關,且為負相關,即高校的排名得分越高,其Alexa流量排名的值越小(即排名越靠前),因此Alexa流量排名對高校網(wǎng)站的評價具有較高的效率。分析結果顯示,蹦失率與排名總分之間并無顯著相關性,其原因是一些排名靠前的學校網(wǎng)站的蹦失率反而高于排名靠后的學校,用戶喪失嚴重,因此蹦失率高的學校要引起重視,加強網(wǎng)站信息整合,提高網(wǎng)站質量,增強對用戶的吸引度。
3. 鏈接特征與流量特征綜合分析
鏈接指標與流量指標綜合得分均與高校排名得分顯著相關,說明在網(wǎng)站進行測評時鏈接指標分析法和流量指標分析法均具有一定的科學性和可行性。流量指標綜合得分的相關性高于鏈接指標綜合得分,并且流量指標數(shù)據(jù)是通過Alexa網(wǎng)站,其具有一定的專業(yè)性和權威性,而鏈接指標的獲取通過商業(yè)搜索引擎,商業(yè)搜索引擎有其局限性。因此,從專業(yè)性角度來說,流量指標分析法效度高于鏈接指標分析法,而綜合運用兩種方法能夠更加全面地對網(wǎng)站進行評價。
三、結語
大學網(wǎng)站評價與大學綜合實力排名相關,在一定程度上大學網(wǎng)站評價可以作為學校綜合實力評價的輔助和參考。一般情況下,排名越靠前的高校,實力越強,科研水平越高,且由于具有豐富的辦學資源和良好的學校形象,勢必帶來大量的鏈接和用戶流量。就網(wǎng)站評價中鏈接分析法和流量分析法而言,二者均是網(wǎng)站測度的有效方法,流量分析法評價高校網(wǎng)站的效度高于鏈接分析法,但為了使評價結果更全面準確,可以綜合運用兩種方法。
參考文獻:
[1]邱均平,陳敬全.網(wǎng)絡信息計量學及其應用研究[J].情報理論與實踐,2001(03).
[2]郭亞寧,徐偉.高校網(wǎng)站評價應用研究——以國內(nèi)15所農(nóng)林類院校網(wǎng)站為例[J].農(nóng)業(yè)圖書情報學刊,2014(02).
[3]劉文云,翟羽佳,王文穎.基于鏈接分析法的高校圖書館網(wǎng)站影響力評價研究[J].情報科學,2013(06).
[4]曹梅.教育網(wǎng)站評價的網(wǎng)絡計量模式初探[J].開放教育研究,2011(05).
[5]邱均平,張洋.網(wǎng)絡信息計量學綜述[J].高校圖書館工作,2005(01).
[6]Ingwersen P. The Calculation of Web impact factors[J].Journal of Documentation, 1998(02).
[7]邱均平,陳敬全,段宇鋒.中國大學網(wǎng)站鏈接分析及網(wǎng)絡影響因子探討[J].中國軟科學,2003(06).
(作者單位:江蘇大學工商管理學院)