


摘" "要:文章以網絡計量學的鏈接分析法對“雙一流”大學英文網站建設情況和影響力進行實證研究,獲取其建構特征,能為國際化辦學進程下的高校英文網站建設發展提供有價值的建議和改革方向。該方法雖被廣泛應用,但它依賴于AllTheWeb、Google等搜索引擎的可用性,在主要搜索引擎不可用的情況下,選取“雙一流”大學英文網站為研究樣本,以鏈接分析法為基礎,重新設定多維度網站評價指標,對指標進行數據獲取和處理,計算出網絡影響因子,歸納出高校英文網站建設現狀中核心網站和二級學院英文網站的問題,并對國內高校英文網站的建設思路進行探討。
關鍵詞:網絡計量學;鏈接分析法;評價;高校英文網站
中圖分類號:G434;G647" " "文獻標志碼:A" " "文章編號:1673-8454(2023)03-0074-08
一、引言
網絡計量學起源于1997年國外相關學者提出的Webometrics概念,國內學者多在2010年前對網絡計量學的定義、發展、趨勢進行梳理和概括。大部分學者認為網絡計量學是采用數學、統計學等定量方法,對網絡信息的組織、存儲、分布、引證、利用等進行定量描述和統計分析,以便揭示網絡信息內在規律和數量特征的一門新興學科。相關學者在《網絡信息計量學綜述》[1]、《網絡計量學的理論、方法及應用》[2]、《網絡信息計量學研究與發展評述》[3]等論文里對網絡計量學的研究方法加以梳理,總結出的研究方法主要有鏈接分析法、統計分析法、圖論分析法。2010年后,鏈接分析法被普遍使用,有關學者在《基于鏈接分析的網站評價實證研究》[4]、《基于鏈接分析法的我國省級教育信息網站影響力評價研究》[5]、《基于鏈接分析法的我國主要商業銀行網站影響力評價研究》[6]諸論文中均利用鏈接分析法對四大門戶網站、省級教育信息網站、主要商業銀行網站開展網站評價研究。以上文獻所用鏈接分析法均依賴于搜索引擎的開放性和可用性。然而,被普遍使用的搜索引擎AllTheWeb已于2015年關閉,各大搜索引擎的搜索結果都有一定的局限性。還有學者在《鏈接指標用于網站評價的缺陷分析》[7]一文中,指出商業引擎難以獲取鏈接指標值。本研究借助鏈接分析法評價高校英文網站建設并設定網站評價指標,進行指標相關性分析,提出建設對策。
二、研究方案設計
(一)研究樣本的選取
國內第一梯隊大學英文網站是各高校網站建設對標調研選取的主要參考對象。教育部網站(http://www.moe.gov.cn/)2019年11月發布關于985、211名單咨詢的答復中已明確,“985工程”1998年啟動,支持39所高校結合國家創新體系進行重點建設。“211工程”1993年啟動,先后共有112所高校納入建設范圍。全部高校均屬全國普通高等學校,之后將“211工程”和“985工程”等重點建設項目統籌為“雙一流”進行建設。因此,本研究選取教育部網站2017年9月公布的“雙一流”建設高校名單A類里的35所、B類里的3所共38個英文網站作為樣本。樣本網站如表1所示。
(二)評價指標
確定核心網站的評價指標。評價一個高校英文網站的整體建設情況,需要將核心網站和二級網站共同組成一個英文網站集群進行綜合分析。這個網站集群的核心網站是這個學校的官方英文網站。
1.核心網站內容指標
確定導航欄目設計和首頁展示欄目數、文章數。一個網站的誕生都是從欄目設計規劃開始,欄目數量和填充的內容是關乎網站吸引度的靈魂。英文網站通過新聞稿件質量(Events)、科研稿件更新頻率(Research)、科研機構(Institute)、招生計劃(Admission)、師資介紹(Faculy)展示一個高校國際化視角下的綜合實力和科研水平。
核心網站頁面設計風格是定性分析的內容,和評價人的主觀感受有關。布局的整體性、分割性、色彩搭配等視覺元素運用得別具一格,符合人類審美的基本原則,往往第一眼就能給訪問者以震撼的力量。
確定核心網站的網頁數、外部鏈接數、網絡影響因子。網頁數是網站架構層次分布和內容規模大小指標,網頁數越多證明英文網站內容越豐富。外部鏈接數是外部網站或頁面指向該網站的超級鏈接數量,可以包括文本、圖片等格式的鏈接。外部鏈接數能反映網站被收錄的頻次、被關注度、網絡影響力。大多數學者選取2006年挪威·阿里雷扎(Noruzi Alireza)根據彼得·英沃森(Peter Ingwerson)提出的WIF公式,修正后的算法為:WIF=外部鏈接數/搜索引擎搜索到的網站內網頁總數[4]。
2.具有特定指向性的標志性指標
核心網站僅是一個權重最高的指標,評價一個高校英文網站的整體建設水平還應選取其它幾個維度指標。一是圖書館(Library)有無建設英文網站。建設英文版的數字圖書資源庫能為留學生開展學術科研提供有力支撐。二是從學校層面統籌建設以獨立域名***.edu.cn為標志的英文版教師主頁系統。三是英文版新聞網(News)。幾乎所有高校都建有官方中文新聞網站,有無建設以獨立域名為標志的英文版新聞網,是反映一個高校教學、科研、文化、活動的獨樹一幟的指標。四是二級學院英文網站建設指標。該二級網站不以首頁域名下的超文本標記語言(Hyper Text Mark-up Language,簡稱HTML)頁面學院介紹為評價指標,而是選取以獨立域名為標志的二級學院英文網站為指標。Schools網站建設數量的多少反映高校對英文網站頂層設計和縱深發展的統籌規劃建設的程度。
(三)研究方法及工具
被網絡計量學研究學者普遍使用的幾大商業搜索引擎AllTheWeb、Google等均存在誤差,對此,有學者在《搜索引擎在網絡鏈接分析中的應用研究》中進行了詳細研究。[4-6][8][9] AllTheWeb于2011年4月被關閉停用,通過幾大搜索引擎和站長之家(https://tool.chinaz.com/)的SEO查詢已經無法直接查詢網頁數。百度的Domain指令,查詢出來的是網站相關域名結果,包含互聯網上含有網站URL鏈接以及網頁內容中存在URL字符串的所有頁面。只要被搜索引擎收錄都有可能當成反鏈數搜索出來。實際上Domain搜索結果的數量要比網站反鏈數多很多。
Google查詢網站反向鏈接的最精準的辦法就是使用Google的網站管理員工具,但Google網站管理員工具只能查到具有控制權的網站。在站長之家的外鏈查詢的官方網站(https://outlink.chinaz.com/)上顯示:該工具用于反鏈查詢(外鏈查詢),可以查看該網站被哪些網站鏈接。綜合比較后選取站長之家的外鏈查詢作為數據采集工具。
三、數據獲取和分析
(一)數據獲取
大數據分析常用數據采集的方法是使用Phython的Beautifulsoup4庫自定義程序爬取樣本網站數據。將樣本網站的核心網站當成種子結點,從種子結點URL開始,按深度優先的策略分別遍歷標簽對象、字符對象、HTML對象、注釋對象。經過遞歸遍歷產生外部超鏈接隊列,接下來對外部超鏈接隊列進行第一次遍歷過濾。設定將域名解析成以edu.cn結尾的URL為目標二級網站;域名解析成非edu.cn結尾的URL為友情外部鏈接。一方面,一次過濾后的結果就是該樣本網站鏈接的所有二級網站。因爬蟲的合法性仍存在爭議,為規避對樣本網站正常運行的影響、保護數據安全,未采用爬蟲庫實施樣本網站的爬取。另一方面,一次過濾分析后的二級網站包含Admission、Research、Laboratory等欄目下的超鏈接,超鏈接跳轉的網站有中文網站、英文網站,還需要通過訪問進行二次過濾分析,對每個鏈接進行點擊確認是否連接訪問有效、是否為英文網站,以及是否重復,研究在2021年6-7月這個時間段內的點擊訪問樣本網站地址,并進行統計分析。最后得到的數據如表2所示。
雙一流大學A類共36所高校,除中央民族大學沒有建英文官方網站,其余35所均建設有英文官方網站。從表2中看出,各高校英文官方網站(核心網站)上鏈接的二級英文網站以獨立二級域名算,不含Schools和Departments,建設單位主要是各高校管理部處和職能部門,核心網站上鏈接二級英文網站較多的是武漢大學(31)、廈門大學(20)、北京大學(17)。僅有5所高校核心網站上鏈接的二級英文網站≥10,這在所有樣本網站上占比約為13%,其它均≤10。
二級學院Schools(不含Departments)建設較多的是山東大學、浙江大學、吉林大學,不少高校Departments也建設有英文網站,在此沒做統計,只統計二級學院層面的數據。同濟大學的Schools有24個英文網站,但沒有在核心網站上進行鏈接。湖南大學的Schools也有6個英文網站,但也沒有在核心網站上進行鏈接。鏈接二級Schools較多的有8所高校,其二級Schools英文網站≥30,占比約為21%;鏈接二級Schools較少的有11所高校,其二級Schools英文網站≤10,占比約為29%;其余近50%的高校Schools鏈接數量在10~30之間。
教師主頁是教師個人學術成果、招生意向的展示窗口。在學校層面統一規劃建設英文教師主頁的有北京大學、復旦大學等6所高校,其余高校僅部分學院在學院英文網站上有教師主頁的展示。
建設圖書館英文網站的有北京大學、清華大學等18所高校,近半數樣本網站針對留學生建設有英文版的圖書數字學術服務項目。
以獨立二級域名算,全國建設英文版新聞網的僅有北京大學(newsen.pku.edu.cn),其它高校均是在英文網站上以News、Events、Research等欄目內容的形式呈現新聞活動類文章,這是北京大學官方英文網站文章數量少的原因。新聞網獨立運營一個英文版,也彰顯出北京大學英文報道獨樹一幟的硬實力。
(二)搜索引擎SEO查詢數據獲取及分析
從表3中看出,各網站網頁數差異較為明顯,中山大學(4686)、上海交通大學(3367)、清華大學(3001)的欄目文章內容頁數量相對較多,排列在網頁數的前三名。網頁數主要來自欄目文章內容詳情頁,主要分布于News、Events、Research這三個欄目,以上三個高校的這幾個欄目均有歷年的文章數據沉淀,總文章數超過其余高校(北京大學除外)文章數的3~4倍。因網站首頁導航(About、Admission、Campus Life等)層次和內容建設一般屬于靜態欄目,網頁數和網站導航欄目層次內容關系不大。而News、Events、Research屬于動態欄目,文章數量是網站網頁數的主要影響因子,文章數量多表示欄目更新維護頻次高。北京大學是38個樣本里唯一獨立建設有英文版新聞網的高校(以獨立域名指向算),News、Events欄目均呈現在英文版新聞網,其英文官方網站的網頁數較其它高校低。網頁數多的高校對學校的新聞、活動事件的英文報道頻繁,內容維護力量強。
站長之家不支持子目錄的反向鏈接查詢,清華大學、中國人民大學、天津大學、復旦大學等9個英文網站的地址,是作為子目錄放在學校一級域名下的,所以無法獲得其英文網站的外部鏈接數和網絡影響因子。其余29個高校英文官方網站外部鏈接數來自百度搜索引擎,數量普遍偏少,表示這29個高校英文官方網站被其它網站鏈接的次數比較少。
在已獲取外部鏈接數的29個樣本網站里,根據外部鏈接數和網頁數計算的網絡影響因子從高到低排序,排名較高的是北京大學(0.557)、北京航空航天大學(0.105)、北京師范大學(0.090),國防科技大學因網頁數較少,用公式計算出的網絡影響因子很大,遠超過其他樣本網站的網絡影響因子,不列入排名。北京地區的高校樣本網站網絡影響因子比華東、東北、華南、西部地區高校樣本網站的網絡影響因子高。其它幾個地區的高校樣本網站的網絡影響因子無顯著差異。
收錄量反映搜索引擎對網站的收錄情況,收錄量大的表示網站被關注程度高。不同的搜索引擎對同一個英文網站收錄量的結果顯示不同。表中的收錄量來自百度,南開大學在百度中的收錄量顯示為2,但在谷歌搜索引擎中的收錄量顯示為933,吉林大學在百度中的收錄量顯示為15,但在谷歌搜索引擎中的收錄量顯示為370。收錄量較高的是上海交通大學、中國海洋大學、北京師范大學。
死鏈指打不開、斷掉、報錯的鏈接,是由于內容的刪除或程序錯誤又沒有及時維護更新產生的。死鏈接會直接影響用戶體驗。死鏈檢測結果顯示,有24個高校樣本英文網站死鏈數為0,其余樣本網站死鏈數在1到5之間,死鏈率極低,意味著所有樣本網站的日常維護有保障。
四、英文網站建設現狀問題探討
(一)各高校核心網站建設相對成熟
導航欄目規劃主要有About、Admission、Academics、News、Events、Campus Life等,涵蓋教學科研、學生活動、對外交流合作、人才招聘等方面的信息,并按角色瀏覽設置有Faculty、Students、Visitors等欄目,能提供更多有用信息。網站在美工設計上向國際看齊,設計有以Headline為主題的Banner,視覺元素沖擊力強,符合國際主流設計,強調適合英語國家本土使用習慣的用戶交互體驗,突出各自特色,體現出全球視野的理念。
(二)二級學院Schools英文網站缺乏統籌規劃
學校二級機構,包括管理職能部門,以及二級學院、系所、科研機構英文網站普及率偏低。在核心網站Schools頁面上顯示的二級學院英文網站,有的沒有建鏈接,有的鏈接失效,鏈接訪問有效的網站大都處于分散建設管理維護狀態,顯得高校的國際化服務水平不高。
(三)高校普遍重視核心網站建設,但二級英文網站建設力量薄弱
有近50%樣本高校的圖書館僅建設有中文網站,沒有建設英文版網站,這表明針對留學生的服務體驗還有待優化。全部樣本網站中有30余所高校沒有在學校層面統一規劃建設英文版教師主頁,教師主頁僅在學院網站上展示。英文教師主頁是海外學生報考學校、了解教師個人信息的途徑,各學院顯示的教師主頁分散,欠缺官方網站上的統一展示窗口。
五、英文網站建設實踐路徑
(一)強調視覺設計,凸顯人文特色
網站信息資源的功能主要是承載內容的表達,頁面如何在視覺美感上給讀者留下深刻印象、吸引讀者,讓讀者內心愿意在這個頁面停留下來閱讀尤為重要。國際一流大學網站主體部分以簡潔為主,以大圖、小圖、大色塊、小色塊來穿插使用,甚至Banner采用滿屏大圖來增加頁面沖擊力。因信息結構的不同,每一個版面的表現形式都做側重處理,讓訪客瀏覽時視覺感受更豐富。網站的美工設計應符合國際高水平大學網站建設潮流,本著簡潔大方的設計思想,進行清晰明快的版式劃分,實現對校園網內信息的整合。頁面設計遵循扁平化原則,沒有過多的色彩和修飾,色彩搭配與視覺心理反應相適應,色彩關系滿足視覺心理平衡,這樣的處理能夠使網站特色鮮明、重點突出。在色彩組合技巧上整體提高圖片色彩的比例,實現高分辨率電腦大屏和移動終端小屏的多屏融合;與國際接軌,個性化地使用VI的標準色,實現同一色調不同深淺度分布;為了增加時代感與空間層次,采用小范圍的絢麗色彩加以點綴。在圖片和一些小元素的運用上,充分挖掘高校多年沉淀的歷史文化內涵,傳遞人文思想,打造海內外有影響力的新宣傳名片。
(二)構建網站群平臺的技術支撐體系
塑造一個高校英文網站整體的外宣品牌,不僅要建設好核心網站,還要從頂層設計上統一規劃協調,推動二級單位英文網站建設。無論是英文核心網站還是二級機構英文網站建設,都應該將其作為網站集群,放到網站群平臺進行統一建設和運維管理。各二級單位英文網站缺少規范化的同時,存在各種安全隱患,英文網站安全性無法得到保證,分散的網站管理加大對服務器管理維護服務的依賴性,也是對技術部門管理資源的極大消耗。
網站群平臺采用垂直管理模式,站點體系呈上下級結構,自上而下統一管理,上級站點又完全擁有下級站點的所有信息資源,直接共享下級站點內的信息。內容樹(Contents Tree)的概念能實現分級管理信息資源,所有的信息只需要維護一次,上級站點可以直接引用下級站點內的信息。非上下級站點之間也可以采用“信息推薦”“跨站發布”“跨站引用”等方式被其它網站引用到。這種模式實現內容的融合與共享,有利于消除信息孤島和信息不一致的現象,核心網站和二級網站的英文信息資源可以互相引用,極大地提升學校英文翻譯稿件的資源利用率。將核心網站和二級英文網站都放到站群系統并加以整合,節省二級單位網站單獨建設的費用,減少網站管理員的工作量。
(三)建立內容建設機制
文章數的產生和內容息息相關,常態化的內容來源是影響網絡影響因子的主要因素。技術部門往往缺乏內容翻譯力量,而管理部門欠缺技術實現能力。要長效運維一個英文網站,就必須建立一個內容專業翻譯機制和網站運作機制,并且成立一個專業的團隊。高校部門分散、信息來源眾多,各職能部門明確分工,形成內容產生、內容翻譯、圖片處理、內容審核、內容發布的常態化運作機制,內容維護從各欄目的特性出發,保障信息發布渠道的暢通,堅持定期內容更新發布,宣傳學校新時期的形象。
(四)提升海外訪問速度
英文網站的訪客多在國外,海外內容分發網絡(Content Delivery Network,簡稱CDN)服務,是保障國外訪問速度的重要措施。因此,可以在現有的Internet中增加一層新的網絡架構,將網站內容發布到最接近用戶的網絡“邊緣”,使用戶可以就近取得所需要的內容,提高用戶訪問網站的響應速度。在完成CDN業務部署后,用戶在國內外訪問英文網站信息資源的速度得到跨越式提升。
(五)SEO優化
對頁面標題進行優化,每一篇文檔有獨立的標題。設定網站關鍵詞為“**University、Admission、Education、Professor”,在keywords和description標簽中使用。內部鏈接以欄目和功能為導向,結合關鍵詞,設置更方便友好的內部鏈接跳轉。使用重點信息HTML標簽,比如 strong / h2-h5 / b 等。完善全站導航,使其具備站點地圖功能。鏈接統計添加title,圖片添加 alt 說明,增強收錄導向。適當靜態化,將事宜公開發布頁面靜態化。校內鏈接與反鏈接方面,優化校內各院系及職能部門鏈接,做好主頁反鏈接(加title)。增加 robots.txt 文件。抽離 js、css 代碼,讓頁面專注于呈現內容。
(六)開闊全局建設視野
在當今“互聯網+”時代手機移動端的廣泛應用潮流下,英文網站除了建設電腦PC端版本,手機端版本也要同時建設,以實現訪客的多終端訪問和網站信息資源的移動端口接入。應當更大力地推動、引導、鼓勵二級英文網站建設。從研究數據來看,頂層核心網站的建設已經有比較清晰的思路,形成可復制可推廣的經驗,建設模式應當推廣到全校:一方面要注重核心網站的頂層設計;另一方面繼續鼓勵二級學院、系、所等科研機構大膽建設英文網站,注重探索,注重核心網站先行,并使頂層設計和先行探索有機結合,不斷將高校整體英文網站建設引向深入,借助網站的傳播廣度和滲透深度,宣傳高校的發展成果,加快國際化辦學進程,積極謀劃、參與國家一流大學和學科建設。
參考文獻:
[1]邱均平,張洋.網絡信息計量學綜述[J].高校圖書館工作,2005,25(1):1-12.
[2]王知津,鄭紅軍,張收棉.網絡計量學的理論、方法及應用[J].中國圖書館學報,2005(4):11-14.
[3]趙丹群.網絡信息計量學研究與發展評述[J].情報理論與實踐,2019(6):154-158.
[4]黃賀方,孫建軍.基于鏈接分析的網站評價實證研究[J].情報雜志,2011(1):74-77.
[5]徐芳.基于鏈接分析法的我國省級教育信息網站影響力評價研究[J].現代情報,2012,32(9):168-171.
[6]張倩,滕紅,袁小姍.基于鏈接分析法的我國主要商業銀行網站影響力評價研究[J].情報科學,2011,29(6):833-837.
[7]李江.鏈接指標用于網站評價的缺陷分析[J].圖書館雜志,2008(5):40-44.
[8]段宇鋒,邱均平.基于鏈接分析的網站評價研究[J].中國圖書館學報,2005(4):19-23,41.
[9]楊木容.搜索引擎在網絡鏈接分析中的應用研究[J].圖書情報工作,2006,50(11):91-94.
Evaluation of University English Website and Implementation Path Based on Webometrics
Lingyan ZHANG, Huanming ZHANG, Yingyi TANG
(Network and Educational Technology Center, Jinan University, Guangzhou 510632, Guangdong)
Abstract: On the webometrics link analysis of construction and influence of “Double First-Class” university English websites, this paper makes an empirical study and obtains its construction characteristics, which can provide valuable suggestion and reform direction for the construction and development of university English websites under internationalization context. Although this method is widely used, it relies on the availability of search engines such as Alltheweb and Google. So we select the English websites of “Double First-Class” universities as the research samples when the main search engines are not available. Based on the link analysis method, we reset multi-dimensional website evaluation indicators to acquire and process indicator data, calculate network impact factors, then summarize the problems of core websites and secondary college English websites in the current situation of university English website construction, and discuss the construction ideas of domestic university English websites.
Keywords: Webometrics;Link analysis;Evaluation; University English website
編輯:王天鵬" "校對:王曉明