朱春艷 華薇娜



[摘要]十年積淀,大浪淘沙。從圖書情報視角來看,Web2.0十年間經過怎樣的發展和演進?為我國圖書情報領域留下了什么?對圖書情報學科的發展產生了哪些影響?文章采用因子分析、聚類分析及多維尺度分析等多元統計分析方法,挖掘了國內圖書情報學視角下Web2.0研究現狀,并以高頻關鍵詞的共詞矩陣為基礎,初步繪制了十年來Web2.0研究熱點演進趨勢的知識圖譜,得出其主要研究領域是圖書館領域、信息服務領域、信息交流與社會網絡、知識管理和用戶行為等。
[關鍵詞]Web2.0;因子分析;多維尺度分析;圖書情報學;研究熱點
DOI:10.8969/j.issn.1008-0821.2015.01.011
[中圖分類號]G250 [文獻標識碼]A [文章編號]1008-0821(2015)01-0054-07
Web2.0到底是什么?自2004年O'Reilly媒體公司總裁兼CEO TimOReilly首次提出“Web2.0”概念以來,至今仍然沒人能給出科學統一的界定。然而,不論是商業領域的概念炒作,還是互聯網界的產業升級,亦或者是計算機領域的技術創新,事實上,Web2.0已在無聲無息中給社會生活、互聯網、科研活動等帶來了強烈的沖擊和巨大的變革,而以計算機科技為支撐的圖書情報領域更是首當其沖。
早在Web2.0提出之前,我國圖書情報界就有學者對此進行探索。2002年劉柏嵩在《新一代基于P2P的圖書館信息系統》中介紹了P2P網絡的現狀和特點,并給出將其應用在圖書館信息系統中的幾種形式;隨后,王敬穩等人于2003年撰文《“博客”現象及其對圖書館的啟示》對博客的定義、類型、思想理念、運作模式和社會影響力做了詳盡闡述,并總結了博客給圖書館的啟示。隨著“Web2.0”概念被明確提出,相關研究逐步興起,經過數十年的發展,成果豐碩。十年積淀,大浪淘沙。從圖書情報學視角來看,Web2.0經過了怎樣的發展和演進?它為我國圖書情報領域留下了什么?它對圖書情報學科的發展產生了哪些影響或者在將來會繼續產生什么影響?這將是本文所要探討的。
1.數據來源與方法
1.1數據來源
以中國學術期刊網絡出版總庫(CNKI)為數據源,以篇名為檢索項,以WFB2.0、BLOG、WIKI、RSS、SNS、P2P、IM、TAG、Folksonomy等及對應的中文翻譯為檢索詞,將來源期刊限定在“圖書情報與數字圖書館”學科,時間范圍為2004-2013年,共檢索文章2039篇;為保證數據的完整性和權威性,本文選定萬方學術期刊全文數據庫收錄的《情報學報》作為補充數據源,檢索策略與前所述一致,檢索文章54篇。對所得結果進行內容分析,去除無關數據結果,如博客選萃、會議通知、電子標簽方面論文等,最后得到有效文獻2036篇(檢索日期2014年2月13日)。
1.2研究方法
知識圖譜是一種以科學知識為計量研究對象,將復雜的科學知識領域通過數據挖掘、信息處理、知識計量和圖形繪制,以可視化技術描述科學知識的發展進程與結構,揭示知識及其活動規律,展現知識結構關系與演進規律。本文將綜合運用知識圖譜涉及的共詞分析、聚類分析、多維尺度分析等方法,描繪我國圖書情報學視角下Web2.0研究熱點演進趨勢。其中,共詞分析是對一組關鍵詞在同一篇文獻出現的頻次進行統計分析,進而揭示其所代表的研究方向和主題的結構關系,本文選取能揭示文獻核心主題的高頻關鍵詞來分析該領域研究熱點;聚類分析是采用聚類的計算方法,對共現的關鍵詞詞對的關聯性進行運算,將關系密切的詞聚集歸類,以達到挖掘隱含信息的目的;多維尺度分析通過低維空間(通常是二維空間)以展示主題間的聯系,并利用平面距離來反應主題間的相似度,高度相似性的主題聚集在一起,從而形成學科研究熱點。
2.Web2.0研究熱點演進趨勢分析
2.1關鍵詞共詞矩陣的構建
統計2036篇有效文獻,得到關鍵詞7512個;合并同義不同形的詞、集中相同研究主題的詞、舍棄表述寬泛無實意的詞,最后得到2013個關鍵詞。進一步排除無實際意義的關鍵詞后,選擇詞頻不少于10次75個關鍵詞作為分析的基礎,詳見表1。由表1可知,我國圖書情報學視角下的Web2.0研究熱點主要集中在圖書館、高校圖書館、數字圖書館等領域,對博客、微博、RSS、WIKI、TAG等技術的應用關注較多。根據遴選的75個高頻詞,本文借助TDA(Thomson Data Analyzer)軟件構建75×75的共詞矩陣,其中對角線上的數據表示關鍵詞的出現頻次,其他數據表示兩個關鍵詞在同一篇文章中共現的頻次。
2.2因子分析
本文將2004-2013年共劃分為5個時間段,每兩年一個時間段,研究不同時間段里我國圖書情報視角下Web2.0的研究熱點以及十年間的演進趨勢。
首先,對十年的數據進行因子分析。將75×75的關鍵詞共詞矩陣導人SPSS21.0中,轉化為Spearman相關矩陣,選取主成分、相關性矩陣、最大方差法進行因子分析;75個高頻關鍵詞中有13個公共因子被提取,能夠解釋圖書情報視角下Web2.0領域總信息的89.685%。根據數據挖掘理論,所提取的因子包括總信息的60%以上即可接受,因此提取4個及4個以上的公共因子都是合理的。依據以上分析,對十年間不同時段的高頻關鍵詞做因子分析,將因子的絕對值超過0.6的視為被接受,每個時間段各提出3-4個主成份,并將其界定為每個時間段中圖書情報學界Web2.0的熱點研究領域,詳見表2。從總體上看,服務、RSS、博客等是Web2.0十年來研究熱點,但我們也注意到從2010年開始,微博憑借發布便捷、管理方便、輻射面廣等諸多優勢逐步取代博客的地位,成為新的熱點研究領域。
2.3關鍵詞共現圖譜
為了進行多維尺度分析,須將關鍵詞共現矩陣轉化為相異矩陣。本文選用Ochiia系數將共詞矩陣轉換成相似矩陣,具體算法為A、B兩詞的Ochiia系數=(A、B兩詞共現的頻次)÷(A詞出現的頻次×B詞出現的頻次),得到相似矩陣;然后,將相似矩陣轉化為相異矩陣,再導入SPSS21.0,利用多維尺度分析繪制Web2.0領域的知識圖譜,然后通過聚類分析劃分出不同的學術領域。按照2.1中劃分的5個時間段,繪制每個時間段Web2.0研究熱點知識圖譜,再結合表2數據,從中探尋十年間Web2.0研究熱點的演進趨勢。endprint
(1)2004~2005年(圖1),圖書情報學界初涉Weh2.0,小試牛刀。Web2.0以用戶參與為本質,以其開放性、真實性、自組織性、聚合性等特性與圖書館開放、參與、分享、創造的精神不謀而合,在數字圖書館建設的基礎上,圖書情報界引入RSS、博客、WIKI、即時通訊等技術,豐富了信息資源,提升了服務功能。
此階段研究焦點在于引入技術、服務圖書館,具體來看有三大領域:a.圖書館基礎服務研究,包括信息檢索和數字圖書館功能等內容;b.信息服務模式和方法研究,介紹了RSS、信息推送、WIKI、QQ等特點、功能及其在圖書館中的應用;c.圖書館與用戶交流方式研究,重點討論在Web2.0環境下博客變革了傳統參考咨詢服務模式、改善了文獻信息加工和信息導航、提升數字圖書館信息服務能力,基于此,博客在圖書館的應用是可行的;同時,博客精神激發用戶的求知欲和表現欲,是有效的知識管理工具,有助于提高圖書館服務質量和管理效率;在圖書館不斷運用博客服務讀者的實踐中,學者們也得到不少啟示:博客更新的及時性、個性化、親和力等是發揮其在圖書館與讀者溝通交流作用的重要基礎。
(2)2006-2007年(圖2),Web2.0領域的研究內容得到進一步擴充和細分,主要體現在兩個方面:第一,除了對P2P、RSS、WIKI以及博客等技術的深入研究外,還引入了TAG、Folksonomy、元數據等內容;第二,首次提出了Lib2.0概念,欲意將Web2.0與library進行深層次融合,以提升圖書館服務與管理水平。其中“圖書館2.0五定律”影響較為深遠——圖書館2.0是以用戶為中心的虛擬社區、圖書館沒有障礙、圖書館無處不在、無縫的用戶體驗、永遠的Beta版。此后,相關學者對圖書館2.0的理論研究、平臺建設、規劃與實施等開展了諸多討論,強調在大力開展圖書館2.0建設的同時,不能忽視圖書館員自身素質的提高,逐步從圖書館員1.0過渡到圖書館員2.0。
在這一階段,對Web2.0的研究分為三大領域:a.以圖書館為核心的研究,包括圖書館應用、高校圖書館、圖書館服務、圖書館網站、數字圖書館等,這是在第一階段的基礎上的延伸與擴展;b.信息服務模式仍然是研究熱點,但研究內容在RSS、信息推送、WIKI基礎上擴充了TAG、Folksonomy、xml、知識博客等。具有里程碑意義的是在2006年5月召開了第一屆“Web2.0與信息服務”研討會,會議以“創新=信息*交流2.0”為主題,旨在促進Web2.0技術應用于圖書館信息服務;c.信息交流與社會網絡是這個時期新興發展的領域。隨著Web2.0技術的廣泛推廣,信息交流變得越來越便捷,信息傳播、人際社會網絡中的現象與規律也逐步引起圖書情報學界的關注。
(3)2008-2009年(圖3),Web2.0進入發展壯大時期,主要表現為發文量大幅增加,達到524篇,是上一階段的兩倍;其次,研究領域進一步分化,Web2.0與圖書情報的結合不再局限于討論博客、WIKI、TAG等技術在圖書館的應用,而是更為深入探討各種技術在教學、管理、服務中的新運用,包括文獻檢索課、圖書采訪、網站設計、網絡資源、圖書館管理、圖書館競爭情報服務、用戶服務、信息共享空間等方面。研究者在理論探討的基礎上對日漸復雜的信息交流、學術交流和知識交流中更深的社會網絡關系進行了大量的實證研究,將傳統的引文分析法用于網絡環境下的鏈接分析,分析博客之間信息交流行為和社會網絡關系。
同時,知識管理也是學界關注的熱點。從Web2.0的主體角度來看,知識管理主要集中研究個人知識管理和組織知識管理,后者包括企業、政府機構和事業單位等;從研究內容看,Web2.0環境下主體獲取知識的模式、整理和存儲知識的方式以及知識共享的途徑等也引起研究者的重視n引。此外,知識管理系統和平臺一直是關注的重點。值得一提的是王偉軍教授團隊較為系統研究了基于Web2.0環境下知識管理系統的構建、模型、框架等,該團隊應用Web2.0的思想和技術,引入SOA技術構架,提出知識管理系統的知識表現層、服務層、邏輯層和存儲層四層模型。
(4)2010-2011年(圖4)是圖書情報界研究Web2.0的穩步發展期,研究者在討論各項技術應用與實踐的同時,開始對已有的研究成果和實踐應用進行梳理和分析,逐步注重對理論基礎、發展機制、特征規律等的研究。
此階段研究特點主要體現在兩個方面:a.圖書館應用Web2.0技術提升服務仍然是研究主流,與以往不同的是研究者在借鑒國外經驗的基礎上,不斷總結、反思國內現狀,以求不斷探索和完善。如杜玉玲等人通過對16個學科館員博客進行實證調研,思考了推廣學科館員博客時應注意統一博客名稱和掛靠點、及時更新、增設“博客推薦”欄目、鏈接學科師生博客等方面;王偉軍等人以SSCI、CNKI收錄的圖書情報學領域期刊所載Web2.0相關論文以及2006-2010年度與Web2.0相關的基金項目為對象進行統計分析,總結Weh2.0關注熱點領域有信息內容生成、信息組織與檢索、信息交流與共享、信息服務、知識管理、網絡倫理等方面,并指出應從研究視角、研究主題和應用領域3個方面對“Web2.0信息資源管理”進行深入探討。b.信息服務進入新的發展階段,強調服務創新、用戶參與、個性化服務、學科服務、知識服務,并新引入微博、Twitter、本體等平臺或技術,尤其是微博以門檻低、裂變式傳播方式、即時通訊、信息交互性強、平民化等特點很快在圖書情報界得到廣泛應用。很多圖書情報機構將微博用于信息推送、參考咨詢、建立讀者興趣圈、個性化學科服務、內部學術園地;其中,新浪微博應用最為廣泛,它的@功能與微博短信為參考咨詢提供新的服務模式,微直播&微話題&微鏈接是宣傳特色活動的完美組合,微媒體與微盤共存讓在線讀者培訓成為現實,微群成為同好讀者、同行交流的平臺,微訪談為讀者提供話語權,微應用讓圖書館服務一切皆有可能。
(5)從Euclidean距離模型圖來看,有關Web2.0的研究在2012-2013年(圖5)間已逐步趨于融合,Web2.0的各項技術與理念已融入圖書情報各領域。除了圖書館、信息服務、知識管理、信息交流與社會網絡外,本階段還分化出新的研究熱點,即用戶行為研究。
Web2.0環境下,用戶的行為、需求和態度等都發生巨大變化;而對于信息服務機構而言,調研用戶行為特征,對提高用戶個性化服務質量、最大限度地滿足用戶的信息需求具有重要意義。基于此,研究者探討了基于Web2.0的用戶行為。用戶信息行為主要包括信息檢索行為、信息利用行為和信息發布行為。考慮到信息檢索行為存在個體性差異,有研究者對不同群體如大學生、教師、醫學生、青少年等的信息檢索行為進行研究,分析影響用戶檢索行為的各種因素,進而優化檢索系統;同時,協同信息檢索行為也受到高度關注,韓毅教授的團隊做了系統研究,他們沿用傳統信息行為研究的社會方法學,通過實證方法驗證和發現了“信息交流”與“語境”在合作查詢與檢索中的獨特作用。用戶產生內容(UGC)已成為一種重要的信息來源,基于此,信息發布行為將會成為Web2.0環境下研究用戶行為的主要趨勢之一。作為Web2.0環境下知識組織的一種新形式,有關百科詞條用戶貢獻行為的研究開始受到關注,研究者以百度百科為例,分析詞條創建者和詞條編輯者的行為,發現用戶在共現過程中呈集中與分散趨勢、共現無偏好性。
3.結論
2004-2013年間,國內圖書情報視角的Web2.0研究總體上形成了五大研究領域:(1)基于Web2.0的圖書館領域的研究;(2)基于Web2.0的信息服務研究;(3)基于Web2.0的信息交流與社會網絡研究;(4)基于Web2.0的知識管理研究;(5)基于Web2.0的用戶行為研究。其間各個領域不斷地交叉、融合、分化、更新。從總體上看,十年來研究熱點當屬圖書館領域,博客、RSS、TAG、Wire、P2P、IM、Folksonomy、微博等技術在圖書館的廣泛應用,為圖書館的服務及其發展提供新的方向。十年來,Web2.0以其獨特的優勢已經逐步融入圖書情報學界的發展,在信息服務、信息交流、用戶參與、知識研究等方面為圖書情報學界的發展做出了不可磨滅的貢獻。endprint