張 敏 霍朝光 吳郁松 (武漢大學信息資源研究中心 湖北 武漢 430072)
我國公共圖書館數字平臺的信息孤島問題研究*——基于社會化網絡的分析視角
張 敏 霍朝光 吳郁松(武漢大學信息資源研究中心 湖北 武漢 430072)
通過社會化網絡分析可以發現,我國公共圖書館數字平臺存在較為顯著的信息孤島現象,部分公共圖書館數字平臺缺乏信息資源合作、協調的管理理念,甚至不與外界建立任何鏈接關系。同時,我國公共圖書館數字平臺呈現出較為顯著的地域差異性態勢,東西部、沿海與內陸的區域發展不均衡。處于信息孤島地位的數字平臺可通過整合優化算法提供的館際合作鏈路方案,選擇入度、出度等指標上表現較為優越的市級或省級平臺作為最佳合作鏈路對象,以此緩解信息孤島現象。
公共圖書館數字平臺信息孤島 社會網絡分析
互聯網技術和信息技術的不斷發展給予了公眾更多的獲取信息的機會,但因受到個人知識背景、地區經濟發展水平、地區文化差異、地域信息發展水平差異的影響,現實社會中部分在資源獲取等方面處于相對劣勢的社會成員在虛擬世界中的信息獲取及知識分享等方面也處于極端弱勢的地位。公共圖書館是國家公共知識服務體系的重要組成部分,其基本要義就是保障社會中的每一個成員獲取信息知識的平等性,進而維護社會信息知識的公正[1]。統計數據顯示,尤其是在經濟危機爆發的時期,經濟實力不佳的社會成員往往會借助公共圖書館進行再學習進而掌握獲取職位的技能,如英國Westminster圖書館在經濟危機時借閱率與危機發生之前相比提高了35%[2]。在過去的幾十年間,世界各國實體圖書館數字平臺的搭建工作如火如荼,圖書館業務不斷趨向數字化、網絡化和社會化[3]。因此,公共圖書館在公眾知識傳播和知識分享中發揮著舉足輕重的作用,全面提升公共圖書館的公共信息服務績效具有重大的社會意義和文化價值。
信息孤島是信息化時代呈現出來的一種獨特的信息現象,它是指由于各系統、軟件、數據庫之間的格式差異、技術隔閡等造成數據共享性與交互率極端低下甚至無法聯通的問題[4]。公共圖書館數字平臺的信息孤島問題不僅僅體現在微觀層面數字平臺系統功能不兼容、信息共享障礙、業務環節脫鉤等問題,還體現在宏觀層面不同平臺群落之間或不同區域之間各自封閉、缺乏協作交流、缺乏資源共享、公共圖書館群落條塊分割等問題[5]。從社會資本理論視角來看,社會資本是繼經濟資本、文化資本之后又一重大資本力量,如何投入最小的社會資本來獲取最大的經濟、文化提升是發揮社會資本優勢的關鍵。對于公共圖書館數字平臺如何同其他平臺開展良好合作、發揮群體智慧的力量,在有限的鏈接空間設置最優的友情鏈接,以最優的社會資本投入獲得最有價值的提升是其平臺優化的關鍵。因此,本文從社會化網絡的分析視角出發,對我國公共圖書館數字平臺之間的鏈接關系進行定量研究,在構建鏈接關系共現網絡的基礎上,對共現網絡的基本屬性、凝聚子群及中心性等指標進行研究分析,之后基于分析結果探討我國公共圖書館數字平臺的信息孤島現狀和形成原因,進而提出弱化和有效規避信息孤島現象的相關建議。
目前,從網絡計量學的視角展開分析,運用數學統計等定量研究方法來探討網絡資源間的引證數量特征和開發利用規律,從而為網絡資源的配置提供依據,已經成為國際、國內學術界信息孤島問題的研究熱點趨勢。社會網絡分析法起源于社會關系學和社會心理學,主要用于研究社交網絡的結構和社交成員之間的社會關系[6];邱均平等人基于鏈接分析提出了網絡影響因子來分析網頁間的鏈接關系,主要用于研究各科研組織和機構平臺間的網絡資源利用情況[7];蔡筱英和胡偉通過搜索引擎收集醫學網站的鏈接數據,研究發現網站的外部鏈接數與網絡評價中的排名顯著相關[8];岳增慧等人基于對全球30個高校圖書館網站的共鏈數據進行分析,通過可視化技術揭示了各個高校圖書館網站的角色及其群落關系[9];劉偉剛通過對廣東、山東兩省的農業網站的鏈接對比分析發現,優化的網站鏈接可以使整個區域形成立體化的網站鏈,根據網站的鏈接數目分析可以量化信息孤島問題[10];翟光勇從網絡計量學角度根據網站之間的鏈接數據對政府網站的信息孤島問題進行了實證研究[11];王雨通過對文獻共引、作者關鍵詞關系、作者的合作關系進行社會網絡關系分析來論證資源聚合的過程,以期為解決信息資源的資源共享問題與不同數字圖書館之間的資源聚合問題提供借鑒[12];Barnett等人對全球1 000所大學之間的鏈接網絡進行結構分析發現,大學網站之間的鏈接網絡能夠很好地展現各大學的學術科研關系及相應教學特征[13]。
上述研究從不同的專業視角和側重點展開,極大地豐富了我國信息孤島問題的研究。但通過文獻綜述不難發現,目前從網絡的整體結構角度來細化研究信息孤島問題,進而對如何有效緩解信息孤島問題提出針對性方案的研究相對較少。相關領域的研究是實現資源聚合、發揮資源優勢、創造良好外部環境,從而有效解決平臺間的信息孤島問題的必由之路。鑒于上述分析,本文采用社會網絡分析法對我國235家公共圖書館數字平臺之間的鏈接網絡進行分析,從定量分析視角論證我國公共圖書館數字平臺的信息孤島問題,并通過量化的數據信息構建相對理想的鏈接網絡,以期為我國公共圖書館數字平臺解決信息孤島問題提供借鑒。
3.1數據收集與處理
近十年來,雖然我國圖書館界在大力發展數字平臺方面取得了重大進展,但因種種因素的限制,據筆者統計,目前在我國34個省和270個市中仍有69個市尚無公共圖書館的數字平臺,全國圖書館數字平臺覆蓋率僅為77.3%。考慮到各個市級圖書館數字平臺可能會依托各自的省級圖書館數字平臺同外界開展信息共享、館際互借業務,本文選取了34個省級圖書館數字平臺和201個市級圖書館數字平臺,共2 3 5個圖書館數字平臺為數據樣本,之后使用SocSciBot4.0獲取上述平臺網站的鏈接數據并應用Gephi軟件構建網絡結構圖[14]。我國市級以上圖書館數字平臺的網絡鏈接結構如圖1所示,將具有鏈接關系的節點進行過濾,剩下的無鏈接關系的節點如圖2所示。

圖1 我國市級以上公共圖書館數字平臺網絡結構圖

圖2 我國市級以上公共圖書館數字平臺網絡孤點圖
從圖1可以看出,浙江省、黑龍江省、湖南省、江蘇省、福建省、內蒙古自治區等省級圖書館數字平臺及成都市、濟南市、四平市、菏澤市、桂林市、通化市等市級圖書館數字平臺的網絡鏈路連通性較好,表現出顯著的平臺聚集效應。從圖2可以看出,235個圖書館數字平臺中有53個市級公共圖書館數字平臺和1個省級公共圖書館數字平臺與其他平臺之間不存在任何鏈接關系,它們游離在鏈接網絡之外,處于信息孤島狀態。因此,上述數據和圖形顯示了高達22.9%的市級以上公共圖書館數字平臺存在顯著的信息孤島現象。
3.2基本屬性分析
本文利用Ucinet軟件從宏觀到微觀對整個公共圖書館數字平臺鏈接網絡進行全面分析,形成的網絡結構圖形顯示,我國公共圖書館數字平臺中的233個節點之間建立了1 796條鏈接關系,網絡密度取值為0.033,相對較低,在整個網絡中只有3.3%的平臺節點是相對密集的,表明只有很少一部分成員之間保持著較為頻繁的信息交換關系;網絡的平均路徑為2.664,表示網絡中任何兩個節點之間平均需要2.664步,網絡直徑為6,表示網絡中最遠的兩個節點之間需要6步,這兩項數據說明網絡中節點之間的路徑比較長,不利于資源共享與知識傳播;網絡的聚類系數為0.297,顯示該網絡整體凝聚力較低,沒有明確的組織關系或合作關系。
從密度、平均路徑、網絡直徑、聚類系數等基本屬性不難看出,現階段我國公共圖書館數字平臺網絡系統整體結構比較渙散,平臺之間尚未建立起良好的合作、共享關系,協同能力較為低下。上述現象說明,一些地區的公共圖書館管理方對協助建立起全國性的公共圖書館數字平臺緊密合作關系的認知有待加強,尚未形成以資源共享為基本目標、以區域協同發展為基本手段的公共圖書館數字平臺聯動系統,這是導致我國公共圖書館數字平臺信息孤島問題的主要原因。
3.3凝聚子群分析
凝聚子群特指那些相互之間具有相對較強、直接、緊密、頻繁關系的成員集合體。凝聚子群分析對于揭示子群成員間的社會結構、分析其內部關系、挖掘群成員之間的同質和異質性特征具有重要意義。基于關系互惠性、基于關系頻次、基于內外關系密度以及基于關系可達性和關系接近性是最常用的凝聚子群處理方式,采用的指標主要有成分分析、K核分析、Lambda集合等[15]。本研究將我國公共圖書館數字平臺中游離于鏈接網絡之外的54個節點進行了排除,將剩余具有鏈接關系的節點網絡依據Louvain[16]社區檢測算法進行凝聚子群分析,算法原理如公式1所示:

分析子群1~6可以發現,上述6個子群依據河北、遼寧、四川、廣西、江蘇、云南6個省區形成了各自獨立的小團體,各小團體在自身所處的政治區域內緊密互聯,形成了局部鏈接系數較高的派系,信息交流與資源共享只限于各團體內部,說明在我國公共圖書館數字平臺的建設大局中,小團體現象仍然存在,并且以區域性小團體為主,即使網絡環境中地域上的差異仍然影響著網上數字平臺的建設。
分析子群7~8可以發現,黑龍江、江西、湖南、湖北等省份在不斷地突破地域限制,跳出局部,積極同整體網絡構建良好的鏈接關系,而處于華中地區的湖南、湖北、江西等地的公共圖書館數字平臺在全國的公共圖書館數字平臺的建設中起到了很好的橫貫南北、溝通沿海與內陸的橋梁作用。

表1 我國公共圖書館數字平臺網絡子群劃分
分析子群9~10可以發現,烏魯木齊、甘肅、青海、陜西等個別城市將西部區域的公共圖書數字平臺構架成一個整體網絡,而北京、天津、遼寧、內蒙古、河南、福建、貴州等地將東部區域的公共圖書館數字平臺構架成為一個整體網絡。因此,無論是東部沿海還是西部內陸都存在積極的能動者,它們通過中部地區的一些節點將我國的整個公共圖書館數字平臺鏈接成一個全國性的大網絡,從而形成了平臺整體架構良好、全局態勢明朗的結構。但是在局部地區也客觀存在一些消極現象。鑒于此,如何借助良好的整體網絡構架帶動局部地區發展,勢必成為緩解信息孤島現象的突破口。
分析子群11~12可以發現,哈爾濱、長春、沈陽、大連、濟南、開封、合肥、長沙、杭州等中東部地區之間關系較為密切,整個中東部地區自成一體。此外,這些中東部優勢節點以深圳為中介點取得同香港、澳門的良好互通效果,而在東部地區又進一步分化為以舟山、溫州、泉州、汕頭、河源、湛江為代表的東南沿海團體。由此可見,我國公共圖書館數字平臺整體區域差異較強,區域抱團現象較為明顯。
3.4中心性分析
點度中心性分析和中介中心性分析是衡量網絡結構的兩項指標,鑒于公共圖書館數字平臺鏈接網絡的實際意義,本文側重對其點度中心性展開分析。在一個網絡結構中,居于核心地位的節點往往與其他節點鏈接關系最多、鏈接強度最大、鏈接路徑最短,它們在影響力層面上往往優越于其他非核心節點,在網絡中顯示了較強的中心性地位[17]。點度中心性可用于挖掘團體中的核心人物、團體和組織,在無向網絡中用與該節點直接相連節點的數目來表示,在有向網絡中又細分為外向點度中心性和內向點度中心性,即出度(Out-degree)與入度(In-degree)。在本研究中,公共圖書館數字平臺被定義為有向網絡,出度表示該平臺主動鏈接其他平臺的數量,入度表示該平臺被其他平臺鏈接的數量。將提取的有向網絡結構數據依據出度和入度取值的大小分別進行排序,排序結果如表2所示。其中,入度較高的為江蘇省圖書館、天津市圖書館、廣州市圖書館、首都圖書館等數字平臺,說明上述數字平臺具有較好的資源優勢或較高的建設水平,吸引其他公共圖書館數字平臺與其建立鏈接關系,在結構網絡中這些節點處于較為核心的位置,具備了較大的影響力;出度較高的有浙江省圖書館、黑龍江省圖書館、成都市圖書館、四平市圖書館、菏澤市圖書館等數字平臺,說明上述圖書館的管理方采取了更積極的信息資源共享的管理策略,能主動與其他平臺建立鏈接關系,在鏈接網絡中起到了較為活躍的關聯作用。

表2 我國公共圖書館數字平臺網絡入度與出度(前10)
通過科學的計算手段將合適的網絡鏈接關系搭建在不存在鏈接關系的網絡節點間是解決信息孤島問題的一種有效手段,主要用到的技術為鏈路預測(Link Prediction),它是指根據已知的網絡結構或結點屬性信息對網絡中兩個結點間未知或者未來可能產生的鏈接的預測[18]。鏈路預測通常采用監督性和非監督性兩類模型,監督性模型主要通過訓練合適的分類器來預測鏈路,如k近鄰算法、支持向量機、決策樹和貝葉斯網絡等算法[19];非監督性模型主要依據一些特定的規則或結點相似性等來預測鏈路,如共同鄰居、Jaccard系數、加權Kazt和隨機森林等算法[20]。
從表1中顯示的12個子群分析不難看出,由于地方性經費來源和地方性政策保障機制的影響,我國公共圖書館數字平臺表現出很強的地域特征,且地區差異較大,因此對處于信息孤點的公共圖書館數字平臺在進行鏈路選取的時候勢必要考慮到自身所屬的省區等自身屬性問題。因此,本研究將基于網絡結構的傳統鏈路預測方法和基于網絡結點自身屬性信息進行了整合,根據上文對我國市級以上公共圖書館數字平臺鏈接網絡的網絡結構分析數據和各省區內各平臺的自身屬性特征,將235個公共圖書館數字平臺鏈接網絡加以優化,以形成較為理想的整體網絡。
諸如廣東省內的珠海市、肇慶市、中山市、揭陽市等處于信息孤島狀態的公共圖書館數字平臺網絡節點,它們最佳的鏈接與合作對象應該是廣東境內的省級或市級公共圖書館數字平臺,而廣州市公共圖書館數字平臺要比廣東省省級公共圖書館數字平臺在入度、出度等指標上表現更為優越,因此推薦最佳的合作鏈接對象應該是廣州市公共圖書館數字平臺,而非省圖書館或者其他市級的公共圖書館數字平臺。同理可得其他省份孤島節點的最佳鏈接選擇,具體網絡優化結果如圖3所示。

圖3 我國公共圖書館數字平臺網絡鏈路預測分析
本文旨在全面剖析我國公共圖書館數字平臺存在的信息孤島問題,以社會化網絡分析方法為手段將信息孤島的表現形式進行了細化。現將研究結果概括如下:
(1)我國公共圖書館數字平臺存在較為顯著的信息孤島現象。主要表現為網絡整體鏈接較少,網絡密度及網絡聚類系數低,節點共現網絡整體呈現出松散的星型結構。部分公共圖書館數字平臺缺乏信息資源合作、協調的管理理念,只關注自身館藏的建設,不與外界建立任何鏈接關系。導致上述現象的原因很多,一方面,許多公共圖書館的管理方缺乏利用其他平臺補缺自身劣勢的積極性,更深層次的原因是館際合作由于不同數字平臺處于不同發展階段,不可避免地帶來了信息鴻溝現象進而阻礙了館際合作的順利開展。為有效解決我國公共圖書館數字平臺的信息孤島問題,應該加強政府主導,加強區域共享型、區域合作型的公共圖書館數字平臺建設,確立合理的共享機制。
(2)我國公共圖書館數字平臺呈現出較為顯著的地域差異性發展態勢。上述數據分析結果顯示,我國公共圖書館界在東西部、沿海與內陸的區域發展過程中呈現出了顯著區域化差異。浙江、廣州、福建、上海等沿海一帶的公共圖書館數字平臺關系較為頻繁,占據整體共現網絡的核心位置,而新疆、青海、內蒙古等西北一帶與廣西、云南、貴州等西南一帶的地區游離在高連通性的核心組織之外,處于相對弱勢地位。上述結果說明,在現實世界中,經濟、文化、政治等方面發展相對弱勢的地區在虛擬世界的信息溝通、交流方面同樣處于弱勢地位。某些省份存在一些具有突出績效、高出入度的公共圖書館數字平臺,這些平臺應充分利用這些優勢節點來強化本省與外省之間的關系,從而突破區域限制,與外界展開良性互動。因此,公共圖書館在建設數字平臺時要注意發揮優勢節點的帶頭作用,突出重點,以點帶面地謀求全面發展。
信息孤島現象嚴重影響社會信息共享的整體績效,那些處于信息孤島狀態的數字平臺更應加強自身建設,通過積極構建良性互動、協調發展的網絡友好合作關系實現資源共享與信息便利。此外,由于中國特有的資源分配和財政政策,在發展過程中可根據地理、民族、語言、文化等特征因素建設區域性的數字圖書館聯動平臺,形成同種語言的或者文化相近的區域性公共圖書館數字平臺聯盟。
[1]范并思. 公共圖書館精神的時代辯護[J]. 中國圖書館學報, 2004,30(2):5-11.
[2]Rooney-Browne C. Rising to the Challenge: A Look at the Role of Public Libraries in Times of Recession[J]. Library Review,2009, 58(5):341-352.
[3]Chowdhury G, Poulter A, McMenemy D. Public Library 2.0: Towards a New Mission for Public Libraries as a "Network of Community Knowledge"[J]. Online Information Review, 2006,30(4):454-460.
[4]李希明, 土麗艷, 金 科. 從信息孤島的形成談數字資源整合的作用[J]. 圖書館論壇, 2003,23(6):121-122.
[5]王俊杰. 沖出信息孤島, 實現數字資源共享[J]. 大學圖書館學報,2004,22(3):16-18.
[6]Freeman L C. Centrality in Social Networks Conceptual Clarification[J]. Social Networks, 1979,1(3):215-239.
[7]邱均平, 楊瑞仙, 陶 雯, 等. 從文獻計量學到網絡計量學[J]. 評價與管理, 2008(4):1-9.
[8]蔡筱英, 胡 偉. 網絡計量學在醫學網站評價中的應用研究[J].醫學信息學雜志, 2010(3):28-31.
[9]岳增慧, 王 娟, 鄭春厚. 基于共鏈分析的高校圖書館網絡結構研究[J]. 圖書情報工作, 2011,55(9):118-121.
[10]劉偉剛. 基于鏈接分析的山東、廣東兩省農業網站對比[J]. 經濟研究導刊, 2014(29):42-44.
[11]翟光勇. 網絡計量學視角下的政府網站“信息孤島”實證研究[J]. 新聞與傳播研究, 2011(6):9-44.
[12]王 雨. 基于社會網絡分析的數字圖書館資源聚合研究[D]. 長春:吉林大學管理學院, 2014:40-59.
[13]Barnett G A, Park H W, Jiang Ke, et al. A Multi-Level Network Analysis of Web-Citations among the World's Universities[J]. Scientometrics, 2014,99(1):5-26.
[14]Barberan A, Bates S T, Casamayor E O, et al. Using Network Analysis to Explore Co-Occurrence Patterns in Soil Microbial Communities[J]. Isme Journal, 2014,8(2):343-351.
[15]劉 軍. s整體網分析:UCINET 軟件實用指南[M].上海:格致出版社, 2014: 153-178.
[16]Vincent D B A, Guillaume J L, Lefebvre E. Fast Unfolding of Communities in Large Networks[J]. Journal of Statistical Mechanics Theory & Experiment, 2008,30(2):155-168.
[17]Luo Qiuju, Zhong Dixi. Using Social Network Analysis to Explain Communication Characteristics of Travel-Related Electronic Word-of-Mouth on Social Networking Sites[J]. Tourism Management, 2015,46:274-282.
[18]呂琳媛. 復雜網絡鏈路預測[J]. 電子科技大學學報, 2010,39(5):651-661.
[19]Ding Jingyi, Jiao Licheng, Wu Jianshe, et al. Prediction of Missing Links Based on Multi-Resolution Community Division[J]. Physica A: Statistical Mechanics and its Applications, 2015,417:76-85. Guns R, Rousseau R. Recommending Research Collaborations
[20]Using Link Prediction and Random Forest Classifiers[J]. Scientometrics, 2014,101(2):1461-1473.
張 敏 女,博士,武漢大學信息資源研究中心,副教授。
霍朝光 男,武漢大學信息資源研究中心碩士研究生。
吳郁松 男,武漢大學信息資源研究中心碩士研究生。
Study on Isolated Information Island Problem of Chinese Public Library Digital Platforms——From the Perspective of Social Network Analysis
Through the social network analysis, the results show an obvious isolated information island phenomenon exists in Chinese public library digital platforms and some public library digital platforms lack the management conception of information resource community and coordination, even construct few links with the outside. Meantime, it shows obvious region discrepancy tendency in domestic public library digital platforms. Imbalance widely exists between the east and the west, the coast and the inland areas. The digital platforms in insolated information islands might select platforms with better in-degree and out-degree as target node to relieve the symptom of isolated information island from city level or the provincial level by interlibrary cooperation link strategy provided by integration optimization algorithm.
Public library; Digital platform; Isolated information island; Social network analysis
G250.76
A
*本文系國家自然科學基金項目“Web2.0環境下基于社會化網絡瓶頸限制的信息擴散最大化研究”,項目編號:71203166;武漢大學自主科研項目(人文社會科學)“危機傷害情境下網絡聲譽演化與修復機制研究”的成果之一。
2015-07-13 ]