肖蒙蒙
(鄭州大學,鄭州 450001)
互聯網發展迅速,互聯網上每個頁面都包含著各種各樣的信息,頁面與頁面之間的鏈接關系更是包含了大量的、潛在的信息。鏈接是網絡的顯著特征,網站、網頁以及網頁上的任何信息都可以通過網絡鏈接的方式與其他相關信息聯系起來,是實現Web2.0平臺上知識交流的重要方式和手段[1]。鏈接分析,即鏈接分析法,或稱網絡鏈接分析或超鏈分析,是以鏈接解析工具、統計分析軟件等為工具,對鏈接數量、類型、鏈接集中與離散規律、共鏈現象等的分析,用于 Web網絡中的信息挖掘及質量評價的一種方法[2]。
社會網絡分析是用于描述和測量行動者之間關系或通過這些關系流動的各種有形或無形東西(如信息、資源等)的一種方法。社會網絡研究的是節點以及節點之間各種各樣的關系。從1996年開始,產生了很多社會網絡分析在Web上的應用例子,通過鏈接簇或者核心節點標明網絡中的核心資源。近幾年,國內圖情領域的學者運用社會網絡分析方法研究博客、微博、企業以及網站之間的鏈接網絡,來分析鏈接網絡的結構特征,研究網絡環境下的知識交流網絡以及評價網站的競爭力、影響力等。在這些研究中,學者們用SNA測度對鏈接網絡的整體網絡結構特征、節點特征以及子網絡結構特征等進行分析,從而對鏈接網絡的結構,網站的地位與作用以及信息交流的規律與特征等有了更加全面和清晰的認識。本文從網絡整體結構、節點結構以及子網絡結構三個方面對SNA測度在鏈接分析領域的應用進行歸納和總結,以期對SNA測度在鏈接分析領域的應用有更加整體、全面的認識。
筆者對CNKI和萬方數據庫中圖情領域的文章進行主題為“社會網絡分析”并含“鏈接分析”的檢索,截止到2017年,共得到文獻46篇。本文將對這46篇文獻進行內容分析,總結社會網絡分析方法的測度在鏈接分析領域的應用。
本文通過對檢索到的46篇文獻進行內容分析,并進行歸納總結,將SNA測度在鏈接分析中的應用分為:整體網絡結構、節點結構以及子網絡結構這三個方面。以下筆者將這三個方面詳細展開,進行分析。
整體網絡分析主要是分析整體網絡的規模、緊密型、凝聚性、信息傳輸性能和效率以及網絡的集中趨勢等特征。
①密度。密度是網絡中的現有連線數量和一切可能連線數量的比值,它用來揭示整個網絡節點之間聯系的緊密性,反映整個網絡的凝聚力水平。②直徑、聚類系數和平均路徑長度。直徑是網絡中全部節點間最長的最短路徑長度。聚類系數是與某個節點相連接的鄰點之間的連線數和這些節點間能連出的最大邊數的比值。平均路徑長度是網絡中存在的路徑相連接的全部節點對之間的平均最短距離。這三個指標考察了網絡的連通情況以及信息在網絡中傳遞的效率與性能。③距離與凝聚力指數。距離是點與點之間構成的最短路徑的長度。凝聚力指數是依賴于“距離”而計算得出的,取值在0~1之間。距離和凝聚力指數都可以表明整體網絡的凝聚力。④中心勢。中心性有兩種指標:中心勢和中心度。中心勢是整個網絡的內聚性圍繞一些特定的點而聚集起來的程度,它描述了網絡的整體集中趨勢。中心勢有三類:點度中心勢可以分析網絡的向心性和集中趨勢;中間中心勢可以看出一個網絡中的資源被某些節點控制的程度;接近中心勢能衡量整體網中節點獨立性的集中趨勢。
對鏈接網絡進行整體性的結構分析,可以了解企業間、網群中、微博或博客用戶間形成的鏈接網絡的整體狀況,分析節點在網絡中的聯系是否緊密,信息是否能高效、通暢的在網絡中傳遞,以及網絡中節點的整體趨勢。整體網絡結構分析就是為了對現實中存在的企業間、網群中、微博或博客用戶間的社會關系進行客觀的展示和說明。
節點分析可以從個體角度分析單個節點在網絡中所處的位置、地位和角色。包括中心度、結構洞和核心-邊緣分析。
①中心度。中心度可以分析網絡節點所處的位置,是個體權利的量化指標。中心度有三種:點度中心度是與一個節點直接鏈接的所有節點的數量,值越大,該節點在網絡中的影響力就越大。中間中心度是一個節點位于網絡中其余節點之間的程度,可以衡量該節點對網絡中資源的控制程度以及對其他節點間聯系的影響力。接近中心度是一個節點不受控制的程度,即該節點的獨立性。②結構洞。結構洞,即社會網絡中的一些個體無直接聯系或關系間斷的現象,從網絡整體看好像網絡結構中出現了洞穴,在結構洞中,將無直接聯系的兩者連接起來的第三者擁有信息優勢和控制優勢。所以,處于結構洞中第三者位置的節點具有更多的社會資本和資源優勢。③核心-邊緣。核心-邊緣結構是由若干元素相互聯系構成的一種中心緊密相連、外圍稀疏分散的特殊結構。它可以分析網絡中處于核心位置和邊緣位置的節點。
對鏈接網絡中的單個節點做分析,可以找出企業間、網群中、微博或博客用戶間核心的、影響力大的企業、網站和用戶,發揮他們的積極作用;也可以分析哪些企業、網站或用戶對整個網絡中的資源、節點之間的聯系有較大的控制力,要對它們進行積極的引導,促進網絡中的信息、知識的流動和共享;對于邊緣位置的企業、網站或用戶,要鼓勵它們積極的和網絡中的其他節點進行溝通和聯系,提高自身的地位,獲取網絡中的信息,促進自身發展。
凝聚子群是滿足如下條件的一個行動者子集合,即在此集合中的行動者之間具有相對較強的、直接的、緊密的、經常的或積極的關系。在鏈接分析中的應用主要集中于凝聚子群密度分析、成分分析、派系分析、k-核分析和k-叢分析。
凝聚子群的密度可以分析網絡中的小團體,如果小團體現象嚴重,會影響整個網絡的信息溝通,不利于管理。成分分析、派系分析、k-核分析和k-叢分析都是將整體網絡劃分為多個小團體,只是它們的劃分依據不同。成分分析是根據子群內外節點關系的緊密度將網絡劃分為成分;派系是網絡中最大的完備子圖;k-核與k-叢都是建立在點度數基礎上的凝聚子群,k-叢要求各個點都至少與除了k個點之外的其他點相連,而k-核要求任何點至少與k個節點相連。
通過對企業間、網站間、微博或博客用戶間的鏈接關系做凝聚子群分析,可以看出企業之間、網站之間或微博、博客用戶之間的派系林立的情況,找出核心團體、中介團體,進而分析整個企業群、網站群、用戶群對核心團體的依賴程度;除此之外也可以揭示團體內、外部的信息交流傳播模式,進而可以為發揮核心團體的引導作用,改善整個網絡的信息交流效率而做出努力,從而提高企業、網站的競爭力,促進企業、網站或用戶間的信息交流和傳播。
本文對社會網絡分析方法在鏈接關系網絡中的應用進行了歸納和總結,從整體網絡結構、節點結構以及子網絡結構三個方面詳細分析了SNA測度在鏈接網絡分析中的作用,并對這些分析的現實意義做了闡述。社會網絡分析方法是鏈接網絡分析的重要方法之一,但是隨著信息多樣化、網絡復雜化的趨勢越來越明顯,SNA不能很好地適用于新的研究問題,如何在鏈接分析領域引入新的分析方法,對其進行更深入、有效的分析,是一個值得思考的問題。