陳柏宏
(廣州大學管理學院,廣東 廣州510006)
近年來,社會網絡分析(SNA)應用越來越廣泛,在許多學科領域都得到了良好的運用。在破壞性創新的研究領域,很少有人注意到學者之間的合著網絡具有什么樣的潛力。文章運用了sati 軟件[1]抓取web of science 上創新領域相關作者信息,并運用Python 對sati 抓取到的信息進行處理與清洗,最后運用網絡可視化分析軟件Gephi 對破壞性創新領域作者的合作關系進行分析,衡量合作網絡是否具有發展的潛力。
破壞性創新理論自提出至今,已成為最受關注的創新理論之一[2]。破壞性創新理論最初起源于christensen 提出的破壞性技術[3]。現在主流的破壞性創新定義是:破壞性創新意味著不同于主流技術所提供的性能屬性。創新首次被引入時,往往在主流客戶最看重的性能屬性上表現不佳,故只會吸引看重非主流性能特征的低端或新興市場的小眾客戶。然而,隨著時間的推移,破壞性創新會比現有的技術在主流的性能屬性上得到更快地提升,使其在主流市場中具有競爭力,然后,它可以“入侵”主流市場,甚至取代主流的現有技術[2]。
社會網絡分析經歷過較長時間的發展已經具有較為完善的體制,基本可以從以下幾個角度進行分析:
1.2.1 平均度分析:平均度是指整個網絡中各個節點的度,而一個節點度的定義是該節點有多少其它節點與之相關聯,所以整個網絡的平均度可以一定程度上表示一個網絡各個節點直接關聯程度。
1.2.2 網絡密度分析:網絡密度可以測算整個網絡的結構是密集還是松散,較為松散的結構意味著節點間的合作較少,信息流通性差。計算公式為:

其中,l 表示網絡中存在的邊數量,n 表示網絡中節點的數量。
1.2.3 聚集系數分析:聚集系數可以分析出網絡的形狀是否規則覆蓋面以及集中性,是了解網絡整個結構的重要方法。聚類系數與平均路徑長度結合時可以判斷該網絡是否具有小世界的特性。計算公式為:

Gephi 是應用于不同學科(社會網絡分析、生物學、基因組學等)的網絡可視化軟件[4]。Gephi 的可視化模塊使用的是特殊的3D 渲染引擎來進行實時的渲染,這可以讓圖形處理用到電腦的顯卡從而解放CPU 去處理其它的工作[5]。Gephi 是在網絡應用中及其有力的工具,它不僅提供了技術上的準確分析和視覺上的美觀性,它還可以自動生成一些隨機圖可以滿足ER 隨機圖理論的應用,也可以生成動態網絡圖,觀察網絡整個生命周期內的變化。作為一個可視化工具,布局算法就格外重要,下面介紹一種主要的布局方式。
Fruchterman Reingold 布局算法將所有的節點看做是電子,每個結點收到兩個力的作用:其它結點的庫倫力(斥力)以及邊對點的胡克力(引力)。那么在力的相互作用之下,整個布局最終會稱為一個平衡的狀態。Fruchterman Reingold 布局在不改變默認值的情況下(主要是重力大小),圖形的布局最終會向一個規則的圓形發展,使整個圖形的布局安排合理恰當且美觀。
本文獲取數據來源于Web of Science 核心數據庫。首先我們使用“Disruptive Innovation”為關鍵詞字段的核心數據庫的主題檢索,一共檢索到了2034 條結果。經過初步的篩選剔除一些無關文獻,一共得到573 篇文獻,將573 篇文獻的題錄信息導出。
2.2.1 SATI 對文獻作者字段的提取
由于我們從Web of Science 導出的數據量過于龐大,且我們只需要相關的作者信息,我們考慮使用SATI 軟件對其的作者信息字段進行提取。其實SATI 本可以完成相關共現矩陣的制作,而這樣的共現矩陣也能夠導入Gephi 進行處理,但是SATI 最多支持100 方格大小的矩陣,我們處理573 篇文獻超過了SATI 可以支持的數據量,所以只使用SATI 軟件對文獻的作者字段進行提取。
2.2.2 Python 對數據進行進一步清洗
由于Gephi 對導入文件的格式有較為嚴格的要求,必須是共現矩陣的形式或者是特殊的表格形式,所以我們考慮使用Python 對其進行處理。利用每篇文章中出現的作者名作為共現矩陣的數據來源,若兩個作者出現在同一篇文章里,則說明他們之間共現一次,以此類推,利用python 編寫程序實現這個功能,并且讓共現次數作為網絡邊的權重。
處理經過以上處理步驟之后,可以順利將數據導入Gephi,選擇圖的類型為無向圖,因為作者之間的合作關系是雙向的,一共產生了1364 個節點以及2311 條邊。直接導入得到的初始圖形非常雜亂,因為其節點過多,考慮使用Gephi 的布局對圖形進行處理。
考慮多個算法不同的特性和優點,本文所建立的網絡規模屬于中等,故選擇Fruchterman Reingold 布局對整個圖形進行處理,采取默認參數的配置處理后的圖形如圖1 所示。可以看到其中一些的大致規律:如果一個很大的集團往往沒有一個節點與外部聯系,盡管他們內部聯系非常緊密,但依舊對于整個網絡的影響不大。相反,比較小的集團,他們之間互有聯系,這樣往往對整個網絡才是具有貢獻的。

圖1 經過Fruchterman Reingold 布局處理后的網絡圖形
之后利用Gephi 對網絡進行量化的分析,見表1。由表可知,平均度數只達到了3.4 左右,說明整個合作網絡的比較低效,且整個網絡的密度為0.002,是處于比較松散的狀態,節點之間交流傳遞比較差。一般來說我們現實世界中網絡最大的密度為0.5 左右[6]。網絡的平均聚類系數為0.981,本文模擬了同等規模的隨機網絡圖,發現隨機圖的平均路徑長度為3.46 且具有相同的平均聚類系數,此合著網絡的平均路徑長度為1.121,遠低于隨機網絡,說明此作者合作網絡具有小世界性的特征。盡管網絡密度較小,但是具有小世界性可以讓網絡中的作者有機會得到與其他未合作的作者更多的合作機會,這樣的合作網絡極具潛力。

表1 網絡中的定量參數
本文利用Web of Science 的核心集檢索,以“Disruptive Innovation”作為關鍵詞字段進行檢索,一共得到了2034 篇文獻的結果,篩選留下了573 篇文獻。之后將573 篇文獻導入SATI軟件進行處理,SATI 軟件對其文本提取了作者字段。本文之后使用了Python 對其SATI 輸出后的文件進行處理,將其導入Gephi 后無異常,得到一個1364 個節點,2331 條邊的無向網絡。之后進行Fruchterman Reingold 布局處理得到更易于觀察的網絡圖,在圖中我們發現,盡管存在一些較大的集團,但是他們是一個獨立的集團,即與外部沒有聯系;我們也發現一些較小的集團之間有聯系,在這其中的聯系節點起了關鍵性的作用,這樣的節點對于整個網絡是關鍵的。之后本文對其相關網絡參數進行輸出和分析,發現破壞性創新合著網絡具有較為松散的結構,但卻擁有小世界性的特征,這樣具有小世界性的網絡是極具發展潛力的,因為擁有大量未來合作的機會。