段慶鋒 蔣保建
〔摘 要〕雖然結構嵌入在技術合作過程中的重要性已受到學者重視,但僅停留在結構特征統計描述層面,并不足以揭示技術合作背后的因果機制。從網絡視角,將技術合作影響因素劃分為內生和外生兩方面,通過ERGM模型,重點考察不同結構嵌入效應,以揭示技術合作網絡生成機制。基于石墨烯領域合作專利的實證研究發現:技術合作傾向于嵌入閉合三角結構,而非星型結構、2-路徑,說明閉合性是技術合作網絡形成的關鍵內生機制;外生性因素方面,表現出強烈的地理同配傾向。研究結果說明網絡結構是技術合作關系社會化特征的反映,技術合作是內生、外生因素交織結果。
〔關鍵詞〕技術合作;網絡結構;ERGM模型;指數隨機圖;石墨烯;合作專利
DOI:10.3969/j.issn.1008-0821.2018.08.011
〔中圖分類號〕F204 〔文獻標識碼〕A 〔文章編號〕1008-0821(2018)08-0083-07
〔Abstract〕It could hardly discover the underlining causal relationship behind technology collaboration if only relying on statistical description about its structure characteristics,although structure embeddedness in technology collaboration network has been paid attention to by scholars.Influencing factors upon technology collaboration were classified into endogenous and exogenous parts from views of technology collaboration network,and ERGM was applied to mainly analyze the effects of structure embeddedness in purposes to discover mechanisms of forming technology collaboration network.Some conclusions were found by the empirical research based on collaborative patents in graphene field.Technology collaboration tend to embedded in closed structure of triangle,but not star or 2-path,which illustrated that closure in structure was the key endogenous mechanism to form technology collaboration network.Furthermore,tendency of homophily in geography could be significantly found in exogenous aspect.Empirical results demonstrated that network structure reflected the socialization characteristics of technology collaborative relationship,and intertwine between endogenous and exogenous issues ultimately resulted in technology collaborations.
〔Key words〕technology collaboration;network structure;ERGM;graphone;collaborative patents
開放式創新背景下,技術創新合作已經成為科技發展的常態形式,技術網絡嵌入是創新主體接入技術前沿的有效途徑。學界及工業界都發現技術合作不是隨機呈現的,合作關系的分布受到了結構嵌入影響,也意識到特定技術網絡結構背后存在著相應動力機制[1-2]。如何根據外部復雜多變的技術網絡嵌入環境,選擇最有利的技術合作方式,是每個企業及研究機構面臨的挑戰和機遇。揭示國際技術合作網絡結構生成機制是技術創新內在機理理論基礎的深化,同時對國際技術合作發展具有實踐啟發。
從結構視角分析技術合作網絡的文獻非常豐富。值得注意的是,社會網絡和復雜網絡理論及工具的發展是技術合作網絡結構研究的助推器,從多視角、多層面揭示了網絡結構的關鍵特征及動態演化[3-4]。梳理文獻,這些研究雖然成果斐然,但是在揭示技術合作網絡背后生成機制方面存在嚴重不足。一是,大量研究停留在網絡結構統計特征層面,通過網絡節點及邊的統計指標來刻畫網絡拓撲,只是反映了網絡外在特征,卻難以揭示網絡結構背后的動力機制。二是,針對網絡生成機制的研究大多為理論仿真,理論演繹的研究邏輯缺乏實際證據支撐,研究結果的有效性受到制約。三是,建模方法上,基于傳統回歸模型的網絡建模以網絡邊的獨立性為前提,顯然簡單化的假設并不符合網絡事實。網絡邊的相關性是網絡結構形成的關鍵要素,因此非常有必要以網絡邊相關性為基礎,構建網絡因果模型,測度不同結構對技術合作網絡生成的貢獻程度。
指數隨機圖模型ERGM(Exponential Random Graph Models)是專門針對網絡邊的建模工具,能夠刻畫網絡生成的因果關系,是社會網絡分析的前沿成果。以Snijders、Robins、Goodreau、Wang為代表的學者推進下[5-7],模型方法趨于成熟,同時在多個領域日益廣泛地應用,例如社會網絡、組織網絡、知識網絡、貿易網絡等[8-10]。不過,目前還未發現將ERGM模型應用于技術合作網絡的有關文獻。
針對上述研究缺口,采用指數隨機圖模型,從網絡結構視角建模,并實證研究國際技術合作網絡的影響因素。具體地,以石墨烯領域美國USPTO數據庫專利為樣本,構建網絡模型,測度不同網絡結構的影響效應,以揭示國際技術合作網絡生成機理。
1 研究方法
1.1 研究框架
研究直接目標在于度量各種網絡結構對國際技術合作網絡生成過程的貢獻程度。研究思路的關鍵在于針對合作網絡構建因果模型,以揭示包括網絡結構在內的各種潛在影響因素。指數隨機圖模型在表征網絡結構效應方面具有分析優勢,能夠滿足研究需要。主要體現在以下方面:其一,模型具有天然適用性。技術合作相互聯結形成網絡,如果將二元合作關系視為網絡邊,則可以將技術合作的影響因素研究,轉化為技術合作網絡的建模問題。而ERGM模型正是針對網絡邊建模的有力工具,能夠揭示不同網絡因素在技術合作過程中的作用機理。其二,模型能夠刻畫網絡結構效應。傳統回歸模型雖然能夠揭示因果關系,但是卻難以刻畫網絡結構的影響性。原因在于網絡邊之間存在相關性,違反了傳統回歸模型要求的序列無關性假設,導致無法將網絡結構作為模型變量,而基于Markov網絡假設的ERGM模型能夠克服這種擬合困難,能夠有效刻畫網絡結構對網絡生成的影響程度。其三,模型能夠同時度量多種網絡影響因素。從網絡視角,將影響因素劃分為內生因素和外生因素。網絡結構反映了網絡系統的內生動力,是內生因素;而基于節點及邊的相關屬性是外生因素。因此,模型可以納入包括網絡結構在內的多種變量,能夠全面地揭示網絡生成過程。
按照ERGM模型理論,技術合作網絡的生成機制由2類因素構成:內生因素和外生因素,如圖1所示。社會網絡分析的重要理論基礎是認為網絡邊存在相互依賴[11],即某條邊是否發生是以網絡其他邊的配置情況為條件。這種網絡邊的自相關機制在網絡宏觀層面涌現為結構[12],因此通過呈現出的網絡結構特征可以分析并推斷潛在的網絡內生動力機制。這里將網絡內生機制歸納為3類:擴張性、閉合性和中介性。擴張性反映了不斷新建技術合作關系,擴大個體中心網絡規模的傾向,通常呈現星型結構;閉合性反映了技術合作關系的傳遞路徑傾向,兩創新主體間存在直接或間接聯結的網絡路徑,例如三角結構;中介性反映了承擔技術中介的功能傾向,技術創新主體與兩個非直接聯結主體建立聯結關系,如2-路徑結構。
除了內生性結構因素,ERGM理論還認為網絡生成過程還受到系統外部因素影響,包括節點屬性和邊屬性。這里將網絡外生機制歸納為:同配性和馬太效應。同配性機制指某種屬性接近的創新主體更容易建立技術合作關系[13]。技術創新理論認為組織、技術、制度等方面的接近性有利于雙方建立信任、提高知識交流效率、便于形成技術協同[14],因此同配性影響技術合作幾率。另外,馬太效應指技術創新能力越強,越傾向于建立技術合作關系。馬太效應機制可以從兩方面加以解釋:一是吸收能力理論認為主體在將外部知識內化并轉化為技術創新能力方法存在差異,吸收能力有利于提高技術合作績效[15],因此吸收能力越高,對外技術合作動力越強;二是按照技術競爭理論,技術創新能力強的主體在技術合作選擇博弈中具有優勢,更容易被其他主體選擇為合作對象[16]。
基于上述機制理論分析,可以選擇相應的因素變量,嘗試構建ERGM模型,研究大致流程如圖2所示。構建模型的重要挑戰在于模型的設定過程,合適的統計量能夠有效捕捉結構效應,并有助于提高模型擬合程度。雖然研究概念模型給出了理論啟發,但由于缺少應用于技術合作網絡的實證研究參照,需要理性設計與反復嘗試。模型構建的基本思路,如圖2所示。首先,從最簡單模型(只包含邊統計量的貝努利模型)開始,以技術合作網絡生成機制為指導,逐步加入有關統計量,直至確定模型;其次,對模型進行參數擬合,檢驗模型顯著性,分析整體擬合程度;最后,判斷模型擬合效果,如果達到預期目標,則給出分析結果,否則根據擬合效果,嘗試調整模型,重新設定模型,重復上述過程,直至滿足分析要求。
1.2 模型定義
ERGM模型是一套專門針對網絡關系的統計建模方法[5],屬于生成式模型,能夠對網絡結構的涌現給予解釋。模型中,將網絡聯結的概率作為因變量,而基于各種網絡結構的統計量作為自變量,其中這些網絡結構也被稱為構型(Configuration)。具體地,假定Y代表隨機網絡集合,y∈Y是隨機網絡的某個具體實現。進一步,將事實網絡y發生的概率建模為各種可能的內生因素(網絡構型)、外生因素(網絡節點及邊屬性)。網絡構型是ERGM模型重點關注的統計量,代表了各種不同的網絡結構,常見的如星型結構、三角結構、甚至更復雜結構。一般地,模型設定為指數函數形式,如公式(1)所示[6]:
其中變量Y和y的定義如前所述;X為協變量向量,代表網絡節點、邊的外生屬性;g(y,X)代表各種統計量組成的向量,包含構型變量及外生協變量;θ為待估計參數向量,取值反映了各個變量對網絡生成的影響程度;κ(θ,y)是模型的歸一化因子,該常數項能夠保證模型計算值符合概率的數學定義,即∑z∈Yexp{θTg(z,X)}=1。θ是后續實證分析關注的焦點,取值反映了統計量g(y)對網絡生成的邊際效應,通過θ的顯著性、方向、取值大小可以直接判斷相關影響因素的貢獻程度。
1.3 變量定義
由技術合作網絡生成機制出發,選擇有關統計量作為模型因素變量。下面,列出后續實證分析用到的統計量定義,如表1所示。
邊數Edges。定義為網絡邊的數量。該統計量基于網絡邊同質性假定,即所有的邊對網絡生成過程具有相同影響。其反映了網絡邊的基準效應,解釋能力相當于回歸模型的常數項。
度分布Degree(k)。定義為度中心性為k的個體中心網絡(Ego Network)數量,其中k為取值正整數的常數。該構型代表了星型結構,中心節點擁有k個鄰居,而其他節點將關系資源聚集于中心節點。個體中心網絡反映了技術創新主體向外擴張關系,形成冗余關系的合作傾向。
同配三角Triangle(δ)。定義為擁有相同屬性δ節點形成的閉合三角數量。該構型代表了同配屬性節點形成的三角結構;等價地,任意兩節點不但存在直接聯結,還有路徑長度為2的間接聯結。三角結構反映了技術創新主體間形成閉合路徑的傾向,冗余路徑的存在有利于提高主體間資源、知識的交流效率。
另外,還選取了3個表現為加權和形式的高階統計量,具體包括:幾何加權度分布項Gwdegree,能夠捕捉呈現星型結構的傾向性;幾何加權邊共享伙伴Gwesp,能夠捕捉邊形成閉合三角結構傾向性;幾何加權二元共享伙伴Gwdsp,能夠捕捉網絡形成2-路徑或者節點承擔中介功能傾向性[17]。模型加入高階統計量的原因在于:一是能夠有效降低簡單統計量導致的模型退化風險[18];二是具有等價的結構效應解釋能力[19],提高模型結果分析的可靠性。
除了上述內生構型變量之外,模型還加入了其他外生變量。選取兩個典型統計量,節點同配和節點屬性。
節點同配Nodematch(δ)。定義為兩端點擁有相同屬性δ的網絡邊數量。該統計量可以捕捉節點同質性對于網絡生成的影響效應。
節點屬性Nodecov(δ)。定義為對所有網絡邊的端點屬性δ取值的求和。該統計量可以捕捉節點屬性δ大小對網絡生成的影響效應。
2 實證分析
2.1 數據來源及處理
專利合作是一種重要的深度技術合作形式,合作雙方不但分享技術知識,更共同擁有專利的經濟收益壟斷權[20]。若干文獻已經證實通過專利可以有效地揭示技術合作特征及機制[21],因此本文選擇石墨烯領域合作專利,采用ERGM模型進行實證研究。
數據源為美國專利數據庫USPTO。以“Graphene”為檢索關鍵詞,查詢專利標題或摘要中包含檢索詞的記錄,得到涵蓋時間2005-2017年的初步記錄1 800條。其次,進行數據篩選和清洗,對機構名稱進行規范和統一,留下至少包含兩個專利權人的合作專利,最終得到數據集合183條。然后,抽取專利元數據,主要包括專利所有權人、國家、城市,以用于網絡構建及外生變量計算。
2.2 網絡構建及描述特征
以專利所有權人為節點,共同申請專利為邊,構建專利技術合作無向網絡。網絡包括節點144個,邊200條,如圖3所示。整體上看,聚類系數(0.109)和網絡密度(0.015)都偏低,說明處于技術成長期的石墨烯技術[22]仍存在較大的專利合作增長潛力。
圖3 石墨烯領域專利技術合作網絡
技術合作網絡微觀結構是關注的焦點。表2列出了實證網絡的典型拓撲結構特征分布,包括節點度分布、三角性及多邊形。由于網絡中沒有孤立節點,故度分布從1開始。可以看出隨度中心性增加,度分布急劇衰減,大部分組織只有1或2個合作者,最多達到7個。網絡邊形成的閉合結構中,三角結構7個,四邊形1個,沒有更多邊數構成的閉合結構。閉合結構的分布說明三角結構是集中呈現的閉合式合作模式。
2.3 模型結果
模型變量的最終確定需要考慮兩方面:一是能夠檢驗不同結構的影響效應,揭示技術合作網絡生成機制;二是利于模型擬合,避免模型退化問題。因此,模型不但選擇了不同構型的簡單統計量、外生協變量,還加入了高階統計量。采用R軟件中的STATNET程序進行模型擬合,方法為MCMC MLE,經過反復嘗試和修正模型,得到最終擬合結果,如表3所示。
擴張性機制可以通過高階構型Gwdegree和簡單構型Degree(k)加以刻畫。Gwdegree的系數顯著為負,說明整體上網絡并不傾向于生成星型結構。由于統計量Gwdegree是由多項度分布的幾何加權和,無法反映不同度分布的結構效應,因此選擇了數量排前3的簡單構型。變量Degree(2)的系數顯著為正,意味著度中心性為2的個體中心網絡每增加1個,則網絡邊聯結的概率約增加到68(=e4.222)倍。變量Degree(3)的系數顯著為負,同理意味著度中心性為3的個體中心網絡每減少1個,則網絡邊聯結的概率約增加到3.5(=e1.262)倍。變量Degree(4)系數并不顯著。另外經過驗證發現再加入更高度中心性的構型都不再顯著。總之,整體上看,石墨烯領域技術合作不傾向于形成資源集中的星型結構,但局部層面具有非常強的傾向建立度中心性為2的個體中心合作網絡。
閉合性機制通過2個變量Gwesp和Triangle(Country)加以刻畫。幾何加權邊共享伙伴Gwesp的系數顯著為正,說明技術合作網絡傾向于涌現三角閉合結構。為了深入理解閉合模式的生成機制,模型還加入了同時考慮外生屬性的三角構型。國家同配三角Triangle(Country)的系數顯著為負,說明不同國家機構形成三角合作結構的概率是相同國家的10(=e2.351)倍,反映了跨國技術合作更易于嵌入三角結構。
中介性機制通過變量Gwdsp加以刻畫。幾何加權二元共享伙伴Gwdsp的系數顯著為負,說明技術合作網絡并不傾向于形成開放三角結構。這種負效應可能原因在于:依賴于第三方組織的資源及知識獲取方式并不可靠,間接傳遞的知識存在被扭曲的可能,不利于提供知識交流效率。
同配性機制通過變量Nodematch(δ)加以刻畫。Nodematch(City)和Nodematch(Country)的系數都顯著為正,意味著相同城市、相同國家機構建立技術合作關系的概率分別是不同城市、不同國家的4(=e1.392)倍、27(=e3.303)倍。結果反映了在地理層面(國家和城市),存在強烈的同配傾向。
馬太效應可以通過Nodecov(Patents)加以刻畫。變量Nodecov(Patents)系數顯著為負,意味著歷史累積申請專利數每減少1件,則對外建立技術合作的概率增加到13(=e2.567)倍。結果說明并不存在技術合作的馬太效應,而是技術創新實力低的組織具有更強烈的對外技術合作傾向。導致馬太效應機制失效的原因可能與石墨烯所處的技術生命周期有關,在發展初期,技術成熟度低,還沒有形成明顯的技術壟斷或分化局面,因此出現大量分散的技術后來者技術合作機會。
2.4 擬合優度分析
為了判斷模型對事實網絡的還原能力,需要進行擬合優度分析。將事實網絡與由擬合模型得出的模擬網絡進行比較,如果統計指標指標分布接近,則說明模型擬合優度高,否則說明擬合優度低。選擇4個典型的統計量作為比較指標,包括最短測地距離GD(i)、度中心性Degree(i)、邊共享伙伴EP(i)、二元共享伙伴DP(i)。模型擬合優度分析,如圖4所示,其中黑實線代表事實網絡的統計特征,箱型圖代表由擬合模型模擬得到的采樣網絡特征。可以看出,擬合模型高估了測地線距離特征(左上角子圖),而在其他3個指標方面則與較好地還原了事實網絡特征。整體上,通過4個指標比較分析,說明模型擬合優度滿意,具有復原事實網絡統計特征的能力,能夠捕捉技術合作網絡生成關鍵機制。
3 結論與啟示
技術合作具有不同的結構嵌入傾向。以石墨烯領域合作專利為數據,采用ERGM模型,定量化測度不同結構的技術合作影響效應,以揭示技術合作產生機制。實證得到基本結論:①技術合作傾向于嵌入閉合三角結構,而非星型結構、2-路徑,說明閉合性是技術合作網絡形成的內生機制。②外生性因素方面,技術合作表現出地理同配傾向,而非馬太效應。由上述實證結果,可以得到以下啟示。
1)合作網絡結構是技術關系社會化特征的體現。研究說明技術合作不是孤立存在,合作關系間交互性反映了技術合作的社會化特征,這種內生性機制被多數研究忽視。結構特征是技術合作網絡自組織的結果,特定的合作自相關性分布將導致不同的結構嵌入傾向,進一步這種關系嵌入影響著技術合作成功與否。實證網絡表現出對閉合三角結構的偏好,而對星型、2-路徑的抑制效應,充分說明了技術合作社區化傾向,相對扁平化結構形態更利于形成平等、互利、共贏的技術合作。
2)技術合作是內生、外生因素交織的結果。從網絡視角,將技術合作影響因素劃分為內生和外生兩方面,更有利于揭示技術合作背后生成機理全貌。雖然本文重點考察了內生性結構效應,但仍充分說明技術合作影響因素的多元復雜性。例如,實證揭示三角結構的國家異配性,說明跨國的技術聯盟傾向性,充分反映了外生地理因素與內生三角結構效應的共同影響。另外,研究也充分驗證了ERGM對技術合作網絡的建模能力,能夠同時將內、外生多種因素納入同一分析框架,是全面揭示技術合作多元復雜機制的有力分析工具。
本文的貢獻在于:不同于以往研究只是停留在技術合作網絡結構特征的簡單描述與統計,而是采用ERGM模型,定量測度了不同結構對技術合作網絡生成機制的貢獻程度。研究方法由一般統計擴展到因果模型,研究焦點由結構發現深入到生成機制,研究結果有助于技術創新合作理論的深入和研究方法的創新。研究難以避免的不足之處是樣本局限性,石墨烯是典型新興技術,未來研究有必要選取技術成熟度高的領域加以分析,以檢驗結論普適性和模型有效性。
參考文獻
[1]丁瑩瑩,宣琳琳.我國海洋能產業產學研合作創新網絡的實證研究——基于網絡結構的視角[J].工業技術經濟,2015,(5):29-40.
[2]呂鵬輝,劉盛博.學科知識網絡實證研究(Ⅳ)合作網絡的結構與特征分析[J].情報學報,2014,(4):367-374.
[3]袁劍鋒,許治,翟鋮.中國產學研合作網絡權重結構特征及演化研究[J].科學學與科學技術管理,2017,38(2):115-126.
[4]顏端武,劉秋艷,陳坤.基于專利計量的電動汽車領域技術創新網絡演化研究[J].現代情報,2016,36(7):144-150.
[5]Robins G,Pattison P,Kalish Y,Lusher D.An Introduction to Exponential Random Graph(P*)Models for Social Networks[J].Social Networks,2007,29(2):173-191.
[6]Goodreau S M.Advances in Exponential Random Graph(P*)Models Applied to a Large Social Network[J].Social Networks,2007,29(2):231-248.
[7]Snijders T A B,Pattison P E,Robins G L,Handcock M S.New Specifications for Exponential Random Graph Models[J].Sociological Methodology,2006,36(1):99-153.
[8]Cimenler O,Reeves K A,Skvoretz J.An Evaluation of Collaborative Research in a College of Engineering[J].Journal of Informetrics,2015,9(3):577-590.
[9]陳華珊.虛擬社區是否增進社區在線參與?一個基于日常觀測數據的社會網絡分析案例[J].社會,2015,35(5):101-121.
[10]時少華,孫業紅.遺產地旅游發展利益網絡治理研究——基于指數隨機圖模型、以農業文化遺產地云南哈尼梯田為例[J].經濟管理,2017,(2):147-162.
[11]Robins G,Snijders T,Wang P,Handcock M,Pattison P.Recent Developments in Exponential Random Graph(*)Models for Social Networks[J].Social Networks,2007,29(2):192-215.
[12]劉雨農,劉敏榕.社會化問答平臺的社區網絡形態與意見領袖特征——以知乎網為例[J].情報資料工作,2017,(2):106-112.
[13]段慶鋒,潘小換.文獻相似性對科學引用偏好的影響實證研究[J].圖書情報工作,2018,62(4):97-106.
[14]曹興,宋長江.認知鄰近性、地理鄰近性對雙元創新影響的實證研究[J].中國軟科學,2017,(4):120-131.
[15]范群林.外部知識、吸收能力與創新績效——基于文化科技融合的視角[J].現代情報,2016,36(2):12-19.
[16]Peng T Q.Assortative Mixing,Preferential Attachment,and Triadic Closure:A Longitudinal Study of Tie-Generative Mechanisms in Journal Citation Networks[J].Journal of Informetrics,2015,9(2):250-262.
[17]Morris M,Handcock M S,Hunter D R.Specification of Exponential-Family Random Graph Models:Terms and Computational Aspects[J].Journal of Statistical Software,2008,24(4):1548.
[18]Brughmans T,Keay S,Earl G.Introducing Exponential Random Graph Models for Visibility Networks[J].Journal of Archaeological Science,2014,49(1):442-454.
[19]Morris M,Handcock M S,Hunter D R.Specification of Exponential-Family Random Graph Models:Terms and Computational Aspects[J].Journal of Statistical Software,2008,24(4):1-24.
[20]周磊,張玉峰,吳金紅.專利視角下企業合作競爭中三種接近性的作用[J].情報學報,2013,32(7):676-685.
[21]馬艷艷,劉鳳朝,孫玉濤.中國大學-企業專利申請合作網絡研究[J].科學學研究,2011,29(3):390-395.
[22]樂思詩.基于專利分析的全球石墨烯技術發展現狀及趨勢研究[J].世界有色金屬,2017,(9):94-95.
(責任編輯:孫國雷)