999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于指數隨機圖模型的技術機會識別

2023-12-26 02:18:10羅泰曄
情報學報 2023年11期
關鍵詞:模型

羅泰曄

(仲愷農業工程學院管理學院,廣州 510225)

0 引言

技術機會識別,是指發現特定技術領域內具有潛在價值的技術開發和應用機會的過程。當前,技術的快速迭代和新興技術的不斷涌現,給研發組織帶來了機遇,也帶來了挑戰。如何有效識別技術機會,是研發組織在制定研發計劃時需要面對的重要問題,是研發組織保持競爭優勢的重要前提,也是研發組織實施“生產一代、研發一代、儲備一代、構思一代”的創新戰略過程中需要思考的關鍵問題。專利是創新成果的重要形式,也是識別技術機會的常用素材。本文提出一種基于指數隨機圖模型和專利知識網絡的技術機會識別新方法。

1 理論基礎與文獻綜述

1.1 指數隨機圖模型

指數隨機圖模型(exponential random graph models,ERGM)是近年來興起的分析社會網絡的有力工具。它能夠整合內生的網絡結構和網絡節點的屬性用于分析網絡的形成機理[1]。指數隨機圖模型的一般形式為

其中,k是常數,用于保證網絡結構y的概率在0 到1 之間;θA是對應統計量ZA(y)的系數。指數隨機圖模型提供了一種預測網絡中兩個節點間連邊概率的思路。其基本思想是通過比較兩個節點連邊前后相關統計量的變化情況來計算這兩個節點間連邊的可能性[2]。兩個節點之間連邊概率的具體的計算公式為

其中,ΔZA(y)表示網絡節點i與j之間連邊前后相關統計量的變化量。

目前,指數隨機圖模型被廣泛應用于多種網絡(如協同創新網絡[3]、產業組織網絡[4]、學術合作網絡[5]、政策網絡[6])的形成、專利引用關系的形成機制[7]、專利技術的擴散機制[8]等方面的研究。

1.2 基于專利知識網絡的技術機會識別

現有的技術機會識別方法主要劃分為定性方法和定量方法兩類。定性方法以德爾菲法和情景分析法為代表。定性分析方法主要依靠專家的意見,存在程序復雜、耗時長、專家意見的差異性不易處理等問題[9],因此,現有研究主要通過定量的方法來發現技術機會。定量方法包括專利計量、文獻計量、知識圖譜、技術路線圖等。其中,專利計量是常用的技術機會識別方法。專利的本質在于包含在其中的知識[10]。根據知識組合理論,創新是研發或實驗過程中對現有知識元素或新知識元素進行組合的過程[11-12]。特定領域的知識元素由組合關系形成知識網絡,知識網絡反映了知識元素在主題內容上的現有或潛在聯系[13],由此成為識別技術機會的工具。

有些研究基于特定領域的專利數據構建知識網絡,并探索了識別技術機會的方法。例如,馮立杰等[14]通過構建知識網絡研判技術關鍵詞及創新維度的重要度,在此基礎上,結合多維技術創新地圖識別了鈦白廢酸制備硫酸鋇工藝領域的技術機會;Han 等[15]采用關聯規則挖掘專利中知識元素間的組合關系,發現了信息通信領域與其他技術領域的技術融合機會;張振剛等[9]基于知識網絡,使用信息熵、組合力等指標探索了納米能源領域的技術機會,發現了領域內3 個重要的研發方向;Kim 等[16]基于專利知識網絡分析區塊鏈技術的發展軌跡,將區塊鏈技術劃分為相互聯系的5 個子領域,并根據主路徑的知識流識別了每個子領域的發展方向和技術機會。

1.3 研究評述

目前,基于專利知識網絡識別技術機會的研究常常停留在知識元素的組合關系(共現關系)層面,對于知識元素的屬性特征缺乏深入挖掘。知識元素基于組合關系嵌入知識網絡。網絡嵌入性賦予了知識元素多種屬性特征,除了現有研究常用的組合廣度外,還存在組合強度、組合距離等特征。除了知識元素節點自身的屬性外,有些網絡結構可能對知識元素間組合關系的形成產生影響。例如,具有相同鄰接節點的兩個知識元素之間發生組合的可能性更大。這些因素如何綜合影響知識元素間的組合,目前鮮有研究。基于此,本文采用指數隨機圖模型對知識元素間組合關系的形成機理進行系統分析,并提出一種識別特定領域潛在技術機會的新方法。

2 研究設計

2.1 基于知識網絡的指數隨機圖模型設計

指數隨機圖模型能夠綜合分析網絡節點的屬性、內生網絡結構以及節點屬性的交互關系對網絡中連邊的影響。本文基于專利知識網絡,從這3 個方面設計具體變量。

2.1.1 網絡節點屬性變量

在網絡節點的屬性方面,網絡節點(知識元素)在知識網絡中的位置和組合關系能夠反映知識元素的不同特性。Wang 等[13]提出了組合潛力(combinatorial potential)的概念,用于反映一個知識元素與其他知識元素發生組合的可能性。一個知識元素的組合潛力由其在知識網絡中的程度中心度(degree centrality)來衡量。一個知識元素的程度中心度高,表明其與較多的知識元素發生過組合。這意味著該知識元素具有較高的知識相關性和融合性,在未來具備較多的組合可能性。組合潛力從廣度的視角反映了知識元素的組合屬性,本文將知識元素的該屬性稱為組合廣度,并將其納入模型。

組合廣度在相關研究中被多次使用[17-19],但其也存在一定的局限性。一方面,一個知識元素的組合廣度只反映了與之組合的知識元素的數量,并未涉及該知識元素與其他知識元素組合的頻率。不同的組合頻率能夠體現知識元素在知識主題上的內在聯系[20]。另一方面,組合廣度僅反映了知識元素間的直接組合,而無法反映未直接相連的知識元素間可能存在的知識相關性。基于此,本文提出兩個新的屬性(組合強度和組合距離)用于增強對知識元素組合特征的刻畫。

組合強度由知識元素間進行組合的頻率來反映。在一定時間內,不同知識元素間發生組合的頻率有所不同,這反映了知識元素間不同的“親近性”。兩個知識元素間的高組合頻率不僅可以反映該領域的某些技術模式,而且可以反映領域內的研發趨勢[10]。該特征有助于研發人員利用這些知識元素探索更多的組合可能性。

組合距離是指知識網絡中知識元素間的最短距離。若兩個知識元素間的組合距離過長,則表明這兩個知識元素在知識主題上聯系并不緊密,二者間進行組合的可能性較小。相反地,若兩個知識元素間的組合距離較短,如兩個知識元素有相同的鄰接節點,則意味著二者間存在較大的組合機會[19]。

綜上,本文用組合廣度、組合強度和組合距離來反映知識元素在知識網絡中的屬性特征。這3 個屬性結合起來能夠比較全面地反映知識元素因嵌入知識網絡而存在的組合機會。

2.1.2 內生網絡結構變量

內生網絡結構是指網絡中的一些節點組成有意義的結構,這些結構能夠反映節點間的特定關系。對于知識網絡這種具體類型的網絡而言,除了兩個知識元素之間的直接組合關系外,還可能存在3 個或3 個以上的知識元素構成的閉環結構。這種閉環結構體現了知識元素間的傳遞性關系,即如果知識元素A 和知識元素B 均曾經與知識元素C 進行過組合,那么知識元素A 和知識元素B 之間也可能由于知識主題上的相關性而發生組合,由此形成三角閉環結構。在指數隨機圖模型中,幾何加權邊共享伙伴結構用于檢驗網絡中的節點間是否存在顯著的傳遞性效應。本文將這種網絡結構納入模型進行分析。表1 中列出了這種典型網絡結構統計量的示意圖。

表1 ERGM網絡結構示例

2.1.3 網絡節點屬性交互效應變量

網絡節點的屬性反映的是網絡成員的個體特征,而節點屬性的交互效應關注兩個節點的互動特征。在指數隨機圖模型中,最常見的交互效應就是兩個網絡節點的同配性(homophily)問題,即兩個具有相同屬性的網絡節點間是否存在建立連接的趨勢[21]。本文分析的對象是知識網絡中的知識元素,參考已有文獻的常見做法[19,22-23],本文采用國際專利分類號(international patent classification,IPC)來表示專利所含有的知識元素。專利的國際分類號采用等級形式,分為部—大類—小類—大組—小組5個等級。現有研究常用IPC 的前四位,即小類級代表知識元素。但小類級的代碼包含的技術范圍過于寬泛,不能準確描述專利所具有的知識,而IPC到大組級就能較好地反映專利所代表的知識主題[24],故本文采用大組級的IPC 表示知識元素。根據國際專利的分類體系,IPC 總共被劃分為8 個部。IPC 代碼的首位字母反映了知識元素的部類歸屬。本文據此將知識元素劃分到8 個類中,用于檢驗知識元素在組合時是否存在顯著的同配性效應。

2.1.4 指數隨機圖模型構建

基于上文論述,本文構建指數隨機圖模型,該模型是結合了網絡節點屬性變量、內生網絡結構和網絡節點同配性的綜合模型,并基于此模型來識別特定領域的技術機會,即

其 中,nodecov("breadth")、nodecov("intensity") 和nodecov("distance")分別表示網絡節點(知識元素)的組合廣度、組合強度和組合距離對組合關系形成的影響;內生網絡結構gwesp 用于檢驗網絡中是否存在顯著的傳遞性效應;nodematch("class")用于檢驗同配性效應,即同類的知識元素是否具有顯著的組合趨勢;θ1~θ5表示統計量的參數估計。

2.2 技術機會識別方法

本文根據公式(3)所構建的指數隨機圖模型進行相關變量的計算和參數估計,具體采用如圖1 所示的技術路線來識別特定領域的技術機會。

圖1 技術路線

Step1.根據知識元素在專利中的組合關系構建知識網絡。

Step2.基于知識網絡計算網絡中所有知識元素的組合廣度、組合強度和組合距離等屬性特征。其中,知識元素的組合廣度用其在知識網絡中的程度中心度來測量。知識元素的組合強度和組合距離的計算公式分別為

其中,intensity 表示焦點知識元素的組合強度;n表示焦點知識元素的鄰接節點數;Cfi表示焦點知識元素與第i個相連的知識元素的組合頻率。

其中,distancei表示網絡中第i個知識元素的組合距離;N表示知識網絡中的節點總數;dij表示知識元素i與知識元素j在知識網絡中的最短距離。

Step3.對構建的指數隨機圖模型進行參數估計。模型的參數估計采用馬爾科夫鏈蒙特卡羅估計法(Markov chain Monte Carlo,MCMC)。

Step4.基于組合廣度、組合強度和組合距離對知識元素進行聚類,從而識別出領域內的趨勢性知識元素。趨勢性知識元素是指知識網絡中具有較高組合潛力和組合機會的節點,能夠在一定程度上反映領域內的研發趨勢。

Step5.按照公式(2)的計算思路,基于Step3 估計的模型參數來計算趨勢性知識元素與知識網絡中未相連的節點間的連邊概率,進而發現具有較高連邊概率的知識元素對,即新的技術機會。

3 實例分析

3.1 數據收集

本文以我國物聯網領域的發明專利為例,按照設計的技術路線來發掘領域內的技術機會。黨的二十大報告中提出了建設制造強國、質量強國、網絡強國、航天強國、交通強國和數字中國的目標,物聯網技術在相關領域中均具有重要的支撐作用。因此,識別物聯網領域的技術機會具有重要的理論和實踐意義。本文從國家知識產權局中國專利信息中心數據庫檢索2016—2021 年我國物聯網領域的發明專利數據,經整理,共獲得38813 條記錄。

為檢驗本文方法的有效性,將所收集到的數據劃分為2016—2018 年和2019—2021 年兩個時段。知識網絡的構建、指數隨機圖模型的參數估計、技術機會識別均基于2016—2018 年的數據,2019—2021 年的數據用于驗證所預測的技術機會的準確性。

3.2 數據分析

3.2.1 知識網絡構建

如上文所述,本文使用大組級的IPC 號代表知識元素,并基于知識元素在2016—2018 年的發明專利中的組合情況來建立知識網絡。對2016—2018 年的發明專利中的知識元素進行統計分析并建網,去除個別孤立節點(對),得到如圖2 所示的1337 個知識元素構成的知識網絡。

圖2 物聯網領域知識網絡

3.2.2 指數隨機圖模型參數估計

在進行參數估計前,先基于圖2 所示的知識網絡對每個知識元素的組合廣度、組合強度和組合距離進行計算,并確定知識元素所屬的類別。在此基礎上,本文使用R 語言中的ERGM 程序包,采用馬爾科夫鏈蒙特卡羅估計法(MCMC)對指數隨機圖模型進行參數估計,結果如表2 所示。表2 中列出了3 個模型,其中,模型1 只檢驗了屬性效應,模型2 在模型1 的基礎上增加了結構效應,模型3 是結合了屬性效應、網絡結構效應和同配性效應的綜合模型,即公式(3)所示模型。AIC(Akaike information criterion)和BIC(Bayesian information criterion)兩個指標用于檢驗模型的擬合情況,兩個指標的值越小,說明模型的擬合情況越好。從表2 可以看出,模型3 的AIC 和BIC 的值最小,說明模型3的擬合效果最好。

從模型3 可以看出,知識元素的組合廣度(β=0.0024,p<0.001)和組合深度(β=0.1294,p<0.001)對其組合關系的形成均為顯著正向影響。組合距離的系數為負且顯著(β=-1.4700,p<0.001),表明知識元素的組合距離對其組合關系的形成存在負向影響。網絡結構統計量gwesp 的系數為正且顯著(β=2.5997,p<0.001),表明知識網絡中存在顯著的傳遞性效應,即存在相同鄰接節點的知識元素間有建立連接的趨勢。此外,nodematch.class 的系數為正且顯著(β=1.6290,p<0.001),表明知識元素間存在顯著的同配性效應,即屬于同一部類的知識元素間有形成組合的趨勢。鑒于模型3 的良好擬合效果和顯著效應,本文后續的知識元素間的連邊概率計算均采用模型3 中的參數。

3.2.3 技術機會識別

本文基于知識組合理論,使用組合廣度、組合強度和組合距離3 個指標刻畫知識元素因嵌入知識網絡而具備的網絡結構特征,這3 個指標能夠較為全面地反映知識元素的組合屬性。具體而言,知識元素的組合廣度高,意味著較大的組合潛力;組合距離小,意味著較多的組合機會;組合強度高,則可以體現領域內的技術熱點和技術發展方向。因此,本文將具備這3 個特征的知識元素稱為趨勢性知識元素。趨勢性知識元素的組合機會代表了領域內重要的研發方向。

本節使用K均值聚類法識別出領域內的趨勢性知識元素,進而對其技術機會進行分析。K均值聚類法處理在大樣本數據聚類方面具有可伸縮性和較高的效率。在聚類之前,使用輪廓系數來確定合適的聚類數[25]。由于聚類指標數量為3 個,分別計算聚類數為2~8 的輪廓系數,結果發現,當聚類數為4 時,輪廓系數最大,故本文將1337 個知識元素聚為4 類。圖3 對聚類結果進行了可視化展示。

圖3 物聯網領域知識元素聚類

表3 展示了各個聚類的相關指標。從表3 可以看出,聚類4 中的知識元素組合廣度和組合強度的值均最大,組合距離的值最小,表明聚類4 中的知識元素具有良好的組合潛力和組合機會。故本文把聚類4 中的9 個知識元素視為物聯網領域內的趨勢性知識元素,即這9 個知識元素反映了領域內技術研發的熱點和趨勢。

表3 聚類指標

基于指數隨機圖模型的參數估計,按照公式(2)對趨勢性知識元素與知識網絡中未直接相連的知識元素的組合概率進行計算,可獲得組合概率高的知識元素組合,即潛在的技術機會。表4 列出了9 個趨勢性知識元素的名稱以及與之發生組合的概率最高的10 個知識元素。

表4 趨勢性知識元素技術機會

3.2.4 技術機會識別結果驗證

為檢驗上述9 個趨勢性知識元素的有效性,基于2019—2021 年的專利數據構建知識網絡,并計算網絡中所有知識元素的組合屬性特征。表5 中列出了9 個趨勢性知識元素的組合廣度、組合強度和組合距離的值,以及知識網絡中所有知識元素3 個指標的最大值、最小值和平均值。從表5 可以看出,9 個趨勢性知識元素具有遠大于平均值的組合廣度和組合強度以及小于平均值的組合距離。這表明在2019—2021 年這個觀測期中,9 個趨勢性知識元素仍然在知識網絡中處于中心位置,仍然是熱點知識元素,能夠反映領域中的熱點研發方向,它們與其他知識元素的組合能夠代表領域內的重要技術機會。

表5 2019—2021年趨勢性元素組合特征

進一步地,統計9 個趨勢性知識元素與表4 中列出的知識元素在2019—2021 年發生組合的實際情況,結果如表6 所示。從表6 可以看出,各趨勢性知識元素技術機會預測的準確率在60%~90%,平均預測準確率為74.4%。因此,本文方法能夠以較高的準確率來識別趨勢性知識元素的技術機會。

表6 趨勢性知識元素技術機會驗證

從趨勢性知識元素的知識內涵來看,這9 個知識元素主要涉及無線通信網絡的系統或設施(H04W4、H04L29、H04L12、G08C17、H04N7)、測量或測試組件(G01D21)、特定領域的數據處理或程序控制系統(G06Q10、G06Q50、G05B19)等領域,這些領域是觀測期內物聯網領域的研發熱點。從與之組合的知識元素來看,相關知識元素屬于多個類別,這意味著物聯網領域的熱點研發在多個方向存在技術機會。因此,本文方法能夠為特定領域內研發方向的確定提供指引。

3.3 穩健性檢驗

為進一步檢驗本文方法識別特定領域內技術機會的有效性,基于工業機器人領域2016—2021 年的發明專利數據進行穩健性檢驗。根據國家統計局2021 年5 月發布的《數字經濟及其核心產業統計分類2021》,工業機器人制造屬于數字產品制造業的范疇,是智能制造的關鍵設備。在建設制造強國和數字中國的背景下,識別工業機器人領域的技術機會具有重要的理論和實踐意義。按照本文提出的技術路線識別出工業機器人領域的4 個趨勢性元素,即B25J15、B25J9、B25J11 和B25J19,聚類情況如圖4 所示。

圖4 工業機器人領域知識元素聚類

對上述4 個趨勢性知識元素的組合機會進行計算和驗證,結果如表7 所示。從表7 可以看出,本文方法在工業機器人領域也具有適用性,這4 個趨勢性知識元素技術機會預測的準確率在60%~90%,技術機會預測的平均準確率為75%。因此,可以認為本文方法具有穩健性。

表7 穩健性檢驗結果

4 討論與結論

本文基于知識組合理論,將指數隨機圖模型運用于知識網絡的分析,提出了一種識別特定領域技術機會的新方法,并以物聯網和工業機器人領域2016—2021 年的發明專利數據為例進行實證分析,驗證了該方法的有效性。

本文具有一定的理論和實踐意義。第一,本文使用指數隨機圖模型分析了知識網絡的形成機理,發現網絡中知識元素間組合關系的形成是內生網絡結構和知識元素的自身屬性共同影響的結果。現有關于知識網絡的研究主要聚焦于知識網絡的應用,鮮有研究對知識網絡形成機理進行分析。因此,本文的研究結果是對知識網絡理論的重要補充。第二,本文提出了組合強度、組合距離等反映知識網絡中知識元素特征的變量,并發現這兩個變量對知識元素間組合關系的形成具有顯著影響。鑒于已有的相關文獻主要關注知識網絡中的直接連邊,鮮有研究對邊權重和間接連邊進行分析和應用,本文的變量設計能夠為知識網絡的相關研究提供新的視角。第三,本文提出了一種基于專利數據的技術機會識別方法,豐富了利用專利數據開展技術預測的方法庫。現有的基于專利地圖、知識圖譜等工具的技術機會識別方法通常需要在定量分析的基礎上借助領域專家的知識或經驗來最終確定技術空缺的內容或技術的發展趨勢,所得出的結果難免存在一定的主觀性。本文方法基于知識網絡中知識元素間的客觀聯系,能夠客觀反映特定領域的研發趨勢及相關技術機會。

本文尚存在一定局限性。在方法方面,本文提出的識別趨勢性知識元素及其技術機會的方法建立在對大量專利數據分析的基礎之上,充足的專利數據量能夠較好地反映領域內知識元素間的組合情況。若專利數據量過少,則可能影響該方法的有效性。在實證方面,本文以物聯網和工業機器人領域的數據為例進行分析。不同的技術領域存在不同的知識特性,領域內知識元素的組合方式也不盡相同。未來可以基于本文提出的思路開展多個技術領域的比較研究,以檢驗該方法在其他領域的適用性。

猜你喜歡
模型
一半模型
一種去中心化的域名服務本地化模型
適用于BDS-3 PPP的隨機模型
提煉模型 突破難點
函數模型及應用
p150Glued在帕金森病模型中的表達及分布
函數模型及應用
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
3D打印中的模型分割與打包
主站蜘蛛池模板: av在线5g无码天天| 波多野结衣一区二区三区四区视频| 中文字幕人妻av一区二区| 青草国产在线视频| 黄色网址免费在线| 中文字幕自拍偷拍| 日本福利视频网站| 国产亚洲欧美日韩在线一区二区三区| 成年看免费观看视频拍拍| 91精品国产自产在线观看| 91精品啪在线观看国产| 免费看美女自慰的网站| 东京热av无码电影一区二区| 欧美日本视频在线观看| 日本91视频| 日韩小视频在线观看| 色噜噜在线观看| 国产一区二区三区视频| 日韩欧美国产三级| 色妺妺在线视频喷水| 国产欧美视频一区二区三区| 国产区在线看| 国产综合无码一区二区色蜜蜜| 为你提供最新久久精品久久综合| 国产精品成人不卡在线观看| h视频在线观看网站| 伊人久久精品无码麻豆精品| 三级毛片在线播放| 99久久国产精品无码| 伊人五月丁香综合AⅤ| 国产精品欧美激情| 日本色综合网| 欧美日韩中文字幕在线| 日本精品影院| 亚洲h视频在线| 在线无码九区| 在线国产欧美| 国产三级国产精品国产普男人| 国产无码高清视频不卡| 久久综合亚洲色一区二区三区| 国产呦视频免费视频在线观看| 青青草原国产| 2021国产精品自拍| 亚洲色图欧美在线| 五月婷婷丁香色| 99成人在线观看| 精品伊人久久大香线蕉网站| 99久久无色码中文字幕| 国产无码精品在线播放| 亚洲激情99| 亚洲精品高清视频| 国产福利微拍精品一区二区| 人妻一区二区三区无码精品一区| 久久人搡人人玩人妻精品一| 久久性视频| 成人av手机在线观看| 国产成人无码综合亚洲日韩不卡| 欧美日韩va| 91久久国产成人免费观看| 青青草久久伊人| 免费又爽又刺激高潮网址| 欧美色综合网站| 午夜影院a级片| 色网在线视频| 超薄丝袜足j国产在线视频| 丁香婷婷在线视频| 国产一级二级在线观看| 国产一在线观看| 热九九精品| 欧美第二区| 在线免费a视频| 国产精品永久免费嫩草研究院 | 亚洲伦理一区二区| 久久精品中文字幕少妇| 狠狠综合久久| 国产91无码福利在线| 香蕉在线视频网站| 国产亚洲欧美在线视频| 拍国产真实乱人偷精品| 亚洲中文字幕国产av| 国产亚洲欧美日本一二三本道| 久久中文字幕av不卡一区二区|