何建佳 廖耀文 周洋



摘 要:產業互聯網絡是一種為“智造”賦能的異質跨界合作網絡,會促進創新要素在節點間流通,而節點創新要素又會影響合作鏈路預測結果。針對這一問題,提出一種基于節點創新要素的鏈路預測方法。首先闡述產業互聯網絡的概念和特性,分析網絡中創新要素的流通方式;然后分別從兩個維度測算網絡節點的創新要素量;最后綜合利用節點局部信息和節點創新要素信息計算節點相似性。在四個產業互聯網絡數據集的實驗結果表明,所提方法與其他方法相比具有更好的預測性能。
關鍵詞:產業互聯網絡; 節點創新要素; 鏈路預測
中圖分類號:TP399 文獻標志碼:A 文章編號:1001-3695(2023)10-022-3028-04
doi:10.19734/j.issn.1001-3695.2023.03.0062
Link prediction method based on nodal innovation elements of industrial interconnection network
He Jianjia, Liao Yaowen, Zhou Yang
(Business School, University of Shanghai for Science & Technology, Shanghai 200093, China)
Abstract:Industrial interconnection network is heterogeneous cross-border cooperation network that empower “intelligent manufacturing” and facilitate the flow of innovation elements between nodes, which in turn influence the predicted outcomes of the cooperation links. This paper proposed a link prediction method based on node innovation elements to address this issue. Firstly, it elaborated the concept and characteristics of industrial interconnection networks, and analyzed the circulation me-thods of innovative elements in the network. Secondly, it calculated the innovation factor quantity of network nodes from two dimensions separately. Finally, it comprehensively utilized the local information of nodes and the innovative element information of nodes to calculate the similarity between nodes. The experimental results on four industrial interconnection network datasets show that the proposed method has better predictive performance compared to other methods.
Key words:industrial interconnection network(IIN); node innovation elements; link prediction
0 引言
產業互聯網絡(IIN)是異質產業組織用來交換知識和技術等資源,以實現賦能智能制造及創新成果轉換的新型跨界合作網絡。IIN是傳統供應鏈在新一輪產業變革中所演化出來的產物,它能夠容納多類型、多層級異質合作主體,具有模糊組織邊界、促進主體跨界互聯及提升聯合創新效率等功能[1],資源要素在網絡中表現出流動性。隨著產業變革的深入開展,IICN的發展也頗為迅速,在網絡規模變大的同時,其網絡結構也日益復雜,逐漸成為學術界和產業界所關注的重點研究領域,主要涉及產業融合[2]、供應鏈網絡演化[3]、供應鏈協同[4]和網絡韌性[5]等內容。
現實社會中很多事物都可以抽象成復雜網絡,例如社交網絡、交通網絡和產業互聯網絡等,利用網絡節點代表社會實體,網絡連邊代表實體間的關系。借助復雜網絡理論知識有助于研究社會網絡結構和演變規律,而鏈路預測作為一種重要的復雜網絡分析工具,能幫助人們從已知的網絡信息中尋找潛在的關系,極大提升了關系預測研究的效率。目前學界已經探索出較多的鏈路預測方法,主要包括:基于相似性方法、似然估計方法和概率模型[6]。其中,基于相似性的方法因其良好的性能而被廣為采納,該方法同時包含了節點相似性和網絡結構相似性,本文主要關注節點相似性方法,關于該方法的研究已有很多,文獻[7]提出了基于監督的相似性方法,從網絡中提取節點特征并表示為向量。文獻[8]提出了一種綜合節點屬性和節點結構特性的鏈路預測模型,實驗表明該模型具有更好的預測效果。文獻[9]構建了新型自動編碼器模型,該模型可以將提取的定向網絡中節點語義信息用于預測鏈路。文獻[10]為了解決異構網絡中節點屬性信息融合問題,提出了帶有局部學習的加權K-means算法,該模型可以有效平衡異構節點的屬性信息。文獻[11]則利用信息擴散提出了基于模糊標準的鏈路預測算法,在群體規范下為不同的模糊標準計算節點相似度。文獻[12]從節點排序角度出發,利用歷史相似性序列自適應地預測每個節點對之間的未來相似性。文獻[13]綜合分析了前人研究,認為基于拉普拉斯算子的卷積不適合單層圖卷積網絡,而使用基于節點相似性的卷積矩陣來進行鏈路預測可提高預測性能。文獻[14]提出了基于二級節點聚類系數的鏈路預測方法,并利用多個靜態網絡證明了該方法的可行性。文獻[15]提出了路徑與節點相結合的鏈路預測方法,并利用五個不同類型的靜態網絡數據集驗證了該方法的良好性能。文獻[16]提出了基于節點吸引力的動態網絡鏈路預測方法,計算的潛在鏈路概率會隨著網絡的發展而變化。綜合來看,節點相似性方法具有復雜度低和預測精確度高的優點,與網絡結構和行為特征等屬性信息耦合后能表現出更好的性能。但既有的節點相似性方法多用于預測同質網絡鏈路,忽略了真實社會網絡中節點的異質性和資源差異,且鮮有學者考慮產業互聯網絡中存在的跨界問題,也沒有闡釋清楚網絡中資源要素的流動方式,無法為準確預測跨界創新合作關系提供支持。
結合上述分析,本文提出一種基于節點創新要素的鏈路預測方法,該方法從產業互聯網絡視角出發,綜合考慮節點屬性信息和創新要素差異對相似性的影響。首先界定了產業互聯網絡,闡明了創新要素在網絡內部的流通方式;然后在節點相似性方法的基礎上,嵌入節點創新要素后構建新的鏈路預測方法;最后利用真實的網絡數據對該方法進行測試。本研究通過實驗將該方法與其他五種鏈路預測方法進行對比,結果表明本文方法具有更高的精確度。
1 相關概念
1.1 產業互聯網絡
產業邊界逐漸模糊促進產業融合與互聯,跨界產業或企業及其產生的創新合作關系的總和形成產業互聯網絡,能夠為智能制造賦予創新活力。資源要素的流動和擴散是引領創新的關鍵動力,而信息流、技術流和知識流等是產業互聯網絡中資源要素交換的主要形式[17]。將產業互聯網絡中的全部跨界節點集合記為S={S1,S2,…,Sn},n≥2,其中n為節點總個數,記任意兩節點i和j之間的連線為邊ij,已知的連邊集合為C,此時將產業互聯網絡記為G,則ij∈G,網絡中理論上可形成的連邊數量Q=N(N-1)/2。因為節點i和j之間的創新合作關系ij是自愿選擇的結果,所以連邊ij為無向邊,且根據現實考慮,網絡G為無向網絡。
同時,在非空網絡G中,連通節點i和j的所有連邊集合構成連接兩節點之間的路徑集合,每條路徑的連邊個數為路徑長度,連邊個數最少的路徑即為節點i和j之間的最短路徑,而在產業互聯網絡中,最短路徑長度表示為兩節點之間的合作關系距離,記為dG(i,j),它也表示節點i和j至少要經過dG(i,j)個其他節點才能實現合作。特別地,若dG(i,j)=∞,表示在網絡G中不存在一條路徑能夠連通節點i和j。
1.2 創新要素流通方式
產業互聯網絡打通了異質主體間的產業壁壘,可以有效整合和優化資源調配,促進產業融合發展。單一主體無法掌握實現創新活動所需要的全部資源要素,創新要素的流通需通過網絡的互連互通功能來實現,為了量化產業互聯網絡中創新要素的流通方式,現假設網絡中跨界主體進行創新活動需要多元化的創新要素儲備,主體實現創新活動所需要的各類知識、技術、資本等資源統稱為創新要素。將創新要素劃分為x和y兩個維度,分別以x和y為橫、縱坐標軸建立坐標系,并形成一個要素空間θ,每個主體自身都有不同的初始創新要素量,并表示為要素空間θ中不同的坐標。x維度可用結構洞指標—網絡約束系數來衡量[18],結構洞屬性決定了個體在網絡中的位置,反映了不同位置的個體獲取資源的能力差異。節點i的網絡約束系數具體如下:
3 實驗與分析
3.1 實驗數據集
相較于傳統社會網絡,產業互聯網絡是種新型跨界合作網絡,網絡節點類型眾多,均具有一定的創新能力和進一步的創新需求,常規數據集無法刻畫出IIN的特有屬性,因此,本研究借助PatSnap全球專利數據庫,獲取2022年中國大陸地區智能汽車(smart cars)、智慧物流(smart logistics)、智慧醫療(smart healthcare)和智能交通(smart transportation)四個產業領域的跨界合作專利數據集作為實驗數據集。專利數據集的具體處理方式為:a)篩選出國民經濟行業分類號數量為兩個及以上的專利數據;b)再篩選出專利申請人數量為兩個及以上的專利數據;c)繼續篩選出技術分類號數量為兩個及以上的專利數據;d)以申請人為節點,聯合申請專利關系為邊,構建產業互聯網絡。具體參數如表1所示,圖1為四個網絡的可視化圖。
3.2 算法評價指標
為了便于測試相似性指標預測的精確度,將已知連邊集合C按照90%:10%的比例劃分為訓練集CT和測試集CP兩個部分,并將屬于Q但不屬于C的連邊稱為不存在的邊,其集合為H。常用來衡量鏈路預測方法精確度的指標主要有AUC、precision和ranking score三個。本研究選取綜合評價指標AUC來衡量預測算法的精確度,其核心思想是從CP中隨機選擇一條連邊的分數值高于從H中隨機選擇一條連邊的分數值的概率[26]。每次分別隨機從CP和H中各選擇一條連邊,若從CP中選擇的連邊分數值大于從H選擇的連邊分數值,則加1分;若分數值相等,則加0.5分;否則不加分。重復獨立n次實驗后,記加1分的次數為X次,加0.5分的次數為Y次,那么AUC的計算公式為
3.3 實驗結果
本節針對不同的數據集進行了仿真,描述了NIE方法的性能,并與五種相似性方法進行比較。為了保證預測的穩定性,所有實驗結果均是重復30次實驗后取平均值而得。
為了分析所提NIE方法的可行性和權重調節參數α和β對AUC結果的影響,先利用四個數據集對NIE方法進行測試,結果如圖2所示,由于α+β=1,所以僅展示AUC值隨β的變化曲線。從圖2中可以看出,當β=0時,本文方法僅考慮節點局部信息,在SC、SL、SH三個數據集中都表現出最低的預測精確度。隨著β值的變大,該方法同時考慮不同權重的節點局部信息和節點創新要素,在四個數據集中的預測精確度都逐漸提升,到達一個峰值后逐漸降低。值得注意的是,在SL和ST網絡中,NIE方法的預測性能衰退得較為緩慢,而SC和SH網絡的預測性能衰退得較為迅速,這說明節點創新要素差異對節點相似性存在影響作用,且需要權衡節點局部信息和節點創新要素兩種因素在預測中的影響力。此外,四個網絡中,ST網絡的平均AUC值最低,這是因為ST網絡的稀疏程度要高于另外三個網絡。從圖中可以看出,當β值在0.5左右時,NIE方法在四個數據集中均表現出最優性能。因此,在后續的鏈路預測方法對比實驗種,將本文方法中α和β值均設置為0.5,這表示在計算相似性SNIE時,對節點局部信息和節點創新要素取相同權重。
本節還測試了其他五種方法的預測精確度,并與所提方法進行比較。表2給出了NIE方法與選取的五種方法在四個產業互聯網絡數據集上的AUC結果,根據該結果繪制出圖3。綜合表2和圖3可以看出,除了在ST網絡中NIE方法的預測精確度AUC值低于RA方法以外,在另外三個網絡中NIE方法都能獲得最好的AUC結果,基本反映出其預測性能要優于其他方法。其中,CN方法只利用待預測節點對的共同鄰居個數來計算相似性,其AUC結果在所有產業互聯網絡中表現最差。LP方法考慮了三階鄰居對節點相似性的貢獻度,其預測精確度AUC值總體高于CN方法,預測性能較CN方法提升了一些。而Kata方法則是在LP方法的基礎上,利用全部路徑鄰居信息計算節點間的相似度,雖然其預測性能優于LP方法,但提升不大,且計算復雜度高。RA和PA方法都以節點度信息作為計算相似性的依據,它們的區別在于RA方法考慮了共同鄰居節點的度信息,而PA方法只根據待預測節點的度乘積計算它們的相似性,因此,RA方法在四個網絡數據集中的預測性能要優于PA方法。
此外,所提NIE方法在ST網絡中的預測精確度AUC值要低于RA方法,排在第二位,是因為ST產業互聯網絡的節點數大于連邊數,網絡平均度和聚類系數較低,表明該網絡內部含有大量小團體網絡,這些小團體網絡一般有兩到三個節點組成,且幾乎不與其他節點互聯,導致網絡整體稀疏程度較高,對節點創新要素的測量存在一定影響。但綜合實驗結果來看,本文提出的基于節點創新要素的鏈路預測方法具有科學性和可行性,在產業互聯網絡中表現出了良好的預測性能。
4 結束語
本文闡述了產業互聯網絡的概念,分析了網絡中創新要素流方式,提出了一種基于節點創新要素的鏈路預測方法。該方法首先定義了節點間的創新要素差異,然后根據節點局部信息和節點創新要素信息給出相似性計算方法。在四個產業互聯網絡數據集的實驗表明,所提方法的預測精確度要高于其他方法。在未來的研究中,將探究如何改進基于節點創新要素的鏈路預測方法,并應用于有向、含權的產業互聯網絡。
參考文獻:
[1]譚曉軍,何建佳,王維祺.基于Q-learning算法的產業互聯協同調度研究[J].工業工程與管理,2021,26(6):171-178.(Tan Xiaojun, He Jianjia,Wang Weiqi.Research on industrial interconnection cooperative scheduling based on Q-learning algorithm[J].Industrial Engineering and Management,2021,26(6):171-178.)
[2]Schiavone F,Sabetta A,Leone D,et al.Industrial convergence and industrial crisis: a situational analysis about precision medicine during the COVID-19 pandemic[J].IEEE Trans on Engineering Mana-gement,2021,70(4):1456-1467.
[3]Park H, Bellamy M A, Basole R C. Structural anatomy and evolution of supply chain alliance networks: a multi-method approach[J].Journal of Operations Management,2018,63(12):79-96.
[4]Zahraee S M, Golroudbary S R, Shiwakoti N, et al. Particle-gaseous pollutant emissions and cost of global biomass supply chain via maritime transportation: full-scale synergy model[J].Applied Energy,2021,303(1):1-15.
[5]何宇,陳珍珍,張建華.人工智能技術應用與全球價值鏈競爭[J].中國工業經濟,2021(10):117-135.(He Yu, Chen Zhenzhen, Zhang Jianhua. The application of artificial intelligence technology and global value chains competition [J]. China Industrial Econo-mics,2021(10):117-135.)
[6]呂林媛.復雜網絡鏈路預測[J].電子科技大學學報,2010,39(5):651-661.(Lyu Linyuan. Link prediction on complex networks[J].Journal of University of Electronic Science and Technology of China,2010,39(5):651-661.)
[7]Li Longjie, Wang Hui,Fang Shiyu, et al. A supervised similarity measure for link prediction based on KNN[J].International Journal of Modern Physics C,2021,32(9):article ID 2150112.
[8]Mallek S, Boukhris I, Elouedi Z, et al. Evidential link prediction in social networks based on structural and social information [J].Journal of Computational Science,2019,30(1):98-107.
[9]Liao Lizi, He Xiangnan, Zhang Hanwang, et al. Attributed social network embedding[J].IEEE Trans on Knowledge & Data Engineering,2018,30(12):2257-2270.
[10]Li Yafang, Jia Caiyan, Kong Xiangnan, et al. Locally weighted fusion of structural and attribute information in graph clustering[J].IEEE Trans on Cybernetics,2019,49(1):247-260.
[11]Singh S S, Srivastva D, Kumar A, et al. FLP-ID: fuzzy-based link prediction in multiplex social networks using information diffusion perspective[J].Knowledge-Based Systems,2022,248(19):article ID 108821.
[12]Wu Xiaomin,Wu Jianshe,Li Yafeng,et al.Link prediction of time-evolving network based on node ranking[J].Knowledge-Based Systems,2020,195(11):article ID 105740.
[13]Coskun M,Koyuturk M. Node similarity-based graph convolution for link prediction in biological networks[J].Bioinformatics,2021,37(23):4501-4508.
[14]Kumar A,Singh S S,Singh K,et al.Level-2 node clustering coefficient-based link prediction[J].Applied Intelligence:The International Journal of Artificial Intelligence,Neural Networks,and Complex Problem-Solving Technologies,2019,49(7):2762-2779.
[15]Yu Chuanming,Zhao Xiaoli,An Lu,et al.Similarity-based link prediction in social networks:a path and node combined approach[J].Journal of Information Science,2017,43(5):683-695.
[16]Chi Kuo,Yin Guisheng,Dong Yuxin,et al.Link prediction in dynamic networks based on the attraction force between nodes[J].Know-ledge-Based Systems,2019,181(1):article ID 104792.
[17]Caloghirou Y,Giotopoulos I,Kontolaimou A,et al.Industry-university knowledge flows and product innovation:how do knowledge stocks and crisis matter?[J].Research Policy,2021,50(3):article ID 104195.
[18]Burt R S. Structural holes: the social structure of competition[M].Cambridge,MA:Harvard University Press,1995.
[19]Castela B,Ferreira F,Ferreira J,et al.Assessing the innovation capability of small-and medium-sized enterprises using a non-parametric and integrative approach[J].Management Decision,2018,56(6):1365-1383.
[20]Tao Xinmin,Guo Wenjie,Ren Chao,et al.Density peak clustering using global and local consistency adjustable manifold distance[J].Information Sciences,2021,577(8):769-804.
[21]Lorrain F,White H C.Structural equivalence of individuals in social networks[J].Social Networks,1977,1(1):67-98.
[22]Lyu Linyuan,Jin Cihang,Zhou Tao.Similarity index based on local paths for link prediction of complex networks[J].Physical Review E,2009,80(4):article ID 046122.
[23]Yao Yabing,Zhang Ruisheng,Yang Fan,et al.Link prediction based on local weighted paths for complex networks[J].International Journal of Modern Physics C,2017,28(4):article ID 1750053.
[24]Xia Jingjing,Ling Guang,Fan Qingju,et al.Evidential link prediction method based on the importance of high-order path index[J].Modern Physics Letters B,2021,35(33):article ID 2150487.
[25]Zhang Xue,Zhao Chengli,Wang Xiaojie,et al.Identifying missing and spurious interactions in directed networks[J].International Journal of Distributed Sensor Networks,2015,8491:470-481.
[26]Fawcett T. An introduction to ROC analysis[J].Pattern Recognition Letters,2005,27(8):861-874.
收稿日期:2023-03-03;修回日期:2023-04-20
基金項目:國家自然科學基金面上項目(71871144);上海理工大學科技發展項目(2020KJFZ046)
作者簡介:何建佳(1981-),男,湖南道縣人,教授,博導,博士,主要研究方向為企業管理、企業供需網、產業互聯;廖耀文(1997-),男,湖北十堰人,碩士,主要研究方向為復雜網絡、產業互聯;周洋(1989-),女(通信作者),黑龍江佳木斯人,講師,碩導,博士,主要研究方向為顛覆式創新管理(zhouyang@usst.edu.cn).