袁夢 宗潔瓊 張正敏(上海市質量和標準化研究院,上海 200000)
標準化工作對人工智能產業發展具有基礎性、支撐性、引領性的作用,既是推動產業創新發展的關鍵抓手,也是產業競爭的制高點。當前,我國人工智能相關產品和服務不斷豐富的同時,也出現了標準化程度不足的問題[1]。一方面,人工智能涉及眾多領域,現有標準化基礎及工作較為分散,不足以支持整個領域;另一方面,人工智能屬于新興領域,發展方興未艾,從世界范圍看標準化工作仍在起步過程中,標準制修訂相對滯后,尚未完成標準體系。另外,現有標準系統內部關聯性及發展規律并不十分清晰。因此,迫切把握機遇,搶占標準創新制高點,加快對人工智能技術及產業發展的研究,首先需要系統梳理人工智能領域相關的標準,明確標準間的依存和制約關系,來推動和完善標準體系,以標準手段促進我國人工智能技術、產業蓬勃發展。
工業機器人是人工智能領域中發展較早的一支,我國工業機器人的研制雖然起步較晚,但憑借廣大的市場潛力和眾多的人才和資源基礎,近年來迅猛發展。其中,從近幾年推出的機器人產品來看,工業機器人技術正在向智能化、模塊化和系統化的方向發展。隨著工業機器人向更深更廣方向的發展以及智能化水平的提高,其應用版圖正在不斷擴大,然相關標準體系不完善,標準制修訂滯后,缺乏自主創新等問題,制約著工業機器人產業的提質升級。從標準層面來講,與發達國家的學者和專家對智能制造裝備的理解相比,我國尚處于起步階段。基礎共性標準、關鍵技術標準、產品標準和重點應用標準亟待研究制定,以提升自主技術標準的國際話語權。
十九大報告中強調要堅定實施創新驅動發展戰略,網絡科學[2]在相對較為成熟的行業領域,從標準及其規范性引用文件入手,已經開始了系統性探索。例如,標準間關聯規則地探索[3],利用規范性引用關系[4],利用語義相似度等[5],將標準系統轉化為網絡模型,并在日化等行業領域逐步開展系統性的探索和實證研究,挖掘內在規律、定位關鍵標準[6-7]等。
本文以人工智能產業中工業機器人為研究領域,依托上海市質量和標準化研究院標準文獻館百萬級的館藏標準數據,結合產業鏈進行數據檢索;對標準數據采集、梳理和預處理后得到基礎數據集;然后,對它們的規范性引用文件進行梳理核查實施狀態,刪除已作廢的標準,并根據當前的制修訂情況進行數據調整,將符合條件的規范性引用文件中的標準擴充到基礎標準集,作為本項目的標準數據集。
前期,研究小組結合標準間信息傳遞方向和規范性引用關系,在日化用品行業標準系統中制定了標準間的連邊規則,即標準與其規范性引用文件之間存在連邊,連邊的方向遵循信息流動方向,由規范性引用文件指向引用它們的標準,并假設它們之間的信息流量完全相同,以此在標準集中搭建有向連邊,而不存在規范性引用關系的標準件不存在連邊,以此規則建立標準有向網絡。然而,工業機器人行業相對日化行業起步較晚,發展尚未成熟,處于高速發展期,市場上廣泛流通的標準數據量有限。因而,考慮到標準的連通性,標準間信息傳遞不具有衰減性,以及信息傳遞非間接性等問題,本項目研究的工業機器人相關標準及規范性引用轉化的數學模型忽略信息流傳播方向,建立無向標準網絡。
工業機器人領域起步較晚,標準體系尚未成熟,本文從研究標準規范性引用系統的網絡基本拓撲性質等問題入手,探索性地對發展相對不成熟的領域嘗試梳理規范性引用關系,轉化為復雜網絡模型,探究該網絡的基本拓撲性質,分析其生成機理。
如果一個網絡中節點的度值都集中在某個值附近,那么該網絡稱為均勻網絡;相反地,如果網絡中節點的度值很不均等,既存在度相對較小的節點,也存在度非常大的節點,那么該網絡被稱為非均勻網絡。
節點的連邊數量記為該節點的度。將網絡中節點的度按從小到大排序,統計得到度為k的節點占整個網絡節點數的比例記為pk,意為網絡中隨機選擇一個節點的度為k的概率,其分布情況即為該網絡的度分布。
在各類分布中,冪律分布是唯一一種具有無標度特性[8]的長尾分布,且度分布服從冪律分布的網絡稱為冪律網絡。當度分布服從冪律分布的網絡,其冪指數從小變大時,被認為是從高度非均勻網絡變化為高度均勻網絡,一般認為只有冪指數較小(γ≤3)的才是非均勻網絡[9-10]。
一個包含N個節點的網絡的密度ρ定義為網絡中實際存在的邊數M與最大可能的邊數之比,記為式(1)
實際網絡的規模隨時間而演化,其中節點和連邊總體上呈現增加趨勢,但網絡是變得越稠密,還是越稀疏有待于實踐認證。當N→∞時,密度趨向于非零常數,則表明網絡中實際存在的邊數與N2同階,網絡是稠密的;若N→∞時,密度趨近于0或者網絡平均度趨近于一常數,則表明實際存在邊數比N2低階,網絡是稀疏的。
如果一個網絡具有短的平均路徑長度和高的聚集系數,則該網絡具有小世界特性[11]。
網絡的平均路徑長度L定義為任意2個節點之間的距離的平均值,如式(2)所示,即
聚集系數是指一個節點的2個直接鄰居節點也具有連邊的概率。網絡中一個度為ki的節點i的聚集系數Ci,且網絡聚集系數C定義為式(3)
其中,Ei是節點i的ki個鄰居節點之間實際存在的邊數。聚集系數的取值范圍為[0,1],其中,當聚集系數為1時,該網絡時全局耦合的,即網絡中任意2個節點直接相連。
在發展較為成熟的日化用品行業領域,相關標準數量相對豐富,因而根據規范性引用關系的存在性和信息傳播的流動性制定連邊規則,建立了有向標準網絡,并結合網絡的基本拓撲結構性和節點的重要性等,發現標準被引用的頻次、局部和全局影響力對它在系統中的重要性影響更為明顯[5-7]。相比之下,工業機器人行業起步較晚、發展不成熟,相關標準數量較少,標準體系有待豐富,且標準間信息傳遞不具有明顯衰減性。因此,僅依據標準間的規范性引用存在性,對工業機器人領域標準系統制定連邊規則,建立標準網絡。
館藏系統中,工業機器人應用領域的標準200多份,在采集并梳理標準的規范性引用文件后,核查標準的使用狀態,刪除廢止標準,標準與其規范性引用文件間存在連邊,與其他標準無連邊,以此為連接規則,忽略引用與被引用的方向性,并假設所用引用關系是等價的,轉化為以標準為節點,規范性引用關系為連邊,建立無權無向的標準引用網。
本項目研究小組為探索新興高科技領域標準的發展趨勢,建立工業機器人應用領域的標準引用復雜系統,轉化為網絡模型,得到一個規模G1(532,1080)的網絡圖,如圖1(a)、(b)所示,其中最大的連通子圖G2(475,1012),占據網絡中89.29%的節點,93.7%的連邊。孤立的碎片中,部分標準制定年限較早,部分被廣泛應用卻未在規范性引用文件中體現,也有面向專業應用領域的部分,有待于發掘與連通子圖之間的關聯性,完善標準數據。例如QJ 1352-1988《機器人產品型號命名方法》屬于早期航天工業部批準發表的基礎性標準,內容中包含多種機器人的命名方法,除工業機器人外還包含服務、航天、軍用機器人等,但未能從形式上被多個標準規范性引用,尚不能體現它在基礎性標準領域的重要性。
圖1 標準網絡及最大連通圖
經初步統計分析,該網絡中節點的度分布,經最小二乘直線擬合,網絡圖近似擬合為,最大連通子圖近似擬合為的冪律分布,如圖2(a)、(b)所示,分別為和且冪指數均小于3,且平均度密度和度分布、密度以及平均度等基本拓撲性質指標表明,該網絡及最大連通子圖各指標值近似,均為稀疏的,符合冪律分布的,非均勻網絡。
圖2 標準網絡及最大連通子圖的度分布
在許多實際的復雜網絡中,節點數巨大,網絡的平均路徑長度小得驚人,即為小世界現象。網絡的平均距離嚴格來說只有對連通圖才是有限值,因此提取網絡中的最大連通子圖,利用廣度優先算法,得出該網絡的平均路徑長度 ,表明連接該網絡中任意2個節點,最短路徑途中不超過5個節點。網絡中包含500多個節點,但平均路徑長度不足5,表明該網絡表現出小世界現象。
但是,網絡的聚集系數約為0.183,分布情況如圖3所示,最大連通子圖的聚集系數為0.192。許多現實網絡中具有小世界現象,往往表現出很高的聚集系數,但工業機器人標準引用網的聚集系數并不高。一是因為網絡在構建過程中,是通過“工業機器人”在標準館藏庫中以“工業機器人”為關鍵詞借助全文搜索得到的核心標準集,然后對其規范性引用文件完成第一層的標準集和規范性引用的擴充,在館藏庫中該領域的相關標準數量有待豐富。另一方面,在圖中3中,C(k)與k之間已經出現了冪律形式,存在部分節點度值不小,但聚集系數值非常小的現象,這表明該網絡有社團聚集發展趨勢,但因為工業機器人行業標準發展不成熟,部分標準的引用關系較為零散,產學研結合不到位,不同領域專家組織間的合作交流不暢,使得各板塊領域間的關系缺乏深入研究。另外,機器人整體制造工藝復雜,涉及眾多行業領域,如應急響應機器人、醫用電器設備以及電磁兼容相關部分的標準,涉及機器人的本體、應用場景以及核心零部件等領域,縱跨工業機器人產業鏈上中下游,在高速發展階段,各組織百家爭鳴,將關鍵技術協商一致轉化為標準文本,難度非常大。
圖3 網絡的聚集系數
標準在社會經濟發展中具有重要作用,是產品質量提質升級、城市管理水平提高的重要基礎。智能機器人重點布局立足國家安全與裝備、服務于國家民生科技、服務于未來引領科技平臺。我國工業機器人憑借廣大的市場潛力和眾多資源基礎,近年來迅猛發展。隨著人類社會的日益網絡化,科學研究的網絡化日趨明顯,標準作為市場經濟與科學研究結合的成果表現,是否也呈現出相同的趨勢,在工業機器人這個處于高速發展階段且標準化工作不成熟的領域,其系統內部的發展規律和趨勢又反映出標準系統存在哪些問題。
本文通過關鍵詞在上海市質量和標準化研究院館藏系統中搜索工業機器人領域的相關標準,并通過規范性引用文件及引用關系,拓展標準集、制定連邊規則、建立網絡模型。利用網絡科學相關理論和技術,對網絡的稀疏性、度分布情況、小世界現象等基本拓撲性質展開計算和研究分析。經實驗分析證明,不僅在發展較為成熟的日化用品行業領域的標準系統中,利用標準間的規范性引用關系建立的引用網絡符合冪律分布,且在機器人這個新興產業中,工業機器人領域的規范性引用網絡也符合冪律分布和稀疏、非均勻的特點;小世界現象不僅存在于較為成熟的行業領域復雜系統中(如日化領域),也存在高速發展的行業領域(如工業機器人領域)中;處于發展不成熟階段的工業機器人領域,反映出標準制修訂相對滯后,標準間雖呈現聚集趨勢,但部分標準的引用關系較為零散,產學研結合不到位,不同領域專家組織間的合作交流不暢,使得各板塊領域間的關系缺乏深入研究等問題。