馬永紅 孔令凱 林超然 楊曉萌 倪惠莉
摘要:[目的/意義]顛覆性技術研發作為國家戰略,如何準確識別顛覆性技術,對于國家和企業把握技術先機,搶占技術制高點意義重大。[方法/過程]本文結合專利文獻數據,利用LDA主題模型實現數據降維,提取技術主題,從技術主題成長性、融合性、創新性、突破性4個特征識別候選顛覆性技術;在此基礎上,結合網頁新聞數據,測算候選顛覆性技術主題與網頁新聞數據主題之間的匹配度,分析技術的市場屬性,準確識別顛覆性技術。[結果/結論]本文以智能制造裝備領域為例,通過實證研究得到“智能數字控制”及“智能數據采集系統”是智能制造裝備領域的顛覆性技術。
關鍵詞:異構數據;文本挖掘;顛覆性技術;技術識別
DOI:10.3969/j.issn.1008-0821.2022.07.008
〔中圖分類號〕G255.53〔文獻標識碼〕A〔文章編號〕1008-0821(2022)07-0092-13
Research on the Identification of Disruptive Technologies
Based on Heterogeneous Data
——An Example in the Field of Intelligent Manufacturing EquipmentMa YonghongKong Lingkai Lin ChaoranYang XiaomengNi Huili
(School of Economics and Management,Harbin Engineering University,Harbin 150001,China)
Abstract:[Purpose/Significance]Disruptive technology research and development as a national strategy,how to accurately identify it is of great significance for the country and enterprises to grasp the technological first opportunity and seize the technological high ground.[Method/Process]The study patent data,using the LDA topic model to achieve data dimensionality reduction and extracting technology topics.And screened candidate disruptive technologies based on four characteristics:growth,convergence,innovation,and breakthrough of the technology topic.On this basis,the match between candidate disruptive technology topics and web news data topics was measured in conjunction with the web news data.The market attributes of the technology were analysed to identify disruptive technologies comprehensively.[Results/Conclusions]This paper took the field of intelligent manufacturing equipment as an example.Through empirical research,the study found that“intelligent digital control”and“intelligent data acquisition system”are disruptive technologies in the field of intelligent manufacturing equipment.
Key words:heterogeneous data;text mining;disruptive technologies;technology identification
技術創新是經濟發展第一動力,而顛覆性技術作為技術創新的重要內容,其對以往的技術和市場具有較強的破壞力。顛覆性技術是打破原有技術生命周期,構建新的技術軌道,以意想不到的方式取代現有主流技術的技術[1],它能夠實現社會技術體系的躍遷,改變技術產品性能,變革原有技術性能標準,對于軍事、科技、產業等具有變革性的意義。世界各國普遍重視顛覆性技術研發,并設計專門的組織或研發計劃,旨在促進顛覆性技術發展,例如:美國國防高級研究技術局(DARPA)、日本的顛覆性技術創新計劃(ImPACT)。中國也高度關注顛覆性技術研發,中國的《國家創新驅動發展戰略綱要》《科技部辦公廳關于開展顛覆性技術研發方向建議征集工作的通知》等文件明確提出發展顛覆性技術,將顛覆性技術擺在國家戰略位置。而顛覆性技術發展具有高度不確定性,研發過程漫長,如何在復雜的技術環境中及早準確識別顛覆性技術,對于加快顛覆性技術研發,掌握國際競爭發展先機具有重要意義。
1相關工作概述
對于如何識別顛覆性技術,國內外學者已經取得豐富研究成果,其中專家經驗、專利數據、科技論文、市場用戶數據、政策法規是顛覆性技術識別常用的數據源。早期主要采用專家經驗及知識識別顛覆性技術,而依靠專家經驗的識別方法包含:調查問卷法[2-3]、專家訪談[4]、理論分析[5]、技術路線圖[6]等。專家知識和經驗的利用,能夠準確識別特定領域顛覆性技術,但專家資源稀缺,且應用范圍較窄,難以滿足顛覆性技術識別需求。
為解決該問題,學者采用專利文獻數據及科技論文識別顛覆性技術。專利文獻包含大量技術信息,學者綜合專利申請數量[7]、專利引用量[8]、科學關聯度[9]、專利權利要求數[9]、IPC數量[10]、專利發展路徑[11]、專利引用知識突變[12]、專利引文相似度[13]等專利外部屬性識別顛覆性技術,然而基于專利外部屬性的顛覆性技術識別方法,難以充分挖掘專利文獻信息,技術寬泛,細粒度不足,并且專利引用具有滯后性,無法及時識別顛覆性技術。為解決以上問題,學者深入專利內部,將文本挖掘及深度學習方法應用于顛覆性技術識別,以技術屬性集相似度[14]、技術主題突變[15-16]挖掘專利文獻內部信息,以此完成顛覆性技術識別。目前,基于專利內部信息識別顛覆性技術的研究還比較少。科技論文同樣包含技術信息,部分學者將科技論文用于顛覆性技術識別,結合科技論文數量變化[11]、科技論文被引量[17]、科技論文關鍵詞網絡[18]、知識主題突變[19]等指標識別潛在顛覆性技術。除了從“技術屬性”層面識別顛覆性技術,也有學者基于市場用戶需求數據、商業報告數據,分析技術功能變化[20]、技術發展軌跡[21]、技術成熟度[22]、技術市場潛力[23]、消費者偏好[24]、產品功能變化[21]、客戶滿意度[25],進而探究技術對于市場的顛覆程度,以此完成顛覆性技術識別。該類顛覆性技術識別方法,考慮了市場及用戶數據,更貼近市場需求,但該識別方法對技術本身挖掘不充分,忽視技術知識結構,識別結果較為片面。
為了提升顛覆性技術識別準確性及全面性,本研究基于專利文獻,引入文本挖掘技術,獲取技術知識結構信息,結合顛覆性技術特征,從技術屬性層面識別候選顛覆性技術,并結合網頁新聞數據,探究候選顛覆性技術的市場影響,分析技術的市場屬性,進而確定顛覆性技術。顛覆性技術整個識別過程,綜合專利文獻及網頁新聞數據,從技術屬性及市場屬性兩個角度識別顛覆性技術,能夠提高識別結果的準確性及全面性。
2顛覆性技術特征分析
顛覆性技術源于技術融合或創新活動中產生的重大技術范式變革,實現技術性能突破,帶來全新的功能屬性,滿足主流客戶需求,取代現有主流技術。本文將其特征歸納為4個方面。
1)成長性:顛覆性技術沿著“利基市場—中間市場—主流市場”的路徑演進[26],顛覆性技術早期在主流市場需求的性能維度上比主流技術產品低劣[1],只能服務利基市場或邊緣市場,但通過后期的技術改進與創新,技術產品性能不斷提升,具備高性能、低成本優勢[27],最終成長為市場主流技術。因此,技術成長性是顛覆性技術的重要特征之一。
2)融合性:顛覆性技術可以是技術融合的產物[28],未來大部分顛覆性技術將來源于不同領域的技術融合[29]。跨越不同知識結構或不相關領域的技術不斷交叉、嵌入,組合新穎的知識元素,打破以往知識結構對技術軌道的約束[30],為顛覆性技術的產生奠定基礎。因此,融合性是其重要特征[10]。
3)創新性:顛覆性技術不是對現有技術的進一步改進,而是更大程度的創新[31],該技術可以提供全新功能、不連續的技術標準以及新的所有制形式,同時可以改變市場標準和消費者期望[32],實現產品或服務技術特征以及功能屬性的革新。因此,創新性是顛覆性技術顯著特征之一。
4)突破性:顛覆性技術可以由科學知識突變或科學原理變化產生,也可以由技術集成創新產生,該類技術具有重大的突破性[2],能夠替代原有的技術,實現技術性能突破,改變因技術研發局限性造成的產業市場落后狀況,滿足主流市場技術需求,實現市場突破[33]。因此,突破性是顛覆性技術所具有的特征之一。
3顛覆性技術識別框架
3.1異構數據收集及預處理
異構數據是指來源和結構不同的數據,相對于單一數據集,異構數據使不同數據特征融合成為可能。顛覆性技術識別過程中,為提高顛覆性技術識別準確性及全面性,本文綜合使用專利文獻及網頁新聞兩種異構數據。專利文獻記錄技術創新、工藝優化,蘊含豐富的技術知識結構信息;網絡新聞數據是市場不同主體對技術的客觀描述,反映市場主體對技術的態度、應用以及評述,可用于分析技術的市場屬性[34]。因此,本文將專利文獻及網頁新聞兩種異構數據作為顛覆性技術識別的數據源。
1)專利數據收集及預處理
德溫特數據庫作為世界知名專利數據庫,已經收集多個國家和地區的專利文獻,專利信息覆蓋全面,且數據庫不斷更新,為技術情報分析提供了可能。因此,本文選擇德溫特數據庫收集專利文獻數據。為全面檢索專利文獻,本文結合關鍵詞及IPC分類號,制定檢索表達式,收集專利文獻數據。NLTK術語庫是著名的自然語言處理庫,具有詞性分類、詞干提取、詞性標記等功能,為50多種語料庫和詞匯資源提供使用界面[35],為此,本文將其引入專利數據處理,實現詞干提取及詞性還原,并結合停用詞表,剔除無關詞語,保證數據的有效性。
2)網頁新聞數據收集及預處理
網頁新聞數據量龐大,人工收集數據工作量巨大,且難以全面獲取新聞數據。為此,本文采用網絡爬蟲技術實現網頁新聞數據收集。而維特比(Viterbi)算法通過尋找動態規劃最大概率路徑,找出詞頻的最大切分組合,具有良好的分詞效果[36],對此,本文將其應用于網頁新聞數據分詞。
3.2文本數據聚類模塊
LDA(Latent Dirichlet Allocation)主題模型作為典型無監督學習,能夠挖掘文檔隱藏語義信息,處理海量文本文檔,降低無效信息影響,實現專利文獻及網頁新聞數據的高效聚類,因此,LDA模型作為本文主題聚類的首選。LDA主題模型最早由Blei D M等提出[37],其假設每篇文檔由特定概率的主題組成,而主題又由特定概率的特征詞組成,形成“文檔—主題—特征詞”的三層貝葉斯概率模型。LDA模型提取效果直接由主題數量決定,為精準確定主題參數,本文結合困惑度(perplexity)及“肘形”理論確定模型參數。困惑度表示所訓練模型中特定文檔屬于哪個主題的不確定性[37],其中困惑度計算如式(1)~(3)所示;而“肘形”是困惑度曲線的拐點,該拐點與上一節點差值最大,而與后一節點的差值最小,而“肘形”對應的主題數為模型的最優主題數[38]。
3.3顛覆性技術主題識別模塊
根據顛覆性技術的成長性、融合性、創新性以及突破性,本文采用專利申請量以及技術強度判斷技術成長性;采用技術主題IPC分類號、接近中心性判斷技術融合性;測度技術主題有效規模及約束度探究技術創新性;基于技術異常檢測判斷技術的突破性,結合以上4個維度從技術屬性層面識別候選顛覆性技術,并結合網頁新聞數據,探究候選顛覆性技術主題的市場屬性,最終完成顛覆性技術識別。識別流程如圖1所示。
1)技術成長性及融合性測度
“成長性”是指顛覆性技術能夠逐步替代原有技術,變革技術知識結構,最終成為市場主流技術。為體現技術成長性,本文采用專利申請數量以及技術主題強度變化測度技術成長性。技術主題強度能夠反映各時期內技術的熱門度,技術主題強度越高表示技術主題影響力越強。技術主題強度計算公式為:
“融合性”作為顛覆性技術基本特征之一,本文從技術主題接近中心性以及技術主題IPC分類號種類兩個維度分析技術主題融合性。接近中心性表示某技術主題與其他技術主題的接近程度,如式(6)所示,接近中心性越高,技術主題融合性越強[40]。為測度技術主題接近中心性變化趨勢,本文基于專利文獻時間屬性,構建不同年份下技術主題共現網絡,以此測算不同年份技術主題接近中心性;此外,統計技術主題內部不同類型的IPC分類號,若技術主題內IPC分類號種類增加,則技術主題融合性增強。
“創新性”是顛覆性技術基本屬性之一。顛覆性技術能夠提供新的產品或技術功能,改變原有技術范式,具備較強創新性。技術主題共現網絡中結構洞占據者能夠獲取非重復異質信息,技術創新可能性較高,因此,本文采用結構洞指標測度技術主題的創新性。有效規模(ES)、約束度(H)是結構洞指數典型指標,有效規模是技術節點的個體網絡規模減去網絡冗余度,有效規模與技術節點結構洞數量呈正比,如式(9)所示。約束度表示約束性多大程度集中在某個節點上,如式(10)所示。
顛覆性技術能夠突破現有技術桎梏,改變原有技術軌道。為分析技術主題是否具有突破可能性,本文采用技術異常檢測,探究技術突破的可能性。技術異常檢測是一種技術突破形式,異常技術是對已建立規則、主流技術的革新[42]。技術異常檢測包含局部異常因子(LOF)、K均值等方法,而K均值異常檢測能夠應用于不同類型數據,因此,K均值技術異常檢測作為本文首選。其計算公式如式(11)所示:
3)技術主題匹配度測算
專利文獻挖掘能夠深入技術本身,獲取技術知識結構信息,但難以分析技術的市場屬性,導致技術分析結果片面。社會網絡新聞數據包含技術應用、技術需求、潛在技術機會等重要技術信息[34,43],網絡新聞技術信息的報道,是技術事件轉移的重要信號,表明市場不同主體的關注,對于分析技術市場應用,技術產生的社會經濟效益、潛在競爭力、商業機會具有重要價值[44]。部分學者已將網頁新聞用于評估技術潛在競爭力、市場認可度,論證網絡新聞數據用于分析技術市場屬性的可行性[34]。對此,本研究將網頁新聞數據引入,結合主題匹配度測算方法,探究待選顛覆性技術的市場屬性,提升技術識別的準確性及全面性。
主題匹配度測算包含詞共現匹配、余弦夾角向量匹配等方法,該類方法從詞頻角度測度主題匹配度,尚未考慮主題內特征詞的詞義信息。為準確測算技術主題匹配度,本文基于語義相似度Sim(kwi,kwj),形成特征詞相似度矩陣F,如式(12)所示,取矩陣中相似度排名前50%元素的均值作為主題匹配度[45]。
4智能制造裝備領域顛覆性技術識別案例
制造業是國民經濟的主體,是立國之本、興國之器。制造系統的智能化是制造業新的發展方向,制約國家競爭力的提升,是各國關注的焦點。智能制造裝備領域具有科技創新能力強、產業關聯度高等特征,極易產生顛覆性技術。因此,本文選擇智能制造裝備領域作為研究對象,利用專利文獻以及網頁新聞數據,識別智能制造裝備領域顛覆性技術。
4.1智能制造裝備領域數據收集及主題提取
4.1.1智能制造裝備領域數據收集
1)智能制造裝備領域專利文獻數據收集
智能制造裝備產業作為戰略性新興產業,根據《戰略性新興產業重點產品和服務指導目錄》獲取智能制造裝備領域技術關鍵詞,結合IPC分類號,制定智能制造裝備領域專利數據檢索表達式,TI=(Intelligent numerical control machine or industrial robots manufacturing or additive manufacturing or intelligent sensing or intelligent control equipment or intelligent measurement or assembly equipment or intelligent logistics or storage equipment) AND IP=( B62D* OR B23P* OR B23Q* OR B24B* OR B23D* OR B23F* OR B23B* OR B23C* OR B23G* OR H02N* OR B23K* OR F16J* OR H04R* OR B64G* OR G08B* OR G11B* OR G06E* OR G06F* OR G08C* OR H01F* OR G05B* OR G01B* OR G02B* OR A24B* OR B02C* OR C03B* OR C25C* OR G08G* OR H02K* OR F16C* OR E01D* OR B60B),檢索時間跨度為1963—2021年,檢索日期為2021年9月25日,基于德溫特數據庫共得到25 564條專利文獻,刪除無效數據,剩余23 581條專利,繪制各年份部分國家(地區)的專利申請情況,結果如圖2所示。
由圖2可知,德國最早申請智能制造裝備領域相關專利,并保持較強研發態勢。此外,中國(CN)及中國香港(HK(China))、中國臺灣地區(TW(China))、世界知識產權組織(WO)、美國(US)、韓國(KR)、日本(JP)、英國(GB)、歐洲專利局(EP)等國家、地區或組織的專利申請數量也不斷增加。在本文收集的專利文獻中,中國(CN)最早圖2各年份部分國家及地區專利申請情況
于1997年申請智能制造裝備領域相關專利,相比其他國家及地區,起步較晚,但中國及地區專利申請數量不斷增加。
2)智能制造裝備領域網頁新聞數據收集
網頁新聞數據龐大,人工收集工作量巨大,且面臨數據收集不全面問題。為此,本研究借助Python軟件,采用爬蟲技術收集智能制造裝備領域網頁新聞數據。其中,智能制造裝備領域網頁新聞檢索關鍵詞為“智能制造技術”“智能制造裝備”“智能制造裝備技術”“高檔數控機床”“工業機器人”“增材制造裝備”“智能傳感與控制裝備”“智能檢測與裝配裝備”“智能物流與倉儲裝備”,通過收集共得到7 218條新聞數據,去除冗余文本及無效文本,剩余6 694條新聞數據,如圖3所示,時間跨度為2012—2021年。
4.1.2專利文獻及網頁新聞數據預處理
1)專利文獻數據預處理
為保證智能制造裝備領域專利文獻技術主題提取效果,本研究刪除長度小于2和長度大于15的單詞,并實現智能制造裝備領域專利文獻的詞性還原及詞干提取;根據NLTK術語庫自帶停用詞表,并結合LDA主題模型計算結果反復調整停用詞表,剔除無效詞語。專利文獻數據預處理后,抽樣得到:“Telescopic”“Bolt”“Monitoring”“Medium”“Grid”等詞語,從抽樣結果可知,數據預處理后得到的詞語專業,說明智能制造裝備領域專利文獻數據預處理有效。
2)網頁新聞數據預處理
針對智能制造裝備領域網頁新聞數據,采用維特比算法實現文本分詞,但文本中存在部分無效詞語,影響文本信息的挖掘。哈工大停用詞庫以及百度停用詞庫是開源的停用詞表[46],收錄了比較全面的停用詞,是目前最常用的停用詞庫,本文將其引入,過濾無效詞語,降低無效詞對本研究的影響。
4.1.3智能制造裝備領域技術主題提取
LDA模型的主題參數直接決定智能制造裝備領域技術主題提取的準確性,為保障智能制造裝備領域專利文獻及網頁新聞數據聚類效果,本研究綜合困惑度及肘形確定LDA模型主題參數。其中,專利文獻以及網頁新聞LDA主題模型困惑度及肘形如圖4所示。
綜合不同主題數下模型困惑度及肘形,如圖4所示,得到智能制造裝備領域專利文獻LDA模型最優主題數為87,而智能制造裝備領域網頁新聞數據LDA模型最優主題數為72。其中,專利文獻聚類結果中兩個主題由數字構成,本研究將其剔除,剩余85個技術主題;由智能制造裝備領域網頁新聞數據LDA模型得到72個主題,其中與智能制造裝備領域相關的主題共28個,剩余44個主題與智能制造裝備領域關聯性不強,將其剔除。每篇文檔由一定概率的主題組成,為準確提取文檔信息,本文借鑒Mann G S等的研究[47],認為若主題分布概率大于0.1,則認為文檔屬于該主題,進而刪除文檔中主題分布概率低于0.1的主題。
根據專利文獻及網頁新聞數據LDA模型提取結果,分別展示不同數據源下前5個主題的特征詞及其概率分布,結果如表1所示。
4.2智能制造裝備領域候選顛覆性技術識別
基于智能制造裝備領域專利文獻以及LDA模型提取結果,本研究從成長性、融合性、創新性、突破性4個維度分析技術自身知識屬性,識別候選顛覆性技術。
4.2.1智能制造裝備領域技術主題成長性測度
顛覆性技術實現技術性能突破,不斷發展,最終成為主流技術,該發展過程中技術創新主體逐漸多樣化,專利申請數量不斷增加。因此,本研究結合專利文獻的時間屬性,統計技術主題專利申請數量及技術主題強度,繪制不同時間段各技術主題專利申請數量及主題強度變化。由于2000年前專利數量較少,信息不豐富,因此,本文僅展示2000年以后的統計結果,結果如圖5和圖6所示。
圖5及圖6顯示智能制造裝備領域大部分技術主題專利申請數量以及主題強度呈現上升趨勢,尤其2015年后,隨著智能傳感器、人工智能、智能算法、大數據采集技術、存儲技術等的不斷成熟,智能制造裝備領域內技術復雜度凸顯,裝備性能得以優化,成為不同國家或地區關注的重點,專利申請量及主題強度不斷提升。但從智能制造裝備領域技術主題強度變化趨勢上看,Topic79、Topic76、Topic72、Topic54、Topic25、Topic3 6個技術主題2000—2012年變化不明顯,尚未出現增強或減弱的趨勢,因此,本文后續研究將該類技術主題刪除,保障顛覆性技術識別的準確性。
4.2.2智能制造裝備領域技術主題融合性測度
基于技術主題共現強度,構建智能制造裝備領域技術主題共現網絡,測算技術主題接近中心性,利用接近中心性探究技術主題的融合程度。為動態觀測技術主題融合性變化,本文以時間為切片,分別構建1966—2021年內55個技術主題共現網絡,并展示2020年智能制造裝備領域技術主題共現網絡,如圖7所示。
通過構建不同年份下技術主題共現網絡,得到技術主題接近中心性變化趨勢。由于2000年前各技術主題共現強度較弱,接近中心性不顯著,因此僅展示2000年后技術主題的接近中心性變化趨勢,如圖8所示。為保持數據一致性,下文同樣僅展示2000年后智能制造裝備領域的數據。此外,本文統計不同技術主題內部IPC分類號,多維度分析技術主題融合性,結果如圖9所示。
圖8中智能制造裝備領域部分技術主題接近中心性不斷增加,不同類型的技術主題關聯密切,融合度上升,該類技術主題共23個,主要包含Topic86、Topic84、Topic83、Topic74等。此外,觀測23個技術主題內部IPC分類號種類,其中Topic21、Topic28、Topic43、Topic56、Topic59、Topic73、Topic84 7個技術主題的IPC號種類均超過200,技術主題涉及領域廣泛,包含不同類型的技術,技術融合性明顯。
4.2.3智能制造裝備領域技術主題創新性測度
顛覆性技術改變原有技術范式,實現技術結構變革,技術創新性明顯。本文利用結構洞指數測度具有創新性的技術主題,結構洞指數越高,技術主題獲取非冗余信息能力越強,實現技術創新可能性越高。本文采用有效規模及約束度指標測算技術主題結構洞。基于技術主題成長性及融合性分析,得到23個技術主題,結合構建的技術主題共現網絡,其有效規模及約束度指數變化情況如圖10、圖11所示。
由圖10可知,Topic22、Topic55、Topic62 3個技術主題有效規模變化不明顯,而Topic19有效規模呈下降趨勢,非冗余信息獲取能力低于其他類型的技術主題,擁有結構洞數量較少,技術主題創新性不強,本文將該4個技術主題刪除;由圖11可知,各技術主題約束度不斷下降,技術主題網絡能力較強,對其他技術主題的依賴程度逐漸減小。
通過技術主題成長性、融合性以及創新性篩選,得到19個技術主題,結合技術主題特征詞及概率,對19個技術主題進行命名,結果如表2所示。表2技術主題命名
主題號IDTopic5太陽能電池電流與電壓控制技術Topic12智能協議轉化裝置Topic17智能手機傳感器技術Topic21智能數字控制Topic28機器人智能傳感控制技術Topic35智能輔助技術Topic43智能軟件Topic44智能裝配技術Topic46三維參數繪圖技術Topic56電機控制與連接技術Topic59導軌安裝技術Topic60耐高溫隔熱與散熱材料Topic65信號智能處理技術Topic69機器人識別掃描系統Topic73無線傳感器網絡芯片技術Topic74驅動器控制系統Topic83智能信息存儲Topic84智能數據采集系統Topic86原材料處理方法
4.2.4智能制造裝備領域技術主題突破性測度
技術異常檢測是另一種技術突破形式,通常認為異常點可能表示對已建立規則、主流趨勢和模式的革新和打破,具備技術突破的可能性[48-49]。本文采用K均值算法檢測技術異常點,分析智能制造裝備領域技術主題的異常,檢測結果如圖12所示。
通過智能制造裝備領域技術主題異常檢測可知,Topic21(智能數字控制)、Topic84(智能數據采集系統)兩個技術主題與其他類型技術主題距離較遠,屬于智能制造裝備領域異常點,具有實現技術突破的可能性。因此,本文認為“智能數字控制”以及“智能數據采集系統”兩項技術是智能制造裝備領域的候選顛覆性技術。
4.3主題匹配性分析
4.3.1網頁新聞數據主題命名
網頁新聞數據LDA主題模型共提取72個主題,刪除無關主題及低強度主題44個,剩余28個主題與智能制造裝備領域相關。根據智能制造裝備網頁新聞數據LDA主題模型特征詞及概率分布,對提取的智能制造裝備領域網頁新聞數據主題進行命名,結果如表3所示。表3智能制造裝備領域網頁新聞數據主題命名
NO.IDNO.ID1智能建筑設計15智能系統2航空航天發動機16智能制造業3科技成果轉化17智能物流4智能家居18燃料電池5腦機19智能制造平臺6智能服務20新能源電池7增材制造21人工智能汽車8高鐵列車22智能終端9智能機器人23物聯網傳感器10制造裝備設計24工業機器人11工業互聯網25增材制造藥物125G網絡芯片26人工智能13數字經濟27智能交通14智能農機28發動機設計
4.3.2主題匹配結果
根據28個網頁新聞數據主題以及兩個候選顛覆性技術主題各自包含的特征詞,并結合式(12)、式(13),測算候選顛覆性技術主題與智能制造裝備領域網頁新聞主題之間的匹配度,探究候選顛覆性技術的市場屬性,更準確識別智能制造裝備領域顛覆性技術。其中,主題匹配度如圖13所示。
由圖13可知,“智能數字控制”“智能數據采集系統”兩項候選顛覆性技術與智能家居、智能服務、智能系統、人工智能汽車、智能交通、發動機設計6個網頁新聞數據主題實現匹配,表明“智
能數字控制”“智能數據采集系統”已被市場中多個主體所關注,潛在競爭力較高。其中,智能系統、智能家居兩個主題與兩項候選顛覆性技術主題匹配度最高,表明“智能數字控制”“智能數據采集系統”對于智能系統以及智能家居影響力最強,技術作用顯著。
基于以上研究結果,本文認為“智能數字控制”及“智能數據采集系統”兩項技術是智能制造裝備領域的顛覆性技術。“智能數字控制”與傳統的控制技術不同,智能控制技術更強調設備的自動化和智能化,融合機械技術、計算機技術以及控制技術,改變了傳統機械制造模式,實現高效率制動控制;此外,智能數字控制技術顯著提升產品質量及生產精度,彌補機械精細化加工領域傳統機械制造模式“粗放”缺點。“智能數據采集系統”能夠完成海量規模數據的采集,有效處理智能制造各環節數據,將數據轉化為知識,有利于問題的分析,避免問題的重復發生。由于智能數據采集系統所具有的高效便捷特性以及良好的可擴展性,智能數據采集系統已經得到越來越多國內企業及客戶的支持,成為多個企業研究和開發的重點。
5效果評估
為評估論文提出方法的有效性,本文采用基于離群專利的顛覆性技術識別方法[9],識別智能制造裝備領域顛覆性技術,并對比結果。由于篇幅限制,本文未展示識別過程。根據該方法,篩選得到智能制造裝備領域離群專利7 745條,涵蓋15種技術組合,并綜合科學關聯度、技術影響潛力等多個指標評估技術組合,運用孔多塞投票法識別顛覆性技術。最終得到智能數字控制、電機控制與連接技術、無線傳感器網絡芯片技術、智能信息存儲、智能數據采集系統屬于智能制造裝備領域的顛覆性技術。該方法最終的識別結果包含本研究的識別結果,識別結果相對寬泛,主要原因在于當技術組合得分相近時,該方法主觀性較強,且該方法尚未考慮技術的市場屬性,影響識別結果的準確性。而本文提出的方法,綜合專利文獻及網頁新聞兩種異構數據,識別過程客觀,考慮技術的市場屬性,能顯著提升顛覆性技術識別的準確性。
6研究結論
本文利用專利文獻及網頁新聞數據,提取不同類型的主題,從成長性、突破性、創新性及融合性4個維度識別候選顛覆性技術主題,并結合網頁新聞數據,探究候選顛覆性技術的市場屬性,最終完成顛覆性技術識別。本研究結合不同數據源,利用文本挖掘方法準確地識別顛覆性技術,對于加快顛覆性技術研發具有重要的參考價值。
智能制造裝備領域顛覆性技術識別案例中,利用LDA模型從專利文獻中提取87個技術主題,其中“智能數字控制”以及“智能數據采集系統”兩個技術主題符合顛覆性技術成長性、融合性、創新性以及突破性特征;結合網頁新聞數據主題,得到“智能數字控制”“智能數據采集系統”與多個網頁新聞主題匹配,兩種技術已被市場所接受,技術影響力較強,能夠改變原有生產方式,屬于智能制造裝備領域顛覆性技術。
案例研究結合專利文獻及網頁新聞兩種異構數據識別顛覆性技術,研究結論清晰明確,說明綜合專利數據以及網頁新聞數據能夠有效識別顛覆性技術。但限于篇幅,本研究對智能制造裝備領域網頁新聞數據挖掘不充分,技術對市場的影響體現不足。未來研究將結合深度學習模型,深入分析技術與市場之間的關系,充分體現技術的市場屬性。
參考文獻
[1]Bower J L,Christensen C M.Disruptive Technologies:Catching the Wave[J].The Journal of Product Innovation Management,1995,28(2):155.
[2]孫永福,王禮恒,孫棕檀,等.引發產業變革的顛覆性技術內涵與遴選研究[J].中國工程科學,2017,19(5):9-16.
[3]Collins R W,Hevner A R,Linger R C.Evaluating a Disruptive Innovation:Function Extraction Technology in Software Development[C]//2011 44th Hawaii International Conference on System Sciences,2011.
[4]Hang C C,Chen J,Yu D.An Assessment Framework for Disruptive Innovation[J].IEEE Engineering Management Review,2013,41(4):109-118.
[5]Sainio L M,Puumalainen K.Evaluating Technology Disruptiveness in a Strategic Corporate Context:A Case Study[J].Technological Forecasting and Social Change,2007,74(8):1315-1333.
[6]Zhang Y,Robinson D,Porter A L,et al.Technology Roadmapping for Competitive Technical Intelligence[J].Technological Forecasting and Social Change,2016,110(9):175-186.
[7]Buchanan B,Corken R.A Toolkit for the Systematic Analysis of Patent Data to Assess a Potentially Disruptive Technology[J].Intellectual Property Office United Kingdom,2010.
[8]欒春娟,程昉.技術的市場潛力測度與預測——基于技術顛覆潛力與技術成熟度綜合指標[J].科學學研究,2016,34(12):1761-1768,1816.
[9]羅素平,寇翠翠,金金,等.基于離群專利的顛覆性技術預測——以中藥專利為例[J].情報理論與實踐,2019,42(7):165-170.
[10]李乾瑞,郭俊芳,黃穎,等.基于專利計量的顛覆性技術識別方法研究[J].科學學研究,2021,39(7):1166-1175.
[11]Momeni A,Rost K.Identification and Monitoring of Possible Disruptive Technologies By Patent-development Paths and Topic Modeling[J].Technological Forecasting and Social Change,2016,(104):16-29.
[12]張金柱,張曉林.利用引用科學知識突變識別突破性創新[J].情報學報,2014,33(3):259-266.
[13]于光輝,寧鐘,李昊夫.基于專利和Bass模型的顛覆性技術識別方法研究[J].科學學研究,2021,39(8):1467-1473,1536.
[14]黃魯成,成雨,吳菲菲,等.關于顛覆性技術識別框架的探索[J].科學學研究,2015,33(5):654-664.
[15]李乾瑞,郭俊芳,黃穎,等.基于突變-融合視角的顛覆性技術主題演化研究[J].科學學研究,2021,39(12):2129-2139.
[16]劉忠寶,康嘉琦,張靜.基于主題突變檢測的顛覆性技術識別——以無人機技術領域為例[J].科技導報,2020,38(20):97-105.
[17]Pilkington A.Exploring the Disruptive Nature of Disruptive Technology[C]//IEEE International Conference on Industrial Engineering &Engineering Management,2009.
[18]Dotsika F,Watkins A.Identifying Potentially Disruptive Trends By Means of Keyword Network Analysis[J].Technological Forecasting & Social Change,2017,119:114-127.
[19]白光祖,鄭玉榮,吳新年,等.基于文獻知識關聯的顛覆性技術預見方法研究與實證[J].情報雜志,2017,36(9):38-44.
[20]Diab S,Kanyaru J,Zantout H.Disruptive Innovation:A Dedicated Forecasting Framework[M].Agent and Multi-Agent Systems:Technologies and Applications,2015.
[21]Keller A,Hüsig S.Ex-ante Identification of Disruptive Innovations in the Software Industry Applied to Web Applications:The Case of Microsofts vs.Googles Office Applications[J].Technological Forecasting & Social Change,2009,76(8):1044-1054.
[22]Ganguly A,Nilchiani R,Farr J V.Defining a Set of Metrics to Evaluate the Potential Disruptiveness of a Technology[J].Engineering Management Journal;EMJ,2010,22(1):34-44.
[23]Linton J D.Forecasting the Market Diffusion of Disruptive and Discontinuous Innovation[J].Engineering Management IEEE Transactions On,2002,49(4):365-374.
[24]Klenner P,Hüsig S, Dowling M.Ex-ante Evaluation of Disruptive Susceptibility in Established Value Networks—When are Markets Ready for Disruptive Innovations?[J].Research Policy,2013,42(4):914-927.
[25]Benzidia S,Luca R M,Boiko S.Disruptive Innovation,Business Models,and Encroachment Strategies:Buyers Perspective on Electric and Hybrid Vehicle Technology[J].Technological Forecasting and Social Change,2021,165:120520.
[26]劉安蓉,李莉,曹曉陽,等.顛覆性技術概念的戰略內涵及政策啟示[J].中國工程科學,2018,20(6):7-13.
[27]Paap J,Katz R.Anticipating Disruptive Innovation[J].IEEE Engineering Management Review,2004,32(4):74-85.
[28]Yu D,Chang C H.A Reflective Review of Disruptive Innovation Theory[C]//PICMET08-2008 Portland International Conference on Management of Engineering & Technology.IEEE,2008.
[29]欒恩杰,孫棕檀,李輝,等.國防顛覆性技術在航天領域的發展應用研究[J].中國工程科學,2017,19(5):74-78.
[30]劉玉梅,溫馨,孟翔飛.基于技術軌道躍遷的突破性技術預測方法及應用研究[J].情報雜志,2021,40(11):39-45,15.
[31]黃魯成,蔣林杉,吳菲菲.萌芽期顛覆性技術識別研究[J].科技進步與對策,2019,36(1):10-17.
[32]Nagy D,Schuessler J,Dubinsky A.Defining and Identifying Disruptive Innovations[J].Industrial Marketing Management,2016,57:119-126.
[33]張佳維,董瑜.顛覆性技術識別指標的研究進展[J].情報理論與實踐,2020,43(6):194-199,193.
[34]Thorleuchter D,Poel D.Weak Signal Identification with Semantic Web Mining[J].Expert Systems with Applications,2013,40(12):4978-4985.
[35]Bird S,Klein E,Loper E.Natural Language Processing with Python:Analyzing Text with the Natural Language Toolkit[M].OReilly Media,Inc,2009.
[36]Viterbi A J.Viterbi Algorithm[J].Scholarpedia,2009,4(1):6246.
[37]Blei D M,Ng A Y,Jordan M I.Latent Dirichlet Allocation[J].The Journal of Machine Learning Research,2003,3:993-1022.
[38]趙蓉英,戴祎璠,王旭.基于LDA模型與ATM模型的學者影響力評價研究——以我國核物理學科為例[J].情報科學,2019,37(6):3-9.
[39]Salton G,Buckley C.Term-weighting Approaches in Automatic Text Retrieval[J].Information Processing & Management,1988,24(5):513-523.
[40]李盛竹,蔣婧秋.企業“互聯網+”信息技術融合應用能力的識別研究——基于社會網絡分析視角[J].現代情報,2016,36(5):98-103.
[41]劉俊婉,龍志昕,王菲菲.基于LDA主題模型與鏈路預測的新興主題關聯機會發現研究[J].數據分析與知識發現,2019,3(1):104-117.
[42]翟東升,郭程,張杰,等.采用異常檢測的技術機會識別方法研究[J].現代圖書情報技術,2016,(10):81-90.
[43]Rotolo D,Hicks D,Martin B R.What is an Emerging Technology?[J].Research Policy,2015,44(10):1827-1843.
[44]Alkemade F,Suurs R A A.Patterns of Expectations for Emerging Sustainable Technologies[J].Technological Forecasting and Social Change,2012,79(3):448-456.
[45]李綱,余輝,毛進.基于多層語義相似的技術供需文本匹配模型研究[J].數據分析與知識發現,2021,5(12):1-16,25-36.
[46]畢達天,楚啟環,曹冉.基于文本挖掘的消費者差評意愿的影響因素研究[J].情報理論與實踐,2020,43(10):137-143.
[47]Mann G S,Mimno D,McCallum A.Bibliometric Impact Measures Leveraging Topic Analysis[C]//Proceedings of the 6th ACM/IEEE-CS Joint Conference on Digital Libraries.New York:ACMPress,2006.
[48]伊惠芳,劉細文,龍藝璇.技術創新全視角下技術機會發現研究進展[J].圖書情報工作,2021,65(7):132-142.
[49]Chandola V,Banerjee A,Kumar V.Anomaly Detection:A Survey[J].Acm Computing Surveys,2009,41(3):1-58.
(責任編輯:郭沫含)