馮立杰,秦浩,王金鳳,劉鵬,仵軒,張芷芯
(1. 鄭州大學(xué)管理學(xué)院,鄭州 450001;2. 上海海事大學(xué)物流工程學(xué)院,上海 201306;3. 河南省創(chuàng)新方法工程技術(shù)研究中心,鄭州 450001;4. 上海海事大學(xué)中國(上海)自貿(mào)區(qū)供應(yīng)鏈研究院,上海 201306)
顛覆性技術(shù)被認(rèn)為是推動技術(shù)創(chuàng)新和經(jīng)濟(jì)增長的重要驅(qū)動力[1]。作為技術(shù)創(chuàng)新的重要內(nèi)容,顛覆性技術(shù)具有強(qiáng)烈的破壞力,能夠打破原有技術(shù)生命周期,構(gòu)建新的技術(shù)軌道,并逐漸取代現(xiàn)有主流技術(shù),從而對社會產(chǎn)生深遠(yuǎn)影響[2]。因此,通過科學(xué)方法識別潛在顛覆性技術(shù),將有助于定位重要的研發(fā)方向,合理分配資源配置,指導(dǎo)科技決策與規(guī)劃,從而進(jìn)一步提升企業(yè)競爭力,幫助國家搶占發(fā)展先機(jī)[3]。
對此,有學(xué)者嘗試采用多種方法識別顛覆性技術(shù),主要包括基于專家經(jīng)驗(yàn)的識別方法、基于模型的識別方法以及基于數(shù)據(jù)挖掘的識別方法等?;趯<医?jīng)驗(yàn)的識別方法主要是德爾菲法[4]、技術(shù)路線圖[5]、調(diào)查問卷法[6]等。這些方法囿于專家知識范圍的影響,具有較強(qiáng)的主觀性,且專家資源較為稀缺,難以實(shí)現(xiàn)顛覆性技術(shù)識別的準(zhǔn)確性與全面性。基于模型的識別方法主要是以一定的理論框架和標(biāo)準(zhǔn)為基礎(chǔ),結(jié)合統(tǒng)計(jì)方法構(gòu)建相關(guān)模型以識別顛覆性技術(shù)。例如,于光輝等[7]采用專利引用信息和Bass模型構(gòu)建了對顛覆性技術(shù)識別和判斷的新方法,并用技術(shù)擴(kuò)散的S形規(guī)律進(jìn)行驗(yàn)證;Cheng等[8]基于SIRS(susceptible, infectious, recovered, suscepti‐ble)流行病模型,提出了一種顛覆性技術(shù)擴(kuò)散模型,用于識別潛在的顛覆性技術(shù)。但這些方法受限于學(xué)者自身領(lǐng)域?qū)I(yè)知識與市場信息,難以抽象顛覆性技術(shù)的核心內(nèi)容或者屬性,從而影響顛覆性技術(shù)識別的準(zhǔn)確性。隨著數(shù)據(jù)驅(qū)動概念的深入,基于數(shù)據(jù)挖掘的識別方法越來越受到關(guān)注。當(dāng)前,基于數(shù)據(jù)挖掘的識別方法主要是結(jié)合統(tǒng)計(jì)學(xué)、文獻(xiàn)計(jì)量學(xué)以及指標(biāo)評估等方法識別顛覆性技術(shù)。例如,陳育新等[9]基于技術(shù)與市場構(gòu)建顛覆性潛力測度指標(biāo),通過結(jié)合滑動窗口與LDA(latent Dirichlet allo‐cation)主題模型,提出了一個(gè)能夠動態(tài)識別具有顛覆性潛力的技術(shù),并用IPC(international patent classification)關(guān)聯(lián)強(qiáng)度驗(yàn)證識別結(jié)果;李乾瑞等[10]基于專利視角,運(yùn)用熵權(quán)法和模糊一致矩陣方法,從4個(gè)維度構(gòu)建了一套系統(tǒng)的顛覆性技術(shù)識別體系,并對5個(gè)技術(shù)領(lǐng)域展開了3個(gè)維度的對比分析以驗(yàn)證模型的可行性;Dotsika等[11]以科技文獻(xiàn)為數(shù)據(jù)源,依據(jù)關(guān)鍵詞在共現(xiàn)網(wǎng)絡(luò)中的接近度和遠(yuǎn)離度來識別顛覆性技術(shù)。這些方法具有較強(qiáng)的客觀性,在一定程度上降低了專家對于識別結(jié)果的影響。但顛覆性技術(shù)早期特征信號較弱,識別難度較高,且上述方法主要考慮技術(shù)本身,較少考慮市場等因素。
為進(jìn)一步彌補(bǔ)僅考慮技術(shù)本身導(dǎo)致的顛覆性技術(shù)識別的低準(zhǔn)確性,部分學(xué)者結(jié)合多源數(shù)據(jù)進(jìn)行顛覆性技術(shù)識別。例如,馬永紅等[12]運(yùn)用LDA主題模型從專利中提取技術(shù)主題,并采用4個(gè)特征識別候選顛覆性技術(shù),基于網(wǎng)頁新聞數(shù)據(jù)分析技術(shù)的市場屬性,進(jìn)而識別出顛覆性技術(shù);譚曉等[13]基于論文、專利與項(xiàng)目等數(shù)據(jù)源,結(jié)合社團(tuán)發(fā)現(xiàn)、主題識別、主題演化等方法,構(gòu)建了科學(xué)-技術(shù)-市場模型用于識別顛覆性技術(shù);呂璐成等[14]基于專家知識和技術(shù)層次體系確定候選顛覆性技術(shù),結(jié)合專利、論文、基金、企業(yè)與輿情等數(shù)據(jù)源評估顛覆性潛力,并界定了兩類顛覆性技術(shù)。綜上所述,已有文獻(xiàn)從多源數(shù)據(jù)出發(fā),從多個(gè)維度開展顛覆性技術(shù)的識別,進(jìn)一步提升了顛覆性技術(shù)識別的準(zhǔn)確性。
顯然,現(xiàn)有顛覆性技術(shù)的識別文獻(xiàn)從多方面進(jìn)行了有益探索,但仍存在以下不足。一是鮮有研究考慮社交媒體數(shù)據(jù)對于顛覆性技術(shù)識別的重要性。顛覆性技術(shù)在發(fā)展的過程中,以滿足用戶需求為導(dǎo)向,能夠吸引主流用戶[15],而社交媒體是社會大眾反映對顛覆性技術(shù)關(guān)注度與情感傾向的重要平臺。通過社交媒體數(shù)據(jù),能夠?qū)撛陬嵏残约夹g(shù)作進(jìn)一步分類,以提升顛覆性技術(shù)早期識別的準(zhǔn)確性。二是鮮有研究利用深度學(xué)習(xí)模型分析顛覆性技術(shù)的指標(biāo)特征,從海量專利中挖掘出深層次的復(fù)雜非線性顛覆性技術(shù)關(guān)鍵特征,并運(yùn)用該特征來識別未來潛在顛覆性技術(shù),從而進(jìn)一步減少專家經(jīng)驗(yàn)的主觀性,并提高潛在顛覆性技術(shù)識別的效率。
鑒于此,為避免專家經(jīng)驗(yàn)評估帶來的主觀性以及上述研究較少考慮社交媒體數(shù)據(jù)等問題,本文擬基于專利與社交媒體雙數(shù)據(jù)源,通過結(jié)合深度學(xué)習(xí)模型、BERTopic主題建模等,提出一種潛在顛覆性技術(shù)的識別路徑。具體研究路徑如下:首先,基于專利數(shù)據(jù),劃分?jǐn)?shù)據(jù)集,構(gòu)建出專利指標(biāo)與技術(shù)影響力之間的關(guān)系;其次,依托雙向長短時(shí)記憶循環(huán)神經(jīng)網(wǎng)絡(luò)(bi-directional long short-term memory,Bi-LSTM)擬合專利指標(biāo)與技術(shù)影響力之間的關(guān)系,預(yù)測出候選顛覆性技術(shù),并結(jié)合BERTopic提取技術(shù)主題;再其次,通過BERTopic基于社交媒體數(shù)據(jù)提取出社會主題,并通過關(guān)注度和情感傾向?qū)ι鐣黝}進(jìn)行評價(jià);最后,通過語義相似度,將社會主題與技術(shù)主題匹配映射,并將技術(shù)主題分為高關(guān)注度-積極態(tài)度、高關(guān)注度-消極態(tài)度、低關(guān)注度-積極態(tài)度與低關(guān)注度-消極態(tài)度4種類型,根據(jù)4種類型技術(shù)主題各自的特點(diǎn),識別出潛在顛覆性技術(shù)。
長短時(shí)記憶循環(huán)神經(jīng)網(wǎng)絡(luò)(long short term memory,LSTM)是一種基于循環(huán)神經(jīng)網(wǎng)絡(luò)(recur‐rent neural network,RNN)結(jié)構(gòu)的改進(jìn)模型,相較于RNN,LSTM解決了RNN存留的“梯度爆炸”和“梯度消失”等問題[16],并考慮了輸入和輸出之間的時(shí)間關(guān)系[17]。LSTM由遺忘門Ft、輸入門It和輸出門Ot共3個(gè)門結(jié)構(gòu)組成,并由這3個(gè)門來更新網(wǎng)絡(luò)。LSTM中的內(nèi)存單元Ct和隱藏狀態(tài)Ht由前狀態(tài)Ct-1和Ht-1更新得到,具體更新過程計(jì)算公式[18]為
其中,Xt為t時(shí)刻輸入LSTM的數(shù)據(jù);Ht為LSTM在時(shí)間t更新網(wǎng)絡(luò)的輸出;W為每個(gè)門單元的權(quán)重矩陣;b為每個(gè)門的偏置向量;σ為sigmoid函數(shù);tanh為tanh函數(shù)。LSTM模型結(jié)構(gòu)如圖1[19]所示。

圖1 LSTM模型結(jié)構(gòu)[19]
LSTM模型只能通過上一時(shí)刻的時(shí)序信息預(yù)測下一時(shí)刻的信息,為了充分利用文本信息,本文引入雙向長短時(shí)記憶循環(huán)神經(jīng)網(wǎng)絡(luò)(Bi-LSTM),該模型由兩個(gè)方向相反的LSTM模型組成,同時(shí)處理文本信息,以獲得具有相反時(shí)間序列的兩個(gè)隱藏層狀態(tài),并將其堆疊以獲得相同的輸出。Bi-LSTM模型結(jié)構(gòu)如圖2[20]所示。

圖2 Bi-LSTM結(jié)構(gòu)模型[20]
截至目前,Bi-LSTM已被廣泛應(yīng)用于變壓器故障診斷[21]、交通事故檢測與狀態(tài)分析[22]、醫(yī)療保健數(shù)據(jù)監(jiān)測[23]、專利數(shù)據(jù)效應(yīng)匹配[24]等眾多領(lǐng)域,且在不同領(lǐng)域均表現(xiàn)出了良好性能。但該模型有較高的技術(shù)環(huán)境要求:一是需要質(zhì)量和數(shù)量較高的數(shù)據(jù)集,并進(jìn)行有效的數(shù)據(jù)清洗與預(yù)處理;二是Bi-LSTM在訓(xùn)練過程中需要大量的參數(shù)調(diào)整和優(yōu)化,以達(dá)到最佳性能。
隨著科研大數(shù)據(jù)的發(fā)展,人們能夠獲取更多顛覆性技術(shù)的特征,相較于人工定義顛覆性技術(shù)特征,深度學(xué)習(xí)模型依據(jù)自身多層非線性結(jié)構(gòu),在處理復(fù)雜數(shù)據(jù)時(shí),能夠更加全面、準(zhǔn)確地提取數(shù)據(jù)特征,從而預(yù)測出候選顛覆性技術(shù)[25]。鑒于此,本文擬運(yùn)用Bi-LSTM擬合專利指標(biāo)數(shù)據(jù)與技術(shù)影響力之間的關(guān)系,以預(yù)測候選顛覆性技術(shù)。
BERTopic是一種主題建模技術(shù),能夠從海量專利文獻(xiàn)中提取技術(shù)主題及其關(guān)鍵詞。由于其能在提取技術(shù)主題時(shí)保留重要的詞匯,且相較于LDA、STM(structural topic model)[26]等模型,能夠充分考慮文本語義信息。因此,眾多學(xué)者利用BERTopic提取了專利主題[27]、在線評論主題[28]、論文主題[29]等,這些研究均驗(yàn)證了BERTopic應(yīng)用在不同文本的普適性。故本文使用BERTopic主題建模模型提取潛在顛覆性技術(shù)主題。BERTopic模型在BERT(bi-directional encoder representation from transform‐ers)基礎(chǔ)上,使用了UMAP(uniform manifold ap‐proximation and projection)降維、HDBSCAN(hier‐archical density-based spatial clustering of applications with noise)文本聚類和c-TF-IDF(class-based TFIDF)提取主題詞3個(gè)步驟,其運(yùn)行原理如圖3[30]所示。

圖3 BERTopic運(yùn)行原理[30]
鑒于此,本文擬運(yùn)用BERTopic主題建模,分別基于專利數(shù)據(jù)提取候選顛覆性技術(shù)主題及主題關(guān)鍵詞和基于社交媒體數(shù)據(jù)提取社會主題及主題關(guān)鍵詞??紤]到專利數(shù)據(jù)和社交媒體數(shù)據(jù)不同主體、不同訴求和不同關(guān)注等因素導(dǎo)致的差異,本文通過語義相似度對兩者進(jìn)行匹配映射,并從社會大眾關(guān)注度和社會大眾情感傾向兩個(gè)維度對社會主題進(jìn)行評價(jià),從而實(shí)現(xiàn)對技術(shù)主題的分類。
本文通過融合專利數(shù)據(jù)與社交媒體數(shù)據(jù),并依托Bi-LSTM與BERTopic主題建模,構(gòu)建了潛在顛覆性技術(shù)識別研究路徑,如圖4所示。

圖4 研究路徑
本文通過制定與具象技術(shù)主題相關(guān)的檢索策略來收集相關(guān)專利數(shù)據(jù)。為提升數(shù)據(jù)分析的有效性,在正式分析之前,需要對已經(jīng)收集的專利數(shù)據(jù)進(jìn)行預(yù)處理。首先,對檢索到的專利進(jìn)行甄選,剔除與具象技術(shù)領(lǐng)域相關(guān)度不高的專利;其次,由于最短顛覆性技術(shù)認(rèn)證時(shí)限為6年[31],本文按時(shí)間段將專利數(shù)據(jù)集劃分為訓(xùn)練集與預(yù)測集,并保證每個(gè)數(shù)據(jù)集的時(shí)間跨度至少為6年;最后,保存每個(gè)專利對應(yīng)的指標(biāo),為后續(xù)構(gòu)建深度學(xué)習(xí)模型奠定基礎(chǔ)。
2.2.1 顛覆性技術(shù)指標(biāo)選取及體系構(gòu)建
在文獻(xiàn)計(jì)量領(lǐng)域中,許多學(xué)者從技術(shù)、科學(xué)、市場等多種角度出發(fā),綜合多個(gè)指標(biāo)描述顛覆性技術(shù)[32]。結(jié)合顛覆性技術(shù)特性和現(xiàn)有專利指標(biāo)體系,同時(shí)考慮指標(biāo)的可獲得性,本文使用技術(shù)類、科學(xué)類以及市場類3類共8項(xiàng)指標(biāo)對顛覆性技術(shù)各方面特征進(jìn)行測度,構(gòu)建顛覆性技術(shù)的技術(shù)指標(biāo)體系。各類指標(biāo)名稱以及衡量方式如表1所示。

表1 指標(biāo)名稱及衡量方式
(1)技術(shù)類指標(biāo)[33]:技術(shù)類指標(biāo)包括技術(shù)新穎性(technological novelty,TN)、技術(shù)價(jià)值(techno‐logical value,TV)、技術(shù)涵蓋度(technological scope,TS)、專利權(quán)人數(shù)量(patentees,PAT)、發(fā)明人數(shù)量(inventors,INV)等指標(biāo)。技術(shù)新穎性描述了目標(biāo)專利對其他技術(shù)的參考程度,即引用其他專利的數(shù)量越多,其新穎性就越低;技術(shù)價(jià)值描述了目標(biāo)專利對其他技術(shù)的影響程度,即被其他專利引用的數(shù)量越多,其影響力就越高;技術(shù)涵蓋度描述了目標(biāo)專利技術(shù)覆蓋的范圍,即專利所屬類別數(shù)越多,其技術(shù)范圍度就越廣;專利權(quán)人數(shù)量描述了目標(biāo)專利的未來技術(shù)發(fā)展力與影響力,專利權(quán)人的能力與水平將影響技術(shù)的未來發(fā)展與影響力,即專利擁有的專利權(quán)人越多,其技術(shù)未來發(fā)展力與影響力就越高;發(fā)明人數(shù)量描述了目標(biāo)專利的未來技術(shù)發(fā)展的潛力,擁有多個(gè)發(fā)明人的專利往往具有更大的發(fā)展?jié)摿Α?/p>
(2)科學(xué)類指標(biāo)[34]:科學(xué)類指標(biāo)包括科學(xué)關(guān)聯(lián)度(scientific relevance,SR)指標(biāo)??茖W(xué)關(guān)聯(lián)度描述了目標(biāo)專利與科學(xué)文獻(xiàn)的關(guān)聯(lián)程度,即專利引用非專利文獻(xiàn)的數(shù)量越多,其與科學(xué)的關(guān)聯(lián)度就越高。
(3)市場類指標(biāo):市場類指標(biāo)包括專利族大小(number of patent families,NF)、專利競爭力(pat‐ent competitiveness,PC)等指標(biāo)。專利族大小描述了目標(biāo)專利在全球布局的廣度,即專利的專利族越大,其在全球布局區(qū)域越廣,花費(fèi)成本越高[35];專利競爭力描述了目標(biāo)專利在市場的競爭能力,通常用權(quán)利要求數(shù)來表征,即專利的權(quán)利要求數(shù)越多,其競爭力越強(qiáng)[36]。
2.2.2 顛覆性技術(shù)影響力評估
高技術(shù)影響力作為顛覆性技術(shù)的核心特征,常常被專利的前向引用次數(shù)所衡量。即若一項(xiàng)技術(shù)越被頻繁、廣泛地應(yīng)用到未來技術(shù)中,則意味著其具有越大的技術(shù)影響力[37]。但針對特定領(lǐng)域而言,高被引專利并不一定是被本領(lǐng)域所引用,也有可能是被其他領(lǐng)域所引用。即對于其他技術(shù)領(lǐng)域而言是顛覆性技術(shù),對本領(lǐng)域而言只是高價(jià)值專利。此外,有些顛覆性技術(shù)早期影響力較弱,意味著前向引用次數(shù)較少。因此,直接使用專利的前向引用次數(shù)來衡量技術(shù)的影響力并不妥當(dāng)。鑒于此,本文采用黃魯成等[38]提出的NPCIA(novel patent cross-impact analysis)法,用于衡量技術(shù)間的交叉影響及技術(shù)影響力(technological influence,TI),計(jì)算公式為
其中,N(j)為包含技術(shù)j的專利數(shù)量;N(i∩j)為同時(shí)包含技術(shù)i和技術(shù)j的專利數(shù)量;Si為技術(shù)影響力系數(shù);n為技術(shù)數(shù)量;i和j為技術(shù)的子集;aij為技術(shù)i對技術(shù)j的交叉影響。
本文將技術(shù)影響力按大小分為高和低兩個(gè)等級。為了更加準(zhǔn)確地設(shè)置技術(shù)影響力大小之間的閾值,需探究不同閾值大小與模型預(yù)測準(zhǔn)確率之間的關(guān)系。因此,本文使用回歸分析,通過比對不同閾值大小對預(yù)測模型準(zhǔn)確率的影響,確定合理的技術(shù)影響力大小的閾值[39]。將大于等于該閾值的專利樣本視為高技術(shù)影響力專利,并貼上標(biāo)簽“1”,其余專利樣本視為低技術(shù)影響力專利,并貼上標(biāo)簽“0”,為后續(xù)深度學(xué)習(xí)模型的構(gòu)建提供數(shù)據(jù)源[40]。
2.3.1 深度學(xué)習(xí)模型訓(xùn)練
一個(gè)技術(shù)領(lǐng)域會存在海量的專利,且有較多指標(biāo)對其進(jìn)行衡量及描述。作為一種神經(jīng)網(wǎng)絡(luò)分類器,深度學(xué)習(xí)模型能夠處理大量數(shù)據(jù)[41]。因此,本文使用深度學(xué)習(xí)模型來預(yù)測候選顛覆性技術(shù),而使用深度學(xué)習(xí)模型預(yù)測候選顛覆性技術(shù)的關(guān)鍵是構(gòu)建出專利指標(biāo)和專利未來影響力之間的關(guān)系。
為了進(jìn)一步提高識別精度以構(gòu)建合適的深度學(xué)習(xí)模型,本文將專利數(shù)據(jù)集劃分為兩個(gè)部分——數(shù)據(jù)集1和數(shù)據(jù)集2。其中,數(shù)據(jù)集1用于幫助深度學(xué)習(xí)模型擬合專利指標(biāo)與專利未來影響力之間的關(guān)系。其具體訓(xùn)練步驟如下:首先,從訓(xùn)練集中依據(jù)前述構(gòu)建的指標(biāo)體系提取相應(yīng)的指標(biāo);其次,依據(jù)前述未來影響力算法,人工計(jì)算并標(biāo)注每個(gè)專利的未來影響力;最后,使用未經(jīng)訓(xùn)練的深度學(xué)習(xí)模型擬合技術(shù)指標(biāo)與專利未來影響力之間的關(guān)系。深度學(xué)習(xí)模型的構(gòu)建如圖5所示。

圖5 深度學(xué)習(xí)模型構(gòu)建
在建立深度學(xué)習(xí)模型之初,首先,需要對模型的各種參數(shù)進(jìn)行初始化設(shè)置,具體包括神經(jīng)元數(shù)量、Epoch以及Batch size等;其次,使用數(shù)據(jù)集1對深度學(xué)習(xí)模型進(jìn)行訓(xùn)練,從而實(shí)現(xiàn)模型的迭代與參數(shù)的更新;最后,完成訓(xùn)練,保存深度學(xué)習(xí)模型。
2.3.2 深度學(xué)習(xí)模型測試
為了評估深度學(xué)習(xí)模型的訓(xùn)練效果,本文隨機(jī)將數(shù)據(jù)集1按8∶1∶1劃分為訓(xùn)練集、驗(yàn)證集與測試集[42],并使用準(zhǔn)確率、精確率、召回率和F1-score共4個(gè)指標(biāo)對訓(xùn)練效果進(jìn)行評估。計(jì)算公式為
其中,Acc為準(zhǔn)確率;Pre為精確率;Re為召回率;TP和TN分別為判斷正確的正樣本和負(fù)樣本;FP和FN分別為判斷錯(cuò)誤的正樣本和負(fù)樣本;P和N分別為正樣本和負(fù)樣本。
2.3.3 候選顛覆性技術(shù)預(yù)測及技術(shù)主題提取
依托上述深度學(xué)習(xí)模型的訓(xùn)練預(yù)測候選顛覆性技術(shù)。其具體步驟如下:首先,提取數(shù)據(jù)集2中的專利指標(biāo);其次,將指標(biāo)信息輸入完成訓(xùn)練的深度學(xué)習(xí)模型中,并輸出相應(yīng)的技術(shù)影響力;最后,將具有高技術(shù)影響力的專利視為候選顛覆性技術(shù),并使用BERTopic模型提取候選顛覆性技術(shù)的技術(shù)主題,其具體流程如圖6所示。

圖6 候選顛覆性技術(shù)預(yù)測流程
通過專利數(shù)據(jù)預(yù)測出的候選顛覆性技術(shù),難以反映社會大眾對其的關(guān)注度與情感傾向。已有研究表明,除去技術(shù)改進(jìn)的自身動力,技術(shù)發(fā)展本身也是一項(xiàng)社會行動[43]。社會大眾往往基于自身利益,動態(tài)、持續(xù)性地關(guān)注某個(gè)主題領(lǐng)域。即如果某項(xiàng)科學(xué)研究的社會大眾關(guān)注度較高,態(tài)度較為積極,那么意味著該研究具有較高的社會影響力。顛覆性技術(shù)作為科研活動的成果表現(xiàn)之一,也同樣適用[44]。因此,本文以社交媒體數(shù)據(jù)為數(shù)據(jù)源,探究社會大眾對前述預(yù)測出的候選顛覆性技術(shù)的關(guān)注度與情感傾向,以進(jìn)一步提升潛在顛覆性技術(shù)的準(zhǔn)確性及全面性,具體步驟如下。
Step1.數(shù)據(jù)獲取及社會主題提取。以社交媒體數(shù)據(jù)庫為數(shù)據(jù)源,利用Python爬取與目標(biāo)技術(shù)領(lǐng)域相關(guān)的內(nèi)容及閱讀量,并使用BERTopic提取出相應(yīng)的社會主題以及文本-主題概率矩陣。
Step2.社會主題關(guān)注度與情感分?jǐn)?shù)計(jì)算。基于文本-主題概率矩陣匹配社會主題與文本,并分別以文本閱讀量的算術(shù)平均數(shù)作為社會主題的社會大眾關(guān)注度,以文本情感分?jǐn)?shù)的算術(shù)平均數(shù)作為社會主題的社會大眾情感分?jǐn)?shù)。
Step3.二維坐標(biāo)構(gòu)建與技術(shù)主題分類。構(gòu)建二維評價(jià)坐標(biāo),從4個(gè)象限出發(fā)對社會主題進(jìn)行分類,并基于語義相似度將上述技術(shù)主題與社會主題進(jìn)行匹配映射,進(jìn)而依據(jù)社會關(guān)注度與社會情感分?jǐn)?shù)兩個(gè)指標(biāo)將技術(shù)主題劃分為高關(guān)注度-積極態(tài)度、高關(guān)注度-消極態(tài)度、低關(guān)注度-積極態(tài)度以及低關(guān)注度-消極態(tài)度4種。
Step4.基于各指標(biāo)的潛在顛覆性技術(shù)識別?;趯<乙庖婈U釋4種技術(shù)主題類型的顛覆性潛力,并識別潛在顛覆性技術(shù)。
具體流程如圖7所示。

圖7 潛在顛覆性技術(shù)識別流程
2.4.1 社交媒體數(shù)據(jù)獲取及社會主題提取
本文通過制定與具象技術(shù)主題相關(guān)的檢索策略,收集相關(guān)社交媒體數(shù)據(jù),并獲取社會主題。具體過程如下:首先,對獲得的數(shù)據(jù)進(jìn)行清洗,去除與主題相關(guān)度不高和無關(guān)的數(shù)據(jù);其次,對清洗過后的數(shù)據(jù)進(jìn)行預(yù)處理,包括HTML(hyper text markup language)解碼、刪除標(biāo)點(diǎn)符號等,并進(jìn)行規(guī)范化儲存;最后,使用BERTopic模型提取社會主題及文本-主題概率矩陣,并結(jié)合相關(guān)領(lǐng)域?qū)<乙庖姡コ嚓P(guān)度不高的主題,得到最終高相關(guān)度的社會主題。
2.4.2 社會主題關(guān)注度與情感分?jǐn)?shù)計(jì)算
社會主題的關(guān)注度為該主題下的所有文本的閱讀量算術(shù)平均數(shù)。具體過程如下:首先,基于文本-主題概率矩陣,并結(jié)合相關(guān)領(lǐng)域?qū)<乙庖?,篩選出每個(gè)主題下的文本;其次,統(tǒng)計(jì)每個(gè)文本的閱讀量,并計(jì)算算術(shù)平均數(shù);最后,將每個(gè)主題的閱讀量作為社會大眾的社會關(guān)注度。
本文使用Python中的SnowNLP來計(jì)算社會大眾對社會主題的情感分?jǐn)?shù)[45]。具體過程如下:首先,根據(jù)先驗(yàn)概率和條件概率,使用樸素貝葉斯算法計(jì)算每個(gè)詞語對于正面情感和負(fù)面情感的概率;其次,根據(jù)文本-主題概率得到每篇文本所屬每個(gè)主題的概率,依據(jù)每個(gè)文本所屬主題概率大小并結(jié)合文本具體內(nèi)容,匹配主題與文本;再其次,根據(jù)文本每個(gè)句子中所有詞的情感極性進(jìn)行加權(quán)平均,計(jì)算每個(gè)句子的情感分?jǐn)?shù),將每個(gè)句子的情感分?jǐn)?shù)加權(quán)平均得到每個(gè)文本的情感分?jǐn)?shù),從而基于主題與文本的匹配結(jié)果計(jì)算每個(gè)主題的情感分?jǐn)?shù);最后,設(shè)置情感分?jǐn)?shù)閾值,將高于該閾值的主題視為社會大眾具有積極態(tài)度的社會主題,將低于該閾值的主題視為社會大眾具有消極態(tài)度的社會主題,將等于該閾值的主題視為社會大眾具有中性態(tài)度的社會主題。
在計(jì)算每個(gè)句子的情感分?jǐn)?shù)時(shí),需要將該句子中的所有詞語的情感極性進(jìn)行加權(quán)平均,從而得到該句子的情感分?jǐn)?shù)。每個(gè)詞語的權(quán)重大小根據(jù)其出現(xiàn)頻率而確定,頻率較大的詞語權(quán)重較大,頻率較小的詞語權(quán)重較小,這樣可以更好地反映每個(gè)詞語在整個(gè)句子情感分?jǐn)?shù)計(jì)算中的貢獻(xiàn)程度。句子的情感分?jǐn)?shù)計(jì)算公式為
其中,sen為情感分?jǐn)?shù);wi為詞語的權(quán)重;pi為情感概率;n為一個(gè)句子中包含的詞語個(gè)數(shù)。
在計(jì)算每個(gè)文本的情感分?jǐn)?shù)時(shí),同樣需要將每個(gè)句子的情感分?jǐn)?shù)進(jìn)行加權(quán)平均,從而得到每個(gè)文本的情感分?jǐn)?shù)。每個(gè)句子的權(quán)重根據(jù)其出現(xiàn)在文本中的位置而確定,出現(xiàn)在文本首句和末句的句子權(quán)重較大,并將剩余權(quán)重分配至其他句子中。這樣可以更好地反映每個(gè)句子在整個(gè)文本情感分?jǐn)?shù)計(jì)算中的貢獻(xiàn)程度。文本的情感分?jǐn)?shù)計(jì)算公式為
其中,pas為情感分?jǐn)?shù);seni為句子的權(quán)重;vi為句子的權(quán)重;m為一個(gè)文本中包含的句子個(gè)數(shù)。
2.4.3 二維坐標(biāo)構(gòu)建與技術(shù)主題分類
以主題關(guān)注度為橫坐標(biāo)、以主題情感分?jǐn)?shù)為縱坐標(biāo)構(gòu)建二維評價(jià)坐標(biāo)。基于各社會主題的指標(biāo)大小,將各社會主題映射到二維坐標(biāo)中。通過社會主題與技術(shù)主題進(jìn)行匹配映射,從而將技術(shù)主題按照高關(guān)注度-積極態(tài)度、高關(guān)注度-消極態(tài)度、低關(guān)注度-積極態(tài)度以及低關(guān)注度-消極態(tài)度分為4類。
技術(shù)主題與社會主題之間的匹配映射是基于二者的語義相似度實(shí)現(xiàn)的,其具體計(jì)算過程如下:首先,使用BERT模型對技術(shù)主題與社會主題分別進(jìn)行編碼以得到其向量;其次,按照余弦相似度的計(jì)算公式計(jì)算社會主題與每個(gè)技術(shù)主題之間的余弦相似度;最后,將技術(shù)主題與每個(gè)社會主題中余弦相似度最大者進(jìn)行匹配映射,并基于相關(guān)領(lǐng)域?qū)<抑R對其進(jìn)一步闡釋說明。
2.4.4 基于社會主題的潛在顛覆性技術(shù)識別
本文依據(jù)社會大眾對技術(shù)主題的關(guān)注度與情感傾向,預(yù)測未來技術(shù)主題的顛覆性潛力。技術(shù)主題的關(guān)注度大小與情感傾向和數(shù)量廣泛的社會大眾自身利益息息相關(guān),即技術(shù)主題的關(guān)注度大小與情感傾向在一定程度上代表了社會影響力。而顛覆性技術(shù)相較于主流技術(shù),能夠改變技術(shù)的發(fā)展方向,離不開其對社會產(chǎn)生的巨大影響,從而得到大規(guī)模的擴(kuò)散并被社會廣泛接受[46]。因此,社會大眾對技術(shù)主題的關(guān)注度大小與情感傾向和其顛覆性潛力有很大的關(guān)系。
(1)高關(guān)注度-積極態(tài)度的技術(shù)主題:高關(guān)注度意味著社會大眾持續(xù)關(guān)注該技術(shù)主題,積極態(tài)度意味著社會大眾對該技術(shù)主題較為滿意。該類技術(shù)主題可能擁有較大的技術(shù)先進(jìn)性,從而導(dǎo)致?lián)碛休^高的社會影響力,并且未來有較大可能性快速占據(jù)市場,完成顛覆。
(2)高關(guān)注度-消極態(tài)度的技術(shù)主題:高關(guān)注度意味著社會大眾持續(xù)關(guān)注該技術(shù)主題,而消極態(tài)度意味著社會大眾對該技術(shù)主題不太滿意。該類技術(shù)主題往往產(chǎn)生于低端市場,可能初始性能不高,導(dǎo)致社會大眾對其態(tài)度消極,但因其便宜、簡單、方便等特點(diǎn)而受到廣泛關(guān)注。未來可能會借助成本優(yōu)勢與市場優(yōu)勢向主流市場侵蝕并完成顛覆[47]。
(3)低關(guān)注度-積極態(tài)度的技術(shù)主題:低關(guān)注度意味著社會大眾尚未關(guān)注或較少關(guān)注該技術(shù)主題,而積極態(tài)度意味著社會大眾對該技術(shù)主題較為滿意。該類技術(shù)主題具有邊緣消費(fèi)者看重的全新功能或?qū)傩?,未來,隨著性能和功能的不斷完善,逐漸滿足多數(shù)大的需求,有可能完成顛覆[48],也可能因無法滿足用戶而不再受到關(guān)注。
(4)低關(guān)注度-消極態(tài)度的技術(shù)主題:低關(guān)注度意味著社會大眾尚未關(guān)注或較少關(guān)注該技術(shù)主題,消極態(tài)度意味著社會大眾對該技術(shù)主題不太滿意。該類技術(shù)主題可能處于萌芽期,因技術(shù)的不完善使得人們對其態(tài)度不夠積極,加之時(shí)間原因暫時(shí)還未受到廣泛關(guān)注。但在技術(shù)發(fā)展的早期,即使顛覆性技術(shù)也呈現(xiàn)“弱信號”的特征[49],因此,對于該類技術(shù)主題,還需等待時(shí)間的驗(yàn)證,亦不能排除其顛覆性的潛力。
綜上所述,本文認(rèn)為高關(guān)注度-積極態(tài)度、高關(guān)注度-消極態(tài)度以及低關(guān)注度-積極態(tài)度的技術(shù)主題更有可能成為顛覆性技術(shù);而低關(guān)注度-消極態(tài)度的技術(shù)主題具有較大不確定性,需要等待時(shí)間的驗(yàn)證。
醫(yī)療機(jī)器人的出現(xiàn),打破了常規(guī)醫(yī)療的現(xiàn)狀,有力地推動了醫(yī)療技術(shù)的變革,越來越多的企業(yè)加入醫(yī)療機(jī)器人產(chǎn)業(yè)化隊(duì)伍[50]。醫(yī)療機(jī)器人由于具有交叉性、前瞻性等特點(diǎn),很有可能引起新一輪技術(shù)革命,從而催生一系列顛覆性技術(shù)[51]。盡管我國近年來大力扶持醫(yī)療機(jī)器人產(chǎn)業(yè)的發(fā)展,但是與世界先進(jìn)水平仍存在一定的差距[52],亟須開展?jié)撛陬嵏残约夹g(shù)的識別,以幫助國家和企業(yè)明晰未來的發(fā)展方向,進(jìn)而縮小與發(fā)達(dá)國家的技術(shù)差距。鑒于此,本文選擇醫(yī)療機(jī)器人領(lǐng)域進(jìn)行實(shí)證分析,以闡釋上述方法的應(yīng)用過程,并驗(yàn)證其合理性。
本文采用incoPat數(shù)據(jù)庫(http://www.incopat.com)為專利數(shù)據(jù)源。經(jīng)初步檢索,得到10652項(xiàng)專利。對原始數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗,去除相關(guān)度低和重復(fù)的專利,最終得到9300項(xiàng)專利。具體檢索時(shí)間、檢索表達(dá)式等信息如表2所示。

表2 醫(yī)療機(jī)器人的專利檢索信息
依據(jù)2.1節(jié)提出的數(shù)據(jù)集劃分方法,本文按時(shí)間段進(jìn)行劃分。2011年1月1日至2016年12月31日的專利數(shù)據(jù)為數(shù)據(jù)集1,將其稱為2020年候選顛覆性技術(shù),共有1982項(xiàng)專利;2017年1月1日至2022年12月31日的專利數(shù)據(jù)為數(shù)據(jù)集2,將其稱為2026年候選顛覆性技術(shù),共有7318項(xiàng)專利。
3.2.1 醫(yī)療機(jī)器人的指標(biāo)選取及體系構(gòu)建
按照2.2.1節(jié)中提出的方法提取訓(xùn)練集中專利樣本的專利指標(biāo)。訓(xùn)練集共1982個(gè)樣本,其中每一個(gè)樣本都有8維數(shù)據(jù),包含8個(gè)專利指標(biāo)的數(shù)值。由于各指標(biāo)數(shù)值跨度較大,直接使用該數(shù)據(jù)會影響模型的訓(xùn)練效果[53]。因此,本文對所有專利指標(biāo)數(shù)值中不為0的取對數(shù)處理,數(shù)值為0的取0。訓(xùn)練集中各專利樣本指標(biāo)描述性統(tǒng)計(jì)如表3所示。

表3 專利樣本各指標(biāo)描述性統(tǒng)計(jì)
3.2.2 醫(yī)療機(jī)器人的專利樣本技術(shù)影響力評估
按照公式(7)和公式(8)計(jì)算每個(gè)專利樣本的技術(shù)影響力,并借助XGB(extreme gradient boosting)模型開展回歸分析,以確定不同技術(shù)影響力閾值大小對模型預(yù)測準(zhǔn)確率的影響,從而確立最佳技術(shù)影響力閾值。具體結(jié)果如圖8所示。

圖8 不同技術(shù)影響力閾值大小對模型預(yù)測準(zhǔn)確率的影響
由圖8可知,在閾值為1.3時(shí),模型預(yù)測準(zhǔn)確率達(dá)到峰值,隨后處于下降狀態(tài),因此,本文將技術(shù)影響力大小的閾值設(shè)為1.3,并將技術(shù)影響力不低于1.3的專利樣本貼上標(biāo)簽“1”,將剩余專利樣本貼上標(biāo)簽“0”。部分專利樣本的部分指標(biāo)如表4所示。

表4 部分專利樣本的技術(shù)影響力
3.3.1 醫(yī)療機(jī)器人的深度學(xué)習(xí)模型訓(xùn)練
由于高影響力和低影響力的專利樣本比例為1∶11,樣本的不均衡導(dǎo)致Bi-LSTM模型無法充分學(xué)習(xí)到高影響力專利樣本的特征。為了進(jìn)一步提升Bi-LSTM模型的學(xué)習(xí)效果,本文在訓(xùn)練集中復(fù)用正樣本專利數(shù)據(jù),使得用于構(gòu)建模型的訓(xùn)練集中正負(fù)樣本相對均衡[54]。經(jīng)訓(xùn)練,最終確定了各模型參數(shù),具體參數(shù)設(shè)置情況如表5所示。

表5 Bi-LSTM模型訓(xùn)練參數(shù)設(shè)置
訓(xùn)練完畢之后,需要檢驗(yàn)?zāi)P偷臄M合程度。將Bi-LSTM訓(xùn)練集的擬合效果與真實(shí)值進(jìn)行對比可知,Bi-LSTM的擬合程度整體上與真實(shí)值差別不大,可以用于下一階段的候選顛覆性技術(shù)預(yù)測。具體對比結(jié)果如圖9所示。

圖9 Bi-LSTM的預(yù)測結(jié)果與實(shí)際結(jié)果對比(彩圖請見http://qbxb.istic.ac.cn/)
3.3.2 醫(yī)療機(jī)器人的深度學(xué)習(xí)模型測試
為了評估Bi-LSTM訓(xùn)練效果,按照2.3.2節(jié)的公式(9)~公式(12)分別計(jì)算準(zhǔn)確率、精確率、召回率和F1-score指標(biāo),并與RF(random forest)、 VSM(vector space model)與LR(logistic regression)等模型進(jìn)行對比。評估指標(biāo)如表6所示。

表6 Bi-LSTM、RF、SVM與LR模型訓(xùn)練效果對比
由表6可知,Bi-LSTM在各項(xiàng)指標(biāo)表現(xiàn)上均優(yōu)于其他模型,即該模型在候選顛覆性技術(shù)分類任務(wù)中整體性能更高,能夠更好地?cái)M合候選顛覆性技術(shù)指標(biāo)與其未來技術(shù)影響力之間復(fù)雜的非線性關(guān)系。因此,可將Bi-LSTM用于2026年候選顛覆性技術(shù)的預(yù)測。
3.3.3 醫(yī)療機(jī)器人的候選顛覆性技術(shù)預(yù)測
提取數(shù)據(jù)集2中的專利各指標(biāo)數(shù)據(jù),經(jīng)由訓(xùn)練完成的Bi-LSTM模型,得到了數(shù)據(jù)集2中各專利的未來技術(shù)影響力。數(shù)據(jù)集2中共有7318項(xiàng)專利,預(yù)計(jì)有395項(xiàng)專利具有高技術(shù)影響力,并視為候選顛覆性技術(shù),占預(yù)測集專利數(shù)量的5.4%。
為了進(jìn)一步明晰候選顛覆性技術(shù)的技術(shù)主題及主題關(guān)鍵詞分布信息,本文使用BERTopic主題建模來提取候選顛覆性技術(shù)的技術(shù)主題及主題關(guān)鍵詞。在此基礎(chǔ)上,結(jié)合領(lǐng)域?qū)<乙庖?,可得?個(gè)技術(shù)主題。各主題代表的技術(shù)領(lǐng)域清晰,具有較好的聚類效果,因此,可根據(jù)各技術(shù)主題所含主題關(guān)鍵詞的內(nèi)容進(jìn)行命名。具體如表7所示。

表7 醫(yī)療機(jī)器人候選顛覆性技術(shù)主題及主題關(guān)鍵詞
由表7可知,醫(yī)療機(jī)器人領(lǐng)域候選顛覆性技術(shù)的技術(shù)主題主要分布在區(qū)塊鏈技術(shù)、智能感知技術(shù)、醫(yī)學(xué)影像采集技術(shù)、上下肢外骨骼康復(fù)、血管介入手術(shù)、自主導(dǎo)航與云服務(wù)技術(shù)、神經(jīng)外科手術(shù)、柔性微型醫(yī)療技術(shù)和神經(jīng)網(wǎng)絡(luò)技術(shù)9個(gè)技術(shù)主題中。為了進(jìn)一步提升識別的準(zhǔn)確性,需要結(jié)合社交媒體數(shù)據(jù)對其加以研判。
3.4.1 醫(yī)療機(jī)器人的社交媒體數(shù)據(jù)獲取及社會主題提取
隨著互聯(lián)網(wǎng)的發(fā)展,社會大眾逐漸在社交媒體中發(fā)表有關(guān)潛在顛覆性技術(shù)的推文,這些推文包含社會大眾對其的情感傾向、認(rèn)知看法與未來期望等,因此具有重要的研究價(jià)值[55]。綜合考慮數(shù)據(jù)的可獲得性與質(zhì)量等特點(diǎn),本文選擇以微信公眾號中的推文、小紅書中的筆記以及知乎中的回答作為社交媒體數(shù)據(jù)。各社交媒體平臺的檢索信息及特點(diǎn)如表8所示。

表8 各社交媒體平臺的檢索信息及特點(diǎn)
因各類型數(shù)據(jù)龐大,本文借助Python來爬取與醫(yī)療機(jī)器人相關(guān)的社交媒體數(shù)據(jù)。經(jīng)數(shù)據(jù)預(yù)處理,濾除重復(fù)數(shù)據(jù)以及與主題相關(guān)度不高的數(shù)據(jù)等,最終獲得668條有效推文。具體檢索關(guān)鍵詞、檢索時(shí)間等信息如表9所示。

表9 醫(yī)療機(jī)器人的微信公眾號推文檢索信息
使用BERTopic主題建模提取上述微信公眾號推文、小紅書筆記以及知乎回答中的社會主題及主題關(guān)鍵詞,初步得到33個(gè)主題,刪除無關(guān)主題及低相關(guān)度主題,最終得到7個(gè)主題。具體結(jié)果如表10所示。

表10 醫(yī)療機(jī)器人相關(guān)的微信公眾號社會主題及主題關(guān)鍵詞
3.4.2 醫(yī)療機(jī)器人的社會主題關(guān)注度與情感分?jǐn)?shù)計(jì)算
基于文本-主題概率矩陣,結(jié)合相關(guān)領(lǐng)域?qū)<乙庖姡瑢⑽谋酒ヅ涞讲煌鐣黝}下。按照2.4.2節(jié)提出的方法,分別計(jì)算不同社會主題的關(guān)注度及情感分?jǐn)?shù),并將情感分?jǐn)?shù)的算術(shù)平均值設(shè)為情感分?jǐn)?shù)閾值。經(jīng)計(jì)算,情感分?jǐn)?shù)的閾值為0.65,故將S1、S2、S3、S4主題設(shè)為積極態(tài)度,將S5、S6、S7主題設(shè)為消極態(tài)度,各社會主題的關(guān)注度與情感分?jǐn)?shù)如表11所示。

表11 社會主題的關(guān)注度及情感分?jǐn)?shù)
3.4.3 二維坐標(biāo)構(gòu)建與醫(yī)療機(jī)器人技術(shù)主題分類
根據(jù)關(guān)注度與情感分?jǐn)?shù)兩個(gè)指標(biāo),以情感分?jǐn)?shù)為縱坐標(biāo)、以關(guān)注度為橫坐標(biāo)構(gòu)建二維評價(jià)坐標(biāo),以更直觀、清晰地了解社會大眾對于醫(yī)療機(jī)器人領(lǐng)域相關(guān)主題的關(guān)注度與情感分?jǐn)?shù)。依據(jù)各指標(biāo)的平均值,將該二維坐標(biāo)劃分為4個(gè)象限,分別是高關(guān)注度-積極態(tài)度、高關(guān)注度-消極態(tài)度、低關(guān)注度-積極態(tài)度和低關(guān)注度-消極態(tài)度。其中,醫(yī)療機(jī)器人的輔助治療屬于高關(guān)注度-積極態(tài)度,處于S2區(qū)域;機(jī)器人的智能化與精準(zhǔn)治療、臨床機(jī)器人應(yīng)用與系統(tǒng)開發(fā)以及機(jī)器人在外科手術(shù)中的應(yīng)用屬于低關(guān)注度-積極態(tài)度,處于S3區(qū)域;其余3個(gè)主題屬于低關(guān)注度-消極態(tài)度,處于S4區(qū)域。具體情況如圖10所示。

圖10 醫(yī)療機(jī)器人社會主題的關(guān)注度與情感傾向二維評價(jià)坐標(biāo)
為了將技術(shù)主題與社會主題進(jìn)行匹配映射,需計(jì)算其余弦相似度。按照2.4.3節(jié)提出的方法,利用BERT模型對其進(jìn)行編碼以得到其向量化表示,并計(jì)算每個(gè)技術(shù)主題與社會主題之間的余弦相似度。醫(yī)療機(jī)器人技術(shù)主題與社會主題之間的余弦相似度計(jì)算結(jié)果如表12所示。
基于表12的計(jì)算結(jié)果,依次統(tǒng)計(jì)各個(gè)技術(shù)主題與每個(gè)社會主題之間的余弦相似度大小,并將技術(shù)主題與社會主題之間余弦相似度中最大者進(jìn)行匹配映射,并依托相關(guān)領(lǐng)域?qū)<抑R,對其進(jìn)一步闡釋說明。具體來說,神經(jīng)外科手術(shù)需要非常細(xì)致和精細(xì)的操作,與機(jī)器人在外科手術(shù)中的應(yīng)用相關(guān),故將其匹配;神經(jīng)網(wǎng)絡(luò)技術(shù)可以幫助機(jī)器人系統(tǒng)的學(xué)習(xí)和優(yōu)化,從而實(shí)線個(gè)性化與準(zhǔn)確治療,與機(jī)器人的智能化與精準(zhǔn)治療相關(guān),故將其匹配;智能感知技術(shù)可以檢測患者的生理狀態(tài)、行為習(xí)慣等信息,從而實(shí)現(xiàn)更加準(zhǔn)確和個(gè)性化的治療效果,與機(jī)器人的智能化與精準(zhǔn)治療相關(guān),故將其匹配;區(qū)塊鏈技術(shù)可以用于記錄和管理醫(yī)療數(shù)據(jù)的安全性,并實(shí)現(xiàn)數(shù)據(jù)的可追溯性,從而為醫(yī)療機(jī)器人提供更加豐富、準(zhǔn)確的數(shù)據(jù)信息,提升機(jī)器人的診斷與治療效果,與醫(yī)療機(jī)器人的輔助治療相關(guān),故將其匹配;柔性微型醫(yī)療技術(shù)可以幫助醫(yī)生在狹小的空間內(nèi)對患者進(jìn)行檢查或治療,與醫(yī)療機(jī)器人的輔助治療相關(guān),故將其匹配;自主導(dǎo)航與云服務(wù)技術(shù)可以幫助醫(yī)生遠(yuǎn)程觀察并操作臨床機(jī)器人查看醫(yī)療影像與數(shù)據(jù)以及遠(yuǎn)程指導(dǎo)手術(shù)過程等,與臨床機(jī)器人應(yīng)用與系統(tǒng)開發(fā)有關(guān),故將其匹配;醫(yī)學(xué)影像采集技術(shù)可以幫助機(jī)器人獲取更加清晰、準(zhǔn)確的醫(yī)學(xué)影像系統(tǒng),與機(jī)器人在醫(yī)學(xué)影像技術(shù)應(yīng)用相關(guān),故將其匹配;上下肢外骨骼康復(fù)是一種常見的機(jī)器人輔助康復(fù)方法,與運(yùn)動康復(fù)與機(jī)器人技術(shù)應(yīng)用有關(guān),故將其匹配;血管介入手術(shù)通常需要在血管內(nèi)進(jìn)行精細(xì)的操作,與微創(chuàng)外科技術(shù)與機(jī)器人應(yīng)用有關(guān),故將其匹配。
為了進(jìn)一步明晰技術(shù)主題與社會主題之間的匹配映射關(guān)系,以社會大眾關(guān)注度大小為橫坐標(biāo)、以社會大眾情感態(tài)度為縱坐標(biāo)構(gòu)建二維坐標(biāo)系,如圖11所示。其中,社會主題中的醫(yī)療機(jī)器人的輔助治療因具有較高關(guān)注度和較為積極的態(tài)度,位于坐標(biāo)系中的第一象限;又因上述的社會主題與技術(shù)主題的匹配結(jié)果,將該主題與技術(shù)主題中的區(qū)塊鏈技術(shù)、柔性微型醫(yī)療技術(shù)進(jìn)行匹配映射;其余社會主題所處的象限以及相匹配映射的技術(shù)主題同理。

圖11 醫(yī)療機(jī)器人技術(shù)主題與社會主題匹配映射
3.4.4 醫(yī)療機(jī)器人潛在顛覆性技術(shù)識別
根據(jù)上述社會主題二維評價(jià)與技術(shù)主題和社會主題匹配結(jié)果,可將技術(shù)主題劃分為4類,分別是高關(guān)注度-積極態(tài)度、高關(guān)注度-消極態(tài)度、低關(guān)注度-積極態(tài)度和低關(guān)注度-消極態(tài)度,具體結(jié)果如表13所示。

表13 醫(yī)療機(jī)器人候選顛覆性技術(shù)主題所屬類別
依據(jù)各技術(shù)主題的指標(biāo)大小,對醫(yī)療機(jī)器人領(lǐng)域相關(guān)技術(shù)主題具體闡釋如下。
具有高關(guān)注度-積極態(tài)度的技術(shù)主題有2個(gè),分別是柔性微型醫(yī)療技術(shù)與區(qū)塊鏈技術(shù)。該類技術(shù)主題未來有較大可能性快速占據(jù)市場,完成顛覆。
(1)柔性微型醫(yī)療技術(shù)可以使機(jī)器人通過微小的切口或者腔道進(jìn)行胃腸道、肺部等部位的檢查和治療,相較于傳統(tǒng)的內(nèi)窺鏡,柔性微型醫(yī)療機(jī)器人更加靈活、精確,并減少了手術(shù)對患者的傷害和恢復(fù)時(shí)間。除此之外,柔性微型機(jī)器人還可以通過柔性身體結(jié)構(gòu),實(shí)現(xiàn)對患者關(guān)節(jié)、肌肉等部位的康復(fù)治療。
(2)區(qū)塊鏈技術(shù)可以為機(jī)器人提供更加安全、可靠的數(shù)據(jù)加密和存儲方式,以確?;颊邆€(gè)人數(shù)據(jù)的安全;可以通過智能合約實(shí)現(xiàn)醫(yī)生的資質(zhì)認(rèn)證和訪問權(quán)限控制,從而確保會診過程的安全性和可信度。除此之外,還可以幫助機(jī)器人實(shí)現(xiàn)醫(yī)療數(shù)據(jù)的共享和交換,促進(jìn)病例數(shù)據(jù)和治療方案的共享和優(yōu)化。
具有低關(guān)注度-積極態(tài)度的技術(shù)主題有4個(gè),分別是神經(jīng)外科技術(shù)、智能感知技術(shù)、神經(jīng)網(wǎng)絡(luò)技術(shù)以及自主導(dǎo)航與云服務(wù)技術(shù)。該類技術(shù)主題隨著未來性能和功能的不斷完善,若能夠逐漸滿足大部分社會大眾的需求,則有可能完成顛覆。
(1)神經(jīng)外科技術(shù)可以幫助機(jī)器人實(shí)現(xiàn)高精度的運(yùn)動和立體成像技術(shù),從而實(shí)現(xiàn)對神經(jīng)系統(tǒng)病變部位的準(zhǔn)確定位和操作;可以幫助機(jī)器人通過MRI(magnetic resonance imaging)和CT(computed to‐mography)等成像技術(shù),實(shí)現(xiàn)對腦功能區(qū)的影像采集和分析。除此之外,神經(jīng)外科機(jī)器人通過植入電極等裝置,實(shí)時(shí)監(jiān)測神經(jīng)元活動和神經(jīng)信號傳導(dǎo)情況。
(2)智能感知技術(shù)可以幫助機(jī)器人識別患者的身體狀態(tài)、疾病類型等,進(jìn)而改變室內(nèi)溫度、適度等參數(shù),提升患者的舒適度和治療效果,從而實(shí)現(xiàn)精準(zhǔn)的診斷和治療。除此之外,還可以幫助機(jī)器人智能獲取醫(yī)生的指令,同時(shí)將患者的信息同步反饋給醫(yī)護(hù)人員,以便及時(shí)調(diào)整治療方案。
(3)神經(jīng)網(wǎng)絡(luò)技術(shù)可以幫助機(jī)器人通過對大量醫(yī)學(xué)數(shù)據(jù)的分析和處理,預(yù)測疾病發(fā)展趨勢,評估患者疾病風(fēng)險(xiǎn),提供個(gè)性化的治療方案和干預(yù)措施。除此之外,還可以幫助機(jī)器人自動學(xué)習(xí)并模擬醫(yī)生的手術(shù)技巧,提升手術(shù)的精度和安全性。
(4)自主導(dǎo)航與云服務(wù)技術(shù)可以幫助機(jī)器人在醫(yī)院內(nèi)部自主移動,從而實(shí)現(xiàn)對患者與醫(yī)生的快速響應(yīng)與服務(wù)。除此之外,該技術(shù)也可以幫助機(jī)器人在云端通過深度學(xué)習(xí)算法和人工智能技術(shù),對大量的病理圖片進(jìn)行識別和分析,從而提供更準(zhǔn)確的病理學(xué)結(jié)果。
具有低關(guān)注度-消極態(tài)度的技術(shù)主題有3個(gè),分別是醫(yī)學(xué)影像采集技術(shù)、上下肢外骨骼康復(fù)與血管介入技術(shù)。對于該類技術(shù)主題,還需等待時(shí)間的驗(yàn)證,不能排除其顛覆性的潛力。
(1)醫(yī)學(xué)影像采集技術(shù)可以使機(jī)器人通過不同的成像技術(shù),獲取人體內(nèi)部的結(jié)構(gòu)、病變及異常情況,從而幫助醫(yī)生實(shí)現(xiàn)精準(zhǔn)定位、準(zhǔn)確診斷與治療。除此之外,還可以對人體各個(gè)部位的影像進(jìn)行三維重建,輔助醫(yī)生進(jìn)行手術(shù)規(guī)劃與操作,既提高了手術(shù)的精度與效率,又減輕了患者的痛苦與風(fēng)險(xiǎn)。
(2)上下肢外骨骼康復(fù)可以使機(jī)器人通過機(jī)械和電氣相結(jié)合的控制方式,協(xié)助患者進(jìn)行康復(fù)訓(xùn)練;可以通過內(nèi)置的傳感器和計(jì)算機(jī)視覺技術(shù),對患者的步態(tài)進(jìn)行分析和識別。即上下肢外骨骼康復(fù)機(jī)器人有助于改善患者日常生活中的行走和站立能力,提高康復(fù)效果和生活質(zhì)量。
(3)血管介入技術(shù)可以幫助機(jī)器人通過微小切口或穿刺進(jìn)入血管內(nèi)部,完成血管內(nèi)手術(shù);或是通過導(dǎo)管和氣囊等裝置將血管擴(kuò)大,從而緩解血管狹窄造成的癥狀。除此之外,該技術(shù)還可以幫助機(jī)器人進(jìn)行神經(jīng)介入治療,利用導(dǎo)管和支架等裝置,恢復(fù)閉塞性動脈供血,保護(hù)受損腦細(xì)胞,從而促進(jìn)患者的恢復(fù)。
本文提出了一種基于深度學(xué)習(xí)模型,融合專利數(shù)據(jù)和社交媒體數(shù)據(jù)來識別潛在顛覆性技術(shù)的方法,并以醫(yī)療機(jī)器人領(lǐng)域?yàn)槔M(jìn)行了驗(yàn)證,是潛在顛覆性技術(shù)識別的重要補(bǔ)充。
本文的學(xué)術(shù)貢獻(xiàn)主要體現(xiàn)在以下兩個(gè)層面。
一是在候選顛覆性技術(shù)預(yù)測階段,本文依托Bi-LSTM挖掘出隱藏在海量專利數(shù)據(jù)中的顛覆性技術(shù)關(guān)鍵特征,并運(yùn)用這些特征識別候顛覆性技術(shù)。該方法不僅能夠有效挖掘隱藏在海量數(shù)據(jù)中的潛在顛覆性技術(shù),并且相較于以往人工歸納顛覆性技術(shù)特征的方法,具有更高的效率、更低的成本以及更高的客觀性。
二是在潛在顛覆性技術(shù)識別階段,提出了一種融合專利數(shù)據(jù)與社交媒體數(shù)據(jù)的潛在顛覆性技術(shù)識別方法,該方法綜合考慮了技術(shù)影響力、社會大眾關(guān)注度與社會大眾情感傾向等,進(jìn)而將潛在顛覆性技術(shù)劃分為高關(guān)注度-積極態(tài)度、高關(guān)注度-消極態(tài)度、低關(guān)注度-積極態(tài)度以及低關(guān)注度-消極態(tài)度4種類型,并對其顛覆性潛力做出了闡釋,是現(xiàn)有顛覆性技術(shù)識別方法的重要補(bǔ)充,能夠?yàn)檎疀Q策、產(chǎn)業(yè)投資等提供參考依據(jù),具有重要的理論和實(shí)踐價(jià)值。
本文尚存在以下局限性。雖然以醫(yī)療儀器人為例驗(yàn)證了本文方法的可行性,但缺乏對多領(lǐng)域技術(shù)的系統(tǒng)研究,未來研究有待于擴(kuò)展補(bǔ)充其他領(lǐng)域的專利數(shù)據(jù)源,以擴(kuò)大潛在顛覆性技術(shù)識別所涵蓋的領(lǐng)域范圍,進(jìn)一步提升研究方法的普適性。此外,本文采用的數(shù)據(jù)主要來自專利數(shù)據(jù)和社交媒體數(shù)據(jù),雖然這些數(shù)據(jù)包含了大量的技術(shù)信息和社會信息,但仍存在不足;未來可以考慮引入更多的數(shù)據(jù)源,如新聞媒體、科技網(wǎng)站等,以獲得更全面和多樣化的數(shù)據(jù)。