周 洪,梁 希,魏 鳳,李小春
(1.中國科學院武漢文獻情報中心,湖北武漢 430071;2.湖北省科技大數(shù)據(jù)重點實驗室,湖北武漢 430071;3.愛丁堡大學商學院,英國愛丁堡 EH8 9JS;4 中科院武漢巖土力學研究所,湖北武漢 430071)
任何技術(shù)都不是孤立的,總是同其他技術(shù)存在著相互作用、相互依存的影響關(guān)系,進而形成技術(shù)體系。通過這種技術(shù)影響關(guān)系,一種技術(shù)類型的變化會導致相關(guān)技術(shù)類型的鏈式變化,從而推動技術(shù)體系或技術(shù)領(lǐng)域的發(fā)展和演化[1]。因此,開展技術(shù)影響關(guān)系的研究十分必要。通過探討技術(shù)間的相互影響關(guān)系、挖掘技術(shù)發(fā)展模式和規(guī)則,有利于發(fā)現(xiàn)技術(shù)或產(chǎn)品的新機會、支撐技術(shù)研發(fā)政策和計劃的制定[2-3]。
專利文獻作為技術(shù)信息的有效載體,包含大量的技術(shù)知識[4],是研究技術(shù)影響關(guān)系的重要切入點。目前,國內(nèi)外學者基于專利文獻,開展技術(shù)交叉影響的研究日益興盛,并取得較為豐碩的成果,相關(guān)方法主要集中在專利引文分析、交叉影響分析等。引文分析是了解專利技術(shù)間的依存關(guān)系和相互作用、識別知識流動和發(fā)展軌跡的常用方法。Park 等[5]使用專利引文網(wǎng)絡(luò),識別建筑信息模型的技術(shù)結(jié)構(gòu)和知識流特征;Lee 等[6]使用美國專利引用信息,構(gòu)建移動生態(tài)系統(tǒng)中技術(shù)知識流的網(wǎng)絡(luò)結(jié)構(gòu);楊中楷等[7]基于專利引文網(wǎng)絡(luò)對不同技術(shù)領(lǐng)域間的關(guān)系進行考察,通過追蹤不同技術(shù)領(lǐng)域間的專利知識流動展現(xiàn)網(wǎng)絡(luò)的宏觀特征。然而,引文分析存在一些缺點,如引用和被引用專利間的平均時間太長[8];引文分析僅考慮個別專利之間的引用關(guān)系,難以從技術(shù)領(lǐng)域角度確定技術(shù)相關(guān)性和特征、引用容易受到人為主觀決策的影響[9],申請人和審查員由于受自身屬性限制和外部環(huán)境約束,分別具有不同的引證動機,造成專利引證行為和結(jié)果迥異等[10]。為了解決引文分析限制,研究人員也嘗試使用其他專利信息分析技術(shù)關(guān)系,如共引分析、共詞分析和關(guān)鍵詞向量分析等[11-15]。然而這些方法仍存在缺點,如共引分析中仍存在時滯問題,共詞分析、關(guān)鍵詞向量分析需要對技術(shù)進行定性判斷。
交叉影響分析(cross-impact analysis,CIA)可以定量分析技術(shù)之間的交叉影響,確定專利技術(shù)間的核心技術(shù)和相互關(guān)系[16]。它基于專利的共同分類特征,如國際專利分類(IPC),而不是根據(jù)個別專利開展分析,并且不存在時滯問題。交叉影響法的概念最早由Gordon 等[17]提出,根據(jù)事件間的相互作用來修正未來事件的估計概率[18],對事物發(fā)展前景進行預(yù)測,并經(jīng)過許多研究人員的改進,如基于模糊邏輯的交叉影響模型、比較交叉影響指數(shù)確定關(guān)系特征、層次分析法和交叉影響法結(jié)合來預(yù)測概率等[19-21]。Choi 等[16]最早提出將交叉影響法應(yīng)用到專利數(shù)據(jù),研究技術(shù)之間的影響關(guān)系,并應(yīng)用了關(guān)聯(lián)規(guī)則的思想提取對象關(guān)系。馬榮康等[22]使用Choi 等的方法,構(gòu)建了不同納米技術(shù)領(lǐng)域交互影響模式的分析框架,并利用社會網(wǎng)絡(luò)理論中的“核心一邊緣”模型分析納米技術(shù)交互影響網(wǎng)絡(luò)。黃斌等[23]針對Choi 等的方法存在的不足,開展了判斷影響類型、定量劃分技術(shù)對影響關(guān)系、分析單個技術(shù)影響的研究,并對匯聚技術(shù)的匯聚趨勢開展了實證研究[24]。Jun 等[25-27]提出了分析IPC 分類號的關(guān)聯(lián)規(guī)則和映射方法,并使用搜索的數(shù)據(jù)庫技術(shù)專利文檔進行實驗,并將關(guān)聯(lián)規(guī)則挖掘結(jié)合自組織映射來預(yù)測圖像和視頻技術(shù)的空白技術(shù),結(jié)合時間序列來預(yù)測生物技術(shù)。Kim 等人[28]提出了關(guān)聯(lián)規(guī)則挖掘結(jié)合分析網(wǎng)絡(luò)過程(ANP)來尋找技術(shù)間的相互作用。然而,上述研究往往側(cè)重于研究技術(shù)之間的直接影響關(guān)系,較少考慮技術(shù)之間的間接影響關(guān)系;同時,上述研究只考慮了技術(shù)之間的單一關(guān)系,沒有充分考慮某個具體技術(shù)在技術(shù)體系中的作用,以及整體影響情況。
針對目前的研究現(xiàn)狀,本文提出一種基于DEMATEL 模型的技術(shù)影響關(guān)系研究方法,可以識別技術(shù)間的直接影響關(guān)系和間接影響關(guān)系,還可以展示單個技術(shù)在技術(shù)體系中的位置和作用,從而全面了解專利技術(shù)間的交叉影響和內(nèi)部結(jié)構(gòu),以期為技術(shù)影響關(guān)系提供一種新的視角和方法。
通常,一項技術(shù)與兩項或多項技術(shù)有關(guān)。就專利而言,一項專利可能具有兩項或多項權(quán)利要求,每個權(quán)利要求都被分配了一個分類,因此專利可以具有多個專利分類號。專利是根據(jù)與特定行業(yè)或具有相似功能、用途或結(jié)構(gòu)的主題相關(guān)的技術(shù)進行分類的,每個專利都可以代表一種單獨的技術(shù)。與之前的研究相同,本文假設(shè)每個IPC 分類號都代表一種技術(shù),技術(shù)之間的影響可以從專利的這種特征中得出。
本文使用Choi 等[16]提出的專利交叉影響分析法,來構(gòu)建技術(shù)直接影響關(guān)系矩陣。交叉影響分析法可以看作是關(guān)聯(lián)規(guī)則挖掘(Association Rule Mining,ARM)在專利分析中的應(yīng)用。關(guān)聯(lián)規(guī)則挖掘(Association Rule Mining,ARM)由Agrawal 等[29]提出,通過找出數(shù)據(jù)項的共現(xiàn)模式來生成不同項之間的關(guān)聯(lián)規(guī)則,已廣泛應(yīng)用于零售、金融、醫(yī)學、互聯(lián)網(wǎng)等多個領(lǐng)域[30-33]。本文定義IPC 分類號(技術(shù))i對IPC 分類號(技術(shù))j的影響關(guān)系為:

在技術(shù)直接影響關(guān)系矩陣的基礎(chǔ)上,使用決策試驗和評價實驗室(Decision-Making and Trial Evaluation Laboratory,DEMATEL)模型,分析技術(shù)間的直接影響關(guān)系和間接影響關(guān)系。DEMATEL 由Gabus 等[34]提出,運用矩陣計算工具與圖表相結(jié)合,對系統(tǒng)中的各因素的影響程度進行分析,已運用于技術(shù)選擇、關(guān)鍵因素識別等[35-38]。該方法可以對各因素的影響程度進行定量排序,按照相關(guān)指標分類,還充分考慮了各因素間的因果關(guān)系。


其中I為單位矩陣,的逆矩陣,通常采用LU 分解法求解逆矩陣。中的,表示技術(shù)i受到技術(shù)j的綜合影響大小。

其中D為T的各行矩陣的值之和,表示各行對應(yīng)技術(shù)對所有其他技術(shù)的綜合影響值,即影響度;R為T的各列的值之和,表示各列對應(yīng)技術(shù)受到所有其他各技術(shù)的綜合影響值,即被影響度。
綜合考慮技術(shù)的影響度和被影響度,確定系統(tǒng)因素的中心度向量Z和原因度向量Y。

中心度反映的是該技術(shù)在整個系統(tǒng)中的地位與作用,中心度的值越大,說明該技術(shù)在整個系統(tǒng)中的作用越大。原因度反映技術(shù)是原因因素還是結(jié)果因素,當原因度為正值時,表示該技術(shù)主要影響其他技術(shù),是施予影響的技術(shù);當原因度為負值時,表示該技術(shù)主要受其他技術(shù)影響,是受影響技術(shù)。
考慮技術(shù)的中心度和原因度,以及技術(shù)綜合影響矩陣,可以構(gòu)建技術(shù)交叉影響圖譜,直觀展示出技術(shù)的交叉影響關(guān)系,反映出單個技術(shù)在技術(shù)體系中的位置和作用,并有助于識別關(guān)鍵的專利技術(shù)。其中,節(jié)點代表技術(shù),節(jié)點間存在有向箭頭,反映技術(shù)對其它技術(shù)的影響度以及被影響度。技術(shù)交叉影響圖譜的橫坐標為中心度,縱坐標為原因度,根據(jù)中心度、原因度的均值,可以將技術(shù)分為四個象限。第I 象限的技術(shù)為“高—高”型技術(shù),中心度、原因度都較高,在整個技術(shù)中作用較大,且較大程度影響其他技術(shù),可以認為是重要基礎(chǔ)技術(shù);第II象限的技術(shù)為“低—高”技術(shù),中心度較低、原因度較高,在整個技術(shù)中作用較小,且影響其他技術(shù),可以認為是一般技術(shù);第III 象限的技術(shù)為“低—低”技術(shù),中心度、原因度都較低,在整個技術(shù)中作用不大,且受其他技術(shù)影響,可以認為是邊緣技術(shù);第IV 象限的技術(shù)為“高—低”技術(shù),中心度較高、原因度較低,在整個技術(shù)中作用較大,且受其他技術(shù)影響較大。
地質(zhì)建模技術(shù)是多學科交叉的技術(shù),運用計算機技術(shù),將空間信息管理、地質(zhì)解釋、空間分析和預(yù)測、地學統(tǒng)計、實體內(nèi)容分析以及圖形可視化等工具結(jié)合起來,用于地質(zhì)分析。目前,我國在工程實踐中,地質(zhì)建模大多引進國外軟件和技術(shù),國產(chǎn)軟件和技術(shù)與國外尚存在不小的差距,相關(guān)核心技術(shù)的缺乏將嚴重制約我國石油、天然氣、頁巖氣和二氧化碳封存等領(lǐng)域的發(fā)展。本研究以地質(zhì)建模技術(shù)領(lǐng)域為研究技術(shù)領(lǐng)域,開展基于DEMATEL 專利模型的技術(shù)影響關(guān)系的實證研究
本文選擇湯森路透集團的德溫特創(chuàng)新索引(Derwent Innovations Index,DII)專利數(shù)據(jù)庫作為檢索數(shù)據(jù)庫。在相關(guān)文獻調(diào)研和專家咨詢的基礎(chǔ)上,通過綜合考慮技術(shù)領(lǐng)域關(guān)鍵詞和IPC 分類號,設(shè)定檢索策略。時間跨度為1970—2019 年,數(shù)據(jù)檢索時間為2019 年12 月31 日。通過檢索和清洗,得到地質(zhì)建模技術(shù)相關(guān)專利(族)811 件。本文利用Thomson Data Analyzer、Aureka、excel、Rstudio 等工具對專利文獻進行數(shù)據(jù)挖掘和分析。
國際專利分類號(IPC)包含了專利的技術(shù)信息,通過對地質(zhì)建模技術(shù)相關(guān)專利進行基于IPC 小組的統(tǒng)計分析,可以了解、分析地質(zhì)建模技術(shù)專利主要涉及的技術(shù)領(lǐng)域和技術(shù)重點等。地質(zhì)建模技術(shù)主要涉及IPC 小組318 個,其中包含20 件以上專利的IPC 小組共計20 個,如表1 所示。

表1 IPC 分類小組的前20 專利技術(shù)領(lǐng)域
地質(zhì)建模技術(shù)主要集中在以下方向:(1)地質(zhì)勘測方法和數(shù)據(jù)收集,例如地球物理中地震數(shù)據(jù)的處理、綜合技術(shù)手段進行勘探或探測、地震、聲學、光學外的方法勘探或探測等;(2)電數(shù)字數(shù)據(jù)處理,例如計算機輔助設(shè)計、專門適用于特定應(yīng)用的數(shù)字計算或數(shù)據(jù)處理的設(shè)備或方法等;(3)地質(zhì)建模設(shè)計和數(shù)據(jù)處理方法,例如用于計算機制圖的3D 地理建模等;(4)地質(zhì)建模設(shè)備,例如用于特定的過程、系統(tǒng)或設(shè)備的模擬計算機、用于分布網(wǎng)絡(luò)的模擬計算機;(5)土層或巖石的鉆進。
本文應(yīng)用專利交叉影響分析法,創(chuàng)建技術(shù)類之間的直接影響矩陣。為了獲得有意義的關(guān)聯(lián)規(guī)則,本文將最小支持度設(shè)置為2%,最小影響關(guān)系設(shè)置為10%,同時設(shè)置提升度以避免無效規(guī)則。通過ARM生成關(guān)聯(lián)規(guī)則,得到直接影響矩陣,如表2 所示。

表2 地質(zhì)建模技術(shù)直接影響矩陣
根據(jù)地質(zhì)建模技術(shù)直接影響矩陣,構(gòu)建地質(zhì)建模技術(shù)直接影響關(guān)系圖,如圖1 所示。圖中節(jié)點代表技術(shù),節(jié)點大小代表專利數(shù)量,專利數(shù)量越多則節(jié)點越大;帶箭頭的邊表示技術(shù)影響關(guān)系,箭頭方向表示技術(shù)影響方向,邊的顏色越深表明影響越大。

圖1 地質(zhì)建模技術(shù)直接影響關(guān)系
生成的直接影響矩陣解釋了技術(shù)間的直接影響關(guān)系,但無法解釋技術(shù)間的間接影響關(guān)系,例如沒有考慮F12 通過F8 間接對F7 產(chǎn)生的影響。本文使用DEMATEL來探索技術(shù)間的直接影響和間接影響。通過對直接影響關(guān)系矩陣迭代,得到綜合影響矩陣,如表3 所示。

表3 地質(zhì)建模技術(shù)綜合影響矩陣
通過DEMATEL 方法,得到各技術(shù)的影響度、被影響度、中心度和原因度,如表4 所示。中心度反應(yīng)技術(shù)位置,即技術(shù)在整個系統(tǒng)中的作用;原因度反應(yīng)技術(shù)的影響,是主要影響其他技術(shù)還是受其他技術(shù)影響。

表4 地質(zhì)建模各技術(shù)的影響度、被影響度、原因度、中心度
從中心度指標排序來看,其大小依次為用于特定的過程、系統(tǒng)或設(shè)備的模擬計算機、綜合技術(shù)手段進行勘探或探測、地球物理中地震數(shù)據(jù)的處理、地震、聲學、光學外的方法勘探或探測、其他地球物理測量技術(shù)、地震或聲學的分析。其中,用于特定的過程、系統(tǒng)或設(shè)備的模擬計算機是最重要的技術(shù),屬于地質(zhì)建模設(shè)備方面;綜合技術(shù)手段進行勘探或探測、地球物理中地震數(shù)據(jù)的處理、地震、聲學、光學外的方法勘探或探測等多項重要技術(shù),屬于地質(zhì)勘測方法和數(shù)據(jù)收集方面,需要重點關(guān)注。
從原因度指標排序來看,地震、聲學、光學外的方法勘探或探測、地震或聲學的勘探或探測、測量鉆孔或井、專門適用于特定應(yīng)用的數(shù)字計算或數(shù)據(jù)處理的設(shè)備或方法等技術(shù)的結(jié)果為正數(shù),作為原因因素對其他技術(shù)產(chǎn)生影響;計算機輔助設(shè)計、地球物理中地震數(shù)據(jù)的處理、地震或聲學的分析等技術(shù)的結(jié)果為負數(shù),作為結(jié)果因素,受到其他技術(shù)的影響。
通過中心度、原因度,構(gòu)建地質(zhì)建模技術(shù)象限圖,如圖2 所示。第I 象限的技術(shù)為“高—高”型技術(shù),包括綜合技術(shù)手段進行勘探或探測、用于特定的過程、系統(tǒng)或設(shè)備的模擬計算機、專門適用于特定應(yīng)用的數(shù)字計算或數(shù)據(jù)處理的設(shè)備或方法、地震、聲學、光學外的方法勘探或探測,是重要基礎(chǔ)技術(shù),在地質(zhì)建模中技術(shù)作用較大,且對其他技術(shù)影響也較大;第II 象限的技術(shù)為“低—高”技術(shù),包括地震或聲學的勘探或探測、測量鉆孔或井,是一般技術(shù);第III 象限的技術(shù)為“低—低”技術(shù),包括用于計算機制圖的3D 地理建模、測試井壁的性質(zhì);地層測試;專用于地表鉆進或鉆井以便取得表土或井中液體試樣的方法或設(shè)備,屬于邊緣技術(shù);第Ⅳ象限的技術(shù)為“高—低”,包括計算機輔助設(shè)計、地球物理中地震數(shù)據(jù)的處理、其他地球物理測量技術(shù)、地震或聲學的分析,在整個技術(shù)中作用較大,且受其他技術(shù)影響較大。

圖2 地質(zhì)建模技術(shù)象限圖
通過考慮各技術(shù)的中心度和原因度,以及技術(shù)間的綜合影響關(guān)系,構(gòu)建地質(zhì)建模技術(shù)的技術(shù)交叉影響圖譜,如圖3 所示。橫坐標為中心度,縱坐標為原因度,節(jié)點為技術(shù),帶箭頭的連線表示綜合影響關(guān)系。技術(shù)交叉影響圖譜反映出單個技術(shù)在技術(shù)體系中的位置和作用,以及技術(shù)間的交叉影響關(guān)系。例如,地震、聲學、光學外的方法勘探或探測技術(shù)位于第一象限,是地質(zhì)建模中技術(shù)中的重要基礎(chǔ)技術(shù),作用較大,并且影響著計算機輔助設(shè)計、其他地球物理測量技術(shù)、綜合技術(shù)手段進行勘探或探測、用于特定的過程、系統(tǒng)或設(shè)備的模擬計算機、專門適用于特定應(yīng)用的數(shù)字計算或數(shù)據(jù)處理的設(shè)備或方法等技術(shù)。

圖3 地質(zhì)建模技術(shù)的技術(shù)交叉影響圖譜
研發(fā)機構(gòu)可以結(jié)合技術(shù)的位置和作用確定研發(fā)重點,參考技術(shù)交叉影響關(guān)系制定具有針對性的技術(shù)研發(fā)策略。在實證研究案例中,綜合技術(shù)手段進行勘探或探測、用于特定的過程、系統(tǒng)或設(shè)備的模擬計算機、地震、聲學、光學外的方法勘探或探測技術(shù)是需要重點關(guān)注的基礎(chǔ)技術(shù),這些技術(shù)對計算機輔助設(shè)計、地球物理中地震數(shù)據(jù)的處理、其他地球物理測量技術(shù)、專門適用于特定應(yīng)用的數(shù)字計算或數(shù)據(jù)處理的設(shè)備或方法等產(chǎn)生較大影響;地球物理中地震數(shù)據(jù)的處理、其他地球物理測量技術(shù)也需要重點關(guān)注,主要受到地震或聲學的分析、綜合技術(shù)手段進行勘探或探測、用于特定的過程、系統(tǒng)或設(shè)備的模擬計算機等技術(shù)的影響。
目前研究主要通過引文分析、交叉影響分析來識別技術(shù)影響關(guān)系,往往側(cè)重于直接影響關(guān)系,較少考慮間接影響關(guān)系和綜合影響關(guān)系,也沒有充分考慮技術(shù)在技術(shù)體系中的作用和整體影響情況。針對目前研究中的不足,本文提出一種基于DEMATEL模型的技術(shù)影響關(guān)系研究方法,使用專利信息衡量技術(shù)影響的程度,通過專利分析技術(shù)提取所需技術(shù)要素,結(jié)合交叉影響分析方法研究了技術(shù)間的直接影響關(guān)系,利用DEMATEL 模型識別技術(shù)間的綜合影響關(guān)系,并結(jié)合中心度、原因度構(gòu)建技術(shù)交叉影響圖譜,進行技術(shù)影響關(guān)系的深入識別。
該方法有助于發(fā)現(xiàn)大量專利文獻數(shù)據(jù)中有價值的技術(shù)模式或規(guī)則,理清技術(shù)的中心位置和相互影響,也有助于研發(fā)機構(gòu)制定具有針對性的技術(shù)研發(fā)策略。本文還以地質(zhì)建模領(lǐng)域為例進行了實證研究,利用交叉影響分析、DEMATEL 模型等技術(shù)方法構(gòu)建了技術(shù)交叉影響圖譜,識別出技術(shù)影響關(guān)系,證明了這種方法在技術(shù)評估中的可行性與有效性。
但是,本研究有一些局限性。首先,本文使用交叉影響分析方法構(gòu)建直接影響矩陣,使用專利的IPC 分類號代表技術(shù),通過專利文獻中共同出現(xiàn)IPC分類號來衡量技術(shù)關(guān)系,可能存在技術(shù)定義不明確、衡量技術(shù)關(guān)系不清楚的難題。其次,技術(shù)關(guān)系研究應(yīng)該涵蓋多種技術(shù)的大量技術(shù)文檔,本研究只使用了專利數(shù)據(jù),存在研究范圍的局限性。鑒于本文的局限與不足,下一步研究可考慮擴大技術(shù)文檔來源,綜合分析論文、專利和標準等文獻數(shù)據(jù),在更深層次上研究技術(shù)之間的關(guān)系。