任曦駿,潘 東,張 理,宋竹萌,聶元弘,張 龍,馬美玲,韓 冬
(1.國網安徽省電力有限公司經濟技術研究院,安徽 合肥 230022;2.上海理工大學電氣工程系,上海 200093)
顛覆性技術指對現有技術具有顛覆性、非對稱性,對經濟社會發展產生重大影響的新技術,是新產業發展的重要推動力量[1]。隨著“碳達峰”“碳中和”目標的提出,若能源電力系統要實現低碳轉型[2],通信系統作為其重要的技術支撐,應不斷增強設備可靠性,以確保電力通信高質量接入。同時,合理利用電力通信新技術可以提高供電穩定性,促進電力系統可持續發展[3]。目前,顛覆性技術識別方法眾多。VOJAK B A基于歷史研究案例,提出了利用技術路線圖識別潛在顛覆性技術的方法[4]。TELLIS G J通過組織相關技術領域專家和市場管理者,確定目標技術的創新點和特性,分析其市場價值并與目前的市場技術進行比較,進而判斷其成為顛覆性技術的可能性[5]。SUN J等運用創新問題解決理論構建模型,從技術成熟度、技術成套化等方面對技術進行前景預測,判斷其成為顛覆性技術的可能性[6]。CARLSEN H采用跨學科專家組評價制度,通過情景分析法組織趨同研討會,以進行顛覆性技術的識別研究[7]。白光祖采用核心專利、核心論文及其引文,進行顛覆性技術預見方法驗證[8]。但是上述方法在應用于具體專業領域的技術識別時,通常存在主觀性及局限性。
電力通信作為電力系統的重要組成部分,在新形勢下更要積極實現有效的創新與變革。通過引入先進的網絡技術,可促進電力通信質量的不斷提升,為電力系統的安全運行提供有效支撐。為了評估先進技術帶來的顯著影響,本文提出了基于專利演化分析的顛覆性技術識別方法。該方法不僅對比了專利新技術與當前已有技術的差異,還考慮了專利新技術未來的研究方向和受關注的趨勢變化,實現了對目標技術專利發展的度量分析。本文結合專利新技術的特征,構建顛覆性技術識別指標體系,從而完成對電力通信領域顛覆性技術的有效判別,進而更好地把握關鍵技術和高效地完成產業升級轉型。
本文基于專利演化分析的顛覆性技術識別流程主要包括:專利數據獲取及預處理、計算專利數據的演化矩陣及相關指標值和顛覆性技術判別。具體識別流程包含:①從專利數據庫中獲取相關技術領域的專利文本數據集,并對專利文本數據進行預處理,得到基于時間序列和基于被引頻次排序的原始專利文本數據集;②構建顛覆性技術識別指標體系;③采用余弦相似度[9]計算兩兩專利間的摘要文本相似度,構建專利相似度矩陣,并根據新穎度與相似度的關系得到專利新穎性矩陣,以專利公開時間為斷點逐個計算各時間區域內的專利新穎性,構建專利演化矩陣;④根據建立的顛覆性技術識別指標體系,確定每條專利的指標值;⑤對識別出的技術進行顛覆性判別與未來發展分析。
為了獲取科學有效的目標領域專利數據集,本文從中國知網專利數據庫中選取了與電力系統有關的專利作為目標領域數據源。中國知網專利庫包括中國專利和海外專利。其從1970年至今共收錄1.4余億項專利。專利檢索需提取專利名稱、專利摘要、專利號、專利權利要求、專利說明書、發明人、專利權人、專利申請日期、專利公開日期等標準化檢索信息。本文的專利檢索日期截至2022年11月1日。本文對獲取的專利按照公開年份進行排序。整理得到的電力系統領域授權發明專利年度分布如圖1所示。

圖1 電力系統領域授權發明專利年度分布
專利檢索結果包含55 241條電力系統領域的專利記錄。由圖1可知:電力系統領域專利自1986年被授權發表,隨后到2001年處于發展潛伏期。這個階段相關領域的專利技術很少甚至在有些年份并沒有相關技術的產出。從2001年開始,電力系統領域進入萌芽期,年度授權專利數穩步上升,該領域技術得到了研究人員的關注。近幾年,電力系統領域年度授權專利數正處于快速增長的狀態,并且呈現出不斷上升的發展趨勢。這說明電力系統領域的技術研發與應用非常活躍,處于上升成長期且具有良好的發展潛能。
1.2.1 專利相似度矩陣
在進行新穎性矩陣計算之前,需要通過相似性計算來判斷目前是否已有相似的技術出現在相關的專利中,而余弦相似度在不同的語料庫中具有很好的性能。因此,本文采用余弦相似度來進行專利相似度計算。專利相似度矩陣的構建包括相似度計算和矩陣建立。具體流程如下。
(1)專利相似度計算。
①采用Python對專利數據進行預處理,以專利公開時間為排序,得到基于時間序列的專利數據集。
②采用調頻-逆文檔頻率(term frequency-inverse document frequency,TF-IDF)[10]算法找出每篇專利的關鍵詞,以構建專利的關鍵詞矩陣集。
③分別構建每篇專利各自的詞頻向量,以計算文字向量間的相似度。專利相似度的值處于0~1之間。值越大,表明兩兩專利的相似性越高。
假設一個n維空間中的兩個數據點分別為X=(x1,x2,…,xn)和Y=(y1,y2,…,yn),則X和Y的余弦相似度計算式為:
(1)
式中:S(X,Y)為X和Y這兩個數據點的相似度;xi和yi分別為這兩個數據點內的關鍵詞,i為專利編號。
(2)處理后得到的專利文本數據集與TF-IDF模型和余弦相似度相結合,可以建立專利文本的相似度矩陣。專利相似度矩陣構建的主要過程如下。
①使用TF-IDF算法對經過預處理的專利文本數據集進行關鍵詞計算,提取每條專利文本數據的關鍵詞列表P={w1,w2,…,wn}。通過專利文檔中各關鍵詞的TF-IDF值,可以構建一個行為專利文檔數并將其列為關鍵詞共現矩陣Dp={P1,P2,…,Pn}。
②采用詞向量模型,對每條專利文本P={w1,w2,…,wn}進行處理,并根據處理后的詞序構建每條專利文本的詞向量Vp={v1,v2,…,vn}。所有專利文本向量構成專利文本向量集Dv={v′1,v′2,…,v′n}。
③根據余弦相似度計算式,計算專利文本向量集中兩兩向量之間的相似度S(Vi,Vj)。
④根據余弦相似度的計算結果建立n×n維的專利文本相似度矩陣Ds=(dij)i,j=1,2,…,n。相似度矩陣中的每個元素d(i,j)為兩兩矩陣的相似度計算值。
(2)
構建的n×n維專利文本相似度矩陣形式為:
(3)
1.2.2 專利新穎度矩陣
通過對兩個專利集合中的發明技術的相似度計算,可間接獲得專利新穎度矩陣[11]。一項專利與先前專利的最大相似性可看作是“舊”。新穎性指一項專利在最大相似性方面與之前專利不相似的特有部分。
本文在計算專利文本相似度后,通過從一個專利中減去該專利與其他已公開專利之間的最大相似性,來計算該專利在出版時與先前出版專利不相似的特有部分的比例,即專利文本公開時的新穎性。因此,專利新穎性在公開時的計算式為:
Npub=1-M
(4)
式中:Npub為專利在公開時的新穎性;M為Pn在Pi之前公開的專利相似度的最大值,n
將n個專利文本間的新穎性系數按時間序列排列,則所構建的n×n維專利文本新穎性矩陣DNOV為:
(5)
1.2.3 專利演化矩陣
本小節計算專利新穎性隨時間的演化過程。由于專利新穎性是隨著時間演變的,因此本小節在專利相似度矩陣(3)和專利新穎性矩陣(5)的基礎上,以專利公開年份為時間切片,對專利技術的新穎性演化情況進行分析。專利Pi在年份y的新穎性N(i,y)為:
(6)
若專利Pi在y時并未公開發表,則N(i,y)計算結果為空值。
對每個專利N(i,y)以公開年份為時間序列進行排序整合,可構建專利文本新穎性演化矩陣DNOV(pi,yn):
(7)
顛覆性技術判別指標體系的建立是本文研究顛覆性技術的重要任務。合理、有效的指標體系不僅有利于獲得高效的評價結果,也對探究顛覆性技術發展的本質有著重要影響。本文從專利演化角度和顛覆性技術的特征對顛覆性技術進行識別和度量。相對于其他技術,顛覆性技術具有新穎性高、發展勢頭強勁且影響力大的特點。因此,根據顛覆性技術的特征,本文以激進的新穎性、相對快速的增長性和突出的影響性[12]為識別指標,實現對相關技術的有效識別與判斷。本文建立的顛覆性技術判別指標體系如表1所示。

表1 顛覆性技術判別指標體系
表1中,對識別體系內激進的新穎性、相對快速的增長性和突出的影響性所提出的針對性的判別標準如下。
①顛覆性技術激進的新穎性。從時間維度上看,一項技術出現的早期階段應該是新穎的。在顛覆性過程中,新穎性和增長性在前期表現突出,隨時間的增長而減弱。本文采用專利在公開時具有高新穎性,并且在發展過程中發生新穎性演化來表征顛覆性技術激進的新穎性。因此,本文將描述專利的新穎性定義為:若Npub小于0.5,則新穎性弱;若Npub處于0.5~0.8,則新穎性適中;若Npub大于0.8,則新穎性強。
②顛覆性技術相對快速的增長性。相對快速的增長性由相似技術年均增長來表征。相對快速的增長性是與相同領域中其他技術相比時,顛覆性技術的發展速度往往更快。本文通過構建的專利相似度矩陣,識別出專利自公開后每年的相似技術專利數,以相似技術的年均增長來表示顛覆性技術的增長性。年均增長越大,說明顛覆性技術相對于其他技術發展速度越快。
③顛覆性技術突出的影響性。突出的影響性由專利被引頻次來表征。專利的被引頻次越高,表示受其影響的后續技術越多,則專利涵蓋的技術就越重要。本文采用專利占公開年份內所有專利被引頻次的前10%來表征顛覆性技術突出的影響性。
電力通信領域授權發明專利的年度分布如圖2所示。

圖2 電力通信領域授權發明專利的年度分布
本文從中國知網專利數據庫與電力系統有關的專利中提取電力通信領域的相關專利。本文檢索截至2022年11月1日的相關發明專利和實用新型專利,并對獲取的數據按照公開年份進行排序。
經過預處理后得到的電力通信領域的專利文本數據集,首先利用TF-IDF算法提取專利文檔中的關鍵詞,構建一個行為文檔數,并將其列為關鍵字數的專利關鍵詞共現矩陣,以生成專利文本的詞頻向量;接著結合余弦相似度,計算出兩兩專利的相似度;最后得到專利文本相似度對稱矩陣(381×381)。專利相似度矩陣結果示例(部分)如表2所示。

表2 專利相似度矩陣結果示例(部分)
表2中的計算結果表示每個專利間的相似度值。專利相似度處于0~1之間。值越大,表明兩兩專利相似度越高。
在本文中,專利新穎性由專利相似性轉化而來,如式(4)所示。在計算專利文本相似度后,通過從一個專利中減去該專利與其他已出版專利之間的最大相似性,來計算該專利在出版時與先前出版專利不相似的特有部分的比例,即專利文本公開時的新穎性。為了研究專利在公開發表后的新穎性變化過程,可以將專利數據集中每個專利的公開日期看作一個時間點,并通過新穎性計算式得到電力通信領域專利文本的新穎性矩陣。專利新穎性矩陣結果示例(部分)如表3所示。

表3 專利新穎性矩陣結果示例(部分)
表3中的計算結果表示每個專利間的新穎值。
為了客觀呈現顛覆性技術領域專利新穎性的演化,本文利用基于時間切片的專利相似矩陣,以專利公開年份為時間切片,計算從公開年開始專利逐年的新穎性變化,以構建專利演化矩陣。專利演化矩陣結果示例(部分)如表4所示。

表4 專利演化矩陣結果示例(部分)
表4中,計算結果表示每個專利間的新穎值。通過計算可得Npub={1,1,0.806,0.84,1,0.164,…,1}。Npub表示專利在公開時的新穎性。Npub中的元素與專利號相對應。從表4中可以看到每項專利自公開年的新穎性演變趨勢。大部分專利在公開時具有高新穎性。例如專利1在2002年新穎值為1,隨著時間演變,該專利在2022年新穎值降為0.897。其主要原因在于,隨著時間的發展,相關熱點研究領域會出現相同或相似的發明專利,使原有專利的新穎性降低。
根據第1節、第2節基于顛覆性技術特征與屬性構建的顛覆性技術識別指標體系以及相關專利的被引頻次排序,可以得到電力通信技術領域的相關專利指標。電力通信領域專利相關指標值(部分)如表5所示。

表5 電力通信領域專利相關指標值(部分)
根據表5可以得出以下結論。
①從激進的新穎性角度來看,電力通信領域367號(CN115314270A)專利技術發表于2022年,在公開發表時具有高新穎性(新穎值為0.973)。這項技術在公開發表時屬于高新穎性專利技術,并且在發展過程中技術新穎性呈降低趨勢。其具有良好的發展潛力,與電力通信領域其他技術相比具有激進的新穎性。
②從相對快速的增長性來看,電力通信領域367號(CN115314270A)專利技術的相似技術年均增長為14,且在剛發布后較短的時間內便有較多相似的專利。這說明該專利所涉及的技術處于快速增長的狀態。這項技術與其他技術相比增長速度更快、發展勢頭更強勁,與電力通信領域其他技術相比更具相對快速的增長性。
③從突出的影響性來看,電力通信領域367號(CN115314270A)專利技術的被引頻次在電力通信領域排前10%。在發表后短時間里,這項技術得到了該領域技術專利的高度引用,可以看出這項技術具有突出的影響性。
根據本文構建的顛覆性技術的識別指標體系,電力通信領域367號(CN115314270A)專利技術與其他技術相比,在顛覆性技術的新穎性、增長性以及影響性這三個判別指標都表現十分良好,呈現出明顯的顛覆性技術特征。因此,根據本文構建的識別指標體系,判定這項專利技術為電力通信領域的顛覆性技術,并通過專利號檢索出這項專利技術為基于量子密鑰的電力業務分級加密方法及通信方法。此專利主要將量子技術應用于電力通信領域,在保障數據安全的前提下提高加密效率和量子密鑰的使用效率,從而提高電力業務通信效率、確保電力業務可以安全順暢地執行,并降低電力業務通信成本。
3.1節通過專利演化分析方法,識別出量子技術為電力通信領域的顛覆性技術之一。量子技術在保障數據安全的前提下,不僅可以提高電力業務通信效率、確保電力業務可以安全、順暢地執行,而且大幅降低了電力業務通信成本。隨著量子科學在量子計算、量子通信、量子網絡、量子仿真等領域不斷實現新突破,量子技術革命受到越來越多的關注。量子技術催生的技術變革和裝備發展不斷改變世界面貌,逐步成為經濟社會跨越發展的基石和動力,為信息化社會的發展提供基礎的安全服務和可靠的安全保障。
本文提出基于專利演化分析的顛覆性技術識別方法,并以電力通信領域為例進行研究分析。結合顛覆性技術的判別指標體系,本文完成了以下工作:①實現了對電力通信領域中顛覆性技術的有效識別;②對上述顛覆性技術的未來發展進行分析,從而實現對關鍵技術的重點把握,進而更快完成產業轉型升級。但本文還存在一些不足之處。后續工作將會對專利相似度計算過程進行優化,從而構建更加全面、多維度的識別指標,以進一步完善顛覆性技術識別體系。