符川川 陳國華 袁勤儉
摘?要:[目的/意義]本研究在一定程度上可以減少專利審查員的時間成本和主觀性并提高業務素質,也可以為專利申請者的專利布局提供參考。[方法/過程]本研究在專利質量界定與指標體系構建的基礎上,提出基于機器學習的組合模型用于專利質量的分析與分類預測,并以新興產業的區塊鏈技術專利為例展開研究。該模型由自組織映射、核主成分分析以及支持向量機3種方法組成,其實現過程包括兩階段。第一階段通過自組織映射(SOM)對從國家知識產權局專利數據庫收集的21?496項區塊鏈技術專利數據進行分析并界定專利質量類別;第二階段,通過核主成分分析(KPCA)對專利數據進行降維降噪處理,經過處理的專利數據再由支持向量機(SVM)得出分類結果。[結果/結論]在對區塊鏈技術專利質量分類模型進行訓練后,基于3?306項區塊鏈專利歷史數據來驗證訓練模型的性能,實驗結果的匹配度達到87.26%。因此,本研究提出的組合模型能夠有效地對專利質量進行分類與預測。
關鍵詞:專利質量;機器學習;區塊鏈;專利質量分析;分類預測
DOI:10.3969/j.issn.1008-0821.2021.07.011
〔中圖分類號〕G255.53?〔文獻標識碼〕A?〔文章編號〕1008-0821(2021)07-0110-11
Research?on?Patent?Quality?Analysis?and?Classification
Forecast?Based?on?Machine?Learning
——Taking?Blockchain?as?an?Example
Fu?Chuanchuan1?Chen?Guohua2*?Yuan?Qinjian1
(1.School?of?Information?Management,Nanjing?University,Nanjing?210023,China;
2.School?of?Engineering?Management,Nanjing?University,Nanjing?210029,China)
Abstract:[Purpose/Significance]This?research,to?a?certain?extent,could?reduce?the?time?cost?and?subjectivity?of?patent?examiners?and?improve?their?professional?quality.It?would?also?provide?reference?for?patent?applicants?patent?layout.[Method/Process]This?research?defined?the?meaning?of?patent?quality?and?constructed?a?patent?quality?indicator?system.It?proposed?a?combination?model?based?on?machine?learning?for?the?analysis?and?classification?prediction?of?patent?quality,and?took?blockchain?patents?in?emerging?industries?as?an?example?to?conduct?the?research.The?model?was?composed?of?three?methods:self-organizing?map,kernel?principal?component?analysis?and?support?vector?machine.Its?realization?process?included?two?stages.At?first?stage,self-organizing?map(SOM)was?employed?to?analyze?the?collected?21496?blockchain?patent?data?from?the?patent?database?of?the?State?Intellectual?Property?Office?and?define?the?patent?quality?category;at?second?stage,dimension?reduction?and?noise?reduction?processing?on?patent?data?were?performed?through?kernel?principal?component?analysis(KPCA),the?processed?patent?data?was?then?classified?by?the?support?vector?machine(SVM).[Result/Conclusion]After?training?the?blockchain?patent?quality?classification?model,historical?data?of?3306?blockchain?patents?was?used?to?verify?the?performance?of?the?training?model?and?the?matching?degree?of?the?experimental?results?reached?87.26%.Therefore,the?combined?model?proposed?in?this?research?can?effectively?classify?and?predict?patent?quality.
Key?words:patent?quality?index?system;machine?learning;blockchain;patent?quality?analysis;classification?prediction
日趨激烈的國際競爭大部分圍繞著科技展開,科技能反映一個國家的創新能力,而專利是科技創新能力的集中體現。專利中蘊含著豐富的技術、法律和經濟信息,能引領國家的創新發展。自2018年開始的中美貿易爭端多在專利領域角逐,尤其高科技企業華為屢屢遭美國打壓,究其原因就是華為擁有許多核心專利,美國繞不開華為高質量的核心專利的布局。專利已經成為我國的高科技企業提高核心競爭力的利器,我國采取一系列激勵性政策鼓勵專利的申請,逐漸超越占據申請量前3的美、德、日,一躍成為世界第一專利大國并逐漸產生國際影響[1]。然而,在數量激增的背后,我國的專利質量還有待提高。低質量的專利會阻礙科技進步,浪費申請、審查、授權的人力、物力和財力。專利競賽理論[2]認為,專利質量比專利數量更重要,高質量的專利能產生較大的經濟和法律價值。因此,專利質量的提升是我國從專利大國邁向專利強國的必經之路。提高專利質量的重要前提是明確什么樣的專利是高質量專利以及對已經申請的海量專利的質量分類進行初步研判。為此,本研究在專利質量的內涵界定與特征刻畫的基礎上,以新興產業的區塊鏈技術為例,運用機器學習方法對專利質量進行分析與分類預測。
學界關于專利質量沒有統一的內涵,現有研究主要從3個視角闡述專利質量:基于專利審查員審查的專利質量;基于專利申請者申請的專利質量;基于專利使用者獲得許可或者轉讓的專利質量。基于專利審查員審查的專利質量取決于專利審查員的業務素質[3],本身具備較強專業背景的審查員能進行完整而全面的檢索,且審查過程把關嚴格則授權后的專利質量高。基于申請者申請的專利質量與技術本身高度相關[4],該視角的專利質量較能反映專利質量的內在本質并且能增強風險共擔者的信心。基于使用者獲得許可或者轉讓的專利質量從使用者使用專利以后的競爭力來表征[5],如荷蘭的阿斯麥在獲得一些國家的專利授權后生產的用于制造高精度芯片的光刻機在全球市場具有極強的競爭力,則這些授權的專利質量較高。本研究根據研判專利質量需要考慮專利的時間跨度[6]、專利涉及的產業類型[7]以及可操作性[8]界定專利質量為基于技術本身的專利質量。
1?文獻綜述
國內外基于構建專利質量指標體系刻畫專利質量特征的研究主要以專利范圍、專利引證、專利維持以及其他專利質量指標體系來評估專利質量。
基于專利范圍的專利質量指標體系主要包括技術保護范圍和區域保護范圍,其中,技術保護范圍是專利技術覆蓋的范圍,涉及專利權利要求數量、國際專利分類號個數;區域保護范圍是申請專利的國家和地區,包含專利家族數量、專利優先權、美國專利數量、專利合作條約申請數量。權利要求數量能表征專利質量,權利要求數量越多,專利質量越高[9]。國際專利分類號個數反映專利寬度,其數量越多則技術覆蓋范圍越廣,創新的集成度越高,與專利質量成正相關關系[10]。由此可見,該類指標能表征早期以及后續的專利質量。專利家族數量也叫同族專利數量,由于專利具有區域性,某類專利若想保持競爭力就需要在不同國家和地區申請一系列專利從而形成專利家族,實驗證明專利家族數量與專利質量具有一致性[11]。專利優先權數量[12]、美國專利數量[13]、專利合作條約申請數量[14]均與專利質量具有正相關關系,但是美國專利數量和專利合作條約申請數量指標只測度后續的專利質量,無法測度早期的專利質量。基于此,本研究采用專利權利要求數量、國際專利分類號個數、專利家族數量、專利優先權構建專利質量指標體系。
基于專利引證的專利質量指標體系借鑒文獻計量學指標體系,主要包括引用和被引用專利質量指標。其中,引用指標也叫后向引用[15],反映專利技術對先前技術的依賴程度,包括引用專利文獻和引用科學文獻次數;被引用指標也叫前向引用[16],反映專利技術對后續技術的啟發程度,包括被引用專利文獻和被引用科學文獻次數。后向引用與科學關聯度密切相關,引用次數多則科學關聯度強,專利質量也就越高[17]。前向引用次數多則對后續申請專利影響大,具有較高的技術和經濟價值[18]。前向和后向引用指標均在一定程度上揭示專利質量特征,由于專利從申請到授權至少需要18個月,早期專利如果采用前向引用指標則不能評估專利質量,而后向引用指標適合于早期和后續專利的質量評估。鑒于此,本研究采用后向引用指標來構建專利質量指標體系。
基于專利維持的專利質量指標體系主要包括專利壽命和專利有效率。一般情況下,專利壽命維持越長,專利有效率保持越高,專利質量越高。但是由于專利具有時效性,這些指標只能評估后續專利質量,無法表征早期專利質量。
其他專利質量指標主要包括代理人數量[19]、申請人數量[20]、發明人數量[21]、說明書頁數[22]、技術循環周期[23]、訴訟次數[24]等。代理人數量、申請人數量、發明人數量、說明書頁數越多,則專利技術的復雜度越高,創造性越強,需要團隊來完成申請工作,往往授權后的專利質量也就越高。訴訟次數反映專利授權后的法律活躍度,訴訟次數多的專利屬于重點專利,其法律、技術和經濟價值也就越高。專利技術循環周期反映專利借鑒專利文獻的平均年齡,能體現專利技術更新速度,專利技術循環周期越短,專利的競爭力越強,其質量越高。代理人數量、申請人數量、發明人數量、說明書頁數、技術循環周期均適合早期和后續的專利質量評估,訴訟次數適于后續的專利質量評估。因此,本研究采用代理人數量、申請人數量、發明人數量、說明書頁數、技術循環周期構建專利質量指標體系。
綜上所述,可以從專利引證、專利范圍以及其他指標構建專利質量指標體系,這些指標體系又包括單指標和多指標并在一定程度上能表征專利質量[25]。一些學者基于專利質量指標體系運用不同方法對專利質量進行評估,這些方法主要集中在傳統的統計學[26]、文獻計量學[27]、專家打分[28]等方面,也有部分方法關注機器學習[29-30]方面。當處理海量專利質量信息時,傳統方法帶有一定的主觀性,人工成本高,效率和精度會打折扣并且需要一些先驗性理論。由于資源限制,其可操作性有時也會受到一定制約,如只能獲取一些后續專利質量指標數據進行事后評估而不能進行事前預估。部分研究運用機器學習單一模型方法[31]對專利質量進行評估研究,其指標選取的層次劃分清晰度和實驗結果精度有進一步提高的空間。基于此,本研究以新興產業的區塊鏈技術為例,根據專利質量指標選取的科學性、易操作性原則篩選出屬于專利引證、專利范圍以及其他指標體系的專利權利要求數量、國際專利分類號個數、專利家族數量、專利優先權、引用專利文獻次數、引用科學文獻數量、代理人數量、申請人數量、發明人數量、說明書頁數、技術循環周期質量指標,運用機器學習的組合模型提取出區塊鏈技術專利質量的主要特征并對區塊鏈技術專利質量進行分類預測,以期為專利審查員節省精力、提高效率,并為專利申請者提前進行專利布局提供參考。
2?研究方法
本研究提出一個結合自組織映射(Self-organization?Mapping—SOM)、核主成分分析(Kernal?Principal?Components?Analysis—KPCA)和支持向量機(Support?Vector?Machine—SVM)的區塊鏈技術專利質量自動分類模型。該質量分類模型分兩個階段實現:第一階段是區塊鏈技術專利分析和質量分類的界定,第二階段是區塊鏈技術專利質量分類模型的建立,如圖1所示。在第一階段,本研究從國家知識產權專利數據庫中收集與區塊鏈技術相關的專利數據,然后基于自組織映射將區塊鏈技術專利聚類成幾個質量組,并通過每個質量組的質量指標來界定每一組的質量等級。第二階段,本研究首先基于核主成分分析從區塊鏈技術專利數據集提取主要特征,然后基于支持向量機分類器并利用區塊鏈技術專利質量的非線性特征建立區塊鏈技術專利質量的分類模型,以提高分類效果。最后,本研究預測區塊鏈技術專利質量的分類,并評估區塊鏈技術專利質量分類的效果。
2.1?區塊鏈技術專利質量的分析與界定
2.1.1?區塊鏈技術專利數據的收集和區塊鏈技術專利質量特征的處理
從國家知識產權局獲得區塊鏈技術專利數據,國家知識產權局提供區塊鏈技術專利的相關信息,包括分類號、說明書、著錄項目和摘要等。本研究的區塊鏈技術專利質量特征使用最小—最大法進行標準化處理。
2.1.2?基于自組織映射的區塊鏈技術專利質量分析
相較于K-means算法,自組織映射接近人腦自組織特性。該算法在聚類過程中引入競爭鄰域,通過某個神經元及鄰近神經元的競爭關系來動態調整權重,經過若干次調整得到聚類結果。該算法相對歐式距離作為聚類判定有一定程度的改進,因此本研究選取該聚類算法。本研究使用自組織映射對區塊鏈技術專利質量進行分析和分類的界定以區分不同的質量組。該自組織映射神經網絡結構由輸入層和輸出層組成,其中輸入層神經元個數設置為11,輸出層神經元個數為9,初始學習率為0.8,迭代次數為1?000。
本研究按照以下步驟使用自組織映射將各類區塊鏈技術專利質量進行分組:
第一步:初始化類神經網絡,并隨機為鏈接值賦予權重。
第二步:將各項區塊鏈專利質量的特征作為輸入變量,并記錄每項數據與其他項數據的鄰近關系。接著通過歐幾里得距離計算各特征向量與各神經元的鏈接權重,所得最短距離的神經元稱為優勝神經元。
第三步:以優勝神經元為中心,調整優勝神經元及鄰近神經區域的權重鏈接向量。
第四步:反復進行第二步和第三步,直到滿足設定的收斂條件,完成所有質量的分組。根據每項區塊鏈專利數據的專利質量指標,將具有相似質量指標的專利分組在一起。
2.2?預測區塊鏈技術專利質量的分類
2.2.1?核主成分分析萃取區塊鏈技術專利質量特征
核主成分分析可以過濾區塊鏈技術專利數據噪聲、降低數據維數,有助于提高分類模型的預測準確率并減少運算時間。將所有區塊鏈技術專利數據依據公開年份分為訓練數據和測試數據,并對訓練數據集中的區塊鏈技術專利質量特征進行核主成分分析,提取出區塊鏈技術專利質量的特征值。
本研究首先利用核函數將原始數據映射至高維的特征空間中,將具有11個維度的區塊鏈專利質量特征通過核函數進行轉換,并計算該核函數的核矩陣,接著找出特征空間中的平均中心點,再將核矩陣去中心化。將去中心化后的核矩陣代入主成分分析公式計算,求解特征值,得到其特征值及對應的特征向量。通過區塊鏈專利特征數據的平均中心萃取出非線性關系的主成分并得到新的特征向量以及區塊鏈專利質量的主要的特征值。
2.2.2?預測區塊鏈技術專利質量的分類
訓練支持向量機的輸入變量為經過核主成分分析得到的區塊鏈專利質量特征。首先使用核函數將測試數據轉換至高維度的向量空間,并在訓練過程中利用支持向量與邊界找尋最佳的線性超平面。
使用區塊鏈技術專利訓練數據建立非線性支持向量機分類模型時,若將區塊鏈專利訓練數據分到不合適的質量組,會影響分類模型的效果。因此需適當地選擇超平面與目標函數并建立分類模型。
建立預測區塊鏈技術專利質量分類的模型后,從區塊鏈專利訓練數據集中抽取一部分測試的區塊鏈專利數據進行區塊鏈專利質量的分類。采用從訓練數據中所取得的核函數、特征向量在非線性的區塊鏈技術專利質量特征空間中進行區塊鏈技術專利質量的轉換并萃取主要特征。
2.2.3?區塊鏈技術專利質量分類效果評價
為評價區塊鏈技術專利質量分類效果,用混淆矩陣記錄區塊鏈技術專利質量的分類情況。表1中,混淆矩陣的4個主要元素用于表征測試集的區塊鏈技術專利質量分類情況,其中真正向(True?Positive-TP)表示屬于類別k所有的區塊鏈技術專利,被正確分類到該類別的區塊鏈技術專利數量;真負向(True?Negative-TN)表示屬于非類別k所有的區塊鏈技術專利,被正確分類到非類別k的區塊鏈技術專利數量;偽正向(False?Positive-FP)表示屬于非類別k所有的區塊鏈技術專利,被錯誤分類到類別k的區塊鏈技術專利數量;偽負向(False?Negative-FN)表示屬于類別k所有的區塊鏈技術專利,被錯誤分類到非類別k的區塊鏈技術專利數量。
3?實驗結果
本研究設計一系列測試來評估提出的自組織映射—核主成分分析—支持向量機(SOM-KPCA-SVM)組合模型。本實驗有3組參數,一是時間尺度上有5年、10年、20年3個不同時期的區塊鏈技術專利數據集;二是區塊鏈技術專利質量組的數量有3種,即3個質量組、5個質量組和7個質量組;最后,特征提取的數目有4個百分點,分別是40%、60%、80%和100%。
3.1?區塊鏈技術專利數據集與統計分析
本研究從國家知識產權局收集時間跨度從2001—2020年的21?496項中國區塊鏈技術專利數據。圖2的統計數據顯示2001—2020年與中國區塊鏈技術相關的年度申請專利,從統計圖可以看出近年來中國區塊鏈專利數量增長迅速,之所以到2020年出現下滑是因為統計的是2020年的前幾個月,但比2019年同時期的要多。截至2020年7月9日,中國共有33個省級行政區申請區塊鏈專利,其中廣東、北京、浙江、上海、江蘇、山東、四川、福建、湖北、陜西、安徽、重慶、湖南、河南、天津占據全部區塊鏈技術專利申請量90%以上,而這些省級行政區大多位于長三角、珠三角、京津冀三大經濟帶上,這也間接反映經濟發達區的區塊鏈技術專利申請量較大。根據前文梳理的專利質量指標體系,篩選出表征區塊鏈技術專利質量的11個特征,如表2所示,專利組的質量分數由這11個特征經式(4)計算所得。這些特征作為自組織映射的輸入變量,將區塊鏈技術專利質量聚類到不同的質量組中。
3.2?區塊鏈技術專利質量分析結果
專利質量類別。其中,區塊鏈技術專利數量是影響區塊鏈技術專利質量分組數量的一個重要因素。為對區塊鏈技術專利質量進行適當的聚類,本研究設計不同的質量組,即3個質量組(3QG)、5個質量組(5QG)和7個質量組(7QG)。此外,本研究還對每組區塊鏈技術專利進行探究,并檢查每個專利的質量指標,以確保分類的一致性。表3顯示3個不同的區塊鏈技術專利質量組的分類情況,其中3個質量組短期(ST)數據分析的最低質量分數為0.0799,屬于低質量組(G1);中等質量分數為0.5580,屬于分類的中等質量組(G2);最大質量分數為1.1545,因此屬于優質組(G3)。由上述分析可知,所有G1組均為劣質專利,且在不同時期的平均質量最低。所有G3在3QG、G5在5QG以及G7在7QG是最高的區塊鏈專利質量組。本研究分別在短期(ST)、中期(MT)和長期(LT)3個數據集劃分訓練數據集和測試數據集,所有不同年份的數據都使用2018—2020年區塊鏈技術專利數據作為測試數據來驗證模型效果。訓練數據的年度范圍各不相同,短期數據集的訓練數據范圍為2013—2017年,中期數據集的訓練數據集為2008—2017年,長期數據集的年度訓練數據范圍為2001—2017年。在訓練數據集中,以區塊鏈技術專利的質量特征作為輸入變量訓練區塊鏈技術專利質量分類器,然后通過測試數據進行區塊鏈技術專利質量分類預測。表4闡明訓練集和測試集的區塊鏈技術專利數量分布情況,其中包括3個不同組的區塊鏈技術質量分類指標值差異與3個不同年份范圍的數據。
在模型效果評估階段,使用不同類型的核函數提取出不同的區塊鏈技術專利質量特征會影響區塊鏈專利質量預測的效果。本研究采用3種方法,即:①用于核主成分分析的高斯核函數(Gauss);②用于核主成分分析的多項式核函數(Poly);③非核主成分分析(Non-KPCA)建立支持向量機的分類模型并評估不同的區塊鏈技術專利質量特征提取方法的效果。高斯核函數(Gauss)和多項式核函數(Poly)提取不同比例的主要成分并進一步觀察不同比例的主要成分對效果的影響。表5比較高斯核函數和多項式核函數對3個不同年度數據集的可解釋性。當高斯核函數取前40%的主成分時,3個數據集的專利質量特征解釋率分別為52.16%、54.23%和48.72%;采用前80%的主成分時,解釋率分別高達92.45%、95.01%和92.21%。當多項式核函數取40%的主成分時,解釋量分別達到90.17%、93.26%和91.82%;當主成分占80%時,各數據集的解釋率達到92%以上。從這一結果可以判斷,利用多項式核函數分析核主成分可以有效地降低區塊鏈技術專利質量特征的維數。
基于上述分析,本研究驗證自組織映射—核主成分分析—支持向量機(SOM-KPCA-SVM)的效果,并評估選取40%、60%、80%、100%的主成分的效果,以混淆矩陣計算各組區塊鏈技術專利質量每個類別的準確率(AC)、精度(PR)、召回率(RE),此處表示各區塊鏈專利質量組的平均準確率、平均精度與平均召回率。表6為自組織映射—核主成分分析—支持向量機(SOM-KPCA-SVM)采用高斯核函數(Gauss)萃取區塊鏈專利特征的分類效果,在短期數據集中取前80%的主成分時具有較高的準確率;中期取60%或取80%的主成分時能有較高的準確率;長期則需取前60%的主成分可得到較高的準確率。由該表可得知,不同區塊鏈專利質量組在短期均具有較高的準確率,接著是中期,最后是長期,可見數據量過多會影響分類的準確性,若分組過多即聚類數目大,其準確率會下降。
4?研究結論
本研究在界定專利質量含義并構建專利質量指標體系基礎上,以新興產業的區塊鏈技術專利為例,運用機器學習的組合模型進行專利質量分析和分類預測,對學術界和產業界客觀評價當前區塊鏈技術專利質量和捕捉潛在專利價值信息具有一定參考價值。對區塊鏈技術專利質量的分析與分類預測研究有以下結論:
影響分析的合理性。當采用3組進行聚類時,這些組在區塊鏈技術專利質量上的相似度太高,因此組之間的差異小;采用7組聚類時又產生由于分組較多導致的對比混亂問題;分5組聚類時,各組內區塊鏈技術專利質量較為接近,并且不同的區塊鏈技術專利質量組間差異明顯。
2)非線性特征變換能提高分類性能。在非線性特征變換中,多項式核函數的準確率、精度和召回率高于高斯核函數。
3)不同核函數提取的不同的主要專利質量特征會影響實驗的精度。
4)本研究提出的專利質量分類模型相較于之前單一機器學習模型能在缺少事后(專利授權后)指標的情況下判定早期(新申請)的專利質量類型。因此,本研究可能會幫助專利申請者提前進行專利布局。此外,本研究的自動專利質量分析和分類盡可能減少專利審查員的人工處理時間并提高部分專利申請者對市場趨勢的反應靈敏度。
本研究提出基于機器學習的專利質量分析和分類預測的自組織映射—核主成分分析—支持向量機(SOM-KPCA-SVM)模型。一方面,自組織映射可以區分不同區塊鏈技術專利質量組間的質量指標差異,具有一定的統計學意義;另一方面,核主成分分析有效地改變區塊鏈技術專利文獻的非線性特征空間以提高分類效果。此外,支持向量機建立一個有效的區塊鏈技術專利質量問題分類模型,該模型可以在短時間內確定區塊鏈技術專利質量類別并提高分析效率。綜上所述,本研究使用區塊鏈技術專利的21?496項專利數據集并結合11個專利質量特征來訓練自組織映射—核主成分分析—支持向量機(SOM-KPCA-SVM)模型,最后使用3?306項區塊鏈技術專利歷史數據來測試模型。該實驗在區塊鏈技術專利質量分類預測中的準確率達87.26%,表明通過增加區塊鏈專利質量評估的其他標準和因素,可以進一步完善區塊鏈技術專利質量分類預測的方法。本研究在一定程度上幫助專利審查員提高業務素質,協助專利申請者提前進行專利布局并啟發未來的專利使用者產品研發的方向。本研究未來可以在專利質量指標的選取以及模型的優化上進行深度探索。
參考文獻
[1]閔超,步一,孫建軍.基于專利大數據的中國國際專利技術流動分析[J].圖書與情報,2017,(5):33-39.
[2]Schankerman?M,Pakes?A.Estimates?of?the?Value?of?Patent?Rights?in?European?Countries?During?the?Post-1950?Period[J].Social?Science?Electronic?Publishing,1986,96(384):1052-1076.
[3]Alcácer?J,Gittelman?M,Sampat?B.Applicant?and?Examiner?Citations?in?US?Patents:An?Overview?and?Analysis[J].Research?Policy,2008,38(2):415-427.
[4]Hirschey?M,Richardson?V?J.Are?Scientific?Indicators?of?Patent?Quality?Useful?to?Investors?[J].Journal?of?Empirical?Finance,2003,11(1):91-107.
[5]朱雪忠,萬小麗.競爭力視角下的專利質量界定[J].知識產權,2009,19(4):7-14.
[6]Putnam?J?D.The?Value?of?International?Patent?Rights[D].PhD?Thesis.Yale?University,1996.
[7]張克群,牛悾悾,夏偉偉.高被引專利質量的影響因素分析——以LED產業為例[J].情報雜志,2018,37(2):81-87.
[8]吳菲菲,米蘭,黃魯成.關于標準必要專利與高質量專利關系的研究[J].科學學與科學技術管理,2018,39(9):89-102.
[9]陳海秋,韓立巖.專利質量表征及其有效性:中國機械工具類專利案例研究[J].科研管理,2013,34(5):93-101.
[10]Lerner?J.The?Importance?of?Patent?Scope:An?Empirical?Analysis[J].The?RAND?Journal?of?Economics,1994,25(2):319-333.
[11]Gay?C,Bas?C?L.Uses?Without?Too?Many?Abuses?of?Patent?Citations?or?the?Simple?Economics?of?Patent?Citations?as?a?Measure?of?Value?and?Flows?of?Knowledge[J].Economics?of?Innovation?and?New?Technology,2005,14(5):333-338.
[12]劉夏,黃燦.專利審查的誤差檢測及影響因素分析[J].科學學研究,2019,37(7):1183-1192.
[13]馬廷燦,李桂菊,姜山,等.專利質量評價指標及其在專利計量中的應用[J].圖書情報工作,2012,56(24):89-95.
[14]歐陽雪宇,何杰,馬秋娟,等.醫藥領域專利合作條約申請現狀及策略[J].中國藥學雜志,2014,49(14):1274-1280.
[15]Yoshikane?F,Suzuki?Y,Tsuji?K.Analysis?of?the?Relationship?Between?Citation?Frequency?of?Patents?and?Diversity?of?Their?Backward?Citations?for?Japanese?Patents[J].Scientometrics,2012,92(3):721-733.
[16]Lee?J,Sohn?S?Y.What?Makes?the?First?Forward?Citation?of?a?Patent?Occur?Earlier?[J].Scientometrics,2017,113(1):279-298.
[17]Narin?F,Noma?E,Perry?R.Patents?as?Indicators?of?Corporate?Technological?Strength[J].Research?Policy,1987,16(2):143-155.
[18]Rogers?M,Bethel?A,Briscoe?S.Resources?for?Forwards?Citation?Searching?for?Implementation?Studies?in?Dementia?Care:A?Case?Study?Comparing?Web?of?Science?and?Scopus[J].Research?Synthesis?Methods,2020,11(3):379-386.
[19]谷麗,閻慰椿,丁堃.專利質量視角的專利代理人勝任特征模型研究[J].科研管理,2018,39(12):179-188.
[20]喬亞麗,汪雪鋒,侯雨佳,等.基于技術多樣性的專利申請人與審查員的引證行為差異[J].北京理工大學學報:社會科學版,2019,21(1):103-108.
[21]蔣仁愛,張路路,石皓月.專利發明人合作對中國專利質量的影響研究[J].科學學研究,2020,38(7):1215-1226.
[22]谷麗,閻慰椿,丁堃.專利申請質量及其測度指標研究綜述[J].情報雜志,2015,34(5):17-22.
[23]吳菲菲,欒靜靜,黃魯成,等.基于新穎性和領域交叉性的知識前沿性專利識別——以老年福祉技術為例[J].情報雜志,2016,35(5):85-90.
[24]宋河發,穆榮平,陳芳,等.基于中國發明專利數據的專利質量測度研究[J].科研管理,2014,35(11):68-76.
[25]李春燕,石榮.專利質量指標評價探索[J].現代情報,2008,28(2):146-149.
[26]孫玉濤,欒倩.專利質量測度“三階段—兩維度”模型及實證研究——以C9聯盟高校為例[J].科學學與科學技術管理,2016,37(6):23-32.
[27]吳菲菲,張廣安,張輝,等.專利質量綜合評價指數——以我國生物醫藥行業為例[J].科技進步與對策,2014,31(13):124-129.
[28]宋河發,穆榮平,陳芳.專利質量及其測度方法與測度指標體系研究[J].科學學與科學技術管理,2010,31(4):21-27.
[29]楊美妮,沈靜,張建軍.基于機器學習的專利質量評估研究[J].計算機與數字工程,2019,47(7):1743-1747.
[30]劉夏,黃燦,余驍鋒.基于機器學習模型的專利質量預測初探[J].情報學報,2019,38(4):402-410.
[31]冉從敬,宋凱.高校可轉化專利識別模型構建——以人工智能領域為例[EB/OL].http://kns.cnki.net/kcms/detail/11.1762.G3.20200629.0820.002.html,2020-08-10.
[32]周成,魏紅芹.專利價值評估與分類研究——基于自組織映射支持向量機[J].數據分析與知識發現,2019,3(5):117-124.
(責任編輯:郭沫含)