趙婷婷
(南京航空航天大學 圖書館,江蘇 南京 210016)
2021年9月22日,中共中央、國務院印發了《知識產權強國建設綱要(2021—2035年)》,對我國未來15年知識產權發展前景提出了總目標、描繪了新景象,知識產權作為國家發展戰略性資源和國際競爭力核心要素的作用更加凸顯。專利作為知識產權最重要的組成部分,是衡量一個國家、地區技術創新能力和經濟競爭實力的重要情報源,如何對其進行高效、準確地獲取、分析,輔助政府部門、科研機構、高新企業進行專利戰略決策、指導技術研發和分析市場態勢布局,是情報機構開展情報分析的重要發展方向。專利情報的檢索和分析離不開專利信息系統的支持,當前國內外專利信息系統種類眾多、功能各異,了解各專利系統的功能,選擇適合的系統,是開展專利情報工作的前提。
為了解我國關于專利信息系統的研究現狀,筆者以主題為“專利”“系統”“比較”在中國知網上進行檢索(截至2023年3月),獲得2010—2023年相關論文共計12篇,其中有7篇均未提及Innovation、PatentSight和incoPat專利信息系統[1-7],其余的5篇中,劉玉琴等[8]從數據處理、文本挖掘與可視化分析等角度對包括 Innovation在內的26種國內外專利分析工具進行了對比研究;康婧等[9]從專利檢索、專利分析和專利評估對包括Innovation和incoPat在內的5個專利信息系統進行功能比較;王玉婷等[10]從專利數據收錄范圍、加工方式、清洗程度以及引文數據、同族數據和法律狀態數據方面對包括Innovation在內的五大專利數據庫進行對比;趙旭等[11]對Innovation在內的四大專利分析軟件的功能進行概述及綜合比較;謝智敏等[12]介紹了incoPat在內的3個專利價值評估工具的評價模型。綜合分析上述文獻可見,已有文獻對一些專利信息系統進行了研究,也有了相關的研究成果。但是,對DI(Derwent Innovation)、PatentSight和incoPat這3個專利系統進行對比分析,特別是對PatentSight系統的相關研究和結論還較少。基于此,本文擬選取Derwent Innovation德溫特創新平臺、PatentSight專利大數據檢索分析平臺和incoPat科技創新情報平臺三大專利信息系統,從宏觀和微觀兩個維度進行對比研究,為國內專利情報研究人員選擇專利信息系統提供更多參考,同時給系統研發人員提出功能完善建議。
1.1.1 Derwent Innovation德溫特創新平臺
Derwent Innovation德溫特創新平臺,簡稱DI,是科睿唯安(Clarivate Analytics)公司提供的專利檢索和分析工具,收錄來自全球156個國家和地區超過11 000萬件標準化專利數據,75個國家/地區的專利全文數據,以及德溫特世界專利索引(DWPI)、德溫特專利引文索引(DPCI)等專利信息深加工的數據。
1.1.2 PatentSight專利大數據檢索分析平臺
PatentSight專利大數據檢索分析平臺,是LexisNexis(律商聯訊)旗下的新一代專利智能分析平臺,集專利檢索、評價、分析功能于一體,共包含116個國家/地區的專利數據、56個國家/地區的全文數據,配備不同語言(中、日、俄、德、英等)技能的專業團隊對數據進行質量規范和專利權人梳理,同時對各個國家4 000多種法律狀態代碼進行標引注釋,確保專利法律狀態的準確和實時更新。
1.1.3 incoPat科技創新情報平臺
incoPat科技創新情報平臺是北京合享智慧科技有限公司開發的,是將全球發明深度整合并翻譯為中文的專利信息平臺,也是擁有自主知識產權的專利數據庫。incoPat涵蓋了全球162個國家/組織/地區超過1.7億件專利數據,集成了專利檢索、分析、數據下載、文件管理和用戶管理等多個功能模塊。
本文從專利數據覆蓋的時間范圍、地域范圍以及檢索語言來比較3個專利信息系統的收錄范圍(見表1)。

表1 DI、PatentSight、incoPat收錄范圍對比
本文基于專利分析流程,在對3個專利信息系統的功能進行調研后,從檢索功能、專利分析和專利評估3個微觀面對上述系統進行具體對比分析。
專利檢索是根據一項或多項專利特征,從大量專利文獻或專利數據庫中挑選出某一特定要求的專利文獻或信息的過程[13],全面準確的檢索結果是后續各種研究分析、結論獲得的基礎。
2.1.1 檢索方式
目前,各個專利信息系統都提供多樣化的檢索方式。例如,傳統的檢索方式(簡單檢索、表格檢索、指令檢索等)和功能更為強大的智能檢索方式(語義檢索),如表2所示。

表2 DI、PatentSight、incoPat檢索方式對比
圖像檢索是基于專利圖像的文本標引(圖像名稱、尺寸大小、壓縮類型、主題內容)或內容特征(形狀、紋理和顏色等)對其進行檢索[14-15],incoPat使用全局的圖像特點來進行基于內容的圖像檢索。
語義檢索是指使用字詞及組合、文本段落或全文作為檢索詞以檢索相關專利[13],其內涵是一種基于概念及其相關關系的能從語義理解角度分析信息對象和檢索請求的檢索匹配機制,改進了傳統檢索存在的檢索效率低下、缺乏語義推理能力和無法實現智能檢索等方面的不足[16],是專利檢索的發展趨勢。DI和incoPat具備語義檢索功能,DI提供兩種語義檢索方式:Smart Search和Thematic Smart Search。incoPat提供3種語義檢索方式:語義檢索、擴展檢索和AI檢索。
2.1.2 檢索字段
每個專利系統都提供豐富的檢索字段,方便用戶從各種途徑進行檢索。DI提供超過348個檢索字段,除了DI預制的檢索字段,用戶還可以根據自己的需要,對專利進行自定義標引生成檢索字段。PatentSight將各檢索字段按分類進行匯總,可瀏覽選擇檢索字段,也可以通過關鍵詞檢索字段。incoPat 通過全面的數據整合加工,可以檢索340多個字段,并提供字段說明。
專利分析是利用文獻計量學方法,對其所含的各種信息要素進行統計、排序、對比、分析和研究,揭示專利文獻的深層動態特征[17]。本文將專利信息系統的分析功能劃分為統計分析、技術分析和戰略分析。
2.2.1 統計分析
統計分析指用適當的統計分析方法對大量的數據進行分析,提供基于專利數量的統計分析結果,包括專利權人分析、地域分析、趨勢分析、技術構成分析、法律及運行分析、專利組合等。
2.2.2 技術分析
技術分析是對專利信息的具體內容進行分析,以實現對技術領域的歷史、現狀、發展脈絡及未來發展方向等內容的揭示,包括專利家族、權利要求、生命周期、主題演化、引證分析、聚類分析等。
聚類分析是采用數據挖掘中的聚類分析手段對專利數據進行分析[17],DI、PatentSight和incoPat均具備了聚類分析功能(見表3)。

表3 DI、PatentSight、incoPat 聚類分析功能對比
2.2.3 戰略分析
戰略分析是主要是面向企業或整個行業,進行發展態勢和競爭狀況的分析,包括技術路線、專利布局、競爭分析等。幫助企業尋找和分析競爭對手,為行業發展提供情報支持。
表4從統計分析、技術分析和戰略分析方面展示了3個專利信息系統的分析功能。

表4 DI、PatentSight、incoPat 專利分析功能對比
專利評估是對專利價值進行判斷,但是專利作為一種無形資產,無法直接表現出它的價值,需要使用科學的估算方法和模型進行預測[19]。目前,3個專利信息系統均提供專利價值評估功能,實現了對專利的價值評估。表5展示了3個專利信息系統的價值評估功能,通過若干個單一指標和綜合指標進行專利價值評估。

表5 DI、PatentSight、incoPat 價值評估功能對比
主要的單一指標包括:引用和被引用次數、同族專利個數和權利要求項數。權利要求項數用以限定專利保護的范圍[20],一般來說,引用和被引用次數越高,同族專利個數越多,權利要求項數越多,專利價值越高。
綜合指標評估是指結合專利被引數、專利引證數、技術生命周期、技術覆蓋范圍、文獻引證數、說明書頁數、權利要求數、審查時長、專利族數、轉讓次數、發明人數等參數[21],并對參數賦予權重,建立價值評估模型對專利進行打分。
本文從宏觀(概況和收錄范圍)和微觀(專利檢索、專利分析以及專利評估)兩個層面對DI、PatentSight和incoPat這3個專利信息系統進行了對比,在此基礎上,進一步總結其各自的優勢和局限性。
DI擁有深度加工數據,例如德溫特分類標引、人工改寫專利標題和摘要等,便于提升專利檢索結果的全面性和準確性;DI的專利分析功能立足于湯姆森公司的前期專利分析工具Aureka系統,提供引證樹、專利地圖(ThemeScape)等強大的可視化分析功能。
雖然DI的分析功能全面且強大,但不提供專利分析報告,只提供可視化圖表及其解讀。
PatentSight對專利權人進行規范化梳理,專利權人現狀準確性較高;支持外部數據導入分析,可導入文本型和數值型兩種類型的數據,分析數據總量無限制。
雖然PatentSight檢索分析界面功能較多,但是設置復雜,不利于初學者使用;針對技術內容的分析只提供專利家族、主題演化、引證分析和聚類分析,深度技術分析功能有待加強。
incoPat檢索分析界面直觀清晰,支持中英文雙語檢索和瀏覽全球專利,方便中國用戶使用;結合語義算法模型和知識圖譜及人工智能技術,提供3種語義檢索方式,減少了分析人員對專利檢索過程的參與,提高了檢索效率;incoPat還提供了專利家族、權利要求、主題演化、技術功效矩陣等技術分析,這些分析是在基本統計分析的基礎上,對專利信息的進一步挖掘,方便對專利技術情報的把握。
incoPat系統的兼容性不強,僅支持批量輸入申請號、公開號和優先權號進行檢索,不支持外部數據導入。
(1)對專利信息系統用戶而言,可以根據專利系統收錄專利數據的時間范圍、地域范圍等并結合自身需求選擇不同的專利信息系統。例如,DI因其數據收錄相對全面,適用于世界范圍內的專利檢索和分析。對于外語水平不高的用戶,首選incoPat對162個國家/組織/地區專利進行標題、摘要漢化,實現中文檢索全球專利信息。對于初入專利情報領域的研究人員來說,可以選擇DI對專利發明的內容及用途、優勢和技術要點等進行了詳細描述,因此,DI更適合初級用戶閱讀。
(2)如果想獲得全面而準確的檢索結果,需要根據專利信息系統數據處理功能選擇不同系統,例如,要檢索某一技術主題的專利,可以選擇DI,其數據的標引和加工提高了專利檢索的查全查準率。要查找某個專利的最終歸屬,可以選擇PatentSight,專利權人現狀準確性較高。當使用傳統的關鍵詞檢索,如果檢索策略復雜不易構建,那么非常適合采用專利信息系統的智能語義檢索功能,如DI的Smart Search和Thematic Smart Search,incoPat的語義檢索、擴展檢索和AI檢索。
(3)如果要對自有專利數據或其他專利數據庫下載的數據進行分析,可以選擇PatentSight支持外部數據導入。
(1)DI和incoPat都應增強系統的兼容性,未來希望增加外部數據導入分析功能,同時增加這項功能的靈活性,支持多種格式的導入。
(2)各系統都需優化人機交互功能,提升系統的友好性。PatentSight應該研發中文界面,為中國用戶提供更為良好的使用體驗。
綜上,3個專利信息系統在數據收錄范圍、檢索功能、專利分析以及專利評估等方面都存在著明顯的差異。對于專利情報研究人員,掌握信息系統的各項功能,了解各系統的優勢與不足,對其開展專利情報研究工作具有重要的支撐作用。另外,隨著新一代信息技術(人工智能、大數據等)的發展,專利信息系統開發人員應該將更多的新技術應用在專利信息系統功能的拓展上,更好地助力專利情報的挖掘和分析。