999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

專利技術信息挖掘研究進展*

2018-04-24 06:04:09文庭孝
圖書館 2018年4期

趙 陽 文庭孝

(中南大學信息安全與大數據研究院 長沙 410083)

1 專利技術信息研究

隨著知識經濟和創新驅動的快速發展,作為知識產權核心的專利得到了高度重視。專利是一種集技術、法律和經濟于一體的復合性、綜合性信息資源,其中,技術信息是專利承載和反映的核心內容,是反映最新科技信息的新發明、新創造、新設計。

1.1 專利文獻的技術屬性

專利文獻記載了人類取得的每一個技術進步,是一本活的技術百科全書。專利文獻對技術信息的揭示完整而詳細,主要體現在:申請人必須按照《專利法》在專利申請書中對發明創造做出清楚而完整的說明,且該說明以所屬技術領域的人員能實現為標準。此外,為了滿足專利申請對新穎性、創造性和實用性的審查要求,專利說明書一般都會對發明創造的技術方案進行完整而詳盡的描述,并且參照現有技術指明其發明點所在、具體的實施方式以及有益的效果[1]。專利文獻不僅詳細說明技術內容,同時還會對技術領域的現存技術作簡要介紹,因而專利文獻提供了一個窺探特定技術發展歷程的獨特視角。

1.2 專利技術信息的內涵

專利技術信息是指某一技術領域內發明創造的內容,也是某一特定技術的發展趨勢、技術解決方案、技術分布(領域、地域、主體)和技術主題等。因此,專利技術信息就是指揭示發明創造技術內容的相關信息,包括某一技術領域內新的發明創造、某一特定技術的發展歷史、某一技術的關鍵解決方案、某項發明的技術領域、主題和發明的內容提要等[1]。

專利技術信息分為外部特征信息和內部特征信息。外部特征信息反映在專利文獻扉頁的著錄項目中,如申請日、授權日、發明人、專利權人、地址、國家代碼、國省代碼、專利分類號、分類范疇、檢索領域等;內部特征信息包含在專利文摘、權利要求項和技術說明書中,具體有發明名稱、摘要、關鍵詞、參考文獻、專利權項、技術說明書、附圖等。

1.3 專利技術信息挖掘及其作用

專利技術信息挖掘是指將個別或大量專利中潛在的技術信息,通過加工、組合、統計或數據文本處理的方式從專利文獻中挖掘出來,形成為創新活動服務的情報和知識[2]。專利技術信息挖掘貫穿于創新活動的全過程,通過理解和跟蹤創新流程[3],從技術趨勢、技術分布和核心專利的挖掘入手,了解技術研發的進程,分析技術分布的態勢以及掌握技術發展的趨勢,從而為技術創新活動提供技術監測、競爭情報、技術評價和預測等決策信息,并在企業技術研發、專利布局、侵權維護等戰略部署中發揮著重要作用。

2 基于專利檢索的專利技術信息挖掘研究

2.1 專利檢索類型

專利檢索是根據一項或數項特征,從大量的專利文獻或專利數據庫中挑選符合特定要求的信息的過程。專利檢索有專利技術信息檢索、新穎性檢索、專利法律狀態檢索和同族專利檢索四種基本類型,由此還可以衍生出多種類型。其中專利技術信息檢索和專利技術方案檢索與專利技術信息挖掘密切相關[4]。

專利技術信息檢索是指從任意一個主題對專利文獻進行檢索,其目的是找出相關的參考文獻。專利技術信息檢索的信息特征一般是:主題詞、專利分類號等,有時輔以專利權人、發明人、申請日、授權日等檢索條件。通過專利技術信息檢索可以挖掘出技術領域內相關技術專利,初步了解技術現狀和技術分布[4]。

專利技術方案檢索是針對發明創造的技術方案,對包括專利文獻在內的全世界范圍內的各種公開出版物進行的檢索,目的是要找出可進行新穎性和創造性對比的文件,確定專利技術方案是否具有新穎性和創造性[4]。因此,專利技術方案檢索又被稱為專利新穎性檢索、專利性檢索、專利對比文件檢索。專利技術方案檢索和專利技術信息檢索一樣,都是從技術主題出發進行檢索,但是專利技術方案對檢索精度要求更高。

2.2 專利檢索策略

專利檢索策略是為實現專利信息檢索目標而制定的計劃和方案,包括確定專利信息檢索類型、選定檢索系統、按照特定檢索步驟、構建合理的檢索提問式。專利技術信息檢索通常以IPC分類號、專利名稱、摘要、關鍵詞、權利要求等作為主要檢索入口,選擇適當邏輯運算符和截詞符等制定檢索策略。為了評估藍藻的現有技術及其應用情況,Sekar制定了相應的專利檢索策略在美國的專利商標局專利數據庫(USTPO)中進行專利技術信息檢索[5]。常用的專利檢索大多依賴專家提出的關鍵詞或IPC制定檢索策略,各有其優缺點,因而張晨提出了關鍵詞與分類號相結合的檢索方式,優化專利檢索策略[6]。但基于關鍵詞或IPC的專利檢索不可避免的存在主觀判斷和信息遺漏等缺陷,為此,陳瓊娣提出了基于詞頻分析的清潔技術專利檢索策略[7]。

現有專利檢索系統大多數是基于IPC分類建立的,但無法從創新的角度提供不同領域可借鑒的技術原理。也就是說,IPC是適用于審查的分類系統,而不是便于技術創新的分類系統。據此,李更提出了基于TRIZ創新流程與IPC相結合的檢索系統,更易找到準確的專利技術信息[8]。劉彤認為,TRIZ理論通過對技術方案的分析,利用矛盾矩陣,形成一種有章可循的發明構想,可以幫助遴選高效的檢索詞,從而提高專利技術信息的有效利用[9]。

2.3 專利檢索技術與方法

專利檢索條目的抽取是專利技術檢索成功的關鍵。由于輸入的檢索詞可能屬于不同的技術主題,無法表達準確的查詢要求,專利檢索方法也無法有效捕捉到用戶的查詢意圖并獲得良好的擴展條件,從而導致專利檢索效率低下。因此,尋求有效的條件擴展和精度進而提升專利檢索技術與方法就成為研究的重點。Mahdabi利用IPC描述作為擴展詞典,提出了基于位置鄰近的擴展檢索方法,可以最大限度地降低擴展詞歧義[10]。Wang則提出了一種基于語義查詢的專利檢索方法,實現專利技術信息的擴展檢索[11]。Mahdabi則將引文信息引入相似專利檢索,通過專利的引文鏈接擴展返回的專利文檔[12]。在提高專利檢索精度方面,最常使用的方法是向量空間模型(VSM),但在文字表述發生變化時該方法就會失效。因此,Lim[13]、陳芨熙[14]利用VSM和本體相結合的方式提高了專利技術檢索精度,而Chen提出用基于IPC的索引詞匯法來提高技術信息檢索的準確性[15]。Lee通過改進檢索技術,利用關鍵詞加權分布和Top-k算法,在檢索結果中直接顯示與目標技術最相關和最重要的專利,實現相關技術的檢索和自動排序[16]。Krestel提出了基于潛在主題的專利推薦方法,利用多項式回歸對專利查詢條件進行計算,從專利集合中選取Top-k個內容相關的專利進行排序[17]。

專利檢索是挖掘專利技術信息的首要步驟,通過不斷改進的檢索策略、檢索技術和檢索方法,可以全面、準確檢索實現專利技術信息,而對檢索結果的技術相關性排序則更是擴大了專利檢索在專利技術信息挖掘中的作用,使專利檢索不單是獲取相關技術的途徑,也成為一種專利分析的輔助方法。

3 基于專利地圖的專利技術信息挖掘研究

3.1 專利地圖的類型

專利地圖是由各種與專利相關的信息以統計分析方法加以縝密及精細地剖析而制成各種可解讀的圖表,使其具有類似地圖的指向功能[18]。專利地圖在專利技術信息挖掘中起到承上啟下的作用,承上是指將檢索到的專利信息經過整理、綜合、歸納,以數據的形式歸入圖表中,對技術信息進行定量和定性分析;啟下是指通過專利地圖的分析,獲得某一技術發展路線、水平、趨勢等情報,為技術發展動向和技術創新角度提供情報。

專利地圖一般可以分為專利管理地圖、專利技術地圖和專利權利地圖三類[19]。其中,專利技術地圖服務于技術研發,是挖掘專利技術發展動向,預測技術趨勢的重要利器。專利技術地圖是針對某個技術領域內的技術發展趨勢、集中程度等方面的分析,主要有專利技術分布圖、技術生命周期圖、技術功效矩陣圖、技術路線圖、技術主體圖等,目的是為了表達某一技術領域的技術總體態勢、周期、熱點、空白、演進和布局,從而挖掘專利技術信息。

3.2 專利地圖的應用

專利地圖是用于專利技術信息挖掘的常用工具,其中技術生命周期圖、技術功效矩陣圖、技術路線圖、主要競爭對手及核心技術分布圖在專利技術信息挖掘中應用比較廣泛。

技術生命周期是技術成熟度的反映,包括導入期、成長期、成熟期和衰退期,一般通過計算專利指標、相對增長率和技術生命周期圖法獲得[20-21]。國內外學者大多使用某一技術在不同時期內專利申請量和專利申請人數的變化關系來繪制專利技術生命周期圖,從而清楚地了解該技術發展狀態[22-23]。由于技術生命周期只能反映專利技術的某一方面,因此還需要借助其他工具來配合進行全面的專利技術信息挖掘。Lo意識到了科學與技術的關系,利用專利授權量制作專利地圖,探討技術生命周期的變化[24]。馮立杰、鐘華珂等結合專利申請情況、IPC和地區分布、專利權人等指標,利用技術生命周期圖反映專利技術現狀[25-26]。

專利技術功效矩陣圖是通過對專利文獻反映的技術主題內容和主要技術功能效果之間的特征研究,揭示技術和功效之間的關系[27],便于相關技術人員掌握技術布局情況,用于尋找技術空白點、技術研發熱點,從而發現潛在的研發方向。目前,技術功效矩陣的構建主要還是以手工為主,已經無法適應專利技術信息挖掘的要求,因此國內外學者把目光聚焦于技術詞與功效詞的有效提取上。陳穎提出了一種基于特征度指標的矩陣構建詞匯模型[28]。王麗利用主題自動標引生成技術功效圖[29]。霍翠婷利用日本專利檢索體系中的FI/Fterm分類標準進行自動標引,構建技術功能效圖[30]。張博培、He依靠術語識別技術構建專利技術功效圖,實現專利技術信息的半自動化挖掘[31-32]。

技術路線圖是基于專利文獻信息分析描繪某技術領域的主要技術發展路徑和關鍵技術節點,從技術鏈的完整視野認知主流技術發展歷程。余小萍認為技術路線圖是應用簡潔的圖表、文字等形式描繪技術變化的步驟和技術環節之間的邏輯關系[33]。繆小明利用專利引文網絡制作了核心技術發展路線圖,并結合核心專利年代分布圖、核心技術IPC分類圖等完整描述了混合動力汽車技術路線[34]。還有一些學者提出了更加先進的專利技術路線圖,如Kim在確定核心專利的引文網絡中加入專利主題的語義分析,利用潛在狄利克雷分布識別技術分類,提高了專利技術路線圖的精度[35]。Jeong通過GTM模型分析技術發展現狀和空白,并利用貝葉斯模型預測技術領域的最大專利申請量和新專利節點近似出現的時間,克服了技術路線圖只能提供發展趨勢而不能提供技術機會出現時間的缺陷[36]。

主要競爭對手及核心技術分布圖是針對某項技術,利用圖表分析,識別競爭對手及其專利活動的分析工具。制作該專利地圖時,需要多種信息的融合,包括技術領域和重點專利申請人排名、專利申請趨勢、技術構成、地域構成、研發團隊發展脈絡等角度[37]。張紅芹從市場、能力、時間三個維度構建專利地圖確立主要競爭對手,進行核心專利挖掘[38]。王興旺構建了基于專利地圖的競爭對手分析模型,使用專利權人研發趨勢圖、研發重點分布圖、專利權人關聯圖、專利引證圖、專利權人引證排行表等綜合確定競爭對手及其核心技術[39]。Trappey[40]和Chang[41]引入專利引文網絡,使用專利受讓人和專利權人網絡來鎖定主要競爭對手。

4 基于專利引文的專利技術信息挖掘研究

專利對其他專利的引用體現了技術發展的規律、繼承和積累以及不同技術領域的交叉和滲透。與科技文獻類似,專利間的引文關系實際上也是一種“引文鏈”或“引文網絡”,能夠反映蘊含在專利中的技術流動,揭示和挖掘專利技術相互聯系的實質和內涵[42]。基于專利引文的專利技術信息挖掘關鍵在于分析專利引文量和引文指標,進一步結合時間序列的引文聚類分析,可用于確定某一技術領域內的核心技術,并通過引證路徑追溯技術發展的歷程,分析技術發展和技術關鍵節點[43]。

4.1 引文分析指標

專利引文分析指標可對單個專利或目標專利群進行專利價值、技術容量、技術原創性、技術應用廣度等多個維度的挖掘。目前,國內外學者用于專利技術信息挖掘的專利引文分析指標有:反映專利技術重要程度的被引頻次[44],反映主體技術實力的自引或他引率[45],反映某技術影響的當前影響指數[46],反映技術變化快慢的技術循環周期[47]和反映技術容量的吸收或擴散指數[48]等。吳菲菲以引文分析指標為基礎,基于知識新穎性和領域交叉性,提出了鎖定前沿技術的專利識別方法[49]。引文指標組合分析雖然可以挖掘技術強度、技術影響力和技術循環周期等,但不能體現專利“引文鏈”和“引文網絡”的特性,存在局限性。

4.2 引文網絡

具有直接引證關系的兩篇或多篇專利必然存在某種技術聯系,因此,可以利用專利群之間直接或間接的引證關系進行引文網絡分析。國內外對專利引文網絡的研究主要集中在引文軌跡、同被引和引文耦合三個方面。

引文軌跡通過將專利前后引證關系以引證鏈的形式完整展現出來,直觀反映技術發展過程的關鍵節點,可以識別專利中包含技術的演進軌跡,確定基礎技術、核心技術[50-53]。引文軌跡依據引文網絡的整體結構識別專利價值,還可以挖掘出被引頻次不高卻在網絡中占據重要位置的專利。Martinelli在引文網絡分析中應用孟德爾基因遺傳規律分解專利知識,通過計算專利持久性指數,成功地減少了需要考慮的節點和鏈路數量[54]。Kim建議通過專利引用網絡與動態技術樹組合應用,確定微觀技術進化軌跡,并使用通用性、多樣性和新穎性指標,發現可以成為下一代技術和衍生技術起點的關鍵技術[55]。

專利文獻不只具有直接引用關系,也存在著同被引和耦合的現象,利用專利共引和耦合分析可以挖掘不同研究主體的技術關聯關系和強度,揭示技術分布規律并預測研究主體的技術發展趨勢等。明宇[56]、李蓓[57]、Sharma[58]、Yongdai[59]等根據專利共引網絡中心度的大小確定核心專利。Rodriguez認為單獨使用中心度確定核心專利具有缺陷,可以通過刪除網絡中的節點得到相似性矩陣,相似性矩陣中變化最大的節點即為最具影響力的專利[60]。許海云認為專利技術功效主題詞與專利共現在核心專利挖掘方面具有優越性,技術功效詞、技術主題詞與專利引文網絡結合可用于鎖定核心專利[61]。在使用引文耦合挖掘技術趨勢方面,高楠提出基于原始觀測值和余弦距離相似度算法建立專利相似性矩陣,并利用引文耦合網絡獲得技術前沿[62]。You使用時間序列模型Bass和ARIMA模型評估由重要專利生成的二級引文耦合網絡,用于技術發展趨勢預測[63]。

5 基于專利網絡的專利技術信息挖掘研究

專利網絡分析以社會網絡分析、社會計量學和圖形理論為基礎,是專利引文分析的拓展和衍生,成為揭示專利之間關系、內涵、聯系強度的重要工具。應用社會網絡進行專利技術信息挖掘的主要項目有專利權利人、發明人、關鍵詞、技術分類和引文網絡分析等,從專利合作、競爭等角度分析了技術發展現狀和趨勢。

5.1 專利合作網絡

以專利權人和發明人構建專利合作網絡,揭示了技術合作關系。國內外大量研究集中在企業合作研發、合作模式、技術集群、核心發明人和專利權人識別上[64]。劉彤、李紅對專利合作網絡的演化路徑和動態特征進行了分析,用于識別網絡中潛在的重要合作關系及其變化[65-66]。貢金濤則對風力發電技術領域的專利合作網絡結構特征和中心度進行了測量,分析專利技術合作情況及核心人員分布[67]。Du使用迭代算法和潛在狄利克雷分布模型分析了具有高影響力發明人和發明團體的技術方向,用于在發明人異構網絡中更加準確和快速地找到核心發明人及合作團體[68]。

5.2 專利關鍵詞網絡

專利關鍵詞網絡的核心思想是利用文本挖掘技術提取專利文本關鍵詞,對關鍵詞進行聚類、關聯等分析,挖掘技術特點,并通過確定網絡中空白點并分析周圍專利,探尋技術空白點。Sungjoo提出了一種基于關鍵詞網絡的專利分析方法,用于技術現狀和技術空白點分析,奠定了專利關鍵詞網絡發展的基礎[69]。劉美佳從專利摘要中抽取RFID技術關鍵詞,利用關鍵詞聚類網絡挖掘技術主題,借助戰略坐標圖展現技術主題[70]。Wu提出一種結合德爾菲和層次分析的關鍵詞網絡分析法,通過提取關鍵詞并確定每個關鍵詞的權重,建立相似矩陣以增加網絡精確性[71]。由于技術總是處于不斷演化過程中,用關鍵詞網絡無法準確發現技術變化狀況,為此Kim假設關鍵詞網絡中存在核心節點,通過加入時間變量,分析關鍵詞網絡隨時間推移的分解性,可以更為細致地觀察技術分解的過程[72]。

專利關鍵詞網絡在揭示技術發展現狀和預測技術發展趨勢方面更具科學性,但也存在局限:第一,用于構建專利網絡的關鍵詞提取受文本挖掘技術限制,操作比較復雜;第二,使用文本挖掘和其他技術時不可避免會造成信息的丟失;第三,在挖掘技術空白點時,雖然可以根據關鍵詞空白確定需要重點分析的專利,但卻無法直接確定技術創新的具體內容。

5.3 專利技術共類網絡

技術共類網絡用于探索專利所屬的技術領域和主題,揭示技術演進和創新體系,從技術網絡結構中挖掘技術分布。技術共類主要通過IPC聚類和共詞分析實現,其中,共詞分析將主題詞作為分析對象,以可視化的方式展示主題分布,研究主題間關系和主題聚類情況。賈佳將所有引證核心專利的專利依據IPC進行聚類,可以掌握間接相關的技術交叉[73]。Yan提出利用距離量化某一技術領域涉及IPC的場鄰近度,從而比較技術的共生和共類[74]。Long以IPC建立地鐵技術共類網絡,通過改進節點重要性貢獻度相關矩陣算法,計算出整個技術共類網絡的關鍵技術[75]。Chun從醫療器械專利提取的IPC代碼協方差和相關系數建立IPC聚類網絡識別中心技術[76]。Han以IPC共類探索ICT領域的技術融合[77]。

德溫特手工代碼(MC)具有很強的一致性和專業性,適用于技術共類分析。趙潤州利用BICOMB軟件對提取的高頻代碼構建專利DC代碼共類矩陣和MC代碼共詞矩陣,構建共詞網絡識別技術分布和熱點[78]。汪莉抽取《德溫特創新索引》20個DC技術大類專利進行技術共類分析,利用技術共類率和強度指標測度專利跨度[79]。

相對于專利引文,基于專利網絡的技術信息挖掘更具優勢:第一,專利網絡不僅考慮存在引證關系的兩個專利之間的聯系,還從整體上把握各專利的關系,減少了信息遺漏;第二,專利網絡使用可視化方式展示全局專利的布局,可以更直觀地理解專利結構,更全面地預見技術發展;第三,專利網絡采用多種算法,并且國內外學者還在不斷探索更為適用的方法,因此產生了更具科學性、準確性的專利指標,可以為精準決策提供依據。

6 基于專利挖掘的專利技術信息挖掘研究

6.1 專利數據挖掘研究

傳統的專利技術信息挖掘主要基于原文分析和數據統計,即通過專利文獻上固有的信息識別專利文獻,并對指標數據進行統計得到技術發展現狀。但這種挖掘方法無法揭示專利文獻中隱藏的技術信息,且面對大量專利數據時工作量繁重,分析淺顯。利用數據挖掘技術,可以從海量的、無法通過人工統計的專利數據中挖掘出潛在的技術信息,還能通過算法構建潛在技術信息的關聯并有效展示出來[80]。專利文獻的數據挖掘主要是指使用數據挖掘原理和方法(統計分析、知識抽取、聚類、分類、關聯等)直接處理專利外部特征信息(著錄項或專利元數據),得到共引與共類統計、時間序列分析、網絡拓撲結構呈現等結果[81],再結合組合理論、專利地圖等技術,對專利技術信息進行情報分析,以可視化的形式展現出來[82]。

6.2 專利文本挖掘研究

專利文本挖掘即綜合使用信息檢索、數據挖掘、自然語言處理及機器學習等領域的知識和技術對非結構化的專利文本,如題名、摘要、權利要求等字段,進行專利特征抽取、主題標引、分類與聚類等挖掘研究,從而識別專利的技術主題,并挖掘出替代性或共性技術,是對專利數據挖掘的補充和擴展。

6.2.1 專利術語抽取

專利術語抽取是專利文本挖掘的首要步驟,國內外在專利術語抽取領域的研究主要集中在抽取方法[83-84]、錯誤來源分析[85]及生偏術語識別上[86-87]。楊雙龍利用術語詞性規則自動生成方法和候選術語的TermRank排序算法得到了最相關的專利技術術語[88]。

“主—謂—賓”(Subject-Action-Object,SAO)結構分析也是專利術語抽取研究的熱點。SAO結構源自發明問題解決理論,是表示問題解決方式的基本功能函數單元[89]。一般從摘要或權利要求部分抽取術語,提升了基于引文或關鍵詞分析的性能,可以更好地揭示技術主題之間的關系。李欣[90]、Choi[91]利用文本挖掘提取SAO結構,根據語義相似度對專利文本聚類,再結合不同分析方法挖掘對應技術信息。SAO結構分析信賴于專家,Yang提出了基于分析樹自動識別和抽取最合理SAO結構的方式[92]。

6.2.2 專利文本分類

基于多種分類器選擇和機器學習的文本挖掘旨在實現高效的專利文本分類[93]。屈鵬對專利文本分類的相關問題進行了研究,包括術語特征適用性、主權項字段分類、主題相似等,并交叉驗證了樸素貝葉斯分類器、KNN、Racchio、SVM等分類器的效果[94]。基于文本挖掘的專利技術分類解決了利用IPC分類和專家分類容易出現偏差的缺點[95],Chen采用分步分層的方式將專利分類到IPC小組水平[96],Trappey使用向后傳播神經網絡進一步提高了專利文本分類精度[97]。

此外,將文本挖掘與TRIZ相結合的分類也得到發展。梁艷紅[98]、魯麒[99]分別以TRIZ發明原理作為分類標準和語料庫,建立了專利特征表示模型,而Loh[100]、He[101]則從用戶分類和技術分類角度推進專利知識發現研究。

6.2.3 專利技術主題識別

專利技術主題識別是專利技術檢索、專利技術分類以及技術領域前沿挖掘等多種技術信息分析的基礎。基于文本挖掘的專利技術主題識別方式包括主題詞獲取、計算知識單元關聯強度和面向多元關系融合的主題分析[102]。侯婷依據技術主題在專利標題中的分布特點和長度特征,提出了主題度算法,將主題度大的確定為技術主題,相似度大的確定為主題詞的替代詞[103]。基于專利文本可視化的技術主題發現也是對大規模文本處理的常見模式,郝智勇利用潛在狄利克雷分布自動建立特征項與語義之間的映射,自動抽取專利技術主題[104]。Tseng提出了通過計算技術術語聚簇頻率的方式獲得高頻技術主題[105]。專利技術主題的識別不僅可以有效挖掘技術分布現狀,還能與其他分析方法相結合獲取其他技術情報。王效岳改進了以專利引文為基礎的技術路線圖,使用文本挖掘技術鎖定專利技術主題,再利用主題分類構建技術主題路線圖,鎖定潛在發展技術主題[106]。Kim結合專利申請時間構建技術主題網絡,展示技術主題變化過程[107]。Chen按照時間窗口切割進行主題聚類,并計算不同技術主題之間關聯,繪制出技術演化過程[108]。

6.2.4 替代性或共性技術挖掘

替代性或共性技術識別是企業進行技術戰略布局的重要依據。目前,替代或共性技術的識別主要依靠定性分析[109],但較少利用專利內含的技術信息進行挖掘。黃魯成綜合使用文本挖掘、德溫特手工代碼共現、專利引用三個指標確立共性技術識別框架[110],婁巖從核心性和相似性兩個視角,應用技術功效矩陣逐層遞進識別替代技術[111]。

基于文本的專利技術信息挖掘是近年來研究的熱點,其中專利技術術語抽取、專利文本自動分類、專利技術主題及結合其他專利分析方法(如專利地圖、引文、網絡)等成為研究的焦點。專利文本挖掘拓展了專利技術信息挖掘的研究視角,同時提高了專利技術信息挖掘的深度和精度。但專利文本挖掘本身存在局限:首先是需要較高的技術水平;其次是專利文本技術與法律用語并存,用詞晦澀難懂,增大文本挖掘難度;再次是專利文本挖掘模型計算結果和專利研究對象之間是否保持合理的聯系還需要進一步探討。

7 結語

專利技術信息是企業和科研機構研發的基礎,是行業和國家創新的源泉,因此專利技術信息挖掘價值顯著、意義重大、倍受關注,成為專利檢索、專利地圖、專利引文、專利網絡和專利挖掘等領域研究的焦點。但基于專利檢索、專利地圖、專利引文、專利網絡和專利挖掘的專利技術信息挖掘各有其優缺點,在可操作性、科學性、應用性方面差異顯著,如表1所示。

目前,國內外在專利技術信息挖掘研究方面取得了可喜的進展,并向更精確、更深入和更全面的方向發展,特別是結合大數據技術和各種算法進行海量專利技術信息的挖掘已經成為一種趨勢。整體來看,當前基于多種方式的專利技術信息挖掘研究仍然以方法為主導,但事實上,基于問題驅動和實際應用場景的專利技術信息挖掘需求更為迫切。

表1 五種專利技術信息挖掘方式比較分析

(來稿時間:2017年9月)

參考文獻:

1.李建蓉.專利信息與利用[M].北京:知識產權出版社,2006.

2. Tseng YH, Lin CJ, Lin YI. Text Mining Techniques for Patent Analysis[J]. INFORMATION PROCESSING &MANAGEMENT, 2007, 43(5):1216-1247.

3.潘君鎮,劉劍鋒,陳雅莉.淺談如何進行專利挖掘[J].中國發明與專利,2016(12):51-53.

4.肖滬衛.專利戰術情報方法與應用[M].上海:上海科學技術文獻出版社,2015.

5. Soundarapandian S, Ponnaiah P. Strategic mining of cyanobacterial patents from the USPTO patent database and analysis of their scope and implications[J]. J Appl Phycol, 2006(19):277-292.

6.張晨.專利檢索新策略——關鍵詞與分類號相結合[J].科技情報開發與經濟,2014(13):112-113.

7.陳瓊娣.基于詞頻分析的清潔技術專利檢索策略研究[J].情報雜志,2013(6):47-52.

8.李更,范文,趙今明.TRIZ創新流程與專利檢索系統的結合探索[J].情報雜志,2013(2):79-81.

9.劉彤,劉以成,李俊.TRIZ理論在專利檢索中的應用[J].中國科技信息,2014(1):163-165.

10. MAHDABI P, ANDERSSON L, Keikha M, et al.Automatic refinement o f patent queries using concept importance predictors[C]. Portland, USA, 2012:505-514.

11. Wang F, Lin LF, Yang S, et al. A Semantic Query Expansion-based Patent Retrieval Approach[J]. 2013 10TH INTERNATIONAL CONFERENCE ON FUZZY SYSTEMS AND KNOWLEDGE DISCOVERY (FSKD),2013:572-577.

12. Mahdabi P, Crestani F. The effect of citation analysis on query expansion for patent retrieval[J]. INFORMATION RETRIEVAL, 2014, 17(5-6SI):412-429.

13. Lim SS, Jung SW, Kwon HC. Improving Patent Retrieval System Using Ontology[M]. NEW YORK:IEEE, 2004:2646-2649.

14.陳芨熙,顧新建,陳國海,等.基于本體的專利檢索技術[J].浙江大學學報(工學版),2009(12):2213-2217.

15. Chen YL, Chiu YT. An IPC-based vector space model for patent retrieval[J]. INFORMATION PROCESSING &MANAGEMENT, 2011, 47(3):309-322.

16. Lee W, Leung C, Song J J. Reducing Noises for Recall-Oriented Patent Retrieval[J]. 2014 IEEE FOURTH INTERNATIONAL CONFERENCE ON BIG DATA AND CLOUD COMPUTING (BDCLOUD),2014:579-586.

17. KRESTEL R, SMYTH P. Recommending patents based on latent topics[J].Recommender Systems, 2013:395-398.

18.左良軍.基于專利地圖理論的專利分析方法與應用探究[J].中國發明與專利,2017(4):29-33.

19.肖滬衛.專利地圖方法與應用[M].上海:上海交通大學出版社,2011.

20.瞿麗曼.專利地圖在企業技術研發中的應用[J].競爭情報,2009(4):44-56.

21. Wang XW. Summary Research on Energy-Efficient Technology for Multi-core Computing System Based on Scientometrics[M]. NEW YORK:SPRINGER, 2016:348, 983-989.

22. Fu BR, Hsu SW, Liu CH, et al. Statistical analysis of patent data relating to the organic Rankine cycle[J]. RENEWABLE& SUSTAINABLE ENERGY REVIEWS, 2014, 39:986-994.

23. Fu BR, Hsu SW, Liu CH. Trends in patent applications relating to organic Rankine cycle[M]. AMSTERDAM:ELSEVIER SCIENCE BV, 2014, 79:249-257.

24. Lo CH. An Extension Design By Applying Patent Map Analysis On Product Life Cycle[J]. PAKISTAN JOURNAL OF STATISTICS, 2013, 29(5):769-784.

25.馮立杰,王宇彬,王金鳳,等.基于專利管理地圖的我國三維打印技術發展研究[J].科技管理研究,2016(4):169-172.

26.鐘華珂,馮立杰,王金鳳,等.基于專利管理地圖的我國煤層氣開采技術發展研究[J].情報雜志,2012(9):21-24.

27.陳穎,張曉林.專利技術功效矩陣構建研究進展[J].現代圖書情報技術,2011(11):1-8.

28.陳穎,張曉林.基于特征度和詞匯模型的專利技術功效矩陣結構生成研究[J].現代圖書情報技術,2012(2):53-59.

29.王麗,張冬榮,張曉輝,等.利用主題自動標引生成技術功效矩陣[J].現代圖書情報技術,2013(5):80-86.

30.霍翠婷,蔣勇青,凌鋒,等.日本FI/F-term分類體系在專利技術/功效矩陣中的應用研究[J].情報雜志,2013(11):140-144.

31.張博培.面向專利的術語識別與技術功效矩陣構建技術[D].北京:北京工業大學碩士論文,2015(3):64.

32. He Y, Li Y, Meng L. A New Method of Creating Patent Technology-Effect Matrix Based on Semantic Role Labeling[J].2015 International Conference on Identification, Information, and Knowledge in the Internet of Things (IIKI),2015:58-61.

33.余小萍,閏現洋.基于技術路線圖的企業知識管理初探[J].情報雜志,2009, 28(7):96-101.

34.繆小明,湯松.基于專利地圖的混合動力汽車技術路線研究[J].情報雜志,2013(5):73-76.

35. Kim M, Park Y, Yoon J. Generating patent development maps for technology monitoring using semantic patent-topic analysis[J].COMPUTERS & INDUSTRIAL ENGINEERING, 2016, 98:289-299.

36. Jeong Y, Lee K, Yoon B, et al. Development of a patent roadmap through the Generative Topographic Mapping and Bass diffusion model[J]. JOURNAL OF ENGINEERING AND TECHNOLOGY MANAGEMENT, 2015, 38:53-70.

37.詹斯特,赫西.競爭對手分析[M].北京:經濟科學出版社,2004:100-113.

38.張紅芹,鮑志彥.基于專利地圖的競爭對手識別研究[J].情報科學,2011(12):1825-1829.

39.王興旺,孫濟慶.專利地圖技術在競爭對手分析中的應用研究[J].中國科技論壇,2009(6):88-94.

40. Trappey A, Chen L, Chang J, et al. Strategic Development of LTE Mobile Communication Technology Based on Patent Map Analysis[M]. AMSTERDAM:IOS PRESS,2014, 1: 825-833.

41. Chang S, Trappey CV, Trappey A, et al. Forecasting Dental Implant Technologies Using Patent Analysis[M]. NEW YORK:IEEE, 2014:1483-1491.

42.滕立,黃蘭青.國際專利引文研究的計量分析[J].情報工程,2016(2):18-25.

43.陳亮,張志強,尚瑋姣.專利引文分析方法研究進展[J].現代圖書情報技術,2013(Z1):75-81.

44.郗建紅,彭愛東.專利被引頻次與專利分類跨領域相關性研究——以中國在美國授權專利為例[J].情報雜志,2016(4):92-97.

45.洪勇,康宇航.基于專利引文的企業間技術溢出可視化研究[J].科研管理,2012(7):81-87.

46. Wang CC, Li YT, Chen DZ, et al. Uses Unexpired Patent to Re-evaluate Innovation Performance by h-index and h-core Indicators[M]. NEW YORK:IEEE, 2013:965-971.

47. Dalton DM, Burke TP, Kelly EG, et al. Quantitative Analysis of Technological Innovation in Knee Arthroplasty Using Patent and Publication Metrics to Identify Developments and Trends[J].JOURNAL OF ARTHROPLASTY, 2016, 31(6):1366-1372.

48. Kim DH, Lee BK, Sohn SY. Quantifying technologyindustry spillover effects based on patent citation network analysis of unmanned aerial vehicle (UAV)[J]. TECHNOLOGICAL FORECASTING AND SOCIAL CHANGE, 2016, 105:140-157.

49.吳菲菲,欒靜靜,黃魯成,等.基于新穎性和領域交叉性的知識前沿性專利識別——以老年福祉技術為例[J].情報雜志,2016(5):85-90.

50.王健美,劉志芳,戴愛兵.純電動汽車產業關鍵技術演進分析——專利引文分析視角[J].圖書情報工作,2014(14):21-27.

51.范維熙,費鐘琳.基于德溫特專利引文網絡的技術演進路徑研究——以太陽能電池技術為例[J].情報雜志,2014(11):62-66.

52. Verspagen B. Mapping technological trajectories as patent citation networks: A study on the history of fuel cell research[J].ADVANCES IN COMPLEX SYSTEMS, 2007, 10(1):93-115.

53. Hsueh CC, Wang C C. The Use of Social Network Analysis in Knowledge Diffusion Research from Patent Data[C]. Social Network Analysis and Mining,2009. ASONAM09. International Conference on Advances in. IEEE, 2009:393-398.

54. Martinelli A, Nomaler O. Measuring knowledge persistence:a genetic approach to patent citation networks[J]. JOURNAL OF EVOLUTIONARY ECONOMICS, 2014, 24(3):623-652.

55. Kim J, On the evolutionary technological trajectory using patent citation network and dynamic technology tree analysis: a case study of HVDC High Voltage DC transmission system[J]. JOURNAL OF TECHNOLOGY INNOVATION,2014, 22(4):117-145.

56.明宇,司虎克.我國足球鞋發明專利的專利引文網絡拓撲屬性研究[J].中國體育科技,2015(5):138-144.

57.李蓓,陳向東.海峽兩岸核心及新興技術比較—基于專利引文網絡的分析[J].科研管理,2015(2):96-106.

58. Sharma P, Rashmitripathi, Tripathi RC. Patent Citation Network Analysis for Measuring the ICT Patent Progress in India[J].ETRI Journal, 2016.

59. Yongdai K. Patent citation network analysis[J]. The Korean Journal of applied Statistics, 2016, 29(4):613-625.

60. Rodriguez A, Kim B, Lee J, et al. Graph kernel based measure for evaluating the influence of patents in a patent citation network[J]. EXPERT SYSTEMS WITH APPLICATIONS, 2015, 42(3):1479-1486.

61.許海云,岳増慧,雷炳旭,等.基于專利技術功效主題詞與專利引文共現的核心專利挖掘[J].圖書情報工作,2014(4):59-64.

62.高楠,傅俊英,趙蘊華.基于兩種相似度矩陣的專利引文耦合方法識別研究前沿——以腦機接口為例[J].現代圖書情報技術,2016(3):33-40.

63. You H, Li M, Hipel KW, et al. Development trend forecasting for coherent light generator technology based on patent citation network analysis[J]. SCIENTOMETRICS, 2017, 111(1):297-315.

64. Schrder C. Dynamics in ICT cooperation networks in selected German ICT clusters[J]. INTERNATIONAL ECONOMICS and ECONOMIC POLICY, 2013(3):197-230.

65.劉彤,郭魯鋼,楊冠燦.基于動態網絡分析的專利合作網絡演化分析——以納米技術為例[J].情報雜志,2014(11):88-93.

66.李紅,陳少龍.基于社會網絡分析的智能手機專利發明人合作網絡演化研究[J].科技管理研究,2013(20):157-160.

67.貢金濤,魏曉峰.基于社會網絡分析的專利合著網絡研究——以風力發電技術領域在華專利為例[J].情報雜志,2013(11):37-42.

68. Du Y, Yao C, Li N. Using heterogeneous patent network features to rank and discover influential inventors[J]. FRONTIERS OF INFORMATION TECHNOLOGY & ELECTRONIC ENGINEERING, 2015, 16(7):568-578.

69. Sungjoo L, Byungun Y, Yongtae P. An approach to discovering new technology opportunities:Keyword-based patent map approach[J]. TECHNOVATION, 2009(29):481-497.

70.劉美佳.基于專利分析的RFID技術演化研究[D].北京:北京工業大學碩士論文,2013.

71. Wu C. Constructing a weighted keyword-based patent network approach to identify technological trends and evolution in a field of green energy: a case of biofuels[J]. QUALITY &QUANTITY, 2016, 50(1):213-235.

72. Kim J. Analysis of Assortativity in the Keyword-based Patent Network Evolution[J]. Journal of Korean Society for Internet Information, 2013, 14(6):107-115.

73.賈佳,孫濟慶.基于核心專利分析對技術創新應用發展的研究[J].情報理論與實踐,2009(1):79-81.

74. Yan B, Luo J. Measuring technological distance for patent mapping[J]. JOURNAL OF THE ASSOCIATION FOR INFORMATION SCIENCE AND TECHNOLOGY, 2017, 68(2):423-437.

75. Long M, Ma T. On a patent analysis method for identifying the core technologies of metro in china[J]. Information Studies, 2016,30:1701-1707.

76. Chun J, Seop LC. Central Technology Deriving for the Patents of Medical Device using Social Network Analysis[J]. Management &Information Systems Review, 2016, 35(2):221-254.

77. Han J, Kim C. A Study of ICT Technology Convergence Analysis and Development Direction by Using the Patent Information: focusing on Kyongbuk area company[J]. The Journal of Intellectual Property, 2015, 10(3):203-238.

78.趙潤州,徐卸古.基于專利信息的腦電圖技術成熟度及技術網絡分析[J].中華醫學圖書情報雜志,2016(4):7-12.

79.汪莉.專利跨度的測度及其應用研究[A].中國學學與科技政策研究會.第十屆中國科技政策與管理學術年會論文集——分8:科學學與政策科學理論方法[C].中國科學學與科技政策研究會,2014:5.

80.謝湘寧.淺談數據挖掘技術在專利信息分析中的應用[J].中國發明與專利,2015(1):59-62.

81.屈鵬,張均勝,曾文,等.國內外專利挖掘研究(2005—2014)綜述[J].圖書情報工作,2014(20):131-137.

82.袁冰,朱東華,任智軍.基于數據挖掘技術的專利情報分析方法及實證研究[J].情報雜志,2006(12):99-102.

83.Tseng Y, Lin C, Lin Y. Text mining techniques for patent analysis[J]. Information Processing and Management, 2007, 43(5):1216-1247.

84.韓紅旗,朱東華,汪雪峰.專利技術術語的抽取方法[J].情報學報,2011, 30(12):1280-1285.

85.徐川,施水才,房祥,等.中文專利文獻術語抽取[J].計算機工程與設計,2013, 34(6):2175-2179.

86. Li Y, Wang LH, Hong CF. Extracting the significant rare keywords for patent analysis[J]. Expert Systems with Applications,2009, 36(3):5200-5204.

87.屈鵬,王惠臨.面向信息分析的專利術語抽取研究[J].圖書情報工作,2013(1):130-135.

88.楊雙龍,呂學強,李卓,等.中文專利文獻術語自動識別研究[J].中文信息學報,2016(3):111-117.

89. Altshuller GS. Creativity as an exact science: the theory of the solution of invention problem[M]. New York: Cordon and Breach Science Publishers, 1984.

90.李欣,王靜靜,楊梓,等.基于SAO結構語義分析的新興技術識別研究[J].情報雜志,2016(3):80-84.

91. Choi S, Park H, Kang D, et al. An SAO-based text mining approach to building a technology tree for technology planning[J].EXPERT SYSTEMS WITH APPLICATIONS, 2012, 39(13):11443-11455.

92. Yang C, Zhu D, Wang X. SAO Semantic Information Identification for Text Mining[J]. INTERNATIONAL JOURNAL OF COMPUTATIONAL INTELLIGENCE SYSTEMS, 2017, 10(1):593-604.

93.張曉宇.基于文本挖掘的交互式專利分類[J].高技術通訊,2013(6):592-597.

94.屈鵬,王惠臨.專利文本分類的基礎問題研究[J].現代圖書情報技術,2013(3):38-44.

95.張世玉,王偉,于躍,等.基于文本挖掘技術的技術層面專利組合分析方法優化[J].情報理論與實踐,2015(10):127-129.

96. Chen Y, Chang Y. A three-phase method for patent classification[J]. Information Processing and Management, 2012, 48(6):1017-1030.

97. Trappey AJC, Hsu F, Trappey CV, et al. Development of a patent document classification and search platform using a back propagation network[J]. Expert Systems with Applications, 2006, 31(4):755-765.

98.梁艷紅,檀潤華,馬建紅.面向產品創新設計的專利文本分類研究[J].計算機集成制造系統,2013(2):382-390.

99.魯麒,任工昌,李平平,等.基于TRIZ理論的中文專利文本挖掘模型的構建[J].情報科學,2014(10):28-32.

100. Loh H, He C, Shen LX. Automatic classification of patent documents for TRIZ users[J]. World Patent Information, 2006, 28(1):6-13.

101. He C, Loh H. Pattern oriented associative rule based patent classification[J]. Expert Systems with Applications, 2010, 37(3):2395-2404.

102.許海云,董坤,劉春江,等.文本主題識別關鍵技術研究綜述[J].情報科學,2017(1):153-160.

103.侯婷,呂學強,李卓,等.面向專利技術主題分析的技術主題獲取[J].情報理論與實踐,2015(5):125-129.

104.郝智勇,賀明科,譚文堂,等.基于多維標度法的專利文本可視化聚類研究[J].計算機應用研究,2010(12):4608-4611.

105. Tseng YH, Lin CJ, Lin YI. Text Mining Techniques for Patent Analysis[J]. Information Processing and Management, 2007,43(5):1216-1247.

106. 王效岳,趙冬曉,白如江.基于專利文本數據挖掘的技術預測方法與實證研究——以納米技術在能源領域應用為例[J].情報理論與實踐,2017(4):106-110.

107. Kim YG, Suh JH, Park SC. Visualization of Patent Analysis for Emerging Technology[J]. Expert Systems with Applications, 2008,34(3):1804-1812.

108. Chen SH, Huang MH, Chen DZ. Identifying and Visualizing Technology Evolution: A Case Study of Smart Grid technology[J]. Technological Forecasting and Social Change, 2012,79(6):1099-1110.

109. Han YJ. Analysis of Competing Technologies and Firms in a Convergence Industry by Using Patent Information: The Case of Telematics[J]. Portland International Conference on Management of Engineering and Technology, 2007(8):259-262.

110.黃魯成,張靜.基于專利分析的產業共性技術識別方法研究[J].科學學與科學技術管理,2014(4):80-86.

111.婁巖,張賞,黃魯成,等.基于專利分析的替代性技術識別研究[J].情報雜志,2014(9):27-32.

主站蜘蛛池模板: 久久毛片网| 中文字幕 欧美日韩| 欧美福利在线| 久久久成年黄色视频| 日本精品αv中文字幕| 国产精品亚洲一区二区在线观看| 日韩小视频在线播放| 成人午夜天| 99re在线观看视频| 亚洲国产在一区二区三区| 久久精品无码专区免费| 国产成人艳妇AA视频在线| 国产精品自在自线免费观看| 99这里只有精品在线| 在线视频97| 亚洲不卡影院| 亚洲毛片一级带毛片基地| 在线观看国产精品第一区免费 | 毛片手机在线看| 成人一级黄色毛片| 久久99精品久久久久久不卡| 中文字幕精品一区二区三区视频| 欧美激情综合| 极品国产在线| 成人在线天堂| 精品国产91爱| 第一页亚洲| 中文字幕 欧美日韩| 日韩色图区| 特级做a爰片毛片免费69| 久久九九热视频| 国产成人盗摄精品| 久视频免费精品6| 高清亚洲欧美在线看| 国产精品亚洲综合久久小说| 婷婷六月在线| 视频在线观看一区二区| 欧美国产成人在线| 中文精品久久久久国产网址| 免费又爽又刺激高潮网址| 久久久久久国产精品mv| 亚洲成人在线免费| 毛片在线播放a| 精品国产成人高清在线| 国产精品成| 国产在线91在线电影| 亚洲欧洲日本在线| 国产女主播一区| 91黄色在线观看| www.亚洲一区| 影音先锋亚洲无码| 色偷偷男人的天堂亚洲av| 久久99这里精品8国产| 99久久国产自偷自偷免费一区| 国产亚洲欧美日韩在线一区| 国产成人超碰无码| 亚洲日韩国产精品综合在线观看| 亚洲天堂自拍| 亚洲欧美不卡中文字幕| 亚洲一区波多野结衣二区三区| 亚洲天堂视频网站| 青青热久免费精品视频6| 欧美在线伊人| 大乳丰满人妻中文字幕日本| 欧美成人aⅴ| 青青久久91| 国产精品思思热在线| 国产人成乱码视频免费观看| 四虎精品黑人视频| 美女毛片在线| 亚洲男女在线| 国产成人精品2021欧美日韩| 亚洲男女在线| 国产精品亚洲专区一区| 五月天丁香婷婷综合久久| 不卡网亚洲无码| 国产精品观看视频免费完整版| 激情乱人伦| 青青青国产视频手机| 亚洲国产第一区二区香蕉| 亚洲精品第一在线观看视频| 日本精品视频一区二区|