999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

Aureka專利分析工具的文獻計量分析

2011-04-29 00:00:00劉桂鋒王秀紅
現代情報 2011年7期

[摘要]專利分析是競爭情報工作中的重要組成部分。Aureka是典型的文本可視化系統之一。采用文獻計量學方法,對國內中國知網、維普等數據庫有關Aureka專利分析軟件的時間分布、期刊分布、作者及其單位和關鍵詞分布進行了分析研究。通過文獻主題的知識挖掘,探討了該領域論文研究熱點及今后可能發展趨勢。

〔關鍵詞〕Aureka;專利分析;專利地圖;專利分析軟件;文獻計量

DOI:10.3969/j.issn.1008-0821.2011.07.025

〔中圖分類號〕G250.252 〔文獻標識碼〕B 〔文章編號〕1008-0821(2011)07-0106-05

A Bibliometric Analysis of Aureka Patent Analysis ToolLiu Guifeng Wang Xiuhong

(Institute of Scientific Technical Information,Jiangsu University,Zhenjiang 212013,China)

〔Abstract〕Patent analysis is an important part of competitive intelligence.Aureka patent analysis tool is one of the typical text visualization systems.Based on literature from 2001-2010 included in CNKI digital publishing platform and VIP,This paper made literature bibliometric statistical analysis about the subject of Aureka research through these aspects of age distribution,intelligence source distribution,researchers and institutions distribution and keywords.Hot research topics of Aureka patent analysis tool was obtained based on knowledge mining from literature text.The paper tried to sum up the study on Aureka patent analysis in the past decades,so as to provide reference for further research and development.

〔Keywords〕Aureka;patent analysis;patent map;patent analysis tool;bibliometrics

Aureka知識產權管理系統最早由美國Aurigin Systems Inc公司推出。2002年,歸由美國Micropatent,LLC.公司所有。2004年,被美國Thomson集團公司收購,Aureka現成為Thomson集團旗下一個重要產品。Aureka是專利文本挖掘和可視化領域的先驅,允許組織和知識產權管理。文本挖掘功能是基于關鍵字和統計分析。Aureka信息平臺[1]是用戶開展專利情報研究、知識產權管理、專利信息利用等工作的有益工具。

Aureka是一個提供在線查詢、監控、分析服務的比較強大的專利分析平臺。主要分為下面4個模塊[2]:查詢模塊(Searching)、主題分布模塊(ThemeScape)、引用模塊(Citation Tree)和報告表達模塊(Reporting)。該工具的關聯可視化分析技術目前在國內處于領先地位,在國際上也具有一定特色。這種深層次的專利信息分析工具,能夠為專利情報人員解決九大問題[3]。

專利地圖(ThemeScape)采用先進的文本挖掘技術,對專利或文獻進行分析,根據專利技術進行自動聚類。通過專利地圖,既可以迅速了解技術的總體分布和技術熱點;也可以了解競爭對手的技術發展歷程和技術分布;還可以幫助用戶快速篩選專利技術,便于制定公司的知識產權戰略。如通過質子交換膜燃料電池技術的專利地圖[4],就可以了解該技術的總體分布。

引證分析是Aureka專利分析工具的特色之一。通過專利引證分析[5],科研人員能夠發現潛在的競爭對手、確定技術發展趨勢或最新應用、識別競爭對手的專利戰略和評估自己的核心技術等。如蘋果公司[6]專利被引情況的Aureka圖,能夠揭示該公司的核心專利技術。

Aureka系統中的報告工具,能對專利數據進行各種統計分析。報告模式主要分為三大類:關鍵信息摘要報告(Key Summary Report)、詳細報告(Detailed Report)和要點圖表式報告(Pivot Tables)。

1 數據來源

本文以中國知網、萬方和維普的數據庫進行檢索,選擇“Aureka”為檢索詞,檢索范圍“主題”或“題名”或“摘要”或“關鍵詞”或“全文”,檢索界面中的入庫時間選“所有年份”。檢索時間截止2010年12月28日。獲取的數據導入到NoteExpress文獻管理軟件,經過去重處理,得到42篇文獻記錄。

2 文獻計量分析

2.1 文獻增長分析

圖1 2001-2010年我國Aureka研究的文獻分布

文獻的年代分布分析在一定程度上反映了該學科的研究發展速度和研究水平規模。圖1為2001-2010年我國Aureka研究的文獻分布,其中2010年數據作為參考,因有很多論文還沒有全部刊出和檢索。從該圖可知,論文數量在總體上呈上升的趨勢。最早的是在2002年,甘利人[8]介紹Aureka 分析工具的引文樹功能。從2005-2008年是緩慢增長的階段,年均論文4篇。2009年是產出最多的1年,為18篇,超過了過去幾年的總和。預計2010年的論文至少不會低于2009年,因為Aureka在專利分析方面越來越體現其價值。

2011年7月第31卷第7期Aureka專利分析工具的文獻計量分析July,2011Vol.2.2 文獻分布分析

統計顯示,42篇文獻分布在22種期刊中,刊均載文量為2篇。根據布拉德福文獻集中與分散定律[9],大量的某領域的專業論文集中在數量較少且質量較高的期刊上,這些期刊是該領域的核心期刊。表1是根據布拉德福定律,按照論文數量的多寡以遞減順序排列,依據每區刊載論文數量相等的原則,分成的核心區、外圍一區和外圍二區。從該表可知,核心區和外圍一區的絕大部分期刊是圖書情報學2008年版北大中文核心期刊。利用Aureka的專利分析現在主要研究領域仍屬于圖情類, 所以發表的文獻主要集中在圖情類期刊。表1 論文期刊統計分布

序號期刊名稱論文數量分區及論文數量1現代圖書情報技術62情報理論與實踐63圖書情報工作31 154科學觀察35情報學報26圖書情報知識27情報雜志28圖書與情報29中國發明與專利210現代情報22 151112種期刊123 12(期刊名稱前面打,為2008年版北大中文核心期刊)2.3 文獻作者及作者單位分析

圖2 論文“核心作者”及其分表論文的數量

通過作者分析,可以了解某領域的主要作者和核心作者群,有利于讀者了解某作者的研究情況,促進學術研究與交流。本次研究的42篇文獻集合的著者總數達到105位作者(全部合著者計算在內),篇均作者數大約為2.5人。13篇論文是由1位作者獨立完成的,其余29篇論文均是合作完成的,其中有2篇與外國人合作的,最多的1篇論文由6人合作完成。發表1篇論文的作者84人,占作者總人數的80%,形成了一個長長的尾部。可見大多數作者處于研究起步階段,內容不夠深入,研究連續性不強。

根據洛特卡定律,發表1篇論文的著者人數應該占總人數的60.79%左右,發表2篇論文的作者大約是發表1篇論文作者的1/4。對于本研究,發表1篇論文的作者84人,占作者總人數的80%,高于洛特卡定律的60.79%;發表2篇論文的有7人,占發表1篇論文的18.18%,又低于洛特卡定律。主要是由于Aureka專利分析目前還處于起步階段,尚未形成核心作者群,目前還沒有達到采用洛特卡定律的條件。

根據普賴斯定律[10],“核心作者”應該完成所有專業論文總和的一半,核心作者最低發文數m的值為:m=0.749nmax,其中nmax是指發文最多的作者所發表的論文數。對于本研究,nmax為張志強的4篇,代人上式,得到核心作者最低發文數m為2,即表明,發表2篇論文以上的為“核心作者”,見圖2。總共有9位作者的論文數量大于等于2篇,占總作者數的8.5%,發表論文總數為24篇,占總論文數的57%。符合普賴斯定律的杰出作者發表了全部作者論文的50%。表2 論文作者單位分布

排序作者單位論文

數量所占比例

(%)1中國科學院國家科學圖書館57.72中國科學院國家科學圖書館成都分館46.23國家知識產權局知識產權發展研究中心南京大學信息管理系中國科學院研究生院中國科學院文獻情報中心中國科學技術信息研究所上海圖書館上海科學技術情報研究所34.6

全部42篇文獻的105位作者,來自65個高校和科研結構,發文量為2篇的有4家單位,只發表1篇的為43家。發文量大于3篇的機構共計8個,如表2所示。中國科學院國家科學圖書館以5篇論文排在首位,僅隨其后的是中國科學院國家科學圖書館成都分館,發表3篇論文的有6家單位。通過發文量的分析,可以看出,只有1家為高校,其余均為科研機構,并且中國科學院是該領域的主導研究力量。

2.4 文獻關鍵詞分析

關鍵詞鮮明直觀地表述文獻論述或表達的主題,對關鍵詞分析能發現Aureka專利分析研究熱點與重點。通過對42篇文獻統計,只考慮中文關鍵詞,共有176個關鍵詞,平均每篇文獻4個關鍵詞。借用描述文獻中的詞與其出現頻次之間關系的齊夫定律,繪制關鍵詞頻次(f)與序號(r)之間的關系,如圖3。由圖可知,Aureka專利分析軟件的研究熱點主要用來進行專利分析,制作專利地圖、文本挖掘和引文分析等。

圖3 關鍵詞頻次(f)與序號(r)之間的關系

2.5 文獻主題分析

主題分析既有助于了解該領域的研究重點和方向,又能把握當前研究領域的特點和變化趨勢,為以后的研究奠定基礎。本文對上述42篇文獻進行詳細分析后,得出有關Aureka專利分析主要分為2個方面:比較分析和實證研究。

2.5.1比較分析

專利分析工具[11]根據其處理不同結構的數據主要分為3類:第一類主要處理非結構化數據,包括:ClearForest、Goldfire、Innovator、Inxight、TEMIS。第二類主要處理結構化文本,包括:Quosa、Refviz、STN AnaVist、VantagePoint。第三類用于處理混合數據(包括結構化和非結構化),包括:Aureka、M-CAM Doors、Wisdomain、PatAnalyst和Denwent Analytics。

國內學者從不同角度對10多種專利分析工具進行比較研究。范哲[12]從收錄范圍、檢索功能、檢索結果方面對Aureka等6個專利檢索工具進行了詳細的比較和分析。在Aureka的檢索界面,選擇相應的檢索方式、入口后,還可利用運算符、截詞符對檢索的數據范圍、時間、字段內容等進行限制。Aureka可保存檢索式定制Alerts,同一檢索式的檢索結果可被不同用戶共享,以email的方式通知更新檢索結果。每次檢索都會以一個新的文件夾來保存結果,并可對檢索結果集進行注釋,以目錄樹的方式組織專利和非專利文檔;用戶可設置不同文檔的訪問權限以便團隊中其他人分享;軟件中內嵌了郵件系統,便于團隊成員溝通。劉佳佳[13]等從“數據整理和概念分組”、“列表或直方圖”、“比較矩陣”、“有結構數據聚類”、“無結構數據聚類”、“文檔聚類地圖”、“引文分析”以及“主語/行為/賓語”8個方面介紹當前國外主要的專利分析工具的功能及特色,并進行比較研究。Aureka采用ThemeScape視圖為用戶提供了聚類結果的直觀展示。Aureka ThemeScape允許用戶選擇附加停用詞,并利用相關反饋概念支持用戶對系統產生的初始結果進行再處理,有效地利用了用戶的領域專家意見。此外,ThemeScape還支持以時間片的方式對生成的等高線圖進行再組織。張靜[14]等根據基本統計分析、引證分析以及聚類分析這3種主要實現方法,對國內外12種專利分析工具的功能進行了比較研究。Aureka支持同族專利合并和展開,并可選擇合并后顯示US、EP或PCT的專利號。王敏[15]等從分析工具類型、分析數據源、主要功能、結果呈現、用戶群5個方面對國外常用的12種專利文本挖掘可視化分析工具進行系統介紹和比較。通過比較分析可知,Aureka與其它專利分析工具既有共性,又有本身特點,Aureka的功能與特點總結于表3。

表3 Aureka專利分析工具的主要功能與特點

主要功能名稱內容文 獻檢索功能收錄范圍US,DE,EP,GB,JP,FR,PCT檢索方式專利檢索、公司文件檢索檢索入口專利權人、專利發明人、專利號/公開號、公開日期、申請號、申請日期、優先權、PCT專利信息、專利引用、非專利引用、相關申請、專利代理人、美國專利代理人、美國專利審核員、歐專局與PCT專利授權國家、德國翻譯專利運算符AND、NOT、OR、SAME、WITH、NAER、()截詞符、?二次檢索能結果呈現方式以報表為主,每一類又分為基本報表和標準報表,共25個報表[11]引證分析引證數據來源US,DE,EP,GB,WO結果可視化顯示可選擇多級引證,最多可顯示5級;引證樹中目標專利可同時顯示多個字段;可自動或手動給不同專利標注不同顏色信息呈現與統計可對檢索結果集的后續引證專利進行統計聚類分析

(themeScape)數據來源自身包含的專利數據庫聚類角度按主題聚類;按標題和文摘、權力要求書、全文的內容進行聚類,每類還可進一步選擇更多字段結果呈現方式以主題地圖的形式可視化展示;可在主題地圖上將不同的公司標注成不同顏色;可用不同顏色標注不同的年份;可進一步瀏覽地圖上特定區域的單個或分組專利文檔,或導出地圖上特定區域的文檔[13]工具類型文本挖掘/可視化/數據庫檢索結果呈現ThemeMap、引文樹、聚類圖、專利報告用戶群研發人員/信息管理人員/決策人員/商業智能[14]特 點優秀的專利分析軟件, 功能全面, 精湛的文本聚類功能和可視化技術[12]

2.5.2 應用分析

與前幾年的專利分析工具的比較研究相比,最近兩年,研究的熱點開始轉向利用Aureka軟件對某一具體領域進行分析。突出的表現在Aureka軟件的兩大特色功能:聚類分析地圖和引證分析。典型的應用領域分布在生物、食品、油氣、水資源等。張嫻等[16]繪制了生物合成技術美國專利景觀圖。張薇等[17]利用Aureka作出的有關水處理技術的專利地圖,由圖可知,專利申請的熱點之一是利用膜技術進行水處理。陳大明[18]獲得了食品生物技術之中某一重點技術領域的Aureka專利總體地圖和不同時間段技術演進圖。王金平等[19]利用Aureka專利分析平臺繪制了國際生態系統研究關鍵詞地圖,利用關鍵詞地圖可以直觀反映熱點及其變化情況。張樹良等[20]繪制了礦產資源領域專利技術布局圖,通過聚類分析結果,可以發現技術研發集中區和分散區。顧震宇等[21]繪制了燃料電池的技術研發重點及技術熱點演進Aureka地圖。卞志昕[22]比較了固體氧化物燃料電池的專利和論文的Aureka地圖,學術研究更側重基礎研究;而專利技術更關注實際產品所需要的結構和功能性研究。王雪梅等[23]利用Aureka分析平臺對文獻進行數據挖掘,在對國際生物多樣性研究的熱點與發展態勢分析的基礎上,得到國際生物多樣性研究論文的標題詞地圖。張嫻[24]得到了智能與仿生材料領域專利的技術分布景觀圖,能夠反映總體和不同時間段的研發熱點。并且以寶潔公司涂料組合物技術和自修復增強型建筑基體材料為例,通過對重要專利技術的專利引證關系分析得出,回溯引證分析能夠進行技術追蹤分析,后向引證分析能夠進行技術演進分析。鄭軍衛等[25]利用Aureka軟件的Thememap功能,對低滲透油氣資源研發專利技術領域布局進行分析,獲得技術領域專利地圖。并且得到了申請專利數比較多的E21B43/24技術領域[利用熱(如熱蒸汽)注入采油]的專利引文樹,通過引證樹,能夠發現在該領域具有強勁技術實力的競爭對手和后來居上的潛在的競爭對手。總之,通過聚類地圖,可以識別技術領域的總體分布和不同時間段的研發熱點趨勢;通過引證分析,可以識別競爭對手和確定某項技術的發展趨勢。

3 結 論

Aureka因其三大特色功能:聚類分析、引證分析和專利地圖,成為專利分析重要的工具之一,有著極其重要的研究及應用價值,國內學者都在對其進行研究,這極大的推動了專利情報分析方法研究的進展。

本文以中國知網、萬方和維普的數據源,共統計了42篇文獻,從文獻的年代分布、期刊發表源、作者及單位、關鍵詞和主題5個方面進行研究。結果表明,Aureka在我國研究的歷史較短,正處在快速發展的上升期。越來越多的科研人員不斷參與Aureka研究中,研究工作也呈現出廣泛合作的趨勢。研究的熱點逐步由專利分析工具的比較研究轉向在各個領域的實證研究。當然,軟件本身存在一些不足之處,如采用ThemeScape繪制技術地圖時,用戶不能加入同義詞詞組或希望關注的主題概念是平臺的一個缺陷。此外,引用樹軟件只顯示直接引用關系,無法顯示整個引用鏈,且只適用于美國專利,以及系統使用費十分昂貴都制約了它的使用和發展。可以預見,在不久的將來,隨著Aureka功能的不斷完善,它的應用前景會更加廣闊。

參考文獻

[1]陳燕,鄧鵬,李芳.AUREKA信息平臺介紹[J].中國發明與專利,2007,(5):63-64.

[2]侯麗,李娜,李娟.學科戰略情報的研究任務與分析軟件適用性探討[J].圖書情報知識,2009,(1):106-110.

[3]董悅.對網絡專利情報源的幾點思考[J].圖書與情報,2009,(2):46-50.

[4]顧震宇.基于案例分析的區域專利分析方法應用研究[J].情報雜志,2010,(8):40-44.

[5]吳正.可視化工具在專利分析中的應用[J].數字圖書館論壇,2009,(10):60-67.

[6]李睿,孟連生.論專利間引用關系分析中存在的問題[J].情報理論與實踐,2009,(7):39-43.

[7]甘利人.我國專利文獻資源亟待挖掘開發[J].情報理論與實踐,2002,(6):445-448.

[8]鞠邦男,袁軍鵬.對我國布拉德福定律研究文獻的科學計量研究[J].現代情報,2010,(11):109-112.

[9]葉鷹,潘有能,潘衛.情報學基礎教程[M].北京:科學出版社,2006:9.

[10]Yang Y,Akersa L,Klosea T,et al.Text mining and visualization tools-Impressions of emerging capabilities[J].2008,(30):280-293.

[11]范哲.中外商用專利檢索軟件的比較研究[J].現代情報,2007,27(11):221-225.

[12]劉佳佳,董,方曙.國外專利分析工具的比較研究[J].現代圖書情報技術,2007,(2):67-74.

[13]張靜,劉細文,柯賢能,等.國內外專利分析工具功能比較研究[J].情報理論與實踐,2008,(1):141-145.

[14]王敏,李海存,許培揚.國外專利文本挖掘可視化工具研究[J].圖書情報工作,2009,(24):86-90.

[15]張嫻,高利丹,陳云偉.生物合成美國專利文獻分析[J].科學觀察,2009,(5):8-13.

[16]張薇,趙亞娟.國際水資源現狀與研究熱點[J].地質通報,2009,(2-3):177-183.

[17]陳大明.食品生物技術相關專利分析[J].生物產業技術,2009,(6):71-75.

[18]王金平,高峰,張志強,等.國際生態系統研究發展態勢文獻計量分析[J].地球科學進展,2010,(10):1101-1111.

[19]張樹良,張志強,熊永蘭.礦產資源領域國際科技發展態勢分析[J].資源科學,2010,(11):2216-2228.

[20]顧震宇,卞志昕,路煒,等.應用領域專利地圖的方法及實證研究[J].情報雜志,2009,(9):21-26.

[21]卞志昕.技術情報地圖——專利地圖與學術情報的結合[J].科技情報開發與經濟,2009,(16):111-113.

[22]王雪梅,曲建升,李延梅,等.生物多樣性國際研究態勢分析[J].生態學報,2010,(4):1066-1073.

[23]張嫻.智能及仿生材料技術專利態勢分析[J].科學觀察,2010,(2):27-36.

[24]鄭軍衛,張志強,王雪梅.低滲透油氣資源研究專利態勢分析[J].科學觀察,2009,(4):16-25.

注:“本文中所涉及到的圖表、公式、注解等請以PDF格式閱讀”

主站蜘蛛池模板: 又黄又湿又爽的视频| 亚洲人成在线精品| 日本久久免费| 国产性爱网站| 精品夜恋影院亚洲欧洲| 美女国产在线| 无码久看视频| 日韩国产高清无码| 国产精品乱偷免费视频| 91免费国产高清观看| 国产 日韩 欧美 第二页| 日本三级黄在线观看| 久久亚洲欧美综合| av性天堂网| 天天操天天噜| 波多野结衣无码视频在线观看| 亚洲aaa视频| 九九九久久国产精品| 97无码免费人妻超级碰碰碰| 国产91麻豆视频| 伦伦影院精品一区| 亚洲高清无在码在线无弹窗| 国产精品欧美亚洲韩国日本不卡| 亚洲天堂日本| 亚洲天堂网在线播放| 中文字幕久久精品波多野结| aaa国产一级毛片| 欧美a网站| 最新国产精品第1页| 精品伊人久久大香线蕉网站| 欧美日韩国产系列在线观看| 日韩精品专区免费无码aⅴ| 影音先锋丝袜制服| 国产香蕉在线视频| 无码内射在线| 亚洲va在线∨a天堂va欧美va| 99久久这里只精品麻豆| 亚洲精品卡2卡3卡4卡5卡区| 伊人中文网| 精品国产电影久久九九| 高潮毛片无遮挡高清视频播放| 国产91精品调教在线播放| 国产福利一区视频| 91www在线观看| 日韩精品成人在线| 久久永久精品免费视频| 国产91高跟丝袜| 国产精品成| 天天综合网在线| 成人a免费α片在线视频网站| 夜夜拍夜夜爽| 伊人色天堂| 女人爽到高潮免费视频大全| 98超碰在线观看| 国产人成在线视频| 白丝美女办公室高潮喷水视频| 午夜视频日本| 亚洲色婷婷一区二区| 日韩AV无码免费一二三区| 丁香六月激情综合| 亚洲男人在线天堂| 尤物视频一区| 99久久亚洲综合精品TS| 青草精品视频| 伊人久热这里只有精品视频99| 国产一区二区三区在线精品专区| 国产特级毛片aaaaaaa高清| 国产精品第页| 欧美自慰一级看片免费| 久久黄色影院| 91系列在线观看| 亚洲精品制服丝袜二区| 免费啪啪网址| 亚洲精品国产成人7777| 一级香蕉视频在线观看| 亚洲无码免费黄色网址| 国产福利影院在线观看| 青草娱乐极品免费视频| 亚洲AⅤ波多系列中文字幕| 国产三区二区| 久久亚洲天堂| 日韩国产精品无码一区二区三区|