汪滿容+劉桂鋒+孫華平
〔摘要〕[目的/意義]運用專利地圖的方法探索全球大數據技術的競爭態勢,以期為我國政府、企業、高校發展大數據產業和技術提供競爭情報支撐。[方法/過程]以Thomson Innovation平臺的Derwent Innovations Index(德溫特專利數據庫)中1 363篇大數據技術專利文獻為數據來源,運用專利管理地圖、專利權利地圖和專利技術地圖的方法,從申請年份、申請國家、專利申請人、同族專利、專利引用、技術領域等角度進行態勢分析。[結果/結論] 研究表明:大數據技術發展的階段特征明顯;美中兩國是大數據技術研發的主要國家;互聯網企業是大數據技術的重要推動力量;大數據研發的熱點聚焦在Hadoop、MapReduce等技術。
〔關鍵詞〕大數據;專利地圖;專利分析;專利計量;競爭情報;技術競爭情報;產業競爭情報;競爭者分析
DOI:10.3969/j.issn.1008-0821.2017.01.028
〔中圖分類號〕G250.25〔文獻標識碼〕A〔文章編號〕1008-0821(2017)01-0148-08
〔Abstract〕[Purposes]The competitive situation of the global big data technology was explored by using patent map,which provided competitive intelligence support for Chinese government,enterprises,colleges and universities to develop big data industry and technology.[Methods]1363 patent documents of big data technology were obtained from Derwent Innovations Index(Derwent patent database)in Thomson Innovation platform.By using method of patent management map,patent claim map and patent technology map,patent documents of big data technology were analyzed from perspectives of application year,priority country,assignee,patent family,patent citation,field of technology.[Conclusions]The result showed that the stage characteristics of big data technology was obvious;China and US were the main countries for big data technology research;Internet enterprise was an important driving force for big data technology;Research hotspots of big data technology were focused on Hadoop and MapReduce.
〔Key words〕big data;patent map;patent analysis;patent bibliometrics;competitive intelligence;technology competitive intelligence;industry competitive intelligence;competitor analysis
專利計量的英文是Patent Bibliometrics,最早由Narin[1]于1994年在《Scientometrics》上提出,Narin是公認的專利計量創始人。專利計量[2]是將數學和統計學的方法運用于專利研究,以探索和挖掘其分布結構、數量關系、變化規律等內在價值。專利計量的本質[3]是對專利文獻信息進行定向選擇和科學抽象的研究活動,是情報信息工作與科學技術管理工作相結合的產物,是一種重要的科研活動。專利計量的指標很多,不同的指標從不同的角度揭示專利信息,因此應該根據不同的評價目的選擇不同的評價指標。比較有影響的是美國知識產權咨詢公司CHI的專利指標體系,CHI的指標最初主要針對公司設計,但同樣適用于國家、地區。CHI一些主要指標包括:專利數量、專利相對產出指數、同族專利指數、專利成長率、引證指數、即時影響指數、技術強度、相對專利產出率、技術重心指數和科學關聯性。邱均平[4]認為應該從宏觀(某領域)、中觀(某公司)和微觀(某專利)3個層次來設計不同的專利計量指標體系。
專利分析方法[5]從研究對象的維度進行分類,通常包括技術分析、市場主體分析和區域分析,以及結合不同的需求做其他行業特色分析。由于專利文獻含有結構化與非結構化的數據[6],因此專利分析方法通常分為文本挖掘方法和可視化方法。
專利地圖[7]是指對一次、二次、三次等專利文獻的統計結果整理成各種圖表,即將專利信息“地圖化”。一般分為專利管理圖、專利技術圖、專利權利圖。專利地圖是專利信息的定量、定性和定量定性分析結果的可視化表達。英文是Patent Map或Patent Mapping。專利地圖有如下特征:專利地圖基于專利信息、有明確的使用目的、專利信息經過組織加工、以可視化的形式顯示。專利地圖[8]起著承上啟下的作用。承上是指對專利信息的加工過程,專利地圖的可視化展示,供專利情報分析使用;啟下是對專利地圖的研究,進行預測和判斷,為技術創新、專利戰略、經營戰略服務。
2011年麥肯錫公司發布《大數據:創新、競爭和生產力的下一個前沿》報告[9],標志著大數據時代的到來。近年來,大數據技術引起了業界與學界[10-17]的高度重視與熱切關注。本文運用專利計量特別是專利地圖的方法對全球大數據技術的研發現狀進行全方位的剖析。
1數據來源
本文數據來自Thomson Innovation平臺的Derwent Innovations Index(簡稱DII)數據庫,包括將Derwent World Patents Index(德溫特世界專利索引,簡稱DWPI)與Derwent Patents Citation Index(專利引文索引,簡稱DPCI)數據庫。分別在標題-DWPI、關鍵詞-DWPI、摘要-DWPI中檢索Big Data,摘要里含有“MapReduce OR BigTable OR MPP Comput OR Hadoop OR GoogleFileSystem”的專利,公開日期從2003年1月1日至2016年8月1日,且專利分類在G06F和H部類下。檢索式:(ALLD=(big ADJ data)OR ABD=(MapReduce OR BigTable OR MPP ADJ Comput)OR ABD=(Hadoop OR GoogleFileSystem))AND DP>=(20030101)AND DP<=(20160801)AND IC=(G06F OR H)。檢索結果1 363項。
2研究結果分析
2.1歷年專利動向圖
歷年專利動向圖常用折線圖表示,縱坐標是專利件數,橫坐標是專利申請年份或公開年份或授權年份。通過歷年專利動向圖可以了解技術領域的歷年專利申請、產出以及發展情況,推測技術發展趨勢或研發投入趨勢。大數據技術研究的專利申請年份和公開年份見圖1。從圖1可知,大數據技術發展分為兩個階段,一是2003-2010年,屬于技術萌芽階段,申請的和公開的專利數量比較少,基本上在20件以下。二是2011年至今,屬于技術的快速發展階段,專利申請和公開的數量呈現加速增長的趨勢,2013年和2014年申請和公開的專利數量在350~450件之間,暫時達到了頂峰。由于受到檢索時間和專利公開時間的影響,2016年的數據只作為參考,但可以預計,2016年專利申請和公開的數量會比2015年穩步上升。大數據技術的快速發展階段還會繼續延長一段時間。
2.2各國專利占有比例圖
各國專利占有比例圖常用餅狀圖表示,圖中每一個扇面代表一個國家,扇面積代表該國家專利所占的份額。通過各國專利占有比例圖可以發現競爭國家以及競爭實力。專利優先權國家是指專利申請人就其發明創造第一次申請所在的國家或地區。由圖2可知,1 363件專利的專利優先權國家或地區主要分布在中國(773件)和美國(343件),約占全部專利總數的82%,其次是韓國(108件)、WO(37件)、印度(32) 和日本(26件)等國家。從專利出版國家或地區來看(圖3),主要分布在中國(743件)和美國(379件),其次是WO(97件)、韓國(79件)和日本(15件)。379件美國專利,優先權國家為美國的有298件、韓國的有29件、印度的有16件、中國的有15件、臺灣的有12件、日本的有6件,歐洲、英國和俄羅斯各有1件。優先權為中國的15件美國專利中,10件為國外申請人(IBM公司9件、EMC公司3件和INVENTEC CORP公司1件),5件是國內申請人申請的,其中騰訊公司申請1件。
2.3主要競爭公司分析圖
主要競爭公司分析圖常用條形圖表示,每一個長條代表一個競爭公司,長條的長度代表該公司的專利數量。通過主要競爭公司分析圖可以發現主要的競爭公司及其競爭實力。1 363件專利共有100余個專利權人/申請人-DWPI,其中申請專利5件以上的專利申請人有49個。圖4列出了專利申請數量在前10位的國外專利申請人。國外前10位申請人除前五位專利數量在10件以上,其余在10件以下。美國申請人為8家,日本(NEC)和韓國(UNIV KONKUK IND COOP CORP)各1家。
申請數量最多的是申請63件專利的IBM公司,包括60件美國專利、2件英國專利和1件日本專利。專利的主要內容為大數據收集與存儲方法、聚類管理方法、數據處理方法、數據定位方法、Map/Reduce搜索優化、Hadoop分布式文件系統(HDFS)、并行計算系統(PCS)、基于Map/Reduce框架的數據轉移方法、社交媒體應用的圖形處理系統和大規模并行程序(MPP)等。排在第二位的是雅虎公司,共有20件,19件是美國專利、1件是WO專利。微軟在2009-2014年申請了7件美國專利,主題為并行計算的數據分區優化、挖掘大數據價值的方法、分布式數據并行執行系統的分支定界算法、基于MapReduce引擎的圖形處理技術等。谷歌公司申請了兩件美國專利和兩件WO專利,涉及網頁文本分割方法、基于無線強度的概率模型降低訓練的計算復雜度、基于MapReduce框架的數據處理方法和MapReduce表格關聯方法。
國內前10位申請人主要是在我國申請的專利(圖5),主要由高校、企業和研究所組成。主要的高校有華中科技大學(17件)、南京大學(14件)、南京郵電大學(12件)、北京大學(9件)。主要的企業有浪潮(20件)、國家電網(18件)、中興(16件)、華為(14件) 和百度(12件)。浪潮在2013年和2015年申請了20件專利,主要集中在HBase表、MapReduce任務資源配置和任務調度算法、基于Hadoop的軟件測試方法、測試Hadoop集群穩定性的方法、HDFS快照的實現方法、數據讀寫方法、多線程數據上傳方法、Hadoop身份認證機制構建方法、大數據系統等。中興在2005-2015年申請了16件專利,其中6件WO專利、10件中國專利,主題包括實現大數據沖擊的自動化測試方法、大數據量分類檢索網頁的響應方法、應用于Hadoop架構的任務調度方法、電信設備的任務管理方法、基于物聯網大數據平臺的智能用戶分析生成用戶圖像的方法、基于Hadoop的硬盤損壞處理方法等。華為申請了14件專利,1件美國專利、9件WO專利和4件中國專利,主題有基于MapReduce編程架構的任務分配方法、Hadoop集群內部節點通信方法、智能手機數據處理方法、網站主頁大數據處理方法、Hadoop分布式文件系統的數據壓縮和存儲方法等。百度申請專利12件,主要分布在2012年和2014年。主題有HDFS、Hadoop程序測試方法、Hadoop的調度方法、用于MapReduce的數據排序及傳輸方法、Hadoop Streaming腳本測試方法、MapReduce分布式系統的文件遷移方法、MapReduce分布式系統的測試方法、用于HADOOP計算的輸入數據的方法等。
2.4專利家族圖
通過專利家族圖可以發現技術保護內容的變遷、確定專利的價值、了解潛在的市場布局等。1 363件大數據技術專利的同族專利數量分布見圖6。由圖6可知,只有1個DWPI同族專利的數量最多,達到930件,占到68%;2~5個DWPI同族專利的數量為410件;6~9個DWPI同族專利的數量只有18個;而超過10個以上DWPI 同族專利的數量則越來越少,僅僅只有5個(見圖7)。DE102014103377A1是FISHER-ROSEMOUNT SYSTEMS公司于2014年3月13日申請的有關“操作過程計劃系統”的德國專利,優先權是US2013792109P和US14028860A。18個DWPI同族專利主要分布在美國(4個)、英國(6個)、中國(2個)、德國(4個)和日本(2個)。US20140225757A1是CORTICA公司于2013年4月30日申請的有關“大數據存儲系統中基于符號空間音頻壓縮模式”的美國專利,優先權是US2013763554P。11個DWPI 同族專利主要分布在美國(2個)、英國(2個)、中國(2個)、日本(2個)、德國(1個)、韓國(1個)、WO(1個)。CA2843459A1是自然人于2014年2月18日申請的有關“分布式計算集群中對存儲的數據進行查詢”的加拿大專利,優先權是US13800280A。11個DWPI同族專利主要分布在美國(2個)、韓國(2個)、加拿大(2個)、澳大利亞(2個)、EP(1個)、英國(1個)、日本(1個)。US20130117847A1是NETFLOW LOGIC公司于2012年11月5日申請的有關“本地網絡系統上生成的網絡協議元數據的處理方法”的美國專利,優先權是US2011556817P和US2012699823P。10個DWPI同族專利主要分布在美國(2個)、韓國(1個)、WO(1個)、印度(1個)、加拿大(1個)、EP(1個)、中國(1個)、日本(1個)、俄羅斯(1個)。WO2012174471A1是ARGYLE DATA公司于2012年6月15日申請的有關“云計算環境中的移動設備應用程序分解”的PCT專利,優先權是US2011497860P、US13525036A、US13524959A和US13524881A。10個DWPI同族專利主要分布在美國(6個)、澳大利亞(2個)、EP(2個)、中國(1個)、WO(1個)、西班牙(1個)。
2.5重要專利引用譜圖
重要專利引用譜圖常用表格或者柱狀圖表示,由此表或圖可以發現重要專利、核心專利或基礎專利,以及技術發展脈絡或技術演進趨勢。前20件高被引專利(圖8)有16件美國專利和4件中國專利。由于大數據的專利基本上是在2010年之后的最近幾年申請的,因此總體被引次數不是很高,基本上在20次以上。
4件中國專利都是大陸申請人在本土申請的,且施引的專利權人都是中國申請人。CN101770402A是中國移動公司于2008年申請的“MapReduce系統中的Map任務調度方法、設備及系統”的專利。共被29項專利引用,26項是中國專利,3項是WO專利(中興2項和華為1項)。CN101996250A是中國科學院計算技術研究所于2010年申請的“基于Hadoop的海量流數據存儲和查詢方法及系統”的專利。共被23項專利引用,全部是中國專利。CN1536820A是華為公司于2003年申請的“提高網絡擁塞時數據傳輸性能的方法”的專利。共被22項專利引用,21項是中國專利,1項是美國專利(自引)。CN101764835A是華為公司于2008年申請的“基于MapReduce編程架構的任務分配方法”的專利。共被21項專利引用,全部是中國專利。
16件美國專利中,US20110302583A1的被引次數最高,達到73項,其中65項是美國專利引用、6項是中國專利(CN103106249B、CN103106249A、CN102799622B、CN102799622A、CN103593401A、CN102663005A)、1項是日本專利(JP05831324B2)、1項是PCT專利(WO2015183344A1)。該專利是耶魯大學于2011年申請的“帶有存儲裝置能夠處理數據庫系統中數據任務的數據處理系統及框架”專利。該專利共引用4件美國專利,Teradata公司、Yahoo公司各1件,亞馬遜公司2件。其中US7984043是亞馬遜公司2007年申請,2011年公開的利用大數據預測用戶需求,使該公司甚至能在客戶點擊“購買”之前就開始遞送商品的“預期遞送”專利。
利用專利引證信息構建雙向多級引證樹,由此確定技術領域的發展趨勢、技術發展路線和研究競爭對手的專利布局等。專利引證圖中的節點可以選擇專利權人、DWPI專利權人代碼、申請日期、公開日期、IPC、DWPI分類、DWPI手工代碼等。根據專利申請人的專利相互引證的信息,研究競爭對手間技術相似性,為企業技術合作、并購等經營活動提供決策依據。圖9為該專利73項DWPI施引專利權人代碼。在圖9中相同顏色的節點代表是同一個專利權人,以被引專利的UYYA為例,綠色代表是UYYA專利權人自己引用,共有3個專利,分別是US8886631B2、US8935232B2和US9336263B2。按年份顯示該專利被引用變化,2012年共被引5次,2013年共被引9次,2014年共被引24次,2015年共被引24次,2016年共被引11次。根據大量的前向和后向引用信息,可以確定核心專利技術、基礎技術等,為企業技術開發、研發投入、專利布局等提供重要幫助。73項施引專利共涉及33個專利權人,其中JOYENT INC最多,有13件專利,IBM和Google各有6件專利,TERADATA公司有4件專利,耶魯大學、ORACLE和PARELASTIC公司各有3件專利。其余在2件專利以下,國內專利權人有華中科技大學、北京航空航天大學、杭州海康威視系統技術有限公司。
2.6專利技術分布圖
通過專利技術分布圖可以發現或識別主要的技術領域、技術布局、技術發展趨勢、技術競爭對手、技術競爭策略等。利用Thomson Innovation的專利聚類分析和專利地圖分析功能,對大數據技術的1363件專利的標題和摘要進行ThemeScape專利地形圖分析。專利地形圖的制作共分為4個階段:收集、分析、文本聚類和專利地圖。采用等高線圖作為全圖繪制的基準。專利地形圖中的點代表一篇專利文獻,點與點之間的距離代表專利文獻之間內容的相似程度,最終形成山峰。不同山峰區域內的專利文獻代表某一特定技術主題。圖10實際顯示了1 350件專利的技術總體分布,每個技術區域使用從題目或摘要中提取的3個英文關鍵詞表述相關技術,反映大數據研發的技術概貌和技術分布。總共分為19個技術領域。技術領域Ⅰ(Embodiment/Customer data/Web scale)、技術領域Ⅱ(Cloud/Cloud server/Server)、技術領域Ⅲ(Service/Management/Function)、技術領域Ⅳ(Train/Algorithm/Step)、技術領域Ⅴ(Mapreduce/Reduce/Job)、技術領域Ⅵ(Platform/Cloud/Data platform)、技術領域Ⅶ(Mine/Algorithm/Parallel)、技術領域Ⅷ(Network/Traffic/Communication)、技術領域Ⅸ(Table/Database/Key)、技術領域Ⅹ(Query/Result/Receive)、技術領域Ⅺ(Information/Device/Include)、技術領域Ⅻ(Determine/Include/Target)、技術領域(Storage/Store/Receive)、技術領域(Virtual/Machine/Virtual machine)、技術領域ⅩⅤ(Index/Distributed/File)、技術領域ⅩⅥ(Resource/Job/Hadoop)、技術領域ⅩⅦ(Hadoop/Device/Hadoop System)、技術領域ⅩⅧ(File/Node/block)、技術領域ⅩⅨ(Field/Combination/Result)。
地圖中不同顏色表示技術區域內專利的數量,按照藍色、綠色、深綠色和棕色依次遞增。白色表示最高峰,即專利文獻最密集部分,說明涉及該技術主題的專利申請量最多,是研發中的熱點技術,圖11中所示共有5處白色區域。中間最大的一個區域為熱點Ⅰ,由技術領域 (Field/Combination/Result)和技術領域(Map/Reduce/Task)兩個山峰圍成的山谷,熱點主題包括多字段并行查詢方法、MapReduce作業處理系統等。熱點I等高線有76篇專利,其中中國專利48篇,美國專利19篇,PCT專利5篇,韓國2篇、歐洲、印度各1篇。右上角的熱點Ⅱ,技術領域為(Storage/Store/Receive),熱點主題包括數據存儲系統、數據儲存方法等。熱點Ⅱ等高線有24篇專利,其中中國專利7篇,美國專利11篇,PCT專利4篇,英國、日本各1篇。右下角的熱點Ⅲ,技術領域為(Virtual/Machine/Virtual machine),熱點主題包括虛擬機、虛擬化計算系統等。熱點Ⅲ等高線有12篇專利,其中中國專利4篇,美國專利5篇,PCT專利2篇,韓國1篇。左下角的熱點Ⅳ,技術領域為(Analysis/Data analysis/Big data analysis),熱點主題包括數據分析方法、大數據分析系統等。熱點Ⅳ等高線有9篇專利,其中中國專利6篇,美國、韓國、印度各1篇。最下面的區域為熱點Ⅴ,由技術領域(File/HDFS/Hadoop)和技術領域(File/Node/Block)兩個山峰圍成的山谷,熱點主題包括分布式文件系統、文件管理服務系統等。熱點Ⅴ等高線有49篇專利,其中中國專利38篇,美國專利4篇,PCT專利2篇,韓國5篇。
Hadoop是一個開源的可運行于大規模集群上的分布式文件系統和運行處理基礎框架。Hadoop的核心組件包括海量存儲的HDFS(Hadoop分布式文件系統,Hadoop Distributed File System)與分布式并行計算的資源調度(Yarn)+編程模型(MapReduce)。在圖10顯示的1 350件專利的技術總體分布中,運用主題檢索功能進行檢索,含有Hadoop的專利文獻數量是396篇。對于核心組件之一分布式文件系統而言,其中含有Hadoop Distributed File System的專利文獻數量是75篇,含有HDFS的專利文獻數量是128篇,二者的并集是146篇,如圖12所示,紅色的點代表含有Hadoop Distributed File System的75篇專利文獻,綠色的代表含有HDFS的128篇專利文獻,白色的點是或者含有前者或者含有后者的146篇專利文獻,說明兩者之間還有交集,既含有前者又含有后者的有57篇。同樣對于核心組件之二分布式并行計算而言,含有MapReduce的專利文獻數量是233篇,含有Yarn的專利文獻數量是3篇,兩者的并集是235篇,兩者的交集是1篇。通過對上述5個主題進行邏輯合并,得到571篇專利文獻,如圖13所示,紅色代表含有Hadoop的專利文獻,黃色代表Hadoop Distributed File System、淺綠色代表HDFS、綠色代表MapReduce、藍色代表Yarn,而白色代表含有其中兩個以上主題的文獻。
3結論
本文運用專利地圖的方法掃描全球大數據技術競爭態勢,得出如下結論:
3.1大數據技術發展的階段特征明顯
大數據研究的專利申請年份或公開年份表明:大數據技術發展分為兩個階段。第一階段為2003-2010年的技術萌芽階段,專利申請的數量比較少,均不超過20件(篇)。這一階段MapReduce、Hadoop、分布式文件系統、非關系型的數據庫、并行數據倉庫、分布式計算等大數據的突破性技術已經閃現,為大數據的快速發展打下了基礎。第二階段為2011-2016年的快速發展階段,專利申請的數量上升勢頭強勁。
3.2美中兩國是大數據技術研發的主要國家
無論是從專利優先權國家還是專利出版國家來看,美國和我國均是大數據研究的領先國家。但是從掌握大數據研究的核心技術來看,美國處于中心地帶,擁有大批一流的研發機構,如IBM、雅虎、微軟等公司。雖然我國大數據研究的專利數量較多,但缺乏原始創新,關于大數據研究的重點方向和核心基礎的系統、性能和算法較少。我國專利申請主要在本國申請,較少在美國和WO申請。從高被引專利看,前20件專利只有4件為國內申請人申請的中國專利,并且施引申請人全部是中國研發機構。
3.3互聯網企業是大數據技術的重要推動力量
從專利申請人可知,國外申請數量較多的有IBM公司、雅虎公司、惠普公司、微軟公司、谷歌公司和亞馬遜公司等,國內申請人主要有浪潮公司、中興公司、華為公司和百度公司等。綜上,大數據的底層架構和核心技術主要由谷歌公司、IBM公司等互聯網企業機構掌握。
3.4大數據研發的熱點聚焦在Hadoop、MapReduce等技術從專利地形圖看,全球大數據技術分為19個技術領域,5個熱點技術。Hadoop[18]的核心組件包括海量存儲的HDFS(Hadoop分布式文件系統)與分布式并行計算的編程模型(MapReduce)。MapReduce編程模型是谷歌公司于2004年申請2010年獲得授權的US7650331專利,有關“高效大規模數據處理的系統與方法”,包括Map模塊和Reduce模塊。
參考文獻
[1]Narin F.Patent bibliometrics[J].Scientometrics,1994,30(1):147-155.
[2]Iversen E J.An excursion into the patent-bibliometrics of Norwegian patenting[J].Scientometrics,2000,49(1):63-80.
[3]欒春娟.專利計量與專利戰略[M].大連:大連理工大學出版社,2012:28.
[4]邱均平,馬瑞敏,徐蓓,等.專利計量的概念,指標及實證[J].情報學報,2008,27(4):556-565.
[5]楊鐵軍.專利分析實務手冊[M].北京:知識產權出版社,2012:137.
[6]Abbas A,Zhang L,Khan S U.A literature review on the state-of-the-art in patent analysis[J].World Patent Information,2014,37:3-13.
[7]Introduction to patent map analysis[EB/OL].http:∥www.training-jpo.go.jp/en/imagesx/uploads/textvtr/pdf/Introduction%20to%20Patent%20Map%20Analysis2011.pdf,2016-08-05.
[8]肖滬衛,顧震宇.專利地圖方法與應用[M].上海:上海交通大學出版社,2011:12.
[9]Manyika J,Chui M,Brown B,Bughin J,Dobbs R,Roxburgh C,Byers A H.Big data:The next frontier for innovation,competition,and productivity[R].2011.
[10]Hu H,Wen Y,Chua T,Li X.Towards scalable systems for big data analytics:A technology tutorial[J].IEEE Access,2014,(2):652-687.
[11]McAfee A,Brynjolfsson E.Big data:the management revolution[J].Harvard Business Review,2012,90(10):61-67.
[12]Chen H,Chiang R H L,Storey V C.Business intelligence and analytics:from big data to big impact[J].Management Information Systems Quarterly,2012,36(4):1165-1188.
[13]李鵬飛,盧瑾,辛一.基于專利的大數據技術發展情報分析及戰略研究[J].情報雜志,2014,33(9):45-50.
[14]劉桂鋒,盧章平,宋新平.專利地圖和知識圖譜視角的大數據比較研究[J].圖書情報知識,2015,(5):89-98.
[15]何曉萍,黃龍.大數據領域演進路徑,研究熱點與前沿的可視化分析[J].現代情報,2015,35(4):46-51.
[16]李文娟,劉桂鋒,盧章平.基于專利分析的我國大數據產業技術競爭態勢研究[J].情報雜志,2015,34(7):65-70.
[17]王忠,安智慧.國外城市管理大數據應用典型案例及啟示[J].現代情報,2016,36(9):168-172.
[18]Shvachko K,Kuang H,Radia S,Chansler R.The hadoop distributed file system[C]∥Mass Storage Systems and Technologies(MSST),2010 IEEE 26th Symposium on.IEEE,2010:1-10.
(本文責任編輯:馬卓)