


〔摘要〕以太陽能汽車技術領域為例,從德溫特數據庫中下載專利文獻的專利權人與分類號信息作為樣本,構建2-模異質多重共現網絡,將兩類特征項及其3種共現關系在同一圖譜中進行集中展示,從中尋找該技術領域的主要研發力量和熱門技術主題,并對二者之間的交叉關聯進行量化分析。證實了多重共現分析能夠克服一重共現分析揭示維度單一的不足,尤其適合于潛在關系的發掘。研究發現,在太陽能汽車領域日本的技術優勢非常明顯,日本企業繼續保持全球領先水平。中國的整體技術實力居于世界前列,但中國企業個體的技術力量卻相對單薄,在市場競爭中將處于劣勢地位。
〔關鍵詞〕多重共現分析;共現分析;專利計量;社會網絡分析;太陽能汽車
DOI:10.3969/j.issn.1008-0821.2017.04.026
〔中圖分類號〕G255.53〔文獻標識碼〕A〔文章編號〕1008-0821(2017)04-0165-05
Study on the Global Patent Layout Based on the Multiple Co-occurrence
Analysis with Patent Assignees and Classification Codes
——In the Case of Solar Vehicles TechnologyWen Fangfang
(College of Management,Henan University of Science and Technology,Luoyang 471023,China)
〔Abstract〕Taking the Derwent patent literatures in the technical field of solar vehicles as the sample,a 2-mode heterogeneous multiple co-occurrence network has been constructed based on the co-occurrence relations of patent assignees and classification codes,with two terms and three kinds of co-occurrence relations centralized displaying in the same visualization map.Powerful research firms and hot technical themes have been identified through the quantitative analysis,as well as the practical and potential collaboration relations have been detected and compared.It confirmed that the method of multiple co-occurrence analysis offering more findings with multiple dimensions that can overcome the shortcomings of single dimension co-occurrence analysis.It is especially suitable for exploring potential relations.The results revealed that Japan possessing obvious advantage in the field of solar vehicles,with Japanese companies maintaining world leading level.Chinas overall technical strength living in the forefront of the world,but the individual strength of Chinese enterprise is relatively weak,resulted in the disadvantage of market competition.
〔Key words〕multiple co-occurrence;co-occurrence analysis;patent bibliometrics;social network analysis;solar vehicles
共現分析是常用的文獻計量方法,共現現象可以轉化為網絡矩陣進行形式化表示和定量測度。在社會網絡分析及可視化方法的輔助下,共現分析以其方法的簡明性和分析結果的可靠性,成為支撐信息內容分析的重要手段和工具,文獻計量學領域涌現出一大批針對論文或專利文獻開展共現分析的研究成果。共詞分析、合作分析、引文分析、共類分析等方法,被廣泛地應用于探測學科研究熱點與發展前沿[1]、追蹤學科知識的演變歷程與擴散規律[2]、揭示作者(機構或國家)之間的合作與競爭關系[3]、測度不同學科之間的知識與技術關聯[4]、改進語義檢索效果以及深度挖掘情報價值[5]。共詞分析、合作研究、共類分析、引文分析等,本質上都是共現分析。
但是,以往的共現分析多為一重共現分析,所構建的共現網絡為同質網絡,如合著網絡、共詞網絡、共類網絡等,僅從單一維度出發,能夠揭示的知識廣度與深度畢竟有限。事實上,作者、關鍵詞、分類號等不同特征項之間存在著千絲萬縷的關聯,所形成的交叉共現關系無法通過一重共現分析來揭示,而需要進行多重共現分析。為了反映不同特征項之間的交叉關聯,文獻計量學家提出了多重共現的概念和方法。Morris等從論文和專利文獻中提取有效信息,基于兩個共現矩陣相同特征項之間的關聯,開發出交叉圖和時間線技術,同時將兩種特征項之間的關聯性在一張二維圖中予以展示,有助于領域專家更好地進行技術預測[6]。Leydesdorff把異質網絡思想引入網絡可視化分析,構建了作者-關鍵詞-期刊三重共現異質網絡,將3類特征項之間的交叉共現關系在同一網絡圖譜中進行集中展示[7]。
國內學者龐弘遷等人對Morris的交叉圖技術進行改進,開發了多重共現的可視化分析工具,并將其應用于實證研究,對機構-期刊-關鍵詞[8]、高校圖書館-核心期刊-關鍵詞[9]、年份-關鍵詞-機構以及年份-關鍵詞-發表期刊[10]等多類特征項之間的多重共現關系進行計量分析和可視化展示。冷伏海等人提出基于位向量的三元共詞分析算法和基于坐標圖的三元共詞結果分析方法,并以期刊論文關鍵詞為對象進行實證研究[11]。魏緒秋等人構建作者-年份-關鍵詞多元合作網絡,以探尋作者科研合作主題行為特征[12],構建作者-關鍵詞-期刊三模網絡,以展示作者分布、期刊分布、主要研究內容以及三者之間的關聯[13]。李長玲等人構建作者-作者-關鍵詞2模異質網絡,測度作者開展潛在合作的可能性及識別作者潛在合作空間[14]。
迄今為止,多重共現分析仍然是一個新興的研究主題,國內外學者進行了一定的探索,并初步證實了多重共現分析的可行性,與以往計量學慣用的單一維度的共現分析相比,多重共現分析揭示的信息更為全面、系統和深入,尤其適合用來發掘多元、交叉、潛在的關系。但是,目前國內外相關研究成果相對較少,且大多以論文作為樣本數據,圍繞專利開展的多重共現分析亟待加強。若將技術創新視為新產品或新工藝從設想產生到市場應用的完整過程,專利文獻則是技術創新活動的完整記錄。專利文獻是集技術、法律、經濟信息于一體的復合型信息源[15]。全球80%可得技術信息都會出現在專利文獻中并且通常不會在其他地方再現。此外,專利文獻具有內容規范、樣本規模大、代表性強、便于獲取、易于計量等優良屬性[16]。因此,專利文獻為技術創新問題研究提供了重要的數據支持。
鑒于以上情況,本文對面向專利文獻的多重共現分析方法進行積極的探索和檢驗。以太陽能汽車技術為例,從德溫特專利數據庫(Derwent Innovations Index,DII)中獲取專利文獻,提取專利權人和分類號信息,基于兩類特征項之間的交叉關聯構建多重共現網絡,將專利權人和專利分類號兩類特征項,專利權人-專利權人共現(合作)、分類號-分類號共現(共類)、專利權人-分類號共現(隸屬)3種共現關系,在同一網絡中集中呈現和綜合分析,揭示該技術領域的主要研發力量、研究主題、競爭態勢等方面的信息。不僅有助于理清太陽能汽車領域的技術創新現狀以及主要創新主體的活動軌跡,也是對文獻計量學中共現分析方法體系的進一步豐富與拓展。
1樣本數據
從DII中檢索太陽能汽車技術領域近五年的專利文獻,選擇高級檢索功能進行主題檢索,檢索算式為:TS=solar AND TS=(vehicle OR auto OR car),索引=(CDerwent,EDerwent,MDerwent),時間跨度=2012-2016。由于DII收錄時滯,導致2016年收錄的數據并不完全。檢索時間為2016年12月14日,檢索結果為12 287條專利記錄。下載每個專利(族)的專利權人和德溫特分類號信息,導入Excel中進行分類匯總。
德溫特分類號(Derwent Class Code,DC):德溫特自創的分類體系,每件專利被分配一個或多個DC,直接表征該件專利的研究內容和技術主題。樣本中64.71%的專利同時包含兩個及以上DC,形成較為普遍的分類號共現現象。
專利權人名稱及代碼(Assignee Name+Code,AE):DII對專利權人名稱進行了規范化處理,以“-C”結尾的標準代碼分配給擁有千件以上專利的標準公司;以“-Non-standard”結尾的非標準化代碼分配給標準公司以外專利申請量不大的非標準公司;個人專利權人代碼以“-Individual”結尾[17]。
個人代碼重名現象較多,無法對專利權人身份進行準確區分,而且僅憑自然人姓名無法透露更多的有效信息。另外,相對于自然人而言,對于企業專利的研究更具商業情報價值。因此,本文僅對專利權人為企業(含企業、高校、科研機構及其他社會組織,本文將其統稱為企業)的情況進行計量分析,選擇專利權人代碼為-C和-Non-standard的數據作為初始樣本。經初步統計,樣本中共有企業3 042個,其中,標準公司1 024個,非標準公司2 018個。
2研究過程及結果
2.1構建多重共現關系網絡
本文構建專利權人-德溫特分類號共現關系網絡矩陣,如圖1所示,該網絡矩陣同時包含兩類特征項和3種共現關系,為2-模、無向、異質網絡。兩類特征項:專利權人代碼(AC)、德溫特分類號(DC)。3種共現關系:①專利權人共現(合作)關系,為同質無向網絡,反映不同專利權人之間以專利文獻聯合署名為標識的合作現象;②專利權人-分類號共現關系,為異質無向網絡,反映各個專利權人所從事的技術主題;③分類號共現(共類)關系,為同質無向網絡,反映各個分類號所代表的不同技術主題之間的交叉關聯性。
多重共現矩陣實際上由3類矩陣組成,初始矩陣中每個值Cij代表著共現頻次,由于3類矩陣的節點類型及共現關系類型各不相同,為消除量綱影響,本文采用極值化方法分別對3類初始矩陣進行處理,將其轉化為標準化矩陣。
C′ij=Cij-CminCmax-Cmin(0≤C′ij≤1)(1)
其中,Cij為初始值,Cmax和Cmin為初始矩陣的最大值和最小值,C′ij為標準值。最后將3個標準化矩陣整合為一個鄰接矩陣,即專利權人-分類號多重共現網絡。樣本中3 042個企業和257個德溫特分類號,組成了一個3299*3299的多重共現網絡。
2.2多重共現網絡可視化
將多重共現網絡標準化矩陣導入Ucinet和NetDraw,繪制多重共現網絡圖譜。由于頁面限制,為實現更為清晰的可視化效果,本文選擇樣本數據中高頻節點(頻次≧20)予以展示,并且將閾值設定為C′ij0.1,以剔除低強度的共現關系。如圖2所示,紅色圓形節點為專利權人,藍色方形節點為德溫特分類號,節點大小代表著專利權人或分類號在樣本中出現的頻次,節點之間的連線表征共現關系,連線粗細代表著共現強度大小。此外,以不同的顏色區分3種共現關系,黃色連線為專利權人-分類號共現關系,綠色為共類關系,紅色為合作關系。
2.2.1專利權人與分類號頻次分析
紅色節點大小顯示出每個專利權人(企業)擁有的專利數量多少,代表其研發力量強弱,節點越大則該企業技術力量越強。藍色節點大小顯示出每個德溫特分類號在樣本數據中的出現頻次,反映出各個分類號所代表的技術主題的冷熱程度,節點越大則該技術主題越熱門。68個企業的技術力量和125個技術主題的熱門程度在圖2中進行集中展示和直接比較,全球主要技術力量和研究主題分布情況便可一目了然。
排名前十的企業分別為:日本豐田汽車公司(TOYT-C)、德國博世集團(BOSC-C)、韓國三星集團(SMSU-C)、德國賀利氏控股集團(HERA-C)、日本電裝公司(NPDE-C)、美國杜邦公司(DUPO-C)、日本旭硝子公司(ASAG-C)、日本住友電氣工業公司(SUMM-C)、中國國家電網公司(SGCC-C)、日本三菱化學公司(MITU-C)。
排名前十的技術主題分別為:X15-Non-Fossil Fuel Power Generating Systems(非化石燃料發電系統)、X22-Automotive Electrics(汽車電子)、X21-Electric Vehicles(電動汽車)、X16-Electrochemical Storage(電化學存儲)、T01-Digital Computers(數字計算機)、U12-Discrete Devices,e.g.LEDs,photovoltaic cells(分立器件,例如發光二極管、光伏電池)、L03-Electro-(in)organic,chemical features of electrical devices(電氣設備的電化學特性)、U11-Semiconductor Materials and Processes(半導體材料和工藝)、X26-Lighting-Discharge,incandescent and electric arc lamps(照明-放電,白熾燈和電弧燈)、A85-Electrical applications(電氣設備)。
2.2.2專利分類號共現關系網絡分析
作為技術主題的符號化表征形式,德溫特分類號反映出太陽能汽車技術領域的研究內容和知識結構。共類網絡則展示了各個分類號所代表的技術主題的分布情況及其相互之間的技術關聯性,以及各個技術主題的熱門程度及其在整個技術領域知識結構中的地位和影響力。結合樣本統計數據可知,太陽能汽車涉及的技術領域非常廣泛,包含了257個德溫特分類號,涵蓋了20個類別。少數節點(分類號)居于網絡核心位置,而更多的節點(分類號)則處于網絡邊緣,該網絡結構特征顯示出太陽能汽車研究領域的知識結構特征,雖然涉獵的技術領域非常廣泛,但研究重心始終圍繞部分關鍵技術主題展開。X15、X22、X21、X16、T01、U12、U11、L03等高頻分類號位于共現網絡的核心位置且相互之間存在較強的共類關系,說明這些技術主題既是研究熱點與技術前沿,又代表著整個研究領域的主流知識與關鍵技術。
2.2.3專利權人-分類號隸屬關系網絡分析
專利權人-分類號共現分析用于測度專利權人與技術主題之間的量化關系,其共現網絡能夠顯示出每個專利權人(企業)所從事的主要技術主題,及其在各個技術主題的研發力量分布情況(由紅色和藍色節點之間連線的粗細表征)。例如,樣本中德國博世集團(BOSC-C)擁有的專利數量居于世界前列,該企業的研究范圍十分廣泛,主要涉及45個技術主題,涵蓋了圖2中125個技術主題的1/3以上。其中,博世集團在太陽能汽車領域的主要研發力量集中在以下幾個技術主題:X21(電動汽車)、X16(電化學存儲)、X15(非化石燃料發電系統)、X12(配電/元件/轉換器)、U24(放大器及電源供應器)。
另外,圖2還顯示出每個技術主題主要由哪些企業參與,各個企業在各個技術主題的研發實力也可進行橫向的比較(由紅色和藍色節點之間連線的粗細表征)。例如,X15(非化石燃料發電系統)為太陽能汽車領域最熱門的技術主題,圖2中68個專利權人,其中64個都擁有該技術主題的專利,其中,日本豐田汽車公司(TOYT-C)、日本三菱化學公司(MITU-C)、日本夏普公司(SHAF-C)、日本東麗工業公司(TORA-C)、美國杜邦公司(DUPO-C)、日本松下電器公司(MATU-C)等在該技術主題具有明顯優勢。
2.2.4專利權人潛在合作關系的發掘
專利權人之間的合作關系分為現實合作與潛在合作兩種形式,前者以專利權人共現(聯合署名、共同持有)為標識,后者是指專利權人因其研究內容的相似性有可能產生但并未真正建立的隱藏關系。潛在的合作關系可以借助于專利權人-分類號共現網絡進行探測。現實中較高強度的現實合作關系實際上很少,圖2中僅有3組合作伙伴:德國賀利氏控股集團(HERA-C)和美國福祿公司(FECO-C)、日本豐田汽車公司(TOYT-C)和日本電裝公司(NPED-C)、日本住友電器工業公司(SUME-C)和日本東海橡膠工業公司(TOKG-C)。但是,由于研究主題相似或相關,不同專利權人之間存在潛在的合作機會,圖2中節點之間的共現強度及其聚類現象,顯示出不同專利權人所從事的研發領域的關聯性與相似性,據此可以發掘潛在合作關系、尋找潛在合作伙伴。
3研究結論與討論
3.1中國太陽能汽車企業的技術實力有待提升
參與太陽能汽車研發的企業數量眾多,但研究實力參差不齊。樣本中逾3 000個企業擁有相關專利,但專利數量在10件及以上的企業不足5%。排名前10的企業擁有專利數量均在百件以上,作為全球知名的大型集團公司,歷史久、規模大、實力強,在汽車制造、電氣工程、工程技術等領域處于全球領先地位。這些企業積極投入太陽能汽車研發,并且在該技術領域居于主導性地位。從其國別信息來看,日本的技術優勢十分顯著,排名前10的企業有5個來自日本,另外,排名前20名的企業也有一半來自日本,包括松下、索尼、三洋、夏普、富士等。
太陽能汽車技術領域,中國擁有的專利總量能夠比肩日、美、韓等國而居于世界前列,但單個中國企業的技術實力卻無法與之相較。樣本中大多數中國企業擁有的專利數量都在10件以下,參與者數量眾多,但各自擁有的專利數量很少,個體力量較弱。中國國家電網公司排名躋身全球前十,擁有相關專利百余件,但這些專利分別由國家電網在全國各地的分支機構持有,因其共用同一專利權人代碼,統計時將其統一計入國家電網名下,實際上各個分支機構擁有的相關專利數量多為個位數。此外,就該技術領域專利權人類型來看,中國的企業作為最主要的創新主體卻并未發揮應有的主導性作用,其表現反而不及中國高校和自然人。尤其是中國的汽車企業在此次專利數量統計結果中可見度非常低,僅有吉利、比亞迪、奇瑞、上汽等少數中國汽車企業進入前100名。
新能源汽車浪潮席卷全球,以太陽能汽車為代表的新能源汽車大戰一觸即發,各個國家和企業都在積極應對。中國企業的情況并不樂觀,國家總體的優勢與企業個體的劣勢并存。雖然中國的專利總量躋身世界前列,證明了中國整體的研究實力和技術水平并不落后,但是這種依靠眾多小規模專利權人累計形成的數量優勢,在商業競爭當中難以轉化為市場競爭力。在全球太陽能汽車市場上,中國企業一時難以與豐田等巨頭抗衡,盡管吉利、比亞迪、奇瑞等汽車企業已經覺醒并積極謀劃,也擁有了一定數量的相關專利,但其研發實力與豐田、三菱、現代、本田等國外汽車企業相比尚存在明顯差距。
3.2多重共現分析有助于發掘潛在合作關系
專利權人之間的現實合作并不普遍,尤其是高強度的合作關系更為少見。在大科學時代,即便合作已經成為科學研究的主流,但專利的特殊性,使其表現出與一般科研成果不同的特征,既是富有創造性的智力成果,也是一種無形財產權[18]。現實的合作關系以“聯合署名、共同持有”作為基本判定標準,即現實的合作意味著權利共享。專利與生俱來的壟斷性特質,壟斷意味著專利是獨占和獨享的,所以專利權天然具有排他性,排斥合作、拒絕分享,尤其是對于那些彼此之間存在直接競爭的企業來說,除非能夠實現共贏或者利益最大化,否則輕易不會開展合作研究并共同持有專利。因此,專利權人之間難以建立起廣泛而緊密的現實合作關系。
寥寥無幾的現實合作關系,使得單純的專利權人共現(合作)網絡無法透露出太多的有效信息。但是,基于專利權人-分類號共現而存在的潛在合作關系卻構成了一個密集的網絡。專利是各個國家和企業參與市場競爭的的利器,技術主題的相似性也代表著專利權人之間可能存在的競爭。共性研究內容越多的機構,相似度越大,距離越近,除去那些有著較多實質合作關系的機構,其余機構顯然有著良好的合作前景,但成為競爭對手的幾率也越大[19]。因此,專利權人-分類號共現同時蘊含著合作與競爭兩種潛在的關系,借助于專利權人-分類號多重共現關系網絡,既可以尋找潛在的合作伙伴,又能夠識別可能的競爭對手。這種合作與競爭并存的復雜而微妙的關系,存在于專利文獻這種特殊的科研成果當中,且通過以往的一重共現分析無法獲知,這也在一定程度上證明了多重共現分析的必要性和優越性。
3.3多重共現分析的優勢與不足
與以往常見的一重共現分析相比,多重共現包含的內容更為豐富,分析角度也更為多元化。本文基于專利權人-分類號共現所構建的多重共現網絡,同時包含了兩類特征項和3種共現關系,能夠發現單純的合作分析或共類分析無法透露的有效信息。例如,專利權人之間潛在的合作與競爭關系、不同專利權人之間現實合作關系與潛在合作關系的直接對比、各個專利權人所從事的技術主題及其在各個技術主題的力量分布、各個技術主題的參與者及其研究實力的比較等,這些研究發現難以通過一重共現分析獲得,從而證實了多重共現分析確實能夠彌補一重共現分析揭示維度有限的不足。
盡管如此,多重共現分析在實現過程當中也存在明顯的不足。當前文獻計量領域主流的可視化技術大多以二維平面形式呈現,由于頁面限制,當共現網絡中節點數量較大、關系較為密集的情況下,無法清晰展示各個節點之間復雜而多樣的共現關系,可視化效果大打折扣。例如,本文僅選擇了少部分高頻節點進行可視化展示,并且過濾了低強度的共現關系,但是可視化效果仍然不太理想,尤其是網絡圖譜中節點較為集中的核心位置,許多共現關系被密集的節點和線條層層覆蓋。在后續研究中應該重點對可視化工具的呈現形式進行改進,將三維可視化技術引入其中,以提升多重共現分析的可視化效果。
參考文獻
[1]高繼平,丁,潘云濤,等.多詞共現分析方法的實現及其在研究熱點識別中的應用[J].圖書情報工作,2014,(24):80-85,98.
[2]王林,冷伏海.學術論文的關鍵詞與引文共現關系分析及實證研究[J].情報理論與實踐,2012,(2):82-86.
[3]溫芳芳.基于社會網絡分析的中外圖書館學合作模式比較研究[J].國家圖書館學刊,2014,(1):76-83.
[4]喬楊.專利計量方法在技術預見中的應用——以國內冶金領域為例[J].情報雜志,2013,(4):34-37,27.
[5]王曰芬,宋爽,苗露.共現分析在知識服務中的應用研究[J].現代圖書情報技術,2006,(4):29-34.
[6]Yemenu D,Yong CD,Salman S,Morris S.DIVA:a visualizing system for exploring document database for technology forecasting[J].Computers & Industrial Engineering,2002,(4):841-862.
[7]Leydesdorf L.What Can Heterogeneity Add to the Scientometric Map?Steps towards algorithmic historiography[EB/OL].http:∥leydesdorff.net/mcallon/mcallon.pdf,2016-01-22.
[8]龐弘,方曙.基于多重共現的可視化分析工具設計及其知識發現方法研究[J].圖書情報知識,2012,(2):100-107.
[9]龐弘遷.基于多重共現揭示高校圖書館與核心期刊間的發文關聯關系研究[J].圖書館,2012,(2):75-78.
[10]龐弘遷,方曙,楊志剛,等.研究領域的主題發展趨勢分析方法研究——基于多重共現的視角[J].情報理論與實踐,2012,(8):44-47,73.
[11]冷伏海,王林,李勇.基于文獻關鍵詞的三元共詞分析方法——以知識發現領域為例[J].情報學報,2011,(10):1072-1077.
[12]魏緒秋,李長玲.基于作者-年份-關鍵詞網絡的科研合作行為研究——以圖書情報學為例[J].情報雜志,2014,(11):117-123.
[13]魏緒秋,李長玲,劉非凡.3-模數據網絡構建及其可視化探討——以圖書情報領域的知識管理研究文獻為例[J].情報理論與實踐,2014,(8):74-78,89.
[14]李長玲,魏緒秋,馮志剛,等.基于2-模異質網絡的作者潛在合作空間測度與識別——以圖書情報學為例[J].圖書情報工作,2015,(12):93-99.
[15]袁曉東,陳靜.專利信息分析在技術創新合作伙伴選擇中的應用[J].情報雜志,2011,(8):22-27.
[16]溫芳芳.我國專利技術轉移的時間與空間分布規律研究[J].情報理論與實踐,2014,(4):32-36.
[17]劉秋宏.德溫特專利權人代碼編制研究及檢索應用[J].科技創新導報,2013,(4):5-11.
[18]溫芳芳.專利計量與專利合作[M].北京:中國社會科學出版社,2015:81.
[19]錢俐娟,張新民,鄭彥寧.國外圖書情報學領域主要科研機構“共現”現象研究[J].圖書情報工作,2008,(11):49-52.