999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于共詞分析的國(guó)際企業(yè)研發(fā)文本知識(shí)挖掘可視化研究

2008-12-31 00:00:00岳洪江
商業(yè)研究 2008年9期

摘要:科技文本挖掘?yàn)槠髽I(yè)研發(fā)提供一個(gè)很好的了解同業(yè)競(jìng)爭(zhēng)者研發(fā)知識(shí)的工具手段,而共詞分析及其可視化是挖掘企業(yè)基礎(chǔ)研發(fā)信息的重要方法。以國(guó)際大企業(yè)IBM公司為例,挖掘其基礎(chǔ)研發(fā)知識(shí)結(jié)構(gòu)并對(duì)其知識(shí)結(jié)構(gòu)進(jìn)行了可視化展示。

關(guān)鍵詞:企業(yè)研發(fā);科技文本挖掘;共詞分析;可視化;IBM公司

中圖分類(lèi)號(hào):F416 文獻(xiàn)標(biāo)識(shí)碼:A

The Visualized Textual Mining Research of R D in Internatinal Enterprizes Based on Co-word Analysis

YUE Hong-jiang

(School of Economics and Management,Nanjing University of Aeronautics and Astronautics, Nanjing 210016,China)[GK2!2]

Abstract:

Oriented technology RD is the basis of R D in the international enterprises.Science Technology (ST) text mining is used to extract technical intelligence from the open source global anthrax research literature. IBM Co. RD literature infrastructure (prolific authors, key journals/ institutions/countries)is obtained with bibliometrics and literature of the co-keyword network for visualization.

一、前言

研發(fā)是現(xiàn)代大企業(yè)持續(xù)發(fā)展的核心,據(jù)不完全統(tǒng)計(jì),目前世界500強(qiáng)企業(yè)研究開(kāi)發(fā)的費(fèi)用(RD)占全球的近70%,并且這一比例還在不斷上升,并壟斷著世界技術(shù)創(chuàng)新70%以上的成果。在大企業(yè)技術(shù)創(chuàng)新體系中,面向技術(shù)的基礎(chǔ)研發(fā)是整個(gè)研發(fā)環(huán)節(jié)之一。面向技術(shù)的基礎(chǔ)研究是新技術(shù)、新發(fā)明的先導(dǎo),信息技術(shù)、生物技術(shù)、激光技術(shù)、半導(dǎo)體技術(shù)、航空航天技術(shù)等都是基于基礎(chǔ)研究的重大突破而產(chǎn)生出來(lái)的;企業(yè)面向技術(shù)的基礎(chǔ)研究的重大進(jìn)展往往可以推動(dòng)高技術(shù)的重大突破,使公司獲得市場(chǎng)競(jìng)爭(zhēng)力和超額利潤(rùn)。

國(guó)際研發(fā)活動(dòng)的一個(gè)重要內(nèi)容就是技術(shù)監(jiān)測(cè)或技術(shù)情報(bào)收集。20世紀(jì)90年代以來(lái),在技術(shù)開(kāi)發(fā)和市場(chǎng)管理的全球化過(guò)程中,特別是世界范圍內(nèi)的RD資源在全球?qū)用嫔蠈?shí)現(xiàn)集成管理,突出了了解國(guó)外其他公司技術(shù)發(fā)展的重要性,相應(yīng)地也促進(jìn)了技術(shù)情報(bào)工作的發(fā)展。

國(guó)際RD中技術(shù)情報(bào)收集的途徑多種多樣,Jokob Edler等列舉了跨國(guó)公司所采用的12種途徑[1],其中包括因特網(wǎng),在線數(shù)據(jù)分析。研發(fā)前沿通過(guò)各種不同媒介展現(xiàn)出來(lái),包括各種科學(xué)與技術(shù)文本,主要有主要各種技術(shù)報(bào)告、學(xué)術(shù)論文、專(zhuān)利,以及其它媒體信息,還有研發(fā)的中試產(chǎn)品,等等。科技文獻(xiàn)以每年6%的速度在增長(zhǎng)[2]。研發(fā)競(jìng)爭(zhēng)情報(bào)對(duì)企業(yè)的競(jìng)爭(zhēng)越來(lái)越重要。在互聯(lián)網(wǎng)時(shí)代可以很容易的獲取各種各樣的信息,但面對(duì)日益快速發(fā)展的科學(xué)技術(shù)工業(yè),特別是非結(jié)構(gòu)化的知識(shí)數(shù)據(jù)管理仍然是一件復(fù)雜和費(fèi)時(shí)的工作。

RD管理是一個(gè)長(zhǎng)期的勞動(dòng)密集型過(guò)程,主要依靠科技專(zhuān)家廣泛的知識(shí)和信息的積累。而隨著全球化的發(fā)展,知識(shí)和信息呈爆炸性增長(zhǎng),以前的借助于手工信息處理已不再是主流的方法,隨之而來(lái)的是借助于計(jì)算機(jī)輔助的信息提取、數(shù)據(jù)挖掘、信息處理技術(shù),這些技術(shù)的有效運(yùn)用,大大提高了企業(yè)研發(fā)知識(shí)和信息處理能力。

文獻(xiàn)計(jì)量學(xué)、技術(shù)預(yù)測(cè)、技術(shù)評(píng)估、技術(shù)競(jìng)爭(zhēng)情報(bào)等研究方法被應(yīng)用到企業(yè)RD管理和評(píng)價(jià)中去。文獻(xiàn)計(jì)量學(xué),特別是內(nèi)容分析法曾是一種有效的展示企業(yè)研發(fā)信息的手段,但此方法有諸多局限性。近些年學(xué)者在關(guān)注“科技文本挖掘”(science and technology text mining)方法,用于分析科技文本的摘要和全文,這種方法可以有效的幫助企業(yè)RD管理以及技術(shù)競(jìng)爭(zhēng)情報(bào)等。特別是文本挖掘的可視化方法,可以充分展示企業(yè)RD的主流、研究領(lǐng)域的結(jié)構(gòu)動(dòng)態(tài),以及預(yù)測(cè)企業(yè)RD技術(shù)目標(biāo)。

而共詞分析作為一種文本知識(shí)挖掘方法,也得到了廣泛應(yīng)用。我們想通過(guò)以共詞這種文本挖掘方法在IBM公司研發(fā)中的應(yīng)用,展示文本挖掘?qū)ζ髽I(yè)RD管理的意義。

二、文本挖掘與共詞分析

(一)文本挖掘方法與意義

科技文本挖掘正是通過(guò)利用自然語(yǔ)言和統(tǒng)計(jì)技術(shù)探索半結(jié)構(gòu)化科技文本的收集、分類(lèi),并通過(guò)可視化的展示,從大量的科技文本中獲得可靠、有價(jià)值的信息。通過(guò)大量的在線文獻(xiàn)數(shù)據(jù)庫(kù)、專(zhuān)利數(shù)據(jù)庫(kù)、企業(yè)網(wǎng)站、各類(lèi)金融報(bào)表可以獲得企業(yè)研發(fā)的信息。快速的技術(shù)跟蹤要依靠互聯(lián)網(wǎng)來(lái)有效的挖掘這些數(shù)據(jù)庫(kù),可以對(duì)文本分類(lèi)、總結(jié)、聚類(lèi),以及文本的分布和趨勢(shì)分析。更主要的是可以獲得該研究主題領(lǐng)域的知識(shí)圖譜,如技術(shù)突破點(diǎn)以及技術(shù)之間的關(guān)聯(lián),等等。

科技文本挖掘可以分五步來(lái)完成,文獻(xiàn)的檢索、數(shù)據(jù)提取、數(shù)據(jù)預(yù)處理、數(shù)據(jù)分析和數(shù)據(jù)可視化[3]。文獻(xiàn)的檢索,依據(jù)要研究的對(duì)象,收集有關(guān)的文獻(xiàn)條目,并對(duì)文獻(xiàn)進(jìn)行編碼。數(shù)據(jù)提取,通過(guò)對(duì)重新編碼的文獻(xiàn)自動(dòng)提取出相關(guān)特性,一類(lèi)文獻(xiàn)特性包括作者、作者單位、日期、作者地址,等等,另一類(lèi)是通過(guò)自然語(yǔ)言技術(shù)得到文本的詞、詞的搭配、句子信息等。數(shù)據(jù)預(yù)處理,通過(guò)一定的運(yùn)算法則檢測(cè)和去處錯(cuò)誤的數(shù)據(jù),為后面的數(shù)據(jù)分析提供基礎(chǔ)。數(shù)據(jù)分析,通過(guò)降維技術(shù),如因子分析、主成分分析和聚類(lèi)分析等,得到知識(shí)之間的關(guān)系、構(gòu)成以及相似性。數(shù)據(jù)可視化,經(jīng)過(guò)對(duì)數(shù)據(jù)的降維,可以通過(guò)二維或三維圖展示出來(lái),主要有多維尺度(Multidimensional Scaling (MDS))、網(wǎng)絡(luò)分析圖(Social Network Analysis),確定文本網(wǎng)絡(luò)之間的概念圖譜或知識(shí)網(wǎng)絡(luò)結(jié)構(gòu)。

目前世界上常用的科技文本數(shù)據(jù)庫(kù)主要有SCI(美國(guó)科學(xué)引文數(shù)據(jù)庫(kù))、EI(美國(guó)工程索引數(shù)據(jù)庫(kù))、MEDLINE(美國(guó)國(guó)家醫(yī)學(xué)圖書(shū)館醫(yī)學(xué)文獻(xiàn)數(shù)據(jù)庫(kù))、INSPEC(英國(guó)機(jī)電工程師學(xué)會(huì)科學(xué)文摘數(shù)據(jù)庫(kù))、USPTO(美國(guó)專(zhuān)利局專(zhuān)利數(shù)據(jù)庫(kù))、ESP(歐洲專(zhuān)利局專(zhuān)利數(shù)據(jù)庫(kù))、PCI(美國(guó)德溫特專(zhuān)利引文索引)。這些覆蓋范圍廣的半結(jié)構(gòu)化科技文獻(xiàn)數(shù)據(jù)庫(kù)大大提高了對(duì)全球范圍內(nèi)文本挖掘的廣度和深度。

隨著人們對(duì)文本挖掘的重視,國(guó)內(nèi)外有許多種文本挖掘計(jì)算機(jī)程序,其中主要用于科技文本挖掘非商業(yè)軟件主要有SITKIS(http://users.tkk.fi/~hschildt/sitkis/)、ARROWSMITH(http://kiwi.uchicago.edu/)、BIBEXCEL(http://www.umu.se/inforsk/Bibexcel/index.html)、BIBTECHMON(http://www.arcs.ac.at/S/ST/BibTechMon)、T-LAB(http://www.tlab.it)。上述軟件都是針對(duì)大型文獻(xiàn)數(shù)據(jù)庫(kù)而設(shè)計(jì)的。

文本挖掘是企業(yè)研發(fā)人員、研發(fā)管理者、研發(fā)管理和資助管理部門(mén)以及企業(yè)研發(fā)競(jìng)爭(zhēng)情報(bào)人員獲得有用信息的手段。能夠在企業(yè)制定戰(zhàn)略計(jì)劃時(shí)提供全面的指示,也能在產(chǎn)品開(kāi)發(fā)階段提供指導(dǎo),

在產(chǎn)品開(kāi)發(fā)過(guò)程中導(dǎo)向新的性能和創(chuàng)新,也可以新技術(shù)突破的機(jī)會(huì)以及新研究領(lǐng)域的開(kāi)辟。

科技文本挖掘增強(qiáng)了人們對(duì)全球技術(shù)文獻(xiàn)的了解,通過(guò)非相關(guān)文獻(xiàn)之間的融合可以找到新的突破和創(chuàng)新點(diǎn)。可以鑒別次領(lǐng)域的研究水平,以及幫助研究人員提高他們成果的影響力以及期刊影響力。

(二)共詞分析及可視化

而近年來(lái)出現(xiàn)的共詞分析方法屬于內(nèi)容分析方法的一種,也是科技文本挖掘的重要方法。它通過(guò)分析科技文本中關(guān)鍵詞、主題詞、索引詞或短語(yǔ)在科技文本中共同出現(xiàn)的形式,統(tǒng)計(jì)一組詞或短語(yǔ)兩兩在同一篇文獻(xiàn)中出現(xiàn)的次數(shù)來(lái)建立一個(gè)矩陣,該矩陣顯示了詞之間的關(guān)聯(lián)。關(guān)聯(lián)的次數(shù)越多,他們之間的關(guān)系就越密切,“距離”也就越近。利用多元統(tǒng)計(jì)技術(shù)如因子分析、聚類(lèi)分析和多維尺度分析等,及其相關(guān)的可視化方法可以反映一定時(shí)期內(nèi)研究領(lǐng)域的主題及微觀結(jié)構(gòu),揭示文本所代表的研究領(lǐng)域中主題間的關(guān)系。也可以通過(guò)比較觀察不同時(shí)期研究領(lǐng)域的主題及微觀結(jié)構(gòu)變化。

以共詞矩陣為基礎(chǔ)對(duì)這些詞之間的連接強(qiáng)度進(jìn)行分析,目前主要的分析方法主要是聚類(lèi)分析法得到研究領(lǐng)域發(fā)展的結(jié)構(gòu)。并且通過(guò)多維標(biāo)度繪制這些詞的結(jié)構(gòu)圖譜,可以直觀的看到該研究主題的結(jié)構(gòu)及變化。

戰(zhàn)略坐標(biāo)圖是在共詞矩陣和聚類(lèi)的基礎(chǔ)上,用可視化的形式來(lái)綜合表示不同詞團(tuán)之間的內(nèi)部聯(lián)系和外部聯(lián)系。所有的詞團(tuán)以向心度和密度為參數(shù)繪制成的二維坐標(biāo), X 軸為向心度(Centrality) , Y 軸為密度(Density) 。向心度用來(lái)測(cè)量一個(gè)詞團(tuán)和其他詞團(tuán)之間相互聯(lián)系的程度。取每個(gè)詞團(tuán)與其他詞團(tuán)的共現(xiàn)次數(shù)的和作為該詞團(tuán)的向心度。密度用來(lái)測(cè)量詞團(tuán)內(nèi)部詞語(yǔ)之間的共現(xiàn)強(qiáng)度。取詞團(tuán)內(nèi)部主題詞共現(xiàn)次數(shù)的平均值作為這個(gè)詞團(tuán)的密度[4]。

該圖以向心度和密度的均值為原點(diǎn),將所有詞團(tuán)劃分為四個(gè)象限,落入四個(gè)象限中的詞團(tuán)分別表示不同的含義: 第一象限中的詞團(tuán)密度和向心度都較高,密度高,詞團(tuán)內(nèi)部聯(lián)系緊密,說(shuō)明該詞團(tuán)組成的研究主題趨向成熟,向心度高,說(shuō)明這個(gè)詞團(tuán)又與其余各詞團(tuán)有廣泛的聯(lián)系,即該詞團(tuán)處于所有研究主題的核心。第二象限中的詞團(tuán)中心度較高,但密度較低,該詞團(tuán)與其余各詞團(tuán)有廣泛的聯(lián)系,但詞團(tuán)內(nèi)部聯(lián)系不緊密,由該詞團(tuán)構(gòu)成的主題領(lǐng)域也是核心,但是結(jié)構(gòu)不緊密,研究尚不成熟,如果給予更多的關(guān)注,他們極有可能沿著研究的主題進(jìn)一步成熟。位于第三象限中的詞團(tuán),與其他詞團(tuán)團(tuán)聯(lián)系不密切,在整個(gè)研究主題中處于邊緣位置,受到越來(lái)越少的關(guān)注,這是由于該詞團(tuán)內(nèi)部鏈接緊密,說(shuō)明這些領(lǐng)域的研究已經(jīng)受到關(guān)注,且被很好的研究過(guò);第四象限的詞團(tuán)研究主題密度和向心度都較低,處于整個(gè)研究領(lǐng)域的邊緣,研究不成熟。

以關(guān)系作為基本分析單位的社會(huì)網(wǎng)絡(luò)分析方法今天已經(jīng)在社會(huì)學(xué)、心理學(xué)與經(jīng)濟(jì)學(xué)等諸多學(xué)科領(lǐng)域得到了廣泛運(yùn)用。社會(huì)網(wǎng)絡(luò)分析是一種對(duì)于以關(guān)系作為基本單位進(jìn)行分析的實(shí)證研究方法,主要分析的是關(guān)系數(shù)據(jù)。此分析方法在科技管理領(lǐng)域也得到了應(yīng)用,如分析科學(xué)研究中的合作關(guān)系網(wǎng)絡(luò)[5-6]、學(xué)科間的引用及被引關(guān)系網(wǎng)絡(luò)[7]。

共詞矩陣呈現(xiàn)的是詞與詞之間的共現(xiàn)數(shù)據(jù),它代表的是詞與詞之間的共現(xiàn)關(guān)系網(wǎng)絡(luò),在共現(xiàn)關(guān)系網(wǎng)絡(luò)中就形成了頂點(diǎn)和邊的網(wǎng)絡(luò),頂點(diǎn)是那些具有代表性的詞,詞之間存在的連接關(guān)系由邊來(lái)表示。這樣就可以通過(guò)網(wǎng)絡(luò)分析方法來(lái)研究網(wǎng)絡(luò)在頂點(diǎn)的相互作用下的分布情況,共詞網(wǎng)絡(luò)分析的一個(gè)主要目的是確定這些代表性術(shù)語(yǔ)之間的概念圖譜或知識(shí)網(wǎng)絡(luò)結(jié)構(gòu),通過(guò)一系列類(lèi)似圖譜就可以相當(dāng)詳細(xì)地描述某一研究領(lǐng)域的主題[8]。

三、結(jié)果分析:以IBM公司為例

IBM公司可稱(chēng)得上是當(dāng)今世界IT業(yè)的“航母”,它的產(chǎn)業(yè)經(jīng)營(yíng)涉及了硬件制造、軟件設(shè)計(jì)、全球化服務(wù)、金融和投資等5大領(lǐng)域,銷(xiāo)售額中有一半以上來(lái)自美國(guó)以外的國(guó)家和地區(qū),屬于典型的規(guī)模經(jīng)濟(jì)與范圍經(jīng)濟(jì)兼具的跨國(guó)公司。雖然全球化的規(guī)模經(jīng)營(yíng)與多元化經(jīng)營(yíng)戰(zhàn)略可以帶來(lái)成本領(lǐng)先優(yōu)勢(shì),在IT行業(yè)這種比較優(yōu)勢(shì)極易被競(jìng)爭(zhēng)對(duì)手模仿和復(fù)制,真正確立和鞏固IBM公司全球競(jìng)爭(zhēng)優(yōu)勢(shì)的決定性因素,是其成功的研發(fā)戰(zhàn)略,保障了IBM的技術(shù)領(lǐng)先和技術(shù)開(kāi)拓,能夠源源不斷地向信息產(chǎn)業(yè)市場(chǎng)推出技術(shù)最先進(jìn)的產(chǎn)品。IBM公司每年大約投入RD經(jīng)費(fèi)50億美元,在全球設(shè)有8個(gè)實(shí)驗(yàn)室,擁有3000多名研究人員,研究領(lǐng)域十分廣泛。在2003年公司獲得美國(guó)專(zhuān)利3415項(xiàng)。

首先根據(jù)研究對(duì)象和目的選擇合適的文獻(xiàn)數(shù)據(jù)庫(kù)。我們的目的是探討IBM公司基礎(chǔ)研發(fā),SCIE文獻(xiàn)數(shù)據(jù)庫(kù)是比較好的選擇,從Web of Science中提取IBM公司發(fā)表的學(xué)術(shù)論文,時(shí)間是1997-2006年。其次通過(guò)計(jì)算機(jī)程序處理,并把結(jié)果圖示出來(lái)。

(一)關(guān)鍵詞聚類(lèi)

本研究采用科技文本中的關(guān)鍵詞之間的關(guān)系作為挖掘的對(duì)象。關(guān)鍵詞是科技文本的一個(gè)重要組成部分,雖然往往只是3-5個(gè)詞,在論文中所占篇幅最少,但卻是論文的精髓。不僅可以利用關(guān)鍵詞檢索到文獻(xiàn),還可以通過(guò)關(guān)鍵詞了解到文獻(xiàn)涉及的領(lǐng)域和內(nèi)容。

采用了詞頻統(tǒng)計(jì)軟件對(duì)所選樣本中所有關(guān)鍵詞的出現(xiàn)頻次進(jìn)行統(tǒng)計(jì)。本研究所采用的樣本庫(kù)中共出現(xiàn)1001個(gè)不同的關(guān)鍵詞。根據(jù)關(guān)鍵詞累積頻次的變化截取高頻關(guān)鍵詞。本文將關(guān)鍵詞出現(xiàn)的累積頻次達(dá)到總關(guān)鍵詞頻次的31.9%的前65個(gè)關(guān)鍵詞作為表征當(dāng)前IBM基礎(chǔ)研發(fā)的研究熱點(diǎn)。

由于這些關(guān)鍵詞是IBM基礎(chǔ)研發(fā)中出現(xiàn)頻次最高的詞,代表了當(dāng)前IBM基礎(chǔ)研發(fā)研究的熱點(diǎn)。為進(jìn)一步反映這些關(guān)鍵詞之間的關(guān)系,我們對(duì)這些高頻關(guān)鍵詞構(gòu)建共詞矩陣:兩兩統(tǒng)計(jì)它們?cè)谕黄撐闹型瑫r(shí)出現(xiàn)的次數(shù),我們稱(chēng)之為共現(xiàn)次數(shù),這樣形成了一個(gè)65×65的共詞矩陣。

在共詞矩陣分析中,SPSS 軟件可作為統(tǒng)計(jì)分析的工具。利用SPSS中的相關(guān)分析,將共詞矩陣轉(zhuǎn)化為皮爾遜相關(guān)系數(shù)矩陣( Pearson correlations),由此能夠消除由共詞次數(shù)差異所帶來(lái)的影響。經(jīng)過(guò)轉(zhuǎn)換的相關(guān)矩陣作為后面聚類(lèi)分析(Cluster Analysis)的數(shù)據(jù)來(lái)源。聚類(lèi)分析采用系統(tǒng)聚類(lèi)(Hierarchical Cluster),選擇離差平方和法(Ward's method)與歐氏距離平方法(Squared Euclidean distance)。

通過(guò)對(duì)2002-2006年65個(gè)高頻詞共詞矩陣的聚類(lèi),在分類(lèi)閾值1.5水平上得到11個(gè)詞團(tuán)。每個(gè)詞團(tuán)如下:

A:9、12、29、59、48

B:17、21、25、30、31、32、38、52

C:1、2、5

D:3、4、19、35、49、51、58、63、65

E:8、10、14、26、41

F:33、37、53、56、61、64

G:11、27、28、40、50

H:7、18、20、45

I:6、23、34、36、39、42、44、46、60、62

J:15、16、22、54、55、57

K:13、24、43、47

(二)戰(zhàn)略圖分析

通過(guò)計(jì)算各類(lèi)詞團(tuán)的中心度和密度,各詞團(tuán)的位置展示在圖2中。

從戰(zhàn)略坐標(biāo)圖可以看出,沒(méi)有詞團(tuán)落在第一象限,C和I詞團(tuán)位于第二象限,H詞團(tuán)位于第三象限,其他詞團(tuán)位于第四象限。

C和I詞團(tuán)有著較高的中心度,但密度低于H詞團(tuán)。 H詞團(tuán)有著較高的密度,但向心度不高。除此之外的其它詞團(tuán)都位于第四象限,這些詞團(tuán)的密度和向心度都較低,詞之間聯(lián)系比較松散,還沒(méi)有形成體系。

從詞團(tuán)的分布看,IBM公司研發(fā)領(lǐng)域比較分散,沒(méi)有高度成熟的領(lǐng)域。

(三)關(guān)鍵詞網(wǎng)絡(luò)分析

圖3和圖4分別是IBM公司1997-2001年、2002-2006年65個(gè)關(guān)鍵詞構(gòu)成的共現(xiàn)網(wǎng)絡(luò)圖。圖中的點(diǎn)數(shù)字分別代表65個(gè)關(guān)鍵詞,點(diǎn)與點(diǎn)之間連接代表兩個(gè)關(guān)鍵詞之間存在共現(xiàn)關(guān)系,如果沒(méi)有連接則表示兩個(gè)詞之間不存在線共現(xiàn)關(guān)系,連線的粗細(xì)則表示關(guān)鍵詞之間的共現(xiàn)次數(shù)的多少。

從圖3可以看出,IBM公司SCI論文高頻詞(前65個(gè))共詞圖譜密度不是很緊密。有些詞構(gòu)成的單鏈條比較突出,這表明這些詞之間的聯(lián)系比較疏松。而圖4共詞圖譜密度卻很緊密,圖中的粗線條較多。這表明IBM公司研發(fā)圍繞這些關(guān)鍵詞不斷的深入下去,以尋求某些技術(shù)的創(chuàng)新和突破。

為更加清楚地展現(xiàn)核心關(guān)鍵詞之間的共現(xiàn)關(guān)系,引入社會(huì)網(wǎng)絡(luò)分析方法: k 核分析。k 核分析是社會(huì)網(wǎng)絡(luò)研究中凝聚子群的一種,凝聚子群是滿(mǎn)足如下條件的一個(gè)行動(dòng)者子集合,即在此集合中的行動(dòng)者之間具有相對(duì)較強(qiáng)、直接、緊密、經(jīng)常的或積極的關(guān)系。核的概念最早是由Seidman提出的。k 核是建立在點(diǎn)的度數(shù)基礎(chǔ)上的凝聚子群概念,是通過(guò)對(duì)網(wǎng)絡(luò)子群中的每一個(gè)成員的鄰點(diǎn)個(gè)數(shù)進(jìn)行限制而得到的。k 核指的是滿(mǎn)足一個(gè)條件的子圖,即子圖中的點(diǎn)都至少與該子圖中的k個(gè)其它點(diǎn)鄰接。通過(guò)改變k 的值,就會(huì)得出不同的子圖。隨著k 的增加, k 核的子圖成員會(huì)逐漸減少,而成員之間的關(guān)系會(huì)更緊密。

圖5和圖6分別是1997-2001年、2002-2006年65個(gè)關(guān)鍵詞構(gòu)成的k 核共詞網(wǎng)絡(luò)圖。圖中每條線的粗細(xì)與其在共詞網(wǎng)絡(luò)中出現(xiàn)的次數(shù)成正比。

在圖5中,1997-2001年65個(gè)關(guān)鍵詞構(gòu)成的k 核的最高的級(jí)數(shù)為6。也就是說(shuō)在k 等于6的核中每一個(gè)詞都最少和同一核中的其他詞共同出現(xiàn)的次數(shù)等于或大于6。圖6展示了2002-2006年65個(gè)關(guān)鍵詞構(gòu)成的k 核等于7的核的連接情況,也即是說(shuō)在k 等于7的核中每一個(gè)詞都最少和同一核中的其他詞共同出現(xiàn)的次數(shù)等于或大于7。兩圖是整個(gè)共詞網(wǎng)絡(luò)中連接最強(qiáng),也是關(guān)系最為緊密的一個(gè)部分。

在1997-2001年由21個(gè)核心關(guān)鍵詞構(gòu)成了最緊密的圖,而到2002-2006年有37個(gè)詞成為核心關(guān)鍵詞。在21個(gè)詞中有4個(gè)詞未成為2002-2006年的核心詞,分別是10(SYSTEM)、15(SURFACES)、19(NETWORKS)和64(STATE)。新增加的16個(gè)詞分別是20(INTERFACE)、21(DEVICES)、23(TECHNOLOGY)、26(MOSFETS)、27(SCATTERING)、29(DEPENDENCE)、31(DEPOSITION)、

33(STATES)、34(KINETICS)、37(SIMULATIONS)、38(DIFFUSION)、39(MICROSTRUCTURE)、40(LITHOGRAPHY)、43(MEDIA)、46(OXIDE)、53(MOLECULAR-DYNAMICS)、54(PHASE)、55(MICROSCOPY)、57(STRESS)、60(RESOLUTION)。這也預(yù)示著下一階段公司研發(fā)重點(diǎn)會(huì)出現(xiàn)在65個(gè)詞中前兩階段未曾成為核心的詞。

四、結(jié)論與討論

科技文本挖掘?yàn)槠髽I(yè)研發(fā)提供一個(gè)很好的了解同業(yè)競(jìng)爭(zhēng)者研發(fā)知識(shí)的工具手段,而共詞分析及其可視化是挖掘企業(yè)基礎(chǔ)研發(fā)信息的重要方法。以國(guó)際大企業(yè)IBM公司為例,挖掘其基礎(chǔ)研發(fā)知識(shí)結(jié)構(gòu)并對(duì)其知識(shí)結(jié)構(gòu)進(jìn)行了可視化展示。

從對(duì)IBM公司的研發(fā)信息挖掘結(jié)果來(lái)看,對(duì)現(xiàn)階段中國(guó)大企業(yè)做大作強(qiáng),成為有核心競(jìng)爭(zhēng)力的國(guó)際化企業(yè)具有重要的借鑒意義。從科技實(shí)力來(lái)說(shuō),中國(guó)大企業(yè)還應(yīng)鍛造世界級(jí)的研發(fā)中心,加強(qiáng)研發(fā)管理的能力使散落的技術(shù)資源轉(zhuǎn)化成強(qiáng)勁的研發(fā)合力,使技術(shù)真正成為公司有效的資產(chǎn)。

參考文獻(xiàn):

[1] Jakob Edler, Frieder Meyer-Krahmer, Guido Reger. Changes in the strategic management of technology:results of a global benchmarking study[J]. RD Management, 2002,32(2):149-164

[2] Fernández-Cano A, Torralbo M, Vallejo M. Reconsidering Price's model of scientific growth: An overview[J]. Scientometrics. 2004,61(3):301- 321

[3] Losiewicz, P., Oard, D. W., and Kostoff, R. N.. Textual data mining to support science and technology management[J]. Journal of Intelligent Information Systems, 2000(15):99-119

[4] Callon M, Courtial J P , Laville F. Co-word analysis as a tool for describing the network of interactions between basic and technological research : the case of polymer chemistry[J]. Scientometrics, 1991, 22(1) :155~205

[5] Caroline S. Wagner, Loet Leydesdorff. Mapping the network of global science: comparing international co-authorships from 1990 to 2000[J]. International Journal of Technology and Globalisation, 2005, 1(2):185-208

[6] Newman, M. E. J..The structure of scientific collaboration networks[J]. Proceedings of the National Academy of Sciences of the United States of America, 2001, 98(2):404-409

[7] Everett,M. .Social network analysis[Z]. Essex: Textbook at Essex Summer School in SSDA,2002

[8] Tor J Larsen,Linda Levine. Searching for management information systems: coherence and change in the discipline[J]. Information Systems Journal, 2005(15): 357-381

[9] Guido Reger. Technology Foresight in Companies: From an Indicator to a Network and Process Perspective[J]. Technology Analysis Strategic Management, 2001,13(4):533 - 553.

(責(zé)任編輯:席曉虹)

主站蜘蛛池模板: 一级成人欧美一区在线观看 | 88av在线播放| 日本www色视频| 免费在线观看av| 免费国产在线精品一区| 亚洲欧美在线综合图区| 亚洲欧美日本国产综合在线 | 日韩精品成人在线| 强奷白丝美女在线观看| 国产在线第二页| 国产成人欧美| 久久一色本道亚洲| 九色在线观看视频| 99热国产在线精品99| 97影院午夜在线观看视频| a天堂视频| 91日本在线观看亚洲精品| 人人看人人鲁狠狠高清| 手机精品视频在线观看免费| 亚洲无码视频喷水| 国产精品亚欧美一区二区三区| 久久一本精品久久久ー99| 少妇精品在线| 97久久精品人人| 亚洲精品无码日韩国产不卡| 亚洲乱亚洲乱妇24p| 无码免费视频| 亚洲区视频在线观看| 午夜国产不卡在线观看视频| 国产在线观看一区二区三区| 蜜芽一区二区国产精品| 亚洲女同一区二区| 国内精品自在自线视频香蕉| 欧洲av毛片| 青青青视频免费一区二区| 久久国产毛片| WWW丫丫国产成人精品| 午夜视频免费试看| 亚洲成网站| 国产精品内射视频| 久久青草免费91线频观看不卡| 国产a v无码专区亚洲av| www.国产福利| 国产91熟女高潮一区二区| 在线看片免费人成视久网下载| 国产免费人成视频网| 午夜激情婷婷| 国产在线98福利播放视频免费| a级毛片在线免费| 国产一区二区网站| 精品伊人久久大香线蕉网站| 亚洲国产成人久久77| 国产流白浆视频| 日韩精品高清自在线| 一级福利视频| 91久久国产综合精品女同我| 91福利免费视频| 99ri精品视频在线观看播放| 久久无码av三级| 日本亚洲欧美在线| 91福利国产成人精品导航| 国产精品观看视频免费完整版| 国产精品综合色区在线观看| 国产美女视频黄a视频全免费网站| 色噜噜在线观看| 一级爆乳无码av| 国产美女无遮挡免费视频| 国产高清精品在线91| 67194亚洲无码| 久久动漫精品| 2021国产精品自产拍在线| 亚洲无码高清一区二区| 国产特一级毛片| 啪啪永久免费av| 四虎影院国产| a级毛片免费网站| 亚洲人成电影在线播放| 午夜爽爽视频| 国产啪在线| 五月婷婷综合色| 91小视频在线播放| 久久久久久高潮白浆|