,
隨著信息爆炸時代的到來,每年各學(xué)科領(lǐng)域都會有海量的科學(xué)文獻產(chǎn)生,如何從海量的信息資源中識別學(xué)科領(lǐng)域的研究熱點便成為了廣大科研工作者所面臨的難題。共詞分析是將文獻計量分析法和內(nèi)容分析法相結(jié)合的綜合分析方法[1]。近年來隨著信息可視化技術(shù)的快速發(fā)展、多種可視化軟件的開發(fā),共詞分析方法逐漸融入了多種可視化技術(shù),使分析結(jié)果更加直觀,因而成為監(jiān)測科技動態(tài)的重要方法。目前,很多學(xué)者將共詞分析結(jié)合可視化的方法應(yīng)用到學(xué)科領(lǐng)域熱點的監(jiān)測中,如1992年Law等人以環(huán)境酸化研究為例,利用共詞分析方法繪制了該領(lǐng)域的科學(xué)圖譜[2];1993年Courtial等人對專利文獻進行共詞聚類分析,得到食品類專利文獻的研究熱點,同時利用戰(zhàn)略坐標(biāo)顯示研究熱點[3];2001年Ding等從SCI和SSCI中獲取相關(guān)數(shù)據(jù),分析了信息檢索領(lǐng)域的研究主題及發(fā)展變化,并通過關(guān)鍵詞共現(xiàn)分析和多維尺度分析繪制領(lǐng)域地圖[4];2003年Stagmann等人利用主題詞聚類分析對Swanson等人所發(fā)現(xiàn)的非相關(guān)文獻之間隱含關(guān)系的數(shù)據(jù)進行研究,并繪制了其研究熱點的戰(zhàn)略坐標(biāo)圖,結(jié)果顯示Swanson等人的研究結(jié)果與詞語在戰(zhàn)略坐標(biāo)中的位置之間存在著一定的聯(lián)系[5];2003年張晗等人利用共詞聚類分析生物信息學(xué)領(lǐng)域的研究熱點,同時繪制了戰(zhàn)略學(xué)標(biāo)圖以定量地分析各研究熱點的發(fā)展階段[6];2005年謝彩霞等人利用關(guān)鍵詞共現(xiàn)分析了1994-2001年我國納米科技論文,展示了我國納米科技研究領(lǐng)域的發(fā)展趨勢[7];2010年王慧將共詞分析和社會網(wǎng)絡(luò)分析結(jié)合,對中美情報學(xué)學(xué)科熱點進行了對比分析研究[8]。
但大多數(shù)研究只選取一種或兩種可視化方法,本文用不同可視化方法監(jiān)測并分析了我國神經(jīng)病學(xué)領(lǐng)域的熱點及其主題的發(fā)展和演進態(tài)勢。
本文擬按照圖1所示路線分析監(jiān)測研究熱點。

圖1 研究路線
共詞分析是通過統(tǒng)計分析反映文獻主題內(nèi)容的專業(yè)術(shù)語、研究文獻內(nèi)在聯(lián)系和學(xué)科結(jié)構(gòu)的方法。通常采用的方法就是從相關(guān)文獻中提取關(guān)鍵詞,并選取高頻詞,兩兩統(tǒng)計一組關(guān)鍵詞在同一篇文獻中共同出現(xiàn)的頻率,構(gòu)建共詞矩陣,為后面的統(tǒng)計分析做好準(zhǔn)備。
社會網(wǎng)絡(luò)是指社會成員之間因相互作用而形成的關(guān)系體系,社會網(wǎng)絡(luò)分析就是要對社會網(wǎng)絡(luò)成員之間的關(guān)系進行量化研究[8]。在社會網(wǎng)絡(luò)圖中,點表示社會成員,點之間的連線表示成員之間的關(guān)系。本文從整體屬性和個體屬性兩個角度選擇指標(biāo)進行分析。其中整體屬性的指標(biāo)包括網(wǎng)絡(luò)密度和網(wǎng)絡(luò)平均路徑長度,前者是指整體網(wǎng)絡(luò)中各個點之間聯(lián)系的緊密程度,后者是指網(wǎng)絡(luò)中任意兩點之間的平均距離;個體屬性的指標(biāo)包括點度中心度、中間中心度、接近中心度,點度中心度是指網(wǎng)絡(luò)圖中與該節(jié)點直接相連的點的數(shù)目,中間中心度表示網(wǎng)絡(luò)成員對資源控制的程度,接近中心度表示網(wǎng)絡(luò)成員與網(wǎng)絡(luò)其他成員的接近性程度。
在共詞分析基礎(chǔ)上,采用聚類算法對共詞網(wǎng)絡(luò)中各主題間的聯(lián)系強度進行運算,根據(jù)聚類結(jié)果將相互聯(lián)系相對緊密的主題聚集起來形成相對獨立的團體-類團[9]。本文劃分類團時將去掉沒有統(tǒng)計分析意義的僅由一個關(guān)鍵詞或兩個關(guān)鍵詞組成的類團[10]和由主題概念不甚關(guān)聯(lián)的關(guān)鍵詞組成的類團[11]。類團內(nèi)部各關(guān)鍵詞對聚類的貢獻度用“粘合力”衡量,某一關(guān)鍵詞與類團內(nèi)其他關(guān)鍵詞的共現(xiàn)次數(shù)越多,其粘合力越大,在類團中的地位越突出。在一個類團中,粘合力最大的關(guān)鍵詞稱為中心詞[12]。本文通過計算類團內(nèi)某一關(guān)鍵詞和其他關(guān)鍵詞的絕對共現(xiàn)頻次的平均值得到該關(guān)鍵詞的粘合力值,并根據(jù)每個類團內(nèi)粘合力最大的幾個關(guān)鍵詞命名類團。
戰(zhàn)略坐標(biāo)是在共詞矩陣和聚類的基礎(chǔ)上,描述某學(xué)科領(lǐng)域的內(nèi)部聯(lián)系情況。戰(zhàn)略坐標(biāo)圖是以測度某個類團和其他類團之間的外部鏈接強度的中心度為橫軸、以測度某個類團內(nèi)部各關(guān)鍵詞之間的內(nèi)部鏈接強度的密度為縱軸繪制的二維坐標(biāo),原點為中心度平均值和密度平均值的交點[13]。落入四個象限中的類團分別表示不同的含義(圖2)。

圖2 戰(zhàn)略坐標(biāo)圖
數(shù)據(jù)來源于萬方醫(yī)學(xué)網(wǎng),通過“中圖分類號”字段檢索2003-2012年我國作者發(fā)表的神經(jīng)病學(xué)相關(guān)文獻,中圖分類號為R741-R748(神經(jīng)病學(xué))、R739.4(神經(jīng)系腫瘤),共檢出103501條文獻記錄(檢索及下載日期為2013-04-01)。為了研究神經(jīng)病學(xué)領(lǐng)域主題的發(fā)展過程,按時間將記錄分成2003-2007年、2008-2012年兩段,分別有40 258和63 243條文獻記錄。
提取記錄中的時間和關(guān)鍵詞字段,對關(guān)鍵詞進行人工清洗,合并同義詞、近義詞,去掉沒有實際意義的詞。為簡化統(tǒng)計過程和減少低頻詞對后續(xù)統(tǒng)計和可視化造成的不必要干擾,本文截取了高頻詞。利用1973年Donohue提出的高頻低頻詞分界公式截取高頻詞[14]。兩個階段分別截取到62個、83個高頻詞。
本文構(gòu)建了高頻詞的共詞矩陣。在原始共詞矩陣中,兩個關(guān)鍵詞共現(xiàn)頻次的大小直接受到關(guān)鍵詞詞頻大小的影響,所以原始共詞矩陣所反映的僅僅是一種表象。為了更準(zhǔn)確地揭示關(guān)鍵詞間的共現(xiàn)關(guān)系,需要對原始矩陣進行包容化處理,使神經(jīng)病學(xué)領(lǐng)域的核心主題和非核心主題間的分界更明顯。經(jīng)過試驗,Ochiai系數(shù)法最適合對本文中的原始共詞矩陣進行包容化處理[15]。
3.3.1 詞分析
3.3.1.1 社會網(wǎng)絡(luò)指標(biāo)
2003-2007年網(wǎng)絡(luò)密度為0.0112,2008-2012年網(wǎng)絡(luò)密度為0.0098。后一階段的網(wǎng)絡(luò)密度較前一階段略小,表明雖然后一階段的文獻量顯著增長,代表研究熱點的高頻詞增多,但是其各個研究熱點之間的聯(lián)系略不如前一階段緊密。
2003-2007年網(wǎng)絡(luò)平均路徑長度為1.392,2008-2012年網(wǎng)絡(luò)平均路徑長度為1.418,表明在神經(jīng)病學(xué)社會網(wǎng)絡(luò)中,每一個關(guān)鍵詞大概只需要通過1-2個關(guān)鍵詞就能和網(wǎng)絡(luò)中其他關(guān)鍵詞產(chǎn)生聯(lián)系。可見神經(jīng)病學(xué)社會網(wǎng)絡(luò)具有小世界效應(yīng),具有迅速的反應(yīng)能力和較高的效應(yīng)[8]。相比之下,前一階段關(guān)鍵詞間的溝通略好一點。
2003-2007年點度中心度的平均值為0.684,2008-2012年點度中心度的平均值為0.806,說明后一階段核心詞在整個網(wǎng)絡(luò)中發(fā)揮的作用略大于前一階段。兩個階段中間中心度的平均值分別為11.968和17.133,表明后一階段中間詞在整個網(wǎng)絡(luò)中發(fā)揮的作用大于前一階段。兩個階段接近中心度的平均值非常相近,分別為72.822和71.549。
3.3.1.2 社會網(wǎng)絡(luò)圖
利用Ucinet 6和NetDraw繪制兩個階段的社會網(wǎng)絡(luò)圖(圖3和圖4)。根據(jù)節(jié)點大小和連線的粗細,結(jié)合節(jié)點點度中心度值,還可以判斷出神經(jīng)病學(xué)領(lǐng)域內(nèi)的核心熱點,如腦梗死、腦卒中、腦出血、康復(fù)、高血壓、癲癇、腦缺血、磁共振成像、體層攝影術(shù)、X線計算機、康復(fù)、治療、再灌注損傷等。

圖3 2003-2007年社會網(wǎng)絡(luò)圖

圖4 2008-2012年社會網(wǎng)絡(luò)圖
3.3.2 類團分析
利用SPSS 19.0進行聚類,根據(jù)聚類樹圖結(jié)果和篩選,兩個階段最終分別確定了11個和12個類團(表1和表2)。

表1 2003-2007年類團

表2 2008-2012年類團
3.3.2.1 類團演變分析
類團存在著消失、新生、演進及分化現(xiàn)象,從中可以判斷學(xué)科領(lǐng)域內(nèi)研究主題的發(fā)展和變化[16]。本文繪制了前一階段到后一階段的類團演變圖(圖5)。從類團演化角度看,近幾年微創(chuàng)手術(shù)在神經(jīng)外科中得到廣泛的應(yīng)用。隨著我國人民生活水平的提高,對于神經(jīng)疾病治療效果的期望上升為心理層面。雖然對于頸動脈粥樣硬化與C反應(yīng)蛋白、同型半胱氨酸水平相關(guān)性的研究尚不成熟,但引起了科研人員的廣泛關(guān)注,具有潛在的發(fā)展趨勢。

圖5 類團演變圖
3.3.2.2 類團地位變化分析
兩個階段的戰(zhàn)略坐標(biāo)圖見圖6和圖7。圖中各節(jié)點旁的序號分別對應(yīng)表1和表2中的類團序號。
對比圖6和圖7,兩個階段位于第一象限的類團相同,分別為“腦梗死的藥物治療”、“高血壓腦出血的手術(shù)(微創(chuàng)手術(shù))”、“腦卒中的康復(fù),腦卒中后致偏癱、抑郁”,它們的中心度和密度都很高。這三個類團始終屬于既核心又成熟的類團,一直是神經(jīng)病學(xué)領(lǐng)域科研人員研究的重點。
類團“兒童癲癇的腦電圖”、“MRI和CT檢查”由第二象限轉(zhuǎn)至第三象限,表明這兩個主題發(fā)展較慢,密度相對變小,相關(guān)研究有待于進一步加強。類團“顱內(nèi)動脈瘤并發(fā)蛛網(wǎng)膜下腔出血”由第三象限轉(zhuǎn)至第二象限,密度變大,類團名改為“蛛網(wǎng)膜下腔出血后并發(fā)腦血管痙攣,顱內(nèi)動脈瘤后并發(fā)蛛網(wǎng)膜下腔出血”,表明后一階段科研人員對這一主題的關(guān)注和研究逐漸增多,該主題發(fā)展較快,逐漸變得成熟,有繼續(xù)發(fā)展的潛質(zhì)。“腦血管疾病的危險因素和預(yù)后”由第四象限轉(zhuǎn)至第三象限,類團名改為“腦血管疾病的護理和并發(fā)癥”,說明前一階段中雖然不成熟,但很受關(guān)注的主題在后一階段中受關(guān)注程度降低,科研人員的研究重點有所轉(zhuǎn)變。
新生類團“頸動脈粥樣硬化與C反應(yīng)蛋白、同型半胱氨酸水平的相關(guān)性”位于第四象限,中心度較大,密度小。雖然該研究主題內(nèi)部結(jié)構(gòu)松散,尚不成熟,但引起了科研人員的關(guān)注,具有潛在的發(fā)展趨勢。

圖6 2003-2007年戰(zhàn)略坐標(biāo)圖

圖7 2008-2012年戰(zhàn)略坐標(biāo)圖
3.3.3 詞和類團綜合分析
社會網(wǎng)絡(luò)分析是從詞的角度分析學(xué)科熱點,而戰(zhàn)略坐標(biāo)分析是從類團的角度研究學(xué)科熱點。將社會網(wǎng)絡(luò)圖和戰(zhàn)略坐標(biāo)圖整合,得到兩個階段的復(fù)合網(wǎng)絡(luò)圖分布(圖8和9)。
首先,根據(jù)類團所在象限,從復(fù)合網(wǎng)絡(luò)圖中可以很清晰地判斷神經(jīng)病學(xué)領(lǐng)域的核心主題和成熟主題。例如,兩個階段中既核心又成熟的類團都是1,2,3號類團,說明他們始終是神經(jīng)病學(xué)的研究核心和熱點,得到了科研人員的廣泛關(guān)注,并已經(jīng)發(fā)展得很成熟。
其次,復(fù)合網(wǎng)絡(luò)圖譜還可以直觀地展現(xiàn)類團內(nèi)及類團間的聯(lián)系。戰(zhàn)略坐標(biāo)圖中中心度越大的類團,和其他類團的聯(lián)系越密切,在復(fù)合網(wǎng)絡(luò)圖中該類團和其他類團的連線越多、越粗;戰(zhàn)略坐標(biāo)圖中密度越大的類團,其內(nèi)部成員的聯(lián)系越緊密,在復(fù)合網(wǎng)絡(luò)圖中其內(nèi)部各個節(jié)點之間的連線越多、越粗。例如,第一象限中類團內(nèi)、類團間的連線更多、更粗,第三象限中類團內(nèi)和類團間的連線更少、更細。

圖8 2003-2007年復(fù)合網(wǎng)絡(luò)圖

圖9 2008-2012年復(fù)合網(wǎng)絡(luò)圖
從詞、類團及二者結(jié)合的角度分析學(xué)科領(lǐng)域熱點時具有不同的特點,獲得不同的領(lǐng)域熱點信息。
從詞的角度分析領(lǐng)域熱點時,既可以定量地分析學(xué)科領(lǐng)域中各關(guān)鍵詞間聯(lián)系的緊密程度、關(guān)鍵詞間溝通的難易程度以及核心關(guān)鍵詞,也可以通過社會網(wǎng)絡(luò)圖定性和直觀地展示學(xué)科領(lǐng)域中各關(guān)鍵詞間的聯(lián)系,但關(guān)鍵詞是孤立的點,不能代表領(lǐng)域的研究主題。
從類團的角度分析領(lǐng)域熱點時,既可以定量地揭示各研究主題在領(lǐng)域中的地位,也可以揭示研究主題的發(fā)展及其地位的改變,但無法分析類團內(nèi)部各關(guān)鍵詞間的具體聯(lián)系。
從詞和類團結(jié)合的角度,將戰(zhàn)略坐標(biāo)圖和社會網(wǎng)絡(luò)圖結(jié)合的,得到的復(fù)合網(wǎng)絡(luò)圖,既可以展示研究主題的地位,也可以直觀地揭示類團間以及類團內(nèi)各關(guān)鍵詞間的聯(lián)系及研究主題的發(fā)展與地位。因此綜合運用詞和類團分析方法,繪制復(fù)合網(wǎng)絡(luò)圖可以直觀地展示從詞、類團角度分別獲得的領(lǐng)域熱點信息,彌補單獨使用某一方法在分析學(xué)科領(lǐng)域熱點時的不足,在領(lǐng)域熱點監(jiān)測中具有重要意義。
本文尚存在不足。首先,只檢索了萬方醫(yī)學(xué)網(wǎng)的相關(guān)文獻,由于該數(shù)據(jù)庫收錄范圍的局限性[17],不能全面獲得我國神經(jīng)病學(xué)領(lǐng)域的相關(guān)文獻,分析結(jié)果難免有失偏頗;其次,用高頻詞代表研究熱點具有一定的合理性,其缺點在于某些最新研究主題的詞頻較低,僅依靠高頻詞無法監(jiān)測到最新的研究熱點。今后將結(jié)合監(jiān)控暴發(fā)詞的方法來探測學(xué)科熱點,從而更加準(zhǔn)確、客觀地揭示學(xué)科的新熱點。