〔摘 要〕本文在已有研究基礎上,以知識管理為視角,采用詞頻分析法對某大學團隊十年間的科研發文進行統計分析,并通過聚類分析和戰略坐標圖對該團隊研究所形成的主題領域及熱點進行戰略情報分析,旨在厘清該團隊的研究領域及各研究主題領域的發展趨勢,從而為團隊知識庫的構建及團隊建設與發展提供決策幫助。
〔關鍵詞〕詞頻分析法;戰略坐標圖;大學團隊;可視化;知識管理
DOI:10.3969/j.issn.1008-0821.2011.11.003
〔中圖分類號〕G250 〔文獻標識碼〕A 〔文章編號〕1008-0821(2011)11-0012-05
A Word Frequency Analysis into the University Team Research Topic TrendLi Yuanming
(Library,Hubei University for Nationalities,Enshi 445000,China)
〔Abstract〕Based on previous researches and from the perspective of knowledge management,the papers published by a universiry research team over the past decade were studied by means of word frequency analysis,and a strategic analysis into the field and hot issues formed by this research team was conducted through cluster analysis and strategic diagram in order to find out the subject areas researched by this team and their trends,which can provide some decision-making help for the construction of team knowledge base and the development of the team.
〔Key words〕word frequency analysis;stategic diagram;university team;visualization;knowledge management
組織知識管理的核心是將個人知識轉化為不依賴于具體個人的組織知識,從而實現組織知識存量的增長[1],大學團隊作為大學學術管理及學術建設的一種重要組織形式,是對專業化知識工作者的協調和結構性制度安排,其知識存量是團隊成員在長期的教學與科研實踐活動中積累而成,其學術積累及知識存量會部分地顯現于團隊的研究成果中,這些成果大多以文獻來加以承載。而詞是文獻中承載學術概念的最小單位,詞頻的波動與社會現象、情報現象之間具有內在的關系,一定的社會現象和情報現象必然引起相應的詞頻波動現象[2]。因此,運用文獻計量學中的詞頻分析法來深入研究大學團隊研究主題的發展動向,能夠有效揭示大學團隊研究成果的總體內容特征、研究內容之間的內在聯系、學術研究的發展脈絡與發展方向等[3],從而達成團隊知識共享與知識整合的知識管理目標。
1 詞頻分析法及數據來源
1.1 詞頻分析法及其主要應用
從1917年文獻學家科爾(F.T.Cole)和伊爾斯(N.B.Eales)率先以動物解剖學方面的論文為對象所進行的文獻統計研究[4]開始,到六、七十年代文獻計量學的正式形成,詞頻一直是文獻計量學的一個重要統計項目和研究手段。
詞頻分析法是文獻計量學的傳統分析方法之一,其所依據的基本理論是齊普夫定律(Zipf’s law)。詞頻分析法對能夠揭示或表達文獻核心內容的關鍵詞、主題詞或論文的標題進行計量統計分析,并以這些詞在某一研究領域文獻中出現的頻次高低來確定該領域研究熱點和發展動向。由于這些詞都是文獻研究內容的濃縮和提煉,因而它們的反復出現,可反映出這些詞所表征的研究主題一定是該領域的研究熱點,同時詞頻的波動變化也能反映研究的發展趨勢。
詞頻分析法對分析對象中特定關鍵詞出現的頻率及關聯進行分析、推斷[5],作為一種透過現象看本質的科學研究方法,能克服傳統文獻綜述方法過于依賴定性的總結描述、難以擺脫的個人經驗和主觀偏好、無法深入揭示文獻隱含的深層次內容等弊端,具有客觀性、準確性、系統性、實用性等特點[6],因而被廣泛應用于情報分析領域,如:預測學科、部門的發展趨向;判斷學科之間、部門之間、專家之間的“聯系強度”;論證科學研究規律;確定核心期刊、核心作者、核心情報源等。
加拿大蒙特利爾大學的Robert教授[7]、河南師范大學的梁立明教授等[8]采用詞頻分析法分別于1997年、2003年對世界納米研究狀況和中國納米研究狀況進行了分析和研究,武漢大學的邱均平教授等人采用詞頻分析法分析了2002年度國內外情報學研究的熱點和動向[9],安秀芬[10]、喻培珍[11]、楊祖國[12]等分別就自己所關注的期刊工作、醫學等相關領域采用詞頻分析法進行了分析和研究。基于詞頻分析法對大學團隊進行研究的文獻尚不多見,本文欲在此方面進行嘗試。
1.2 數據來源
本文在文獻[13]研究的基礎上,以該文獻所揭示的團隊為研究樣本,采用詞頻分析法對該團隊近十年間的研究成果進行計量分析,期望對該團隊的知識結構和研究熱點進行揭示。為此,本文選擇中國知網(CNKI)的中國學術期刊網絡出版總庫為數據來源,該庫收錄了7 579種學術期刊,文獻來源覆蓋率達到了99%。檢索時間限定為2001.1.1-2010.12.31,10年的時間跨度應能反映出團隊知識結構的增長與變化過程。以第一作者為檢索途徑來檢索每一位團隊成員所發表的文章,可以避免檢索結果的冗余。
2 結果與分析
2.1 團隊發文概況
經對檢索結果的論文標題進行詞頻統計并整理后發現,該團隊在中國學術期刊網絡出版總庫中共收錄577篇論文,年均57.7篇,第一作者共45人,總署名作者人數為386人。其逐年發文概況如圖1所示:圖1 該團隊2001-2010年發文概況
圖1顯現出該團隊在2005年和2008年是發文較多的年份,自2005年開始,所發文章中的北大核心篇數均在40篇以上,其所占比例分別為55.3%(2005)、78.4%(2006)、62.5%(2007)、84.4%(2008)、66.1%(2009)、75.9%(2010),雖略有起伏,但總體上看,該團隊所發表文章的質量和水平呈逐年上升趨勢。
2.2 團隊發文核心期刊頻次分析
所有文章共分布在141種期刊上,其中北大核心期刊共88種361篇文章,占發文期刊總數的62.4%和發表文章總數的62.6%,《食品科學》、《安徽農業科學》和《湖北農業科學》3種核心期刊分居該團隊發文期刊的前一、二、三名,占到團隊發文總量的24%。中國科學引文數據庫C庫標記期刊共46種158篇文章。這些期刊主要分布在物理學、化學、生物科學、中國醫學、農業科學、化學工業、輕工業等學科領域以及農林院校學報的自然科學版上。表1是該團隊發文3篇以上的北大核心期刊統計表,表中所列期刊10年間共發表該團隊281篇文章,占團隊發文總數的49%。表1 團隊發文核心期刊統計表(部分)
序號關鍵字段頻次1食品科學542安徽農業科學463湖北農業科學384時珍國醫國藥185中國釀造136應用化學107江蘇農業科學108精細化工109食品研究與開發1010食品工業科技9
續表1
序號關鍵字段頻次11園藝學報712中國調味品713食品科技614原子與分子物理學報515北方園藝416華中農業大學學報417化學研究與應用318中國中藥雜志319化學試劑320福建林學院學報321農業工程學報322信陽師范學院學報(自然科學版)323華中師范大學學報(自然科學版)324北京林業大學學報325西北林學院學報326河南農業科學3
2.3 團隊發文關鍵詞詞頻分析
關鍵詞是承載科研論文學術概念的最小單位,能反映團隊研究的主題領域,表2對該團隊10年間各年度的發文篇數、關鍵詞總量、年均關鍵詞數及高頻詞個數進行了統計。
結合圖1和表2,顯示出該團隊在2005年和2008年發表文章相對較多,且研究主題豐富。2001-2004年使用的關鍵詞穩定在100~140個之間,2005年后使用的關鍵詞基本穩定在200個以上。從詞頻次數達2次以上的關鍵詞分年度占比來看,除2001年和2003年分別僅為6.9%和5.1%以外,其余各年度基本穩定在11%~18%之間,說明該團隊有相對固定的研究領域和研究主題。借助邱均平老師[14]關于關鍵詞的相對頻次計算方法,表2中年均關鍵詞頻次數基本穩定在2.8~4.0這一區間,可看出關鍵詞的波動幅度不大,由此也可說明該團隊的研究領域及研究主題相對穩定。
表3為該團隊2001-2010年發文全部關鍵詞且頻次為8次以上的統計分析表,表中所列關鍵詞能基本顯示出該團隊10年間研究的重點及熱點領域,即:生物曬含量研究;香料的合成研究;區域特色資源及新品種的生理生化特征研究;主要藥用植物生物學特性與栽培技術研究等。表3 頻次8以上的關鍵詞統計表
序號關鍵詞頻次序號關鍵詞頻次1硒4815制備102合成3716氨基酸93多糖2517藤茶94香料2018莼菜95提取1719油菜96五鶴續斷1520品種97賦存形態1521狹葉四照花98含量1422化學成分89日本落葉松1323黃酮810RP-HPLC1224香氣811和厚樸酚1125分布812厚樸酚1126蛋白質813GC-MS1127玉米814絞股藍10
為進一步厘清該團隊10年間的研究主題動向,本文提取了577篇文章的全部關鍵詞共1 335個,并對其進行頻次排序,因年均關鍵詞數的均值為3.3,故取閾值4,得到95個關鍵詞,對這95個關鍵詞進行詞共現頻次統計,形成關鍵詞共詞矩陣,采用SPSS17.0對共詞矩陣進行聚類分析并形成相應地聚類結果。依據聚類結果,作者對該團隊中的學科專家及領域專家進行了訪談,整理成表4所示的團隊研究相對固定的12個主題領域及與之對應的關鍵詞。
表4 團隊研究主題——關鍵詞聚類結果表
研 究 主 題關 鍵 詞A.區域特色資源及新品種的生理生化特征研究愈傷組織、誘導、新品種、恩施州、品種、油菜、分布、富集、鉛、生理特性、花椰菜、脯氨酸、蛋白質、狹葉四照花、可溶性糖、黃酮、莼菜、薇菜、安全性B.主要農作物產量品質測定及經濟林木病蟲害防治研究玉米、產量、施肥水平、淀粉、魔芋、發生規律、綜合防治、杜仲、大豆、日本落葉松、日本落葉松人工林、藥劑篩選
續表4
研 究 主 題關 鍵 詞C.主要藥用植物生物學特性與栽培技術研究蜜環菌、甜味絞股藍、絞股藍、植物群落、天麻、栽培技術、生物學特性D.天然產物開發利用研究多糖、提取、氨基酸、藤茶、竹節人參、正交試驗、勢能函數、總黃酮、提取工藝、茗荷、優化、組成、工藝條件、正交實驗、穩定性、席夫堿E.生物硒含量研究賦存形態、硒多糖、硒蛋白、硒F.藥用植物營養成份分析與評價五鶴續斷、評價、堇葉碎米薺、營養成分、分析、含量、RP-HPLC、和厚樸酚、厚樸酚G.主要農作物生物量與農藝性狀研究地徑、苗高、生物量H.三峽庫區自然災害研究三峽庫區、自然災害I.無機配合物及有機化合物的熱化學研究稀土配合物、差示掃描量熱法、釹配合物、熱分析、咪唑、熱分解動力學J.天然香料與化學香料的有機合成研究進展、香料、合成、香氣、BunteSalts法K.恩施州特色天然產物的利用研究化學成分、揮發油、GC-MS、揮發性成分L.納米材料的合成與性能研究碳酸鈣、資源、鋅、工藝、催化、固體超強酸、納米碳酸鈣、制備
2.4 團隊共詞戰略坐標圖
為測度各研究主題的內部聯系強度及其發展趨勢,本文采用共詞戰略坐標對聚類結果作進一步描述和分析。
戰略坐標(stategic digram)是在建立主題詞或關鍵詞的共詞矩陣和聚類的基礎上,采用可視化形式加以描述的一種方法。1988年Law[15]等提出了用“戰略坐標”來描述某一研究領域內部聯系情況和領域間相互影響情況。
戰略坐標圖是以向心度和密度為參數繪制成的二維坐標系,其中,X軸為向心度(Centrality),Y軸為密度(Density)。密度被用于衡量研究主題之間的內部聯系的強度,它表示該主題維持自己和發展自己的能力。向心度被用于衡量一個主題和其他主題之間相互聯系的程度。向心度越大,即一個主題和其他主題之間聯系越緊密,則該主題在此學科中就越趨于中心位置。位于不同象限的研究主題處在不同的發展階段,其中第二、三象限研究主題有可能向“前沿領域”發展。
在表4所示的聚類結果基礎上,本文繪制了該團隊12個研究主題的戰略坐標圖,如圖2所示。圖2 團隊研究主題戰略坐標圖
在圖2中,落在第一象限的研究主題有天然產物開發利用研究、生物硒含量研究(即D、E),該區域內的研究主題趨向成熟,居于團隊研究網絡的中心位置,并與其他主題建立了廣泛的聯系;落在第二象限的研究主題有藥用植物營養成份分析與評價、天然香料與化學香料的有機合成研究、恩施州特色天然產物的利用研究(即F、J、K),該區域內的研究主題向心度不高,在整個研究網絡中處于邊緣,但其主題領域內部鏈接緊密,主題明確,研究趨向成熟,在整個研究網絡中具有較大的潛在重要性;落在第三象限的研究主題有主要農作物產量品質測定及經濟林木病蟲害防治研究、主要農作物生物量與農藝性狀研究、三峽庫區自然災害研究、無機配合物及有機化合物的熱化學研究、納米材料的合成與性能研究(即B、G、H、I、L),該區域內的研究主題距離研究核心比較遠,同時自身研究的密度也不夠高,說明這些研究不成熟,也暫未成為核心內容,有待于進一步發展以受到研究人員的關注;落在第四象限的研究主題有區域特色資源及新品種的生理生化特征研究、主要藥用植物生物學特性與栽培技術研究(即A、C),該區域內部結構松散,研究尚不成熟(密度較低),但向心度較高,與網絡中其他研究結合緊密,說明該領域有進一步發展的空間,有潛在的發展趨勢。
圖2顯示出,密度相對較高的是生物曬含量研究、藥用植物營養成份分析與評價、天然香料與化學香料的有機合成研究(即E、F、J)3個研究主題,表明這些研究主題內部聯系強度大,且發展能力強。向心度最大的是生物曬含量研究(即E),說明這個研究主題與其它各研究主題的聯系非常緊密,居于團隊研究的中心位置。
3 結 語
本文運用詞頻分析法對某大學團隊10年間的科研發文情況進行了統計分析,并在共詞聚類的基礎上采用戰略坐標進行了可視化描述。2001~2010年間,該大學團隊的科學研究情況總體上呈現出12個主題研究領域,其間各個主題領域不斷地交叉、融合、分化、更新。天然產物開發利用研究和生物硒含量研究趨向成熟,居于團隊研究網絡的中心位置,且與其它各研究主題的聯系非常緊密。這一結論與該校于2005年經湖北省教育廳和科技廳聯合批準立項建設的生物資源保護與利用湖北省重點實驗室有直接關系(該重點實驗室現設有3個主要研究方向——生物資源保護與恢復、天然產物與生物制品開發和生物硒資源研究),表明該省級重點實驗室自建成后對該校的科研與教學產生了極為重要的推動作用,并在部分研究領域有了突破性進展。
參考文獻
[1]晉琳琳.高校科研團隊知識管理系統要素研究——來自教育部創新團隊的實證分析[J].技術與創新管理,2010,22(5):29-34,55.
[2]鄧珞華.詞頻分析——種新的情報分析研究方法[J].大學圖書館通訊,1988,(2):18-25.
[3]李文蘭,楊祖國.中國情報學期刊論文關鍵詞詞頻分析[J].情報科學,2005,23(1):68-70,143.
[4]查先進.信息分析與預測[M].武漢:武漢大學出版社,2000:171.
[5]劉成山,趙捧未,竇永香.數字圖書館的集成策略[J].情報雜志,2004,(1):87-89.
[6]張勤.詞頻分析法在學科發展動態研究中的應用綜述[J].圖書情報知識,2011,(2):96-98,128.
[7]馬費成,張勤.國內外知識管理研究熱點——基于詞頻的統計分析[J].情報學報,2006,25(2):163-171.
[8]梁立明,謝彩霞.詞頻分析法用于我國納米科技研究動向分析[J].科學學研究,2003,21(2):138-142.
[9]邱均平,趙蓉英,侯經川.2002年國內外情報學發展動向研究[J].情報學報,2003,22(5):515-519.
[10]安秀芬,等.期刊工作文獻計量學學術論文的關鍵詞分析[J].中國科技期刊研究,2002,13(6):505-506.
[11]喻培珍,秦惠基.從主題詞頻率變化分析我國放射診斷新技術發展趨勢[J].中華醫學圖書情報雜志,1995,(3):26-27.
[12]楊祖國,李秋實.中國情報學期刊論文篇名詞統計與分析[J].情報科學,2000,18(9):820-821,840.
[13]Li Yuanming,Hu Kuiju,Cai Qingwan.Visual Analysis of Network Structure in University Scientific Research Teams[C]∥Jinwen ZOU.2011 International Conference on Management Innovation,Information Technology and Economic Growth(2011 MIITEG).Irvine: Scientific Research Publishing,2011:1470-1475.
[14]邱均平,丁敬達,周春雷.1999-2008年我國圖書館學研究的實證分析(下)[J].中國圖書館學報,2009,(6):72-79.
[15]Law J,Bauin S,et al.Policy and the mapping of scientific change:a co-word analysis of research into environmental acidification[J].Scientometrics,1988,14(3/4):251-264.