欒旭倫
(淮陰師范學院國有資產管理辦公室,江蘇 淮安 223300)
碩士學位論文的發表狀況常被認作是衡量學科發展水平和科技產出的一項重要指標[1]。筆者通過詞頻統計方法和關鍵詞共現聚類方法,對近五年的情報學碩士學位論文進行了詞頻分析,得出了情報學近年來的研究熱點,揭示了情報學的研究現狀。
文章所采用的研究數據來源于中國知網的《中國優秀碩士學位論文全文數據庫》。以“學科專業名稱”等于“情報學”、畢業時間為“2008年至2012年”為檢索條件,共檢索到情報學碩士學位論文1,503篇。其中2008年 284篇、2009年 299篇、2010年346篇、2011年280篇、2012年244篇。檢索到的論文單位包含了中國知網上收錄的全部情報學碩士點的院校和科研機構。從檢索到的碩士學位論文中提取作者、學位論文標題、授予學位年代、導師、關鍵詞、摘要等信息,建立文章研究的題錄信息數據庫。
文章采用關鍵詞詞頻方法、關鍵詞共現方法和內容分析法進行研究。通過對5年間各關鍵詞出現的頻次和總頻次的統計,得出高頻關鍵詞。再利用詞頻共現的方法對高頻關鍵詞進行聚類研究,通過聚類結果內容分析來揭示情報學的研究現狀。
詞頻統計(Word Frequency Count)是通過統計一定長度的語言材料中每個詞出現的次數,分析統計結果,來確定某領域研究熱點和發展動向的文獻計量方法[2]。筆者使用武漢大學POST統計軟件中的中文詞統計功能對獲得的情報學碩士論文關鍵詞進行統計分析,選取出現頻次為12次以上的關鍵詞作為分析對象,得到的統計結果如下:
2008年~2012年情報學碩士論文關鍵詞出現次數最多的是“知識管理”“競爭情報”“本體”“高校圖書館”“圖書館”“指標體系”和“數字圖書館”。其中“知識管理”“競爭情報”和“指標體系”是情報學自己獨有的研究領域,特別是指標體系中與情報計量有關的指標體系和信息經濟學中的宏觀指標體系,情報學中的“本體”研究則是對信息檢索方法的深化。“高校圖書館”“圖書館”和“數字圖書館”反映了情報學與圖書館學的聯系,情報學也將圖書館及圖書館服務作為自己研究的一個方向,促進了文獻信息服務水平的不斷提高。從關鍵詞出現頻次由高到低的趨勢,可以看出情報學的研究內容逐步走向寬泛。具體詞頻情況見表1。

表1 2008年~2012年情報學碩士論文關鍵詞詞頻排名分布表

2008年詞頻最高的關鍵詞依次為:本體、知識管理、圖書館、對策、指標體系、數字圖書館、電子商務、電子政務、知識服務、高校圖書館。
2009年詞頻最高的關鍵詞依次為:知識管理、圖書館、競爭情報、高校圖書館、數字圖書館、本體、信息服務、指標體系、實證研究、知識轉移。
2010年詞頻最高的關鍵詞依次為:競爭情報、本體、高校圖書館、指標體系、知識管理、數據挖掘、績效評價、信息服務、專利分析、企業、數字圖書館、競爭情報系統。
2011年詞頻最高的關鍵詞依次為:電子商務、層次分析法、數字圖書館、本體、電子政務、競爭情報、指標體系、知識管理、數據挖掘、高校圖書館。
2012年詞頻最高的關鍵詞依次為:圖書館、知識管理、信息組織、電子商務、競爭情報、云計算、信息服務、本體、知識共享、高校圖書館、層次分析法、網絡環境、評價。
通過對高頻關鍵詞進行共現聚類分析可以對情報學的研究熱點進行整體的揭示。如果兩個關鍵詞在一篇學位論文中共同出現則共現次數為“1”,若它們在n篇學位論文中共同出現則共現次數為“n”。筆者將頻率大于11的67個高頻關鍵詞在學位論文中的共現情況進行記錄,轉換為關鍵詞詞篇矩陣。筆者用SPSS統計分析軟件對數據進行層次聚類,選擇“類內連接法”(Within-groups linkage),利用二值方法進行聚類,取用Ochiia系數得到聚類分析圖,通過聚類分析圖,可以把近五年來情報學的研究熱點概括為8大類,每個大類表示一個研究熱點。
文獻計量學一直是情報學的一個重要的研究方向,特別是各類文獻數據庫的出現,在數據挖掘方法的帶動下,不少論文開始用文獻計量學的方法分析情報等各個學科的學科結構,比如:中南大學的魏海燕用引文分析的方法對情報學與相關學科進行了研究,得出了它們之間知識的相互轉移、知識吸收、知識擴散和主題交叉情況[3];重慶大學的侯筱蓉將新的引文分析方法應用到專利分析中,通過引文路徑分析來勾勒專利技術演進圖,將得到的結果利用到具體的醫用內窺鏡技術中,并成功預測了其發展趨勢[4]。
知識管理和競爭情報研究是情報學研究的兩個固有領域。如何在知識管理中促進隱形知識的發現與轉移成為知識管理的一個重要內容,社會網絡分析則在知識共享研究中發揮了越來越重要的作用。安徽大學的黃諦用社會網絡分析方法分析研究團體中的知識共享,發現知識共享網絡的核心人物、邊緣點和孤立點[5]。天津師范大學的唐超從本體論、認識論、方法論三個方面探討了國家競爭情報系統構建的基礎性理論框架[6]。
情報學中的危機管理研究不僅用在圖書館運作中,而且已應用到企業中,無論應用到哪一方面其實質都是從信息的角度對具體情況進行分析[7-8]。知識轉移研究是宏觀層面上的技術流動,特別應用于國家與國家之間,但也包括機構內部人員的知識轉移,比如:吉林大學的吳艷玲探討了高校科研團隊內部知識轉移情況[9]。
政府自身的信息管理問題,企業的電子商務問題也是情報學研究生選題的一個重要方面。政府如何利用信息共享,信息公開來提高自己的服務水平;公共圖書館如何為政府、企業提供具有特色的信息服務都已成為研究生的研究內容。如:華東師范大學的黃曉曼就解決信息的公開和保密之間的矛盾進行了探討[10]。
這一部分主要包括兩個方面的研究內容,一方面是評價指標及體系研究,一方面是知識產權的對策問題研究。包括對績效的評價研究、對危機預警的評價研究,對大學生信息素養的評價研究。這其中層次分析法以其簡單及有效性得到了廣泛的應用,比如:西南大學的何曉陽通過層次分析法構建了《醫學本科生信息素養評價指標體系》的基本框架,并通過問卷調查證明了在實際應用環境中的有效性[11]。
云計算是信息技術的一種新型形式,通過這種方式可以實現資源的合理共享,山西財經大學的郝雪梅針對煤炭企業信息網絡的信息孤島問題,提出了基于云計算技術的煤炭企業信息化解決方案[12]。數字圖書館的安全問題也是情報學研究的一個持續熱點,北京師范大學的石勇提出了基于Web服務的數字圖書館最佳安全實踐方案,其中的分布式計算,也就是云計算的根本理念問題[13]。
隨著網絡信息的不斷增多,更多的研究者將本體引入到語義網中,構建互聯網信息存取方式的檢索方法。其中的領域本體應用比較廣泛,這使信息中存在了一種概念間的整體關系,對更好地認識領域知識,在領域知識的前提下,更好地檢索到想要的信息創造了條件。這些論文對本體理論進行了深入的研究,并且將本體概念引入到各個學科領域,構建了化工文獻本體、醫學領域本體等[14-15]。
大學生的信息行為、信息需求的研究具有現實的意義,高校圖書館能開設相關的信息素養課程,培養大學生的信息素養水平;能提供更人性化的信息服務,強化大學生的學習能力。華中師范大學的孫丹探討了個人用戶、企業用戶、政府部門用戶的信息行為特點,根據用戶的信息行為構建了一個個性化知識服務模式[16]。
筆者利用詞頻分析法揭示出2008年~2012年情報學碩士學位論文的高詞頻關鍵詞,并利用聚類分析將這些高頻關鍵詞分為8個大類,分別是文獻計量學與數據挖掘;知識管理與競爭情報;危機管理、績效評價和知識轉移;公共圖書館、政府與企業;各種評價方法下的指標體系;數字圖書館和云計算;本體、信息檢索與開放存取;高校圖書館的知識服務。研究存在的不足是:受論文發表到數據庫收錄時間延遲的限制,所選取的中國知網的《中國優秀碩士學位論文全文數據庫》,其數據具有一定的滯后性,如:受部分院校學位論文對外公開時限的限制,2012年所檢索到的碩士論文數量有所減少;此外,數據庫收錄的情報學學位論文也不是很全面,北京大學、中山大學等情報學學位論文中國知網未能收錄。如何獲取更齊全的情報學碩士論文,并與其他相關學科的研究內容進行比較,是需要進一步研究的方向。
[1]張浩,成施充,崔雷.我國情報學碩士學位論文研究熱點分析[J].醫學信息學雜志,2012(2):44-47.
[2]貢金濤,楊帥,魏曉峰.基于專利詞頻和信息可視化的特定競爭對手分析——以通用風力發電技術為例[J].現代情報,2013(3):109-114.
[3]魏海燕.基于引文分析的情報學與相關學科的研究[D].長沙:中南大學,2009.
[4]侯筱蓉.基于引文路徑分析的專利技術演進圖研究[D].重慶:重慶大學,2009.
[5]黃諦.基于社會網絡的知識生態系統中的知識共享研究[D].合肥:安徽大學,2012.
[6]唐超.國家競爭情報系統構架的基礎性理論框架研究[D].天津:天津師范大學,2008.
[7]孟玲.基于核心競爭力的企業危機信息管理研究[D].鄭州:鄭州大學,2012.
[8]韓雙梅.圖書館危機管理的溝通機制研究[D].哈爾濱:黑龍江大學,2011.
[9]吳艷玲.高校科研團隊內部的知識轉移模式與機理研究[D].長春:吉林大學,2011.
[10]黃曉曼.政府信息公開下的信息獲取權研究[D].上海:華東師范大學,2009.
[11]何曉陽.醫學本科生信息素養評價指標體系的構建[D].重慶:西南大學,2011.
[12]郝雪梅.基于云計算的煤炭企業信息化研究[D].太原:山西財經大學,2011.
[13]石勇.Web服務安全問題及其對策研究[D].北京:北京師范大學,2008.
[14]劉卓燕.化學化工文獻本體的構建與實現研究[D].上海:上海交通大學,2008.
[15]呂爽.基于敘詞表的醫學領域本體的構建研究[D].長春:吉林大學,2011.
[16]孫丹.基于用戶信息行為的個性化知識服務研究[D].上海:華中師范大學,2012.