○沈敏佳
對外漢語研究主題分析
○沈敏佳
本文以中國知網為數據源,在核心期刊中檢索和獲取了2006-2015十年內與“對外漢語”相關的3378篇論文。利用SATI、ucinet和excel三款軟件,通過詞頻統計、社會網絡分析以及聚類分析相結合的方法,分析了近十年內對外漢語的主要研究主題和方向。以此更好地了解和掌握對外漢語研究的現狀以及趨勢,為今后的研究提供相應的數據支持和方向引導。
對外漢語 主題分析 共詞分析 社會網絡分析
隨著我國經濟的持續發展和綜合國力的不斷增強,漢語熱已經在世界范圍內形成。對外漢語這一領域的研究也逐漸深入。為了能更科學地了解對外漢語在近十年的研究現狀和發展方向,本文以在線文獻為實例,通過計量、社會網絡分析等方法來展開此項研究。作為了解一個領域研究現狀的一種重要途徑,文獻統計分析對于把握學科研究結構和發展趨勢的作用不容小覷。
中國知網是目前國內最大的匯集各種學術資源的網絡平臺,提供CNKI源數據庫、外文類、工業類、農業類、醫藥衛生類、經濟類和教育類多種數據庫。其中綜合性數據庫為中國期刊全文數據庫、中國博士學位論文數據庫、中國優秀碩士學位論文全文數據庫、中國重要報紙全文數據庫和中國重要會議文論全文數據庫。核心期刊則具有代表性、前沿性、權威性,在核心期刊上發表的論文在很大程度上揭示了國內在對外漢語領域的研究成果及研究方向。
本文以中國知網中的核心期刊為數據源,采用文獻計量學的方法,在中國知網中通過全文高級搜索“對外漢語”,在文獻的“哲學與人文科學”學科領域內選擇“中國語言文字”下的“語言學”及“漢語”,同時,由于研究對外漢語的論文數量比較龐大,因此本文所選的論文時間跨度在2006年到2015年之間。論文數量如圖1所示,這十年間發表在核心期刊上的相關論文數量沒有太大的變動。

圖1:對外漢語相關論文數年份分布圖
同時,本文整理了論文發表數量排在前10的核心期刊,具體名稱如表1。

表1:論文數量前10的核心期刊列表
筆者基于論文關鍵詞共詞分析法,以搜集到的3378篇論文為數據,對關鍵詞聚類與多維尺寸分析結果,可以呈現出對外漢語的研究主題,并利用社會網絡分析方法,通過繪制共現網絡知識圖譜,可以進一步揭示該研究領域結構的內部聯系及其特征。
共詞分析法是內容分析法的一種,其認為兩個能夠表達論文主題內容的詞條在一篇論文中同時出現,則表達二者具有一定的共現關系,共現詞數越多,則關系越強。聚類分析和多維尺度分析法,用來構建聚類圖和多維尺度圖譜,聚在一起的若干關鍵詞可構成一個研究主題領域。研究者利用社會網絡分析方法,可繪制網絡知識圖譜并呈現出各個研究主題在相互作用下的分布情況(核心與邊緣),因知識圖譜并不能很好地反映領域的成熟度,難以判定某研究領域的成長趨勢,還將基于共現矩陣構建戰略坐標圖,進一步解析各個研究領域的特征以驗證結論。
(一)關鍵詞頻率分析
本文利用SATI軟件,對收集的2278篇論文的所有關鍵詞進行詞頻統計與分析,并認為詞頻越高,則該關鍵詞在該領域的研究熱度越高。在操作軟件過程中,除去與本領域無關的關鍵詞,并對有效關鍵詞進行過濾,本文沒有對同義及近義關鍵詞進行合并。如下表2所示為2006-2015年中國知網的核心期刊內關于對外漢語研究的相關論文高頻率前30的列表。

表2:核心期刊對外漢語前20高頻關鍵詞列表
由表2可大致看出在對外漢語領域多集中在教學方面:“對外漢語教學”“漢語教學”“第二語言教學”和“漢字教學”等,研究主題則有語言文字、語法、語義、詞匯及口語等,說明這些主題是2006-2015年這十年間我國對外漢語研究的重點及熱點。
關鍵詞的出現頻率在一方面反映了對外漢語研究的情況,但僅僅從關鍵詞的詞頻來推斷對外漢語的研究熱點和難點還是遠遠不夠的。研究關鍵詞之間的共現關系,構建出關鍵詞內容之間的網狀結構對于分析對外漢語領域的研究熱點是一個很好的補充。本文利用共現分析法獲得關鍵詞的共現頻率,再以聚類樹狀圖和多維尺度圖譜來揭示對外漢語的研究主題及結構等。
(二)聚類樹狀圖
崔雷(1996)將聚類分析定義為是一組將研究對象分為相對同質的群組的統計分析技術。通過統計聚類分析,揭示實驗語音學研究主題結構,讀者可以簡單、直觀地了解到研究內容的大致分類情況,以此展現對外漢語的研究主題結構。同樣,本文選取詞頻前20的高頻關鍵詞,得出高頻關鍵詞共現相似矩陣,將相似矩陣導入ucinet進行層次聚類分析,得到如圖2所示的對外漢語高頻關鍵詞聚類樹狀圖。

圖2:對外漢語高頻關鍵詞聚類樹狀圖
從對外漢語高頻關鍵詞聚類樹狀圖中可看出,對外漢語領域的研究多集中在教學方面如對外漢語教學、漢語教學、第二語言教學和漢字教學等,研究主題則有語言文字、語法、語義、詞匯及口語等,說明這些主題是2006-2015年這十年間我國對外漢語研究的重點及熱點。
(三)網絡知識圖譜
從關鍵詞頻次的角度來探索對外漢語領域的研究熱點及現狀固然是一個很好的方向,但是略顯單薄。本文還將使用網絡知識圖譜來進一步探究,并使用SATI和ucinet兩個軟件對以上的20個高頻關鍵詞進行共現分析,構建共現網絡,如圖3所示。

圖3:對外漢語高頻關鍵詞共現網絡
網絡知識圖譜以關鍵詞為節點,關鍵詞之間的共現為連線,連線越多說明該關鍵詞和其他關鍵詞出現在同一論文中的情況越常見。節點位置越居中則認為該關鍵詞越核心,節點的形狀越大便表明該關鍵詞在共現網絡中的地位越重要。節點之間的連線越粗則認為關鍵詞之間的關系越緊密。由圖3可知,關鍵詞“對外漢語教學”的節點形狀最大,與其他關鍵詞之間的連線最多,位置也居中,說明“對外漢語教學”這個關鍵詞在這個共現網絡中的地位十分重要。同理可知,其他關鍵詞如“對外漢語”“現代漢語”“漢語教學”等,在這個共現網絡中的地位也不容小覷。
利用社會網絡分析方法及專門的分析工具,可以把某一主題的關鍵詞網絡以可視化的方式呈現出來,更加直觀地呈現出該研究領域的重點、熱點以及內部聯系和特征。本文通過這種方法將對外漢語相關論文進行了定量的統計和分析,從中我們可以總結出以下結論:對外漢語領域的研究多集中在教學方面如對外漢語教學、漢語教學、第二語言教學和漢字教學等,研究主題則有語言文字、語法、語義、詞匯及口語等,說明這些主題是2006-2015年這十年間我國對外漢語研究的重點及熱點。
[1]Callon M,Courtial J P,Laville F.Co-word analysis as a tool for describing the network of interactions between basis and technological research:The case of polymer chemistry[J].Scientometrics,1991,(1):155-205.
[2]Cottrill C A,Rogers E M,Mills T.Co-citation analysis of the scientific literature aditof innovation research traditions:Diffusion of innovations and technology transfer[J].Knowledge,1989,(2):181-208.
[3]崔雷.專題文獻高頻主題詞的共詞聚類分析[J].情報理論與實踐,1996,(4):49-51.
[4]劉啟元,葉鷹.文獻題錄信息挖掘技術方法及其軟件SATI的實現——以中外圖書情報學為例[J].信息資源管理學報,2012,(01):50-58.
[5]汪小帆,李翔,陳關榮.網絡科學導論[M].北京:高等教育出版社,2012:158-159.
[6]那日松,齊力格爾.蒙古語語言學研究主題分析[J].蒙古學集刊,2015,(2).
(沈敏佳 浙江杭州 杭州師范大學人文學院 311121)