甘橋
基于文獻計量的眼動與漢語研究動態的知識圖譜分析
甘橋
運用CiteSpace文獻計量學方法,以1995-2016年間中國期刊全文數據庫(CNKI)中收錄眼動與漢語研究相關的266篇學術論文作為數據來源,對從事相關研究的主要作者、科研機構、高頻熱點詞等方面進行了可視化知識圖譜分析,梳理了國內學界22年來利用眼動技術進行漢語研究的發展脈絡、核心課題和研究前沿,對這種新的學科內部交叉研究進行了深入分析。旨在輔助從事眼動與漢語研究的學者全面把握領域進展,借鑒已有經驗和成果,以更好地進行交叉研究,探究漢語學習中學習者的潛在心理進程,為教育研究者將學習結果和相關的認知加工過程聯系起來提供一個便捷的途徑,并深度建構漢語研究的心理學路徑。
文獻計量;CiteSpace;眼動;漢語研究;科學知識圖譜
眼動即眼球的運動,是指通過測量眼睛的注視點的位置或者眼球相對頭部的運動而實現對眼球運動的追蹤,在視覺系統、心理學、認知語言學的研究中有廣泛的應用。它與注意及內部信息加工機制具有密切聯系,存在著外源性和內源性兩種控制,更多情況下受到任務或目的指引。因此,眼動心理學研究已經成為當代心理學研究的一種有用范型,同時,基礎性眼動研究及其理論建構也越來越受到重視,眼動追蹤技術在漢語研究領域中應用的程度也隨之提高。本文通過對1995-2016年文獻的總結,揭示眼動追蹤技術在漢語研究中的應用。對研究中所使用眼動指標的統計表明,時間指標(如注視時間)的使用最多,其次是量值指標(如注視點個數),而空間指標(如注視位置)則較少。通過對內容的分析,發現眼動追蹤技術主要被用于探究漢語中7個方面的主題:閱讀、詞切分、詞匯識別、句子理解、語義加工、工作記憶和眼動特征。利用眼動追蹤技術,可以探究漢語學習中學習者的潛在心理進程,為教育研究者將學習結果和相關的認知加工過程聯系起來提供一個便捷的途徑,并深度建構漢語研究的心理學路徑。
本研究所使用的數據均來源于中國知網全文數據庫。筆者于2017年1月6日以“眼動”并含“漢語”或者“中文”為檢索式,檢索類型為“主題”,檢索時間不限,在CNKI中共檢索到323篇論文,借助NoteExpress文獻管理器的去重功能,以及剔除期刊目錄、會議通知等無效數據后梳理出266篇有效論文。每條引文均保存為純文本格式以便導入CiteSpace進行可視化分析提取數據,包括作者、篇名、期刊名稱、出版年份、作者單位、摘要、關鍵詞等指標。
本研究借助科技文本挖掘及可視化工具——CiteSpace計量文獻學系統對文獻數據進行分析,此系統由美國德雷賽爾大學知識可視化與科學發現聯合研究所所長陳超美博士開發。CiteSpace是一款基于Java語言、著眼于科學分析中蘊含的潛在知識,并在科學計量學、數據和信息可視化背景下逐漸發展起來的一款引文可視化分析軟件,得到的可視化圖形稱為“科學知識圖譜”(Mapping knowledge domains,MKD),具有圖和譜的雙重特性[1]。
(一)文獻發表時間分布圖

圖1 1995-2016年CNKI中眼動與漢語研究的發文量統計
從圖1中可以看出,國內學界該領域研究發端于20世紀末,發文量總體呈波動上升趨勢,2014年達到頂峰29篇之后數量有所回落。最早一篇論文出現在1995年,除1996和1997年文獻量為0,其余20年里每年均有相關論文出現。肇始的論文由秦震和陸費漢倩1995年發表于《臨床神經科學》,涉及華人和德國人閱讀中德文眼動型式的比較研究,結果表明,華人與德國人各自閱讀本國文字材料的眼動型式非常相似,原來學習表意文字(表音文字)的人在轉而學習另一種文字時很可能還是運用閱讀原來文字的語言手段。對內容一致的橫排體和直排體中文的閱讀眼動參數并無明顯區別[2]。該文獻借助眼動實驗研究了不同國籍漢語學習者的閱讀差異,揭示了學習者間的閱讀異同,深刻闡釋了眼動在漢語研究中的巨大前景,此后的20年間借助眼動進行漢語研究的實驗不斷增加,質量也更高,既有對漢語學習的理論建構也有對教學實踐的科學指導。
(二)主要學者及科研單位
CiteSpace通過漸進的共引網絡分析來實現對一個學科或者研究領域發展脈絡的梳理[3]。因此,本文以年為時間分區,將1995-2016劃分為22個時間分區。選取每個時間分區內發表論文篇數前50名的作者、科研機構作為數據,采用最小生成樹算法得到作者及科研機構合作情況的可視化知識圖譜。閾值設定為2,即圖譜中的作者和科研機構頻次均不少于2次,字號為5,字節尺寸取最大值,并選擇展示連接強度功能,最終生成圖2的可視化知識圖譜。

圖2國內從事眼動與漢語研究的主要學者和科研機構分布
圖2 中節點的大小、顏色深淺以及連線強度代表該學者或機構發表的論文數量,數量越多節點越大,字體顏色越深且作者間以及作者與科研機構間合作頻次越大,連線越明顯。例如圖中“閆國利”和“白學軍”與“天津師范大學心理與行為研究院”這三點間有連接線,且閆國利字體顏色最深,所占圖譜圓周最大,這說明以上兩名研究者的工作單位均是天津師范大學心理與行為研究院,且合作發表過文章,其中閆國利的文章產出數量多于白學軍。
1995-2016年期間,國內從事眼動與漢語研究且產出成果較多的學者和科研機構較為有規律可循,作為教育部人文社會科學百所重點研究基地之一(全國僅有2個心理學重點研究基地)的天津師范大學心理與行為研究院產出文獻最多,單一單位署名文獻達35篇,閆國利和白學軍為最高產學者,分別產出文獻31、23篇,該基地的區域影響力突出,南開大學和天津外國語大學均有多位學者與該單位有實質性的合作研究,致力于漢語的語義消歧、歧義加工、注視位置和詞匯識別研究。此外,高產的作者和單位還有遼寧師范大學任桂琴,研究領域主要是句子語境下的詞匯形、音加工和詞匯歧義消解;北京師范大學心理學院舒華和武寧寧,主要研究詞匯和句子層級的歧義消解和句子加工;中國人民大學心理學系張積家和王娟針對漢英雙語者進行啟動語言和語義加工研究。從中我們可以看出天津師范大學心理與行為研究院獨樹一幟,合作優勢明顯,區域輻射力較強,研究領域主要集中于漢語閱讀研究,也啟發研究者應該進行學科交叉和優勢互借,加強協同合作,提升研究層次以促進學科的縱深和優化發展。
(二)研究領域和熱點
1.研究領域。CiteSpace軟件能夠通過繪制聚類和時區視圖顯示一個學科或知識域在一定時期發展的趨勢和動向,展示若干研究前沿領域的演進歷程[3]。因此,以1年為時間分區,將1995-2016年劃分為22個時間分區,采用尋徑算法剪切后生成可視化知識圖譜。其中,閾值設置為3,即關鍵詞的出現頻次不少于3次,字體大小設置為16號,節點選取最大值并選擇展示連接強度功能鍵,最后得到圖3的知識圖譜。基于圖譜及CiteSpace的統計數據,得到表1的高頻次詞頻表和表2的高中心度關鍵詞詞頻表。

圖3國內眼動與漢語研究熱點分布
圖3 中的每個圓圈(即節點)代表一個關鍵詞,節點越大反映該關鍵詞出現的頻次越高。節點顏色深淺反映了研究熱點的演變過程,年輪的厚度代表該時間分區里關鍵詞出現的次數—數量越多,年輪越厚[4]。節點間不同的連線代表其共現關系,連線越粗共現關系則越密切。有些大的節點內部或周圍分布著一些小的節點,說明這些節點之間關系非常緊密,構成了聚類(cluster)。例如圖3中的“漢語閱讀”與“眼動儀”“詞切分”與“中文閱讀”明顯屬于兩個不同的聚類。

表1 高頻次關鍵詞
從圖3和表1的統計信息看來,眼動與漢語研究的研究對象集中于老年人和學前兒童,領域分布于閱讀、詞切分、詞匯識別、句子理解、語義加工、工作記憶和眼動特征7方面,其中“漢語閱讀”頻次為31,表明有31篇文獻以漢語閱讀為關鍵詞,占比12%,“詞切分”“閱讀障礙”和“閱讀過程”頻次均大于10,這3個關鍵詞均屬于閱讀領域,分別占比6%、5%、4%,漢語閱讀研究占比最大,涉及閱讀障礙、閱讀過程、閱讀知覺廣度等內容,經系統檢測得知,其中“閱讀過程”Sigma值達到2.63且2000年的突變值為4.43,表明閱讀過程研究在眼動與漢語研究中重要性最突出,具體研究內容為閱讀過程的句子理解、詞匯識別以及對雙字詞的認知加工。
2.研究熱點。中介中心度是用來測量節點在網絡中重要性的指標,CiteSpace使用此指標來發現和衡量關鍵詞的重要性、揭示研究演繹路徑和熱點。現通過考察和解讀高中心度關鍵詞解讀眼動與漢語研究的熱點。
表2是筆者根據CiteSpace生成的信息統計得出的中介中心度大于或等于0.10的14個高中心度關鍵詞表。

表2 高中心度關鍵詞
由表2可以看出,眼動研究、閱讀過程的聚類中心度均大于0.20,是眼動與漢語研究的前沿與熱點,具體體現在利用眼動技術進行閱讀過程的探討,如沈模衛,張光強等介紹了閱讀過程眼動控制理論模型-E-Z Reader的理論基礎和具體操作方法[5]。韓玉昌,隋雪等探討了小學學習困難生閱讀過程中的眼動特征[6],指出小學學習困難生文章閱讀的注視次數多、注視范圍小且回視次數多;注視點持續時間長、加工速度慢;眼跳距離小。賀薈中和賀利中針對聾生篇章閱讀過程進行了眼動研究[7],指出語言發展前全聾學生閱讀記敘文的整體能力與低于其3個年級的聽力正常學生有差距,主要表現在文章閱讀的整體效率顯著低于聽力正常學生,而在其他眼動指標上均未見差異,但以反復回視、增加注視點等為代價。
此外,由表1、表2可知,眼動研究在基于眼動實驗的系列研究中仍然占據本體地位,因此,從事眼動與漢語研究的科研工作者應當具備必要的眼動知識,包括儀器使用、實驗設計、變量監控等各個環節的準備與參數設定。事實上,只有系統全面地掌握了眼動實驗知識才能提升基于眼動的漢語研究水平,進而從方法論創新的高度建構漢語研究的心理學路徑。
眼動與漢語研究目前主要集中于閱讀,包括詞匯識別、閱讀障礙、閱讀知覺和句子理解等研究主題,該領域研究成果豐碩,使用眼動技術有力的推動了漢語閱讀研究的縱深發展,然而與漢語寫作、聽力、口語等方面的結合相對較少,可能的原因一是操作難度較大,相關變量的可控性和實驗環境及設備的限制性,二是該領域的研究仍處于發展階段,寫作、聽力、口語等研究主題會有后續的研究進展。據此,下一步研究應注意領域的廣度與深度,眼動與漢語的研究尚大有可為,具有良好發展前景,如充分利用眼動儀觀測漢語寫作時學習者的心理加工特性,基于學習者心理探索高效的漢語寫作教學模式。此外,筆者在WOS數據庫中以“eye movement”AND“Chinese”檢索得到772條相關文獻,文獻量為CNKI數據庫相關數據的兩倍,其中臺灣和中國大陸學者為主要學者群,通過閱讀發現國外眼動與漢語研究成果較多,且呈現多格局和精細研究的趨勢,如加拿大學者Tsang,Cara和Chambers,Craig G.的最新成果針對粵語口語的復合詞、重復詞和增量詞識別進行了研究[8],這一研究充分的開拓了眼動與漢語口語研究的心理學路徑。總之,眼動與漢語結合的研究歷史較短,急需開拓的領域廣泛且研究深度極具前景,相關實驗結果對閱讀障礙、特殊語言教育等有較好的臨床輔助和矯正效果,這一領域值得進一步拓展。
[1]李杰,陳超美.CiteSpace:科技文本挖掘及可視化[M].首都經濟貿易大學出版社,2016:2-3.
[2]秦震,陸費漢倩.華人和德人閱讀中—德文眼動型式的比較研究[J].臨床神經科學,1995(4):14-17.
[3]劉則淵,陳悅,侯海燕等.科學知識圖譜方法與應用[M].北京:人民出版社,2008.
[4]Chen Chaomei.Predictive Effects of Structural Variation on Citation Counts[J].Journal of American Society for Information Science and Technology,2012(3):439-449.
[5]沈模衛,張光強,符德江,陶嶸.閱讀過程眼動控制理論模型:E-ZReader[J].心理科學,2002(2):129-133,252.
[6]韓玉昌,隋雪,任延濤.小學學習困難生閱讀過程中的眼動特征[J].心理科學,2005(3):550-553.
[7]賀薈中,賀利中.聾生篇章閱讀過程的眼動研究[J].中國特殊教育,2007(11):31-35.
[8]Cara Tsang,Craig G.Chambers,and Mindaugas Mozuraitis.Compounds,Competition,and Incremental Word Identification in Spoken Cantonese [J].Language,Cognition and Neuroscience,2017 (1):69-81.
責任編輯:賀春健
H109.4
A
1671-6531(2017)05-0049-04
甘橋/西安交通大學外國語學院在讀碩士(陜西西安710049)。