






【摘要】本文使用CiteSpace對收錄于中國知網核心期刊與CSSCI期刊的句法復雜度論文進行可視化分析,發現自有論文發表以來,句法復雜度研究受關注程度一般,核心與C刊中論文發表數量不到百篇、且正處于從年度發文量最高峰下降后的恢復期;論文作者之間與所屬機構之間均有一定的合作關系;研究熱點主要是二語/外語寫作中的句法復雜度問題及其影響因素;研究前沿曾有向專門領域寫作和縱向的句法復雜度研究轉變的趨勢。
【關鍵詞】 CiteSpace;句法復雜度;中國知網;可視化分析
【中圖分類號】H0 【文獻標識碼】A 【文章編號】2096-8264(2024)43-0121-04
【DOI】10.20024/j.cnki.CN42-1911/I.2024.43.032
一、引言
在語言學領域中,句法復雜度概念用來揭示語言結構的豐富性和多樣性,對于理解和解析人類思維過程、認知能力和語言發展等有著不可忽視的重要性。從語言發展的角度來看,句法復雜度研究可以揭示語言結構的內在規律性,為語言習得和語言障礙研究提供重要參考。句法復雜度作為語言結構的重要指標,有助于深入理解語言習得的機制、更好地了解語言發展的規律,為語言教育提供科學依據[1]。句法復雜度研究也可以為語言障礙的診斷和干預提供科學依據;比如,通過分析句法復雜度在口吃患者中的表現,可以幫助研究人員更準確地診斷和干預這些語言障礙,有助于提高語言障礙患者的康復率和生活質量[2]。
國外語言學界對句法復雜度的關注始于20世紀六七十年代,起源可以追溯到早期的結構主義語言學和生成語法學派。結構主義語言學強調語言結構的內在規律和形式,通過分析語言中的句法結構和規則來揭示語言系統的普遍性和規律性。[3]生成語法學派則更加關注語言生成的過程,提出了一系列關于句法結構生成和解釋的理論模型,為后來的句法復雜度研究奠定了基礎。[4]
從研究范式來看,國內外學者對于句法復雜度的定義和測量方法有著不同的視角。傳統上,復雜度經常通過句子長度、句法深度、從句嵌套結構、結構類型的復雜化與多樣化等因素來量化[5]。然而,現代研究更傾向于結合語法結構的多樣性、靈活性以及非線性特征來進行評估[6]。隨著神經科學和心理科學的發展,句法復雜度的研究已逐漸成為跨學科研究的熱點,它不僅影響著閱讀理解的速度與效率[7],也與認知發展等領域緊密相連[8]。另外,隨著計算機技術的發展,計算語言學的出現也為句法分析和句法復雜度評估提供了新的方法和工具,使研究者能夠更加客觀地分析語言結構的復雜度。這種多學科的交叉融合,提升了句法復雜度研究的水平,進而更全面深入地探究語言習得和語言障礙的問題。
國內對句法復雜度的關注遠遲于外國學界,但也獲得了一些成果。由中國知網得知,國內涉及句法復雜度主題的研究論文最早發表于2006年。那么時至今日,國內關于句法復雜度的研究成果,其大致情況、研究熱點與研究前沿又是什么?基于中國知網核心期刊和CSSCI期刊收錄的論文數據,本文將通過CiteSpace可視化分析,對以上幾個方面進行簡單地回顧與梳理,以便為該領域的后續研究提供一些建議與參考。
二、數據收集與研究方法
本文數據在中國知網的檢索過程具體如下:由舊版網址進入,選擇期刊檢索,點擊“高級檢索”進入檢索頁,以“句法復雜度”為檢索詞、檢索條件選擇“主題并且篇關摘”,不限定文獻發表時間(數據采集時間為2024年3月29日)。為保證研究論文的水準,文獻來源選擇核心期刊和CSSCI期刊。剔除無關文獻后,最終獲取有效文獻78條。
本研究主要使用CiteSpace(6.3.R1 64-bit)進行可視化分析,通過對所選論文的作者、機構和關鍵詞的分布和聚類挖掘,展現出句法復雜度研究的現狀、熱點與前沿的動態發展。CiteSpace主要通過對文獻的共引分析,利用尋徑網絡或者最小生成樹算法,對一定條件下所收集的相關文獻進行統計分析[9],最后通過可視化圖表直觀地展現“一個學科或知識域在一定時期發展的趨勢與動向,形成若干前沿研究領域的研究歷程”[10]。
三、國內句法復雜度研究的可視化分析
(一)知網發文量概況
下面圖1展示了自有關于句法復雜度研究的論文收錄于中國知網以來的核心與C刊論文發表的數量及走向。由該圖可知,國內句法復雜度研究的論文數量不是很高(共78篇)。由圖1可見,在2006年發表了第一篇論文之后,經歷了一個長達五年的空窗期。隨后,發文量才于2012年開始緩慢上升,并經歷了一個增長(并于2022年到達最高峰)、回落又上升的過程,2024年度發文量能否超越2022年的最高峰(18篇)尚未可知。大致上,句法復雜度研究受關注度呈增長態勢。
(二)研究者及其機構
在進行研究者、機構和關鍵詞的CiteSpace可視化分析中,時間切片默認設置為1,篩選標準選擇g-index (K=25)。因生成的圖譜足夠簡潔,在圖譜剪裁設置欄中未勾選任何參數,選擇軟件默認計算法和圖譜剪裁策略。
通過分析得知,句法復雜度的研究者節點數共116個,合作關系連線為92條。如果設定參數閾值(by citation)為2,可獲得圖2,展示了其中發文數量較高的研究者及其合作關系。CiteSpace的運作邏輯是通過節點和姓名標簽的大小來表示發文數量的多少; 節點與標簽越大,發文數量越高,反之亦然。經過仔細觀察可看出,節點與姓名標簽最大者為吳繼峰(發文4篇)。緊接其后的是韓笑、馮麗萍、何蓮珍、胡韌奮、劉黎崗、張會平和鄭詠滟(均為3篇)。王同順、亓海峰等人發文數則均為2篇。另一方面,網絡圖中連線則表示這些研究者之間的合作關系。圖2顯示,句法復雜度研究中,部分研究者們中有比較密切的合作關系,形成了一定的研究小團體,如吳繼峰和胡韌奮等人、韓笑和馮麗萍等人間的合作。
研究者所屬機構方面,CiteSpace的分析結果顯示,節點數為95個,合作關系連線61條。把節點標簽的參數閾值(by citation)設定為3,獲得關系圖譜3。圖3顯示,發文數量前十的機構中,上海交通大學節點最大,發文數量最高(5篇),與其他研究機構有較緊密的合作關系。節點小于它的是北京師范大學漢語文化學院,發文數量為4篇,但連線顯示其與其他機構之間的合作關系更加密切。中央民族大學國際教育學院、北京外國語大學等其他六家研究機構節點更小,發文數量也少,均為3篇。節點的大小和之間的連線顯示,機構間有較緊密的合作關系,但尚未形成研究陣地或者研究中心。
(三)研究熱點
CiteSpace可視化分析中,研究熱點的獲取主要通過提取關鍵詞來實現[11]127,具體則通過對某領域相關論文中的關鍵詞項進行提取、統計其頻數、并形成網絡圖譜,從而確定該領域的研究熱點。關鍵詞來源涵蓋論文的題目、摘要、作者關鍵詞以及補充關鍵詞[11]204。
在進行句法復雜度研究關鍵詞共現分析時,CiteSpace的參數設置基本相同,其中的節點標簽參數閾值選擇“by frequency”(值為2)。最后我們獲得節點123個、連線153條,如圖4所示。節點和標簽的字體越大,說明該關鍵詞出現的頻數越高,研究熱度也越高[12]。
由CiteSpace分析可知,句法復雜度研究中關鍵詞頻數在2及以上的共有19個。其中,二語寫作為9,復雜度和準確度均為8,緊隨其后的是英語寫作(5次),流利度和語料庫各4次,寫作質量3次,寫作質量、寫作等12個關鍵詞頻數為2。由圖可見,相關論文中的高頻關鍵詞均與語言產出有關,主要圍繞二語寫作、英語寫作、復雜度、準確度形成四個關鍵詞節點群,體現了句法復雜度領域的研究熱點,主要是二語或外語寫作中體現出的句法的復雜度、準確度。其他的小關鍵詞節點群包括元分析、協同效用等,相關論文主要試圖解釋呈現不同句法復雜度的原因。以上關鍵詞是句法復雜度研究論文核心內容與主題的高度提煉,由這些關鍵詞出現的頻數變化可看出句法復雜度研究的熱點和重要主題之所在[13]。
在已有關鍵詞及共現網絡的基礎上進行聚類,把聚類欄中的參數“set the smallest size of a cluster to show”設定為3,共獲得七個聚類,如下面圖5所示。該圖再次印證,句法復雜度研究的熱點是二語/外語寫作或學習中所呈現出的句子復雜度問題以及對影響句法復雜度因素的探究。另外,聚類分析也顯示,翻譯活動中的目的語文本的句法復雜度也是研究的熱點。下文簡單介紹相關熱點。
1.二語/外語寫作中的句法復雜度研究。國內句法復雜度研究多與二語/外語寫作相關,圖5所示關鍵詞聚類0號、1號和6號中至少19篇論文是此主題。比如,亓海峰、廖建玲考察了34名漢語學習者九周內記敘文與議論文的詞匯復雜度和句法復雜度的發展情況,發現兩種文體呈現出不同的發展軌跡,其中部分詞匯和句法復雜度指標高于其他指標,有顯著的發展,但準確度未展現明顯的發展[14]。周文華通過追蹤4名漢語學習者8個月內的120篇周記、考察他們在詞匯、句法方面的復雜度與準確度的發展,發現句法方面的發展慢于詞匯層的發展[15]。
2.關于影響句法復雜度因素的研究。比如,邢加新、羅少茜以英語論文為對象、運用元分析方法討論了任務復雜度對英語書面語產出的詞法與句法復雜度的影響,結果顯示,任務復雜度對產出語言的詞法與句法復雜度的影響均是正面的,而對其準確度和流利度的影響則均為負面的[16]。另外,任務組織形式、任務復雜度、反饋方式等因素均對二語/外語寫作中的句法復雜度產生影響。劉兵和尉瀟以65名英語專業大一學生為對象,探討不同任務組織形式對在線寫作任務的準備和產出的影響;其研究發現,對于不同的任務,學生在準備層面體現出時長、形式和內容上的差異,方差分析進一步說明不同任務形式對語言產出的流利度沒有明顯影響,但對句法復雜度和準確度的影響明顯,復雜度和準確度均大幅上升[17]。張煜杰和蔣景陽通過分析180名學生的三種不同寫作題型的英語作文發現,高復雜度的英語寫作任務有助于提高英語寫作產出的句法復雜度,但其對詞匯的復雜度和準確度的影響則比較小;另外,復雜度與準確度的表現容易受到寫作任務要求和體裁的影響[18]。白云等人以自動評分系統反饋與范文反饋為例、探究了糾錯與非糾錯反饋對大學生英語作文語言復雜度的影響,他們發現,自動評分系統反饋可有效提高詞匯復雜度但會降低句法復雜度,而范文反饋對作文的詞匯與句法復雜度均有顯著的提升作用[19]。
3.翻譯活動中目的語文本的句法復雜度研究。比如,趙秋榮、孫培真比較了漢語母語者和英語母語者所做的兩個《傳習者》英譯文本,發現英語母語者的譯入型文本在詞匯上更豐富、句法復雜度也更高,但準確度與忠實度底、易讀性較差;漢語母語者的譯出型文本在詞匯上不夠豐富,句法復雜度底,但準確度與忠實度更高、易讀性更好[20]。朱周曄、王金銓通過自建語料庫比較了英語學者在漢譯英時,源文本的不同文體將影響目標文本,具體體現在詞匯豐富程度、句法復雜度和銜接連貫度上[21]。吳繼峰等人基于兩個可比語料庫、使用14項句法復雜度指標比較了翻譯漢語與原創漢語的句法復雜度,結果發現,翻譯漢語有8個指標顯著高于原創漢語,4個指標則顯著低于原創漢語;8個指標中文本類型和體裁類型有顯著的交互作用,7個指標中翻譯漢語與原創漢語不同體裁的句法復雜度表現有差異[22]。
(四)研究前沿
在CiteSpace可視化分析中,研究前沿的獲取與討論可通過關鍵詞突現圖譜和關鍵詞時間線圖譜來進行。
根據突現關鍵詞圖譜(圖6)可以看出,2015—2020年,關于句法復雜度的研究較為關注產出語言的準確程度、流利程度和復雜程度,其中準確度突現程度最高,說明句法復雜度與句法的準度密切相關。同一期間,還有對造成不同句法復雜程度原因的元分析。2017—2019年,“學術寫作”突現而出,說明研究熱點曾短暫著落在學術文章所呈現出的句法復雜度上。2020—2021年,“文體”成為突現關鍵詞,說明有研究開始關注不同文體文章所體現出的句法復雜度現象;“動態發展”則說明有研究關注句法復雜程度的縱向發展。2021—2022年,有論文關注句法復雜度與寫作質量的關系。
此外,我們也可以從關鍵詞時間線圖譜直觀地觀察句法復雜度研究前沿的演變。從下面圖7可看出,各主要關鍵詞首次出現的時間節點以及與其他關鍵詞的共現關系。除突現關鍵詞圖譜顯示的“二語寫作”“復雜度”“準確度”等關鍵詞外,時間線圖也展示了其他非突現關鍵詞,例如,“翻譯質量”“譯入”,說明翻譯中的句法復雜度問題成為了研究的前沿熱點。
四、結語與展望
本文使用CiteSpace軟件對中國知網收錄的有關句法復雜度研究的核心期刊和CSSCI期刊論文進行了可視化分析,從多方面展示了國內時至今日該領域的研究現狀、研究熱點以及研究前沿的演化過程,最后發現,自有論文發表以來,句法復雜度的關注度在2022年經過最高峰后,現正處于恢復階段。僅就核心和C刊論文刊發數量上看,該領域受關注程度一般。其研究熱點主要是二語/外語寫作中的句法復雜度問題及造成寫作中不同句法復雜度的因素,熱點也包括翻譯中目的語文本的句法復雜度問題。研究前沿也曾由一般寫作的句法復雜度研究轉向學術等專門領域寫作的句法復雜度研究、由橫向研究轉向關注句法復雜度發展的縱向研究。
國內句法復雜度研究在一定程度上揭示了英語、漢語等語言的句法結構的內在規律,但是仍有諸多尚待解決的問題和未充分挖掘的研究領域。縱觀這78篇論文,不難發現以英語作為研究對象的論文占大部分,而以漢語為研究對象的論文占比較少(13篇);關注書面語的論文多,研究口語的論文少(7篇);此外,涉及或進行中外語言句法復雜度對比研究的論文更少,僅有區區3篇。
由此可見,我們可以加大漢語言產出的句法復雜度研究。增加口語產出的句法復雜度研究,因為從本體論的角度來看,口語是先于書面語的,是語言的根本,口語的復雜度水平更能反映語言復雜度問題。增加中外語言對比的句法復雜度研究;句法復雜度是一個普遍問題,但單一語言情境中體現出的句法復雜度現象在跨語言情境中多大程度上為真,需要通過研究才能得出結論。另外,我們可以構建更大規模、更具代表性的語料庫,以提高研究的普適性和可靠性;探索更多元的句法復雜度維度,如動態變化、層級結構等,以更全面反映語言的復雜動態性;關注個體差異,特別是對特殊群體(如兒童、語言障礙者)的研究,以增進對語言學習和認知發展過程的理解。
參考文獻:
[1]Lu,X.Automatic Measurement of SyntacticComplexity in Child Language Acquisition[J].InternationalJournal of Corpus Linguistics,2009,(1):3-28.
[2]Yaruss,J.S.Utterance Length,Syntactic Complexity,and Childhood Stuttering[J].Journal of Speech,Language,and Hearing Research,1999,(2):329-344.
[3]Bloomfield,L.An Introduction to the Study of Language[M].New York:Henry Holt and Company,1933.
[4]Chomsky,N.Syntactic Structures[M].The Hague:Mouton&Co.,1957.
[5]Ortega,L.Syntactic Complexity Measures and Their Relationship to L2 Proficiency:A Research Synthesis of College Level of L2 Writing[J].Applied Linguistics,2003,(24):429-518.
[6]王淼.二語寫作句法復雜性研究的新發展[J].北京第二外國語學院學報,2019,(2):81-99.
[7]Wang,M.D.The Role of Syntactic Complexity as a Determiner of Comprehensibility[J].Journal of Verbal Learning and Verbal Behavior,1970,(4):398-404.
[8]Kagan,D.M.Syntactic Complexity and Cognitive Style[J].Applied Psycholinguistics,1980,(1):111-122.
[9]袁琳,孫敬姝,蓋學敏.基于CiteSpace的物理演示實驗可視化分析[J].物理實驗,2018,(1):33-38.
[10]陳超美著,陳悅,侯劍華,梁永霞譯.CiteSpace Ⅱ:科學文獻中新趨勢與新動態的識別與可視化[J].情報學報,2009,(3):401-421.
[11]李杰,陳超美.CiteSpace:科技文本挖掘及可視化[M].北京:首都經濟貿易大學出版社,2017.
[12]雷曉康,陳澤鵬.國內政府治理研究熱點和發展趨勢的知識圖譜分析——基于CSSCI數據庫(2000—2019)的可視化研究[J].濟南大學學報(社會科學版),2021,31(01):108-117+159.
[13]莊少霜.近二十年國外認知語言學;領域研究的可視化分析——基于CiteSpace II的計量分析[J].哈爾濱學院學報,2016,(8):97-101.
[14]亓海峰,廖建玲.基于記敘文和議論文的漢語二語寫作發展研究[J].世界漢語教學,2019,(4):563-576.
[15]周文華.零起點漢語學習者書面語復雜度、準確度的動態發展——以4名預科學生的周記追蹤為例[J].世界漢語教學,2022,(1):130-144.
[16]邢加新,羅少茜.任務復雜度對中國英語學習者語言產出影響的元分析研究[J].現代外語,2016,(4):528-538+584-585.
[17]劉兵,尉瀟.任務組織方式對在線英語寫作任務準備和產出的影響[J].中國外語,2019,(6):67-74.
[18]張煜杰,蔣景陽.任務復雜度對二語寫作復雜度和準確度的影響[J].西安外國語大學學報,2020,(4):49-54.
[19]白云,韓佶穎,王俊菊.反饋方式對二語寫作語言復雜度的影響[J].外語教學理論與實踐,2022,(1):111-121.
[20]趙秋榮,孫培真.譯者多重身份對譯者行為影響路徑的語料庫考察——以《傳習錄》英譯本為例[J].外國語文,2024,(1):131-143.
[21]朱周曄,王金銓.文體差異、語言特征與學習者漢英翻譯質量的關系研究[J].中國外語,2020,(4):58-68.
[22]吳繼峰,劉康龍,胡韌奮,周蔚.翻譯漢語和原創漢語句法復雜度對比研究[J].外語教學與研究,2023,(2):264-275+320-321.
作者簡介:
王艷金,男,漢族,江西信豐人,碩士,浙江傳媒學院國際文化傳播學院講師,研究方向:句法學。