朱慧敏,劉艷梅,王 靜
(1.山東英才學院 人文學院,山東 濟南 250000;2.山東財經大學 外國語學院,山東 濟南 250014)
近年來,隨著二語習得研究的不斷深入,復雜動態系統理論(complex dynamic systems theory,簡稱CDST) 逐漸被應用到語言學領域[1],為第二語言動態發展過程研究提供了理論基礎。 Verspoor 等《二語發展的動態路徑:方法和技巧》論文集的問世①M. Verspoor 等人于2011年出版的論文集A Dynamic Approach to Second Language Development: Methods and Techniques,由John Benjamins Publishers 出版,從第163-197 頁,著重介紹了第二語言發展動態研究方法。,為該領域提供了科學的研究方法支撐。 理論基礎和研究方法的結合,為研究二語學習者真實語言發展過程中的微觀變化提供了可行性[2]。 已有國內外相關領域的實證研究,通常只呈現數據分析的結果,少有研究詳細描述數據分析的過程,導致許多讀者知其然,但不知其所以然,難以進行同類型的復制研究,影響了研究成果的推廣與應用。 本研究將通過回顧復雜動態系統理論的發展歷程,闡釋復雜動態系統理論視域下的語言發展觀,繼而探析復雜動態系統理論的特色研究方法,并以二語書面語中的詞匯和句法復雜度具體指標為例,對其發展趨勢、變異特征及交互特征的數據分析步驟進行細致描述,以期為語言習得研究提供新視角和新思路,從而賦權增能多語言發展研究。
復雜動態系統理論應用于語言發展研究始于20 世紀末,歷經二十多年的發展,在理論建樹和研究方法上日臻完善,業已形成獨特的動態化研究范式,成為國際上頗具影響力的二語發展理論[3]。
復雜動態系統理論(complex dynamic systems theory),發端于混沌/復雜理論(chaos/complexity theory)和動態系統理論(dynamic systems theory),它們名稱雖異,但內容趨同,可互換使用[4]7。 圖1 展示了復雜動態系統理論的歷時演進過程。

圖1 復雜動態系統理論的發展歷程
混沌/復雜理論源自生態學和氣象學,后來由美國應用語言學家Larsen-Freeman 將其應用于語言習得研究[1]。 她認為混沌/復雜理論作為一種關注變化的系統理論,與學習者學習語言有諸多相似之處,因此她率先將該理論與二語習得研究聯系起來,用于語言教育研究。 其核心思想可概括為:語言是一個復雜系統,系統各維度間相互聯結、交互變化,受外部條件刺激,語言系統會通過自組織性和自適應性,重組新的語言結構和狀態[5]。 她認為在復雜理論框架下,學習者也是一個復雜系統,由記憶力、學習動機等子系統構成,且子系統間相互作用,互相影響。 這一思想將“語言學和語言學習兩個傳統研究中相對分離的領域有效融合”[6],是對傳統語言學研究的傳承創新。 混沌/復雜理論為語言習得領域的動態發展研究奠定了基礎。
動態系統理論源自數學和發展心理學,后由歐洲學者de Bot,Lowie 和Verspoor 等將該理論應用于第二語言習得研究,展示了“外語學習如何通過社會和認知層面的互動促使語言得以發展”[7]。 該理論認為語言行為具有復雜性、交互性和動態開放性。 其一,語言行為通過簡單程序的反復迭代,前一個迭代的輸出將作為下一個迭代的輸入,從而導致語言的復雜性;其二,動態系統各變量(或子系統)間交互發展,一個變量的變化會對系統中其他變量產生影響;其三,復雜系統的發展過程由系統初始狀態、承載力類型及認知系統和環境中的資源相互作用所決定。 在發展過程中,某些子系統是其他子系統的先導,某些子系統間也可能存在關聯生長點,所以子系統發展所需能量或動力并非等同。
結合上述兩個理論的歷史發展、使用現狀、核心概念及方法論,de Bot 指出混沌/復雜理論與動態系統理論在語言發展過程的根本觀點上并無明顯差異,主張將美國學派和歐洲學派二者統稱為“復雜動態系統理論”[8],具體見圖1。 后來,Hiver 和AL-Hoorie 提出了更全面的復雜系統研究方法,使復雜動態系統理論及其研究方法進一步走向完善[9]85-225,為語言發展研究提供了更為堅實的理論基礎和方法論依據。
語言和語言發展在傳統上具有不同的學科定位,采用不同的理論范式。 在語言上,語言學理論往往側重靜態能力研究范式;而在語言發展上,心理學或心理語言學理論范式關注學習者語言發展的過程和表現。 復雜動態系統理論有效合并了上述兩種不兼容的理論范式。 Larsen-Freeman 強調復雜動態系統理論是一種元理論,一種理論化的方法,而不是語言發展本身的理論,這種元理論更像是一種看問題的世界觀、視角,或是一套可在拓展理論和方法時應用的價值觀[10]。 若要從復雜動態系統理論視角回答新的研究問題,需在特定內容領域使用新的研究方法。
復雜動態系統理論的語言觀主要包括:語言是一個復雜動態系統,其發展具有初始狀態敏感性、變異性、交互性、非線性和不可預測性等特征。 語言系統對初始狀態具有敏感性,初始水平的微小差異可能導致個體間語言發展的顯著差異;系統發展中的變異性是系統行為的重要組成部分和系統發展的重要標志;語言系統各子系統間相互聯結、交互變化,在語言發展的不同階段,子系統間呈現競爭或支持等不同交互模式;語言系統在一定外部條件作用下,通過自組織性適應環境帶來的壓力,并涌現新的語言結構,呈非線性和不可預測性發展。 因此,動態和變化是該理論的核心。
復雜動態系統理論視角下的語言發展觀強調學習者在語言系統的發展變化中學習語言,因為語言系統的若干子系統各發展階段均處于不斷變化中,且子系統間和子系統內組成成分互相作用、相互影響,使得復雜系統以多種不同方式演化和適應。 此外,由于語言系統具有開放性,子系統與內外環境也相互補充能量,存在交互效應。 隨時間發展,這種交互效應產生自適應性且更趨復雜化,最終達到內外部生態平衡,從而引起系統變化。 復雜動態系統理論視域下的二語習得過程研究,體現出語言習得的基本特征,即語言學習是一個動態復雜的過程,在此過程中,隨環境因素互動和語言輸入增強,語言不斷自我調整并適應交際需求,學習者才能最終掌握語言。 因此,不能用靜態的階段性觀念看待語言發展,其發展不是單向的、逐步向目標語水平靠攏的過程,而是可能伴隨進步、停滯、倒退等現象的復雜動態過程。
另外,在研究方法上,傳統的定量研究方法無法測量復雜變量間的交互發展變化,而van Dijk 等卻提出了解決復雜動態系統問題的可視化研究方法,并指出要研究個體或群體學習者在一段時間內的語言發展過程,數據收集需滿足以下三個標準:一是在許多常規測量點密集收集數據;二是在較長時間內縱向收集數據;三是每次收集以個體為單位的數據而不是平均數據[11]。在動態系統發展定量分析上,除使用傳統的相關性分析外,主要采用移動極值分析、整體變異度絕對值差計算、局部變異性再抽樣計算、蒙特卡羅分析、變點分析、移動相關系數分析等復雜動態系統特有的時間序列數據分析方法,客觀呈現群體或個體二語書面語語言動態發展特征。
復雜動態系統理論廣泛應用于二語習得研究,為該領域帶來了全新視角。 該理論框架下的研究方法在方法論原則、變量選擇和處理、實驗設計與數據收集、數據處理與分析方法等方面與傳統實證研究不同。 傳統二語發展數據分析通常關注平均值、標準差和正態分布,此類測量方法旨在描述語言發展的平均趨勢,歪曲了真實語言發展中的變異性,其測量結果對學習者群體而言有推廣性,但忽略了個體學習者日常學習時的波動。 在日常習作中,學習者不可避免地會受到寫作任務、話題、動機、環境、學習投入等因素影響。 在復雜動態系統理論觀照下,這些因素相互依存、相互關聯,并非簡單的因果關系。 因此,傳統研究方法難以充分闡釋和分析變量在發展過程中的波動,以及多變量間的復雜邏輯關系,而動態系統研究方法可以追蹤研究變量在不同時間節點的動態變異及交互特征。 下面分別闡釋復雜動態系統理論下的方法論和數據分析方法。
其一,基本原則。 復雜動態系統理論持語言使用的語言觀,即關注學習者在語言使用和發展過程中所表現的特征及規律。 其方法論遵循以下基本原則:把環境因素作為系統組成部分加以研究;重視系統復雜性;以系統自組織、自適應和涌現為核心;采用互為因果的邏輯;克服原有的二元分析法;避免層次和時間尺度的混淆;重視個體變異性在系統中的核心地位。 簡言之,該理論堅持系統各要素的整體觀,關注系統的復雜性、動態性和變異性,遵循系統發展的非線性和敏感性,體現系統的自組織性及交互性等。 在研究方法上,提倡對學習者進行歷時個案研究,通過密集收集時間序列的數據,以更好地捕捉個體學習者的語言發展軌跡[12]。 通過研究多個子系統的移動交互關系,凸顯語言系統發展過程中的交互性[13]125。
其二,變量選擇。 復雜動態系統理論采用“互為適應”(co-adaptation)這一概念[14],強調與事件有關的多因素間的相互影響,認為一個系統的變化會導致其他相關系統的變化,強調系統發展的動態性。 研究目標在于發現系統潛能,即描述影響變化的各種因素所構成的網絡系統及它們與教學目標的互適應過程。 因此,在同一研究中應選取不同維度并能互補的變量測量研究目標,最好選取能代表獨立特征而且相關性不高的變量[15]。 對于書面語發展研究,詞匯復雜度和句法復雜度是衡量學習者產出水平的重要維度。 在詞匯和句法復雜度測量方面,建議選擇細粒度指標,以便能作出更精確的解釋[16]。
其三,數據收集。 復雜動態系統理論認為學習者的二語發展路徑和速度也是動態系統,可采用縱向個案法、時間序列法和微發展研究法追蹤其變化的完整過程。 針對發展研究,分析一段時間內學習者發展情況,縱向收集數據比橫斷面數據更合適[17]。 縱向個案法和時間序列法將學習者個體放在不同時間段密集考察其發展變化。在采用此類方法時要注意根據系統變化速度確定好取樣的均勻時間間隔,通常追蹤時間長度為一年或更長的時間,“從而產生多個觀察點或數據點”[4]66,依次來考察變量的細微發展變化。此類研究方法要求在較短時間段內增加取樣頻次獲取數據,研究者可在某些時間點直接觀察正在發生的變化。 數據收集和分析需兼顧細節性和整體性,案例發展中的細節性分析通常在橫向研究方法中被忽視。
其四,數據處理。 計算機技術的發展為應用語言學研究提供了諸多便利,尤其在數據處理和分析方面省時高效。 復雜動態系統視角下對數據的處理和分析,采用了一系列自然科學研究方法。 如利用可視化工具對時間序列的數據進行分析,能客觀呈現學習者語言發展變異的過程。縱向個案研究是研究動態系統發展變異性的典型方法[13]130,該方法既可幫助研究者發現發展過程中關鍵性節點的變化,也便于了解其變化原因,并據此推斷出其后較長時段可能發生的變化。 二語書面語動態發展特征可通過繪制趨勢線、移動極值圖、變點分析圖、移動相關系數滑窗圖等多種可視化分析方法實現。 此類方法是用定量方法做質性研究,并強調時間維度變化和迭代作用,是對傳統二語習得研究方法的有效補充。
1.數據提取工具與方法
由陸小飛等研發的詞匯復雜度分析器(Lexical Complexity Analyzer, 簡稱LCA)[18]和句法復雜度分析器(L2 Syntactic Complexity Analyzer,簡稱L2SCA)[19],無需研究者對語料進行特殊標注,簡便易用,近年來被許多研究者廣泛用于語言復雜度的研究,其信度和效度均已得到驗證[20]。 所以本文著重介紹這兩種分析器對語料處理的要求和數據提取方法。
對用于書面語中詞匯動態發展研究的語料,按LCA 的要求,將全角字符和中文字符均統一為半角英文字符。 為確保詞匯各變量測量的準確度,可以將阿拉伯數字、人名和地名等用相應代詞替換,并改正可能會影響測量準確度的拼寫錯誤[21]。 最后以UFT-8 TXT 格式保存,輸入詞匯復雜度分析器,提取時間序列研究語料的詞匯測量指標原始數據,用于詞匯復雜度動態發展研究。
Lu 指出句法復雜度分析器適用于基本無語法錯誤、句子結構完整的較高英語水平學習者的文本語料分析,不適用于包含大量語法錯誤的初級學習者的語料分析,所以通常在收集和處理加工語料時需要對這些因素進行有效控制,如修正語料中的連寫句、錯誤標點和拼寫錯誤,最終形成無拼寫錯誤、基本無語法錯誤、句子結構完整的時間序列的研究語料[19]。 最后將每篇作文分別用英文命名,同樣生成UFT-8 TXT 格式文本,保存為研究語料,輸入句法復雜度分析器,提取時間序列的句法測量指標原始數據,用于句法復雜度動態發展研究。
2.典型數據分析方法
基于上述分析工具提取的原始數據,下面主要介紹復雜動態系統理論下典型數據分析方法,具體操作步驟如下。
(1)繪制發展軌跡平面圖
為使二語書面語多維度語言子系統動態發展趨勢可視化,使用Microsoft Excel 可以繪制群體均值或個體不同維度多變量發展軌跡平面圖。此方法是描述時間序列數據最簡單直觀的技術,也是Microsoft Excel 軟件中的基礎工具。 時間序列數據匯集成的發展趨勢線,既能展現原始數據整體發展趨勢,也能反映局部發展特征。 為了使不同變量能在同一數值區間呈現,可以對各指標時間序列的數據分別進行標準化處理。 數據標準化的目的是通過線性變換的方式消除數據間的計量單位差異,并將原始數據的大小控制在0-1 之間,常用的辦法是極小-極大值標準化,計算公式為:標準化數據=(原數據-極小值)/(極大值-極小值)。
(2)繪制移動極小-極大值圖
移動極小-極大值圖(moving min-max graph)簡稱移動極值圖,是動態研究的典型工具之一,能呈現測量指標的發展趨勢和發展變異程度。 移動極值圖把發展過程中的變異情況可視化,其原理是通過移動窗口,以連續測量的方式觀察時間序列數據的極大值(max)和極小值(min)間的帶寬(brand width),從而將發展過程中雜亂無章的變異度可視化[4]77。 此方法既能形象呈現變異整體規律,同時也能保留原始數據發展軌跡。 移動極值圖通過極值間的帶寬來呈現學習者語言發展變異程度,帶寬越大,變異度越大[21]。 移動極值圖中的移動窗口設置方法通常根據數據收集總次數來定,如研究觀測點為12 次,可設定每3 次為1 個移動窗口(若時間序列點較多,可設每5 次為1 個窗口),對每個窗口進行極小值和極大值運算,然后繪制移動極值圖。
具體做法如下:以學習者XL 的12 次詞匯復雜度觀測指標詞匯復雜性(LS)和句法復雜度觀測指標T 單位中的子句數量(C/T)為例,使用Microsoft Excel 以每3 次為1 個移動窗口計算極值,繪制移動極值圖。 如圖2 所示,隨時間的推移,LS 帶寬的波動較大,C/T 帶寬變化不大,因此可以假設學習者的LS 在發展中變異度較顯著,有可能是系統發展中有意義的變異或推動系統產生質變的變異,C/T 則可能為無顯著性變異。

圖2 移動極值圖
(3)局部峰值變異性分析
鑒于移動極值圖僅能提供直觀視覺判斷,“難以準確判斷發展趨勢線中的波峰或波谷是否有統計學意義,還需通過再抽樣運算和蒙特卡羅模擬進行概率計算,以檢驗數據局部峰值變異是否存在顯著性”[22]。 局部峰值變異分析考察學習者某一指標的發展,在一段時間內是否發生顯著變異。 該分析假設若有一個真實峰值,它不應只是一次孤立或偶然的跳躍,應該有其發生的必然性。 下面仍以學習者XL 的LS 和C/T 為例說明具體操作步驟。
第一步,計算移動平均值。 分別選取學習者XL 的LS 和C/T 的前兩次觀測數據t1 和t2,取平均值,然后選取t2 和t3,t3 和t4,t4 和t5……以此類推,求取平均數,共得到11 個移動平均值,復制第一個移動平均值補齊12 個數值,作為該數據欄起始。
第二步,計算觀測數據點間的最大差值。 計算t2-t1,t3-t2,t4-t3,t5-t4……以此類推,求取2 步差值;計算t3-t1,t4-t2,t5-t3……以此類推,求取3 步差值;計算t4-t1,t5-t2,t6-t3……以此類推,求取4 步差值;計算t5-t1,t6-t2,t7-t3……以此類推,求取5 步差值;計算t6-t1,t7-t2,t8-t3……以此類推,求取6 步差值。 為確定每一欄步差的最大差值,對每一欄步差值求最大值。 選中所有步差平均值,求取最大值,即為學習者觀測指標的最大差值,該數據為檢驗標準。
第三步,進行原始數據重采樣。 該分析的零假設是通過對每個人的原始數據重新采樣,得到與觀察數據集相同的最大差值。 運行Microsoft Excel 里的插件PopTools,選擇重采樣(resample),在input range 中選中學習者觀測指標的原始數據,選取一個空白欄放置重采樣后的數據,點擊output range。 在方法一欄選擇可替換(replacement),意味著在每個模擬中,均從原始數據池中隨機抽取一個新集合,并非在每個模擬中選擇所有的觀測值。 點擊運行,即可得到重采樣后的數據。 對重采樣數據同樣進行移動平均值計算和2步差到6 步差的計算,求取重采樣數據的最大差值,得到重采樣數據的標準。
第四步,進行蒙特卡羅分析(Monte Carlo analysis)。 在得到原始數據的檢驗標準和重采樣數據的檢驗標準之后,將兩個檢驗標準進行蒙特卡羅模擬運算,計算p值。 繼而使用Microsoft Excel 中的加載項PopTools 中的蒙特卡羅分析對群體或個體學習者時間序列的原始數據進行5000 次隨機抽樣模擬,計算觀測值中偶然波動的概率。
蒙特卡羅分析操作步驟如下:首先運行PopTools,選擇模擬工具(simulation tools),選擇蒙特卡羅分析。 在dependent range 中輸入重采樣后的標準,在檢驗標準(test values)中輸入原始數據檢驗標準,設置復制數量為5000 次,檢驗標準選擇大于等于,點擊運行。 最后,計算p值。將大于或等于檢驗標準的值除以迭代次數5000次,即可得到p值。 若p小于等于0.05,就可以拒絕零假設,說明指標的局部峰值不是系統偶然發生的隨機波動,而是系統發生了顯著性變異。若p值大于0.05,則說明系統的局部波動不具顯著性,為系統偶然波動。
(4)整體變異度分析
動態研究方法不僅可以揭示學習者每個指標局部峰值是否產生顯著變異,還能提供用于對比群體和個體或個體間相同指標,或同一個體不同指標間的整體變異度的方法。 操作方法以學習者XL 的LS 和群組LS 為例,具體步驟如下。
首先計算絕對差。 若要考察個體XL 和群體的LS 在整體變異度上是否具有顯著差異,首先用個體數據中的第二次數據減去第一次數據,即t2-t1,以此類推t3-t2,t4-t3……個體12 次數據共得到11 個絕對差。 取11 次絕對差平均數,即個體的平均絕對差。 對群體均值采取同樣操作。 若個體平均絕對差大于群體,說明個體XL的整體變異度大于群體。 但上述分析不能說明是否具有統計學意義。 為考察兩者在同一指標上的整體變異度是否有顯著差異,還需進行重采樣計算和蒙特卡羅分析。
將個體和群體平均絕對差相減,得到檢驗標準。 然后,運行PopTools,進行蒙特卡羅分析。對個體和群體的同一指標的絕對差數據采樣。在input range 中同時選中個體和群體共兩欄絕對差數據,選擇新的兩個空白欄放置重采樣后的數據,點擊output range。 如果研究希望得到的數據數量與原數據一致,就選擇不替換重組(without replacement reshuffle)。 將得到的重采樣絕對差分別取平均數,然后將個體和群體重采樣后的數據平均絕對差相減,得到dependent range,然后進行蒙特卡羅分析。 在dependent range 中輸入個體和群體重采樣絕對差平均數之差,在test value 中輸入上述檢驗標準。 同樣設置復制數量為5000 次,檢驗標準選擇大于等于,點擊運行,進行數據分析,求取p值。 若p值小于0.05,表明個體與群體均值在LS 的整體變異度上存在顯著差異。
(5)移動相關分析
為檢驗學習者二語書面語不同子系統內和不同子系統間是否存在交互發展效應,計算時間序列的移動相關系數,繪制移動相關系數滑窗圖,可使每兩個指標間的發展交互關系可視化,具體做法如下。
首先,使用標準化數據,利用SPSS24.0 對群體和個體的測量指標分別進行兩兩相關分析,考察每兩個指標間整體上是否存在顯著相關性。該分析結果可用來與移動相關系數進行對比和對照,互為補充。 然后以每5 次數據點為1 個移動窗口,利用Microsoft Excel 計算兩個指標間的移動相關系數。 以學習者XL 的詞匯復雜性LS和子句數量C/T 的12 次時間序列數據為例,將光標放置在移動相關系數輸出處,輸入指令=Correl,選取標準化的第一個指標前5 次數據LS(t1:t5)作為第一組數值,選取標準化的第二組數據的前5 次指標C/T(t1:t5)作為第二組數值,即可得到兩個指標前5 次數據的移動相關系數。 第二個相關系數選取LS(t2:t6)和C/T(t2:t6),以此類推,得到兩個指標所有相關系數。 12次數據共得到8 個移動窗(1-5,2-6,3-7,4-8,5-9,6-10,7-11,8-12),即8 個相關系數。 選中8 個數值,插入折線圖,可得到兩個指標間的移動相關系數滑窗圖。 滑窗圖的橫坐標顯示移動窗口,縱坐標顯示相關系數,取值范圍(-1,1)。 滑窗圖可直觀展示兩個指標間隨時間維度的變化交互聯動的發展軌跡,揭示指標間在時間維度中競爭或支持的交互關系。
本研究通過梳理當代新興的二語習得理論——復雜動態系統理論的語言發展觀,結合該理論用于語言發展研究的主要特征,以學習者書面語中詞匯復雜度和句法復雜度中的具體指標為實例,詳細描述了復雜動態系統理論應用于語言發展研究先進科學的研究方法。 復雜動態系統的研究方法是一種全新的跨學科時間序列數據可視化分析方法,它“向自然科學、社會科學和應用語言學中的靜態觀、線性觀和簡化論提出了挑戰”[23]。 運用動態研究方法,能突破傳統研究中以均值獲取整體發展軌跡的范式,從而能有效檢驗個體學習者語言系統發展過程中的不穩定性,即變異性。
因此,復雜動態系統的研究方法能有效補充和拓展以往相關領域的研究,進一步對我國本土多語言發展實證研究提供方法上的參考和借鑒。此外,以復雜動態系統理論為框架開展的研究,可進一步嘗試使用其他動態系統研究方法,如社會網絡分析方法(social network analysis method)和基于設計的研究方法(design-based research method)等[9]139-152。 由于語言系統具有全面聯結性,不同語言子系統和次級系統之間組成了多節點樞紐,共同構成了復雜的書面語網絡。 因此,這些創新性研究方法同樣適用于多語書面語動態發展研究,能為該領域相關研究開拓新的視野、帶來新的發現。