黃 雷
(肇慶學院 外國語學院,廣東 肇慶 526061)
程式語(formulaic Language),又常被譯為語塊或預制語言等,已成為二語習得研究的重要問題。研究者們對于程式語的關注在最近幾年里達到了一個新的“井噴”(Wray, 2012)式的高度。他們從語言學、語料庫語言學、語用學、語言教育和心理語言學等角度對程式語進行研究,內容涉及各種類型的程式語,包括固定搭配、詞串和習語等,研究既有對理論框架的討論也有實證研究。核心問題在于探究本族人和二語學習者在理解和運用程式語過程中所經歷的認知過程,涉及語言的存儲,表征和提取(Ellis et al., 2015;Myles et al., 2017)。很多研究表明,程序語在語言使用過程中發揮著重要的作用,有一定的心理現實性(Wray, 2012)。
最近兩年的研究呈現出幾個趨勢:(1)在關注各種類型程序語的同時,更為關注基于頻率的程式語(詞串,lexical bundles);(2)研究手段趨于多樣化,既有學者通過語料庫以及口頭完成對話等手段考察程序語的產出,也有學者通過心理語言學在線閱讀的方法探討程序語的理解;(3)研究者更為深入地探討程序語的習得同二語句法和語用能力發展之間的關系。
本文從三個方面綜述國外近兩年(2016—2017年)有關二語程式語的研究,包括程式語這一概念的重新界定,程式語與二語語法能力的發展,以及程式語與二語語篇能力的關系。
雖然程序語已成為二語習得研究中一個非常重要的話題,但研究者們對于程序語這一概念仍有不同的理解,其研究往往針對不同類型的程序語得到不同的結果。Wray(2012)發現,在針對程序語的不同研究中,研究者們使用了多達40種不同的術語,使得這一研究領域顯得混亂。不少學者試圖針對程序語建立規范的術語和標準,但由于不同研究有各自的側重點,并且各自選用了不同的鑒別標準,使得其研究結果缺少可比性(Gonzalez Fernandez et al., 2015)。
不同術語的使用體現出研究者不同的研究角度。比如使用語塊(chunk)一詞時,多為心理語言學角度的研究;而語串(clusters)一詞則暗示一種語料庫語言學角度的研究。近些年來,雖然程序語(formulaic language or formulaic sequence)逐漸成為一個大家普遍接受的統稱(Weinert,2010; Wood,2015),但程序語究竟是一個什么概念仍沒有統一的共識。一方面,研究者們使用“程序語”這一術語指代本族人和二語學習者接觸到的習語和固定搭配等語言結構(Conklin et al., 2008, 2012; Underwood et al.,2004),而另一方面,同樣的術語“程序語”也可以指代語言使用者作為一個整體存儲和提取的語言單位(Hickey,1993; Weinert,1995)。正如Wray(2012)所說,一些研究者研究習語和固定搭配時,默認它們作為一個整體被語言使用者存儲和提取,實際是將程序語的不同方面進行了混淆。這種術語使用的混亂給研究者們的設計和結論都帶來了一定的影響。
很多二語習得研究都忽視了一個根本問題:程式語對于本族人和二語學習者來講并不是同一個概念。對本族人來講,作為一個整體存儲和提取的程序語是以他們的語言產出為參照的。二語學習者的情況有本質的不同。很多習語或慣用表達并不能被二語學習者作為一個整體進行存儲和處理。這一點可通過他們在口語表達時的停頓和錯誤看出(比如“it’s raining/…pause…/dogs and cats”)。另一方面,對他們來講已能自動處理的“程序語”也許含有一些錯誤(比如使用“on the other hand”作為萬能的語篇標記手段),顯然同本族人的“程序語”不是一個概念。
Myles等(2017)針對現有二語程式語研究中概念使用的問題,認為應從兩個角度來界定程序語這一概念:(1)語言學視角或學習者外部視角,即學習者接觸到的包括習語和固定搭配在內的外在語言結構。他們用“語串”來指代這一概念,并將其定義為“某種語言里作為慣用表達方式存在的多詞結構。其特點是語義或句法上不規則,并且其組成成分頻繁同時出現”(Myles et al., 2017:10)。(2)心理語言學視角或學習者內部視角(learner-internal),即學習者處理這種語言結構時經歷的認知過程。用“處理單位(processing units)”來指代這一概念,定義為“能夠幫助語言使用者節約處理資源、具有語義功能的多詞結構。他們在大腦中作為一個整體存儲,并有高度的自動提取特點”(Myles et al., 2017:10)。
這兩個角度互相獨立又相互關聯,成為程序語概念里不可忽視的兩個方面。他們還指出,鑒于之前研究中存在的一些缺陷,非常有必要從理論層面區分程序語的兩個方面,否則有關程序語的研究難以走出概念上的誤區。雖然大多數研究只針對程序語的某一方面,卻聲稱其結論具有普遍的適用性,這顯然是不合適的。他們進一步提出,在二語習得研究中,應停止使用“程序語”這一術語,而使用兩個不同的術語進行替代(語串和處理單位)。
我們認為,Myles & Cordier(2017)提出的程序語概念的兩個方面在二語習得研究中尤為重要。大多數針對二語學習者的程序語研究都將程序語看成是學習者外部的語言結構。他們研究了二語學習者如何使用和處理習語(Irujo,1993)、習慣表達(Foster,2001)、固定搭配和詞串(Chen et al.,2010 ; Laufer et al.,2011)。結果大多表明,二語學習者對這些語言結構的習得和使用沒有本族人那樣準確和自如(Forsberg,2009)。
相比學習者外部視角的程序語(語串),學習者內部視角的程序語(處理單位)應當在二語習得研究中有更重要的位置。學習者內部視角的程序語將其看成是學習者接觸語言材料過程中使用的心理語言單位(psycholinguistic units)。相比其他語言結構,程序語更容易被語言使用者進行處理,并作為一個整體進行存儲和提取。程序語的這兩個方面雖然互相聯系,且有重疊的地方,但卻是完全不同的兩個概念,必須在研究中加以區分(Myles et al., 2017)。比如,本族人在使用“It is time to”時,可以將其作為一個整體進行處理,而二語學習者會說:“It is…uhm.…time to”。很明顯,在語言產出時,二語學習者臨時這些詞語組織在一起,沒有像本族人那樣作為一個整體提取。也就是說該程序語對于具體二語學習者沒有心理現實性。現有研究都將這兩方面混為一談,認為本族人能作為一個整體存儲和提取的程序語,對二語學習者也一樣,因此這些研究會引來各種誤解,其結論也無法令人信服。
二語學習者接觸到的語言輸入有限,“處理單位”的自動化進程尚未完成(或僅部分完成,或將錯誤的語言結構進行了自動化)。鑒于以上原因,我們進行相關研究時應避免使用二語學習者不熟悉的習語和固定搭配,而應選用他們會經常接觸到的語言結構,這樣才可能準確考察要研究的內容。同樣,我們要從二語學習者自身的語言產出中考察程序語結構。至于這些結構依據本族人的標準是否是程序語(學習者外部的程序語)并不重要。
二語習得研究的一個核心目標是考察二語學習者如何習得、存儲和提取語法知識(Shantz, 2017)。目前主要有兩種觀點:基于使用(usage-based)的習得觀和基于規則(rule-based)的習得觀。前者認為二語學習者語法能力的發展源于他們的語言輸入。語法能力的發展是學習者自身的認知機制同語言輸入相互作用的結果(Bybee, 2006; O’Grady, 2005)。基于規則的習得觀認為語法能力由一系列抽象和內在的規則組成。學習者接觸語言輸入時,會激發其本身具有的語法機制(Lardiere, 2008, 2009)。因此語言習得并不依賴于學習者的認知機制。
小波變換的閾值去噪過程中,選取合適的閾值和恰當的分解層次是保證良好去噪效果的首要條件。為避免因閾值選取不合理而影響信號去噪,本文在對微流控芯片信號去噪過程中引進能量元的方法,通過能量元放大有用信號和噪聲小波系數之間的差異,在閾值選取時有更大的裕度[11],更容易選取較為合理的閾值。
另一方面,程式語可以用來考察學習者的語法知識同語言輸入的關系,尤其是高頻出現的語言結構(基于使用)同抽象的語法規則(基于規則)之間的關系。針對二語學習者處理程式語的研究表明,他們對于目標結構的頻率確有一定的洞察能力。但與本族人相比,他們無法區分更為細微的頻率差別 (Siyanova et al.,2008),這也許同他們有限的語言輸入有關。然而,探討程式語的頻率同二語句法能力關系的研究還很少。
Shantz(2017)和Bardovi-Harlig 等(2017)分別從語言輸入和輸出兩個角度探討了程式語同二語句法能力發展的關系。
Shantz(2017)考察了母語為漢語的英語學習者在線處理詞串(Lexical Bundles)*詞串是程式語的一種,是高頻出現的語串結構(Biber et al., 1999)。同其他的程式語(比如習語)不同的是,它們在句法和語義上具有可分割的特點(比如“I thought he was”),因此詞串具有十分特殊的身份。的情況。實驗試圖探討基于使用的習得觀同基于規則的習得觀哪個更實用于二語語言處理的過程。按照基于使用的習得觀的觀點,語法能力受到二語語言輸入里的統計特征(頻率)的影響。因此,在進行在線語法依賴(grammatical dependencies)處理時,目標結構的頻率會對處理產生一定的影響。也就是說,頻率高低會對二語學習者進行的語法判斷產生影響。相反,按照基于規則的習得觀,語法能力的發展和語法信息的處理只依賴于抽象的語法規則。因此對于目標結構的語法判斷不會受到詞串頻率的影響。
Shantz(2017)研究結果顯示,本族人閱讀違反語法實驗句的時間顯著長于符合語法的實驗句。他們閱讀高頻詞串的時間顯著低于低頻詞串。語法規則性同詞串頻率之間沒有交互影響。作者認為,對本族人來講,語法信息的處理主要依賴基于語法規則的信息,而不是基于使用(頻率)。
二語學習者的情況與本族人略有不同。詞串頻率對于閱讀時間有顯著的影響。無論是否符合語法,高頻句閱讀時間都要快于低頻句。這一點同本族人的情況一樣。不同的是,語法規則性這一因素在二語學習者中沒有達到顯著,這說明,二語學習者閱讀符合語法的實驗句同閱讀違反語法的實驗句在時間上沒有顯著差異。將二語語言水平因素加入實驗設計之后發現,語法規則性、詞串頻率同語言水平三者之間存在交互作用。對于高水平組和低水平組,語法規則性和詞串頻率對閱讀時間都有顯著的影響。也就是說符合語法的實驗句閱讀時間明顯短于違反語法的實驗句,高頻實驗句閱讀時間明顯短于含有低頻實驗句。中間水平組的情況略為特殊,未發現語法規則性對處理時間的影響。
作者認為,二語學習者的句法知識隨著學習經歷的加深,語言輸入的增加,逐步地發展和完善。對于低水平的學習者而言,語法處理機制還不健全,語言輸入的處理主要基于頻率的分布。很顯然,違反語法規則的實驗句在正常的語言輸入里出現頻率很低,因此閱讀時間要更慢。隨著語言水平的提高,中間水平組的被試經歷了更多的語言輸入,其自身中介語語法體系不斷發展,頻率和語法規則在他們身上產生一種特殊的制約關系。高水平組的被試更加接近本族人,他們依賴基于規則的句法信息處理語言輸入,因此語法規則性對他們的閱讀產生了顯著影響。
我們認為,Shantz(2017)的研究主要存在兩點不足。首先,作者在實驗中設定符合語法的實驗句同其違反語法的對照句具有相同的頻率。這顯然有邏輯上的問題。因為符合語法的詞串“I thought he was”同違反語法的詞串“I thought he were”在語言輸入中的頻率會有顯著的區別。作者自己也提道:“對于低水平學習者而言,語法處理機制還不健全……很顯然,違反語法規則的實驗句在正常的語言輸入里出現頻率很低,因此閱讀時間要慢于符合語法規則的實驗句。”(Shantz, 2017:22)
其次,作者在實驗設計時強調要探討基于使用的習得觀同基于規則的習得觀的適用性問題,但是并沒有能夠合理解釋語法規則這一變量對于二語習得者在線處理的影響,尤其是中等語言水平學習者的復雜情況。
Bardovi-Harlig 等(2017)從語言產出的角度,采用口頭表達和書面造句的任務,考察了二語學習者在具體語境里使用習慣表達(conventional expressions)*習慣表達是程式語的一種,包括習語(idioms)、復合詞(compounds)和固定搭配(collocations)等。的情況。
同Shantz(2017)一樣,Bardovi-Harlig 等(2017)在實驗設計時考慮到二語句法能力發展的二種觀點(基于使用的習得觀和基于規則的習得觀)。依據基于使用的習得觀,因為程式語是二語學習者語言輸入的重要組成部分,是其句法能力得以發展的主要原因,所以不論一語習得還是二語習得,學習者都可以從含有程式語的語言輸入中提煉分析出目標語的語法結構。依據基于規則的習得觀,語法能力的發展主要依賴那些可分析性的語言輸入(analytic input),同程式語沒有關系。
Bardovi-Harlig 等(2017)研究結果表明,二語學習者在習得程式語時,會將程式語的關鍵詞(Lexical core,比如“Sorry I’m late”中的“Sorry”)及其出現的語境存儲在中介語體系中。遇到合適的語境,他們嘗試使用目標程式語。結果顯示他們都正確使用了關鍵詞(比如“sorry”),而關鍵詞之外的其他部分呈現出多樣性和創造性。隨著語言水平的提高,他們使用程式語時依舊保留了關鍵詞,但對其他部分進行了改變,逐漸接近本族人的表達。這也體現他們中介語語法體系的發展過程。
Bardovi-Harlig 等(2017)的重要貢獻在于表明,二語學習者未能準確使用程式語,并不表示程式語在他們大腦中沒有表征。相反,他們能夠識別合適的語境,并不斷嘗試將頭腦中的程式語提取,結合自己的中介語知識進行表達。這正好與Myles & Cordier(2017)談到的學習者內部的程式語一致,應當同學習者外語的程式語(以本族人為參照)區分開。以往的研究多以誘導性的填空或選擇為任務,無法深入考察程式語在學習者中介語里出現的形式。Bardovi-Harlig 等(2017)的實驗要求被試按照自己的需要進行語言產出,為研究他們的中介語語法特點提供了直接的途徑。
很遺憾,我們認為Bardovi-Harlig 等(2017)仍沒能回答“基于使用的習得觀”同“基于規則的習得觀”之爭的問題。主要原因在于他們選取的程序語為習慣表達,非常依賴具體的語境。雖然它們是本族人首選的表達手段,但在學習者日常的語言輸入里未必有很高的頻率,未能滿足“基于使用的習得觀”對頻率的要求,因此失去了同“基于規則的習得觀”比較的意義。
最近幾年,有不少研究考察語言水平考試中考生的表現,探討水平不同的學習者語言輸出中體現的結構和語篇等特點。Kennedy和Thorp (2007)從雅思考試考生的回答中提取出文本,考察了其中的反問句、情態句、話語標記、從屬句及并列句等,并分析了其中的連貫和銜接(coherence and cohesion)等語篇特征。研究表明,相比低分考生,高分雅思考生很少使用詞匯語法標記(lexico-grammatical markers,比如“however”),數字型標記(enumerative markers,比如“firstly”),以及從屬連詞(subordinators,比如“because”)。
Chen和Baker (2010)采用了結構和功能的分析法,比較了二語學習者同英語本族人在學術寫作中的語言使用特點。結果發現,相比本族人,二語學習者更多使用一些語串結構(比如夸大地域范圍的“all over the world”),而很少使用典型學術寫作中的表達(比如名詞和介詞詞串,“the extent to which”和“in the context of”)。Staples 等(2013)考察了三組水平(高,中,低)不同的托福考生使用詞串的情況。結果發現,低水平考生更多使用了詞串,尤其是考試指令中包含的詞串;然而從功能的角度分析,水平不同的考生對詞串的使用大致相同。之前研究的一大問題在于,缺少嚴格和統一規范的標準考察二語學習者的語言水平(尤其是寫作水平)并進行高低水平的分組,這使得研究結果缺少說服力。
Chen & Baker (2016)考察了母語為漢語的英語學習者在寫作中使用詞串的情況。他們采用語料庫統計和語言專家評審相結合的研究手段。獨特之處在于,為確保能夠準確考察被試的寫作水平,從而研究語言水平對程式語使用的影響,研究者采用了一些高風險語言測試常用的嚴格并完整的評估手段。
二語學習者的寫作文本來自《朗文學習者語料庫》(LongmanLearnerCorpus(LLC)),由其中的說明文和議論文組成。評分和分組根據歐洲共同語言參考標準(CommonEuropeanFrameworkofReference)中規定的B1, B2和C1三個水平。
通過分析寫作文本,Chen & Baker (2016)考察了二語學習者使用的詞串在語篇功能方面的特點。討論圍繞三種常見的語篇功能:指示(如“at the end of”)、立場(如“It is possible to”)和組篇(如“in addition to”)。指示功能方面一個明顯的特點是低水平組B1過度使用了表示數量的詞串(如“a lot of people”),尤其是含有“a lot of”及“many”的詞串。相反,高水平組C1很少使用的表示數量的詞串,更接近學術寫作的風格。立場功能方面,低水平組B1更多使用含有“I think”的詞串來表達觀點。而高水平組C1更多使用由“It”引導的從句表達觀點和態度(如“it is not easy”以及“it is very difficult”)。組篇功能方面,低水平組B1更多使用“If”引導的表示條件的詞串(如“if you want to”以及“if you don’t know”)來展開話題。高水平組C1則使用了各種不同類型的詞串來組篇(如“in order to”,“how to deal with”以及“to cope with the”)。
總之,低水平組使用的語串中出現了很多的動詞(尤其是“be”),人稱代詞(“I”)以及表示數量的單詞(尤其是含有“a lot of”以及“many”的詞串)。高水平組則更多使用前置詞和名詞/介詞語串進行表達,更加書面語化(如“it is true that”,“one of the most”以及“the end of the”),更接近學術寫作風格。B2作為中間水平組,表現出一種從B1到C1過渡階段的特征。他們對于詞串的使用介于正式與非正式語體,以及口語會話與學術寫作之間。
Chen & Baker (2016)最為重要的一點是其測試寫作水平并進行水平分組所采用的嚴格的標準和步驟。他們參照歐洲共同語言參考標準,從語言發展的角度將語言測試研究和二語習得研究結合起來,考察不同水平的二語學習者使用詞串的不同,從而探討二語語篇能力的發展。不同于Staples 等(2013)的完全定性研究,Chen & Baker (2016)采用定性和定量研究相結合的方法,也是這類研究中的一個突破。
本文選取的幾個研究是這兩年比較有代表性的二語程序語研究。他們中既有對程序語概念本身進行的理論探討,也有采用語料庫和心理語言學手段進行的實證研究;既研究二語學習者對語言輸入的理解和判斷,又研究他們口頭和書面形式的語言產出。盡管在實驗設計方面還存在一些問題,這些研究有助于我們更進一步了解二語學習者語法和語篇能力的發展,以及程式語在二語習得過程中扮演的角色。當然,有關二語程式語還有很多未解的問題,還需要今后的研究去進一步探索,揭開其神秘的面紗。