詹宏偉 朱永生
(杭州師范大學,杭州 310036;復旦大學,上海 200433)
在韓禮德看來,系統功能語言學與語料庫研究之間有天然的血緣關系,是共生和聯合增效的關系(a symbiotic and synergistic relationship)(Halliday 2006:293)。系統功能語言學與語料庫相結合的研究的代表性成果是《系統與語料庫——探究其聯系》(SystemandCorpus:ExploringConnections)。這是第29屆國際系統功能語言學會議(2002年7月在利物浦大學召開)的論文集,于2006年由Equinox公司出版。除引言以及結語外,該文集共收入論文12篇,圍繞3個主題:系統功能語法和語料庫語言學的關系、語料庫語言學中理論模型的發展和語料庫對系統功能語法研究的貢獻。
語料庫語言學的重要學科理論基礎是弗斯(J.R.Firth)的語言學思想,包括弗斯本人的學說與新弗斯學者的理論與方法。作為系統功能語言學的創始人,韓禮德對語料庫語言學的發展作出重要貢獻。韓禮德 (2005/2007)從系統功能語法的角度對科技英語語體進行系列研究,提出以語法隱喻為核心的理論模型,對分析以語料庫為基礎的語體差別極具指導意義,十分引人注目(桂詩春 2009:19)。本文探討韓禮德的基本語言觀及其對語料庫語言學的定性與定位、語法系統中的概率與語料庫中的頻率之間的契合和韓禮德關于應用語料庫研究系統功能語法的構想。
現代意義的語料庫是計算機技術在語言研究領域的應用,它伴隨著計算機技術的進步而發展。“語料庫指在隨機采樣的基礎上收集有代表性的真實語言材料的集合,是語言運用的樣本”(楊惠中 2002:9),是按照一定的采樣標準采集而來的、能夠代表一種語言或某語言變體的電子文本集(梁茂成等 2010:3)。
1964年,世界上第一個語料庫——布朗語料庫在美國誕生,隨后多個語料庫相繼建成,語料庫的應用范圍也進一步擴大。很多學者運用語料庫描述語法,其代表性的成果是Biber等(1999)基于BNC語料庫主編的《朗文英語口語和筆語語法》和Sinclair(2005)基于COBUILD語料庫(Collins Birmingham University International Language Database)主持編寫的《柯林斯COBUILD英語語法》。最為經典的是Quirk等基于SEU語料庫編寫的《英語語法大全》(1972)。此外,Kennedy (1998)也對語法描寫作過綜述。上述語法研究語料詳實,數據準確,覆蓋范圍廣,具有一定的意義,至少可作為語法教學的指導和參考。但是,也存在值得反思的問題。語料庫分析不應當為數據而數據,為統計而統計。語料庫的作用不僅僅是為統計分析提供有限的代表性數據,它還可以提供真實的語料,便于語言學家從功能和語篇的視角進行語法研究。(Mair 1991:80) 所以,基于語料庫的語法研究不能只停留在簡單的數據描述層面,必須結合一定的語言理論,提升語法描寫的理論高度。產生這種現象的原因在于,以往對語料庫研究的理論基礎和語言觀缺乏統一的認識。
語料庫所收集的真實語言材料的價值似乎毋庸置疑,但在喬姆斯基理論的背景下,語料只能作為語言行為(language performance)的集合,不能反映真正的語言能力(language competence)。他認為語料庫永遠也不會成為語言研究的有用工具,因為語言研究的最終目的是尋找語言能力而不是語言行為。語言能力是所有本族語者可以理解并且說出從來沒有聽過的句子的能力,是人人都共有的、內在的語言知識。語言行為只是語言能力在特定場合下的表現,它是支離破碎的,不能反映語言能力的實際情況。語言行為受到很多外部事物的影響,說話人是否飲酒和說話時的環境等都會對語言行為產生影響。因此,喬姆斯基認為語料庫充其量只是對語言能力的外在表現——語言行為即言語的一種收集,這些數據無法指導語言學家獲得語言能力的模型(McEnery,Wilson 2001:5-13)。
韓禮德反對喬姆斯基有關語言能力與語言運用的二元區分,也批評索緒爾的語言與言語(langue/parole)的二元區分(Halliday 1991:63)。語言能力與語言運用的二元區分在語言體系和語言實例間打下巨大楔子,使得真實文本研究在語法描述和語言理論構建中不能起任何作用。語言與言語的二元區分在我們的腦海中根深蒂固,使得人們將語言和言語看成兩種不同的現象。韓禮德認為,語言學只研究一種現象,那就是語言現象,區別在于語言觀察的視角和深度不同,那就是語言系統(language as system)和語言實例(language as instance)。韓禮德認為,兩者之間的關系類似于氣候和天氣之間的關系,是看待同一現象的兩種不同方式。我們可以把具體語境下的語言實例看作天氣事件,同時,我們也可以從“氣候”的大視角去觀察和研究某種語言提供的整個意義系統和資源。因此,語言系統和語言實例之間是整體和個別的關系:語言系統是一個總體的概念,在具體語境下的語言使用則是運用系統表達意義的實例。(Halliday 1992:61-77)
語料庫由若干語篇組成。黃國文(2006)認為語篇由一個以上的話段或句子構成。王振華認為語篇是一個系統,由“三個要件”和語篇實現的社會目的組成。他把語篇定義為“文本/話語生產者通過文本/話語(產品)及其消費者的互動來實現社會目的的系統”(王振華 2008:71)。根據韓禮德的理論,語篇與系統是并協與互補的關系,是同一現象的兩個不同側面。它們之間的關系如同實例與系統的關系,語篇是系統的示例,系統是語篇的潛勢(Halliday 2008:83)。韓禮德(1992)還告訴我們,在語言研究中,語言實例的觀察者(instance-observer)就像天氣記錄員,從語篇中得出每天的溫度、濕度、氣壓、風向及其變化等信息;語言系統的觀察者(system-observer)類似于氣象學家,根據總體的概率,對特定地區的全部天氣情況進行建模或模擬。韓禮德的“氣候和天氣”的比喻非常恰當,給出方法論的啟示是:小處著手,大處著眼,既要從微觀入手,也要著眼宏觀大局。我們可以理解為語言現象是語言理論的基礎,語言理論建構必須源于對大量真實語料的觀察。韓禮德將語言系統和語言實例視為同一語言現象,使語料庫語言學的研究對象嚴格界定為真實的語言,有助于型式、規律和意義方面的研究向深度推進,也有助于學科的理論體系建設和總體發展。根據弗斯的思想,語言是一種社會行為。語言、性格、思想、交際意圖、語外物體和行為等組成一個整體,不可分割。韓禮德繼承弗斯的思想,將語言視為社會符號。語料庫語言學研究也視語言為社會現象(Teubert 1999:4)。
對于語料庫語言學是理論還是方法的問題學界一直有不同的意見。不少人把語料庫語言學與理論語言學作出區分,互為對立。他們認為,語料庫只是工具而已,只能是一種研究方法。韓禮德的觀點非常鮮明,他多次提到語料庫語言學的重要性及其對理論建構的作用(Halliday,Matthiessen 2004:IFG3)。韓禮德認為,語料庫語言學是一種高度理論化的工作(至少有這種可能),基于語料庫的研究已經開始改變人們對語言中的詞匯及詞匯型式的認識,它還影響著人們對語法的認識,這些影響都是非常有益的(Halliday 1993)。韓禮德認為語料庫語言學將數據收集與理論論述有機地結合在一起,使人們對語言的理解發生質的變化(Tognini-Bonelli 2001:1)。
2002年,韓禮德出席第23屆國際英語語料庫語言學年會(ICAME 2002)。在大會發言中,他強調口語語料庫對語法理論的重要性。這一思想發源于弗斯,早在1935年他就認識到話語研究的價值。他說,“話語研究至關重要,有助于我們更好地理解語言的本質及語言的運作”(Firth 1957:32)。口語語料庫含有大量真實的數據:自然發生的話語。韓禮德認為,這些無意識的話語活動最能體現語言的本質,即意義發生的潛勢(Halliday 2002:175)。他高度重視口語語料庫的定量研究,籍此可建立大規模的頻率型式,描述語言的特征——用布拉格學派的話說就是“特征學”。口語語料庫為研究者提供主要資源,對語言的詞匯語法層面進行理論論述,進而對語言系統的整體進行理論論述。
韓禮德對比多種口語語料庫,發現當今的口語語料庫在轉寫和標注方面存在很多問題。“轉寫就是轉化,轉化就是轉換”(同上:164)。在口頭語言中,話語的旋律和節奏都是能夠表達意義的特征,這些特征在口語轉寫時被丟失。韓禮德建議,“所有的口語轉寫應當對韻律特征加以系統的標注。這些特征并不是可有可無的附加物,至少在某些語言中,語調和節奏能夠系統地表達意義” (同上:163)。
在韓禮德看來,語料庫并不僅僅是語言實例的倉庫,也“是各種表義行為的寶庫 (a treasury of acts of meaning),其探索和研究的視角絢麗多彩,包括量化的方法”(Halliday 1996)。
關于語料庫研究的語言單位,最基本的是詞語,后來擴展到搭配、類聯接、語義傾向、語義韻和短語趨勢等。語料庫研究的發展歷程表明,語言系統中詞匯和語法不可分。這與韓禮德的詞匯語法(lexicogrammar)觀點不謀而合。早在1961年,韓禮德就認為詞匯和語法是互相聯接交匯的連續體,具有不同的精密階。語法學家的夢想是,把所有的語言形式都轉變為語法,這樣詞匯就是最精細的語法。詞匯和語法的關系是語言系統中的并協與互補關系之一。(同上 2008) 例如,英語中表示否定的意義有多種體現形式,可以是語法形式(not)、詞素(un-,unhappy)、半語法化形式(hardly)或詞匯(refuse)。
語料庫研究的一個重要研究領域是搭配,也是源于弗斯提出“由詞的結伴可知其詞”(Firth 1957)。語料庫中的意義是語境(上下文)中的節點詞(Key Word in Context,KWIC) 與其搭配詞所形成的聯接模式。據考證,基于文本從統計學視角研究搭配始于韓禮德(1961)。在韓禮德(1966)中,更明確提出node(節點詞)、span(跨距)、collocate(搭配詞)這一組語料庫語言學術語。其后,辛克萊爾(Sinclair)對韓禮德的搭配觀進行深化研究。語言潛勢本質上是一種縱聚合系統,即一套帶有準入條件的選擇系統 (Halliday 1993:94)。選擇系統的實現是通過詞匯語法層,而介于物質維度和意識維度之間的詞匯語法層的選擇潛勢系統是一個彈性空間 (同上 2002:359-364)。詞匯語法構建現實的動態彈性選擇過程:一是語境決定詞匯語法選擇的社會性;二是在特定語境下詞匯語法的選擇性。系統功能語法所指的意義即詞匯語法在特定語境下的系統選擇,這與語料庫中的節點詞本質上是一致的。
系統功能語法強調聚合性,系統網絡中的選擇具有或然性(probability)。早在現代語料庫誕生之前,韓禮德既已形成語法系統的或然性思想。
20世紀50年代,韓禮德在弗斯等著名語言學家的指導下,對我國《元朝秘史》的語言結構進行定量分析,其目的在于證明語言結構在語篇中出現的頻率正體現出語法系統中的概率問題(胡壯麟 2000)。韓禮德在“現代漢語語法范疇”(Grammatical Categories in Modern Chinese)一文中,給主要系統標注概率。中間概率是1/2,較高的概率是1/2+,1-,1(表示有可能、較肯定、肯定),相對應的低概率是1/2-,0+,0。如:在漢語的“體”(aspect)系統中,在帶“了”表中性語氣的小句中,“了”不位于句尾的或然率為1/2+。這些概率的依據是韓禮德在北京和其它地方收集的小型漢語口語語料庫。(Halliday 1956:210)
隨著信息技術在語料庫研究中的應用和發展,語料庫的規模越來越大,數據檢索和處理技術越來越高明。這些條件為語法系統的或然性研究提供便利。在20世紀90年代的COBUILD語料庫項目中,韓禮德與他人合作完成其中的部分課題,對英語的限定性小句的歸一性和主要時態做量化研究(Halliday,James 1993)。這一研究的出發點是韓禮德提出的假設:語法結構的概率分布有兩種情況,有些系統中的選擇機會是均等的(equi systems: 0.5:0.5),無所謂標記與非標記性的結構;有些系統中的選擇帶有明顯的傾向性(skew systems: 0.9:0.1),頻率高的是非標記性的。韓禮德提出假設概率的依據有兩個,一是香農的信息理論(Shannon,Weaver 1963),二是根據對語言例證的手工統計。例證材料是現代英語不同語料的語篇中的若干語法系統,各2000例。通過對COBUILD語料庫中的數據分析,語法系統的概率分布假設基本證實,其結果如圖1所示(Halliday,James 1993)。

圖1 英語的限定性小句的歸一性和主要時態
語料庫中的頻率還可用于語域研究。韓禮德認為,語域變化體現為語法概率的變化。對于某一特定語法系統,我們可以調查它在不同語域中的使用頻率分布(Halliday 1992:84)。Halliday和Matthiessen (1999)通過對菜譜和天氣預報的分析,發現兩種語域中最突出的語法系統分別是祈使語氣和將來時態。
韓禮德在語料庫研究的思考和實踐中還發現和總結出若干問題,值得我們繼續探究。(1)根據系統功能語法的精密階,調查各種語法系統在語料庫中的總體頻率;(2)對于某一特定語法系統,調查它在不同語域中的使用頻率分布;(3)同一系統中的前后兩次選擇是否有影響;如果有的話,概率是多少;(4)調查語篇的復雜化趨勢的體現方式;(5)調查兩個同步系統的關聯程度(simultaneous systems);(6)條件概率如何影響語言的歷時變化;(7)語法系統中,是否存在某種統一的模型,其對所有的概率分布進行概括。(Halliday 1992:83ff)
其中問題(4)涉及到語篇發生學(logogenesis),與phylogenesis和ontogenesis相對應,研究語篇產生的動態過程。韓禮德發現語篇有復雜化的趨勢:隨著語篇的展開和深入,它的復雜程度會增加(同上:85)。測量語篇復雜程度有多種指標,包括詞匯密度、名詞鏈的長度、每個句子中嵌套小句的數量以及語法隱喻(朱永生 2006,朱永生 嚴世清 2011:26-37)。韓禮德提出假設:隨著語篇的展開,語法隱喻也會增加,至少在某些語體中存在這種現象(Halliday 1992:87)。例如:
① how glass cracks
the stress needed to crack glass
as a crack grows...
glass fracture growth rate(Halliday 1992:87)
韓禮德從事語料庫研究的實踐給我們樹立良好的典范。韓禮德在基于語料庫與語料庫驅動的語料庫語言學兩條路徑上都有重要影響。他有關“語言系統的并協與互補”的觀念更有助于對語言現象的闡釋(許家金 2012)。韓禮德主張語言系統是語言實例的總體,從語言觀的層面將語料庫語言學的研究對象界定為真實的語言。韓禮德還旗幟鮮明地指出語料庫語言學的重要性和理論性,語料庫中的頻率體現出語法系統中的概率,強調語料庫研究的理論高度,提高語料庫語言學的學科地位。韓禮德尤其重視口語語料庫的作用,基于語料庫的口頭話語分析應該成為今后語言研究的方向,它可以揭示詞匯語法層面的理論,乃至整個語言系統的本質。
韓禮德(2006)在后記中提到,語料庫的發展正好解決長期以來困擾語言學家的語料短缺問題,但由于語料庫中呈現的是詞和詞串,而不是語法范疇,這對于詞匯學家來說是“友好的”,而對于語法學家而言就極其“不友好”。如果能克服這些難點,語料庫應用于語法研究的前景還是樂觀的。此外,語言系統中的3種并協與互補關系:詞匯和語法,口語和筆語、系統與文本,也是今后值得探索的領域。
桂詩春.基于語料庫的英語語言學語體分析[M].北京:外語教學與研究出版社,2009.
胡壯麟.功能主義縱橫談[M].北京:外語教學與研究出版社,2000.
黃國文.社會符號學理論中的“語篇”概念[A].符號與符號學新論[C].南京:東南大學出版社,2006.
梁茂成 李文中 許家金.語料庫應用教程[M].北京:外語教學與研究出版社,2010.
王振華.作為系統的語篇[J].外語學刊,2008(3).
許家金.中外語料庫語言學源流[OL].http://www.sinotefl.ac.cn/a/zhongxinxinwen/2012.
楊惠中.語料庫語言學導論[M].上海:上海外語教育出版社,2002.
朱永生.名詞化、動詞化與語法隱喻[J].外語教學與研究,2006(2).
朱永生 嚴世清.系統功能語言學再思考[M].上海:上海外語教育出版社,2011.
Biber,D.,Johansson,S.,Leech,G.,Conrad,S.,Finegan,E.,Quirk,R.LongmanGrammarofSpokenandWrittenEnglish[M].Harlow: Longman,1999.
Firth,J.R.PapersinLinguistics1934-1951[M].London:Oxford University Press,1957.
Halliday,M.A.K.Towards Probabilistic Interpretations[A].In: Ventola,E.(Ed.),FunctionalandSystemicLinguistics:ApproachesandUse[C].New York: Mouton de Gruyter,1991.
Halliday,M.A.K.Language as System and Language as Instance:The Corpus as a Theoretical Construct [A].In:Ventola,E.,Svartvik,J.(Eds.),DirectionsinCorpusLinguistics[C].New York: Mouton de Gruyter,1992.
Halliday,M.A.K.Quantitative Studies and Probabilities in Grammar[A].In:Hoey,M.(Ed.),Data,Description,Discourse[C].New York: Harper Collins,1993.
Halliday,M.A.K.On Grammar and Grammatics[A].In: Hasan,R.,Cloran,C.,Butt,D.(Eds.),FunctionalDescriptions:TheoryinPractice(CILT121)[C].Amsterdam: John Benjamins,1996.
Halliday,M.A.K.The Spoken Language Corpus:A Foundation for Grammatical Theory [A].In: Aijmer,K.,Al-tenberg,B.(Eds.),AdvancesinCorpusLinguistics(ICAME2002)[C].Amsterdam: Rodopi,2002.
Halliday,M.A.K.CollectedWorksofM.A.K.Halliday:LanguageofScience[M].London:Continuum,2005/2007.
Halliday,M.A.K.ComplementaritiesinLanguage[M].Beijing: The Commercial Press,2008.
Halliday,M.A.K.,James,Z.A Quantitative Study of Pola-rity and Primary Tense in the English Finite Clause[A].In: Sinclair,J.M.,Hoey,M.,Fox,G.(Eds.),TechniquesofDescription:SpokenandWrittenDiscourse[C].London: Routledge,1993.
Halliday,M.A.K.,Matthiessen,C.M.I.M.ConstruingExperienceThroughMeaning:ALanguage-basedApproachtoCognition[M].London: Cassell,1999.
Kennedy,G.AnIntroductiontoCorpusLinguistics[M].Harlow: Addison Wesley Longman,1998.
McEnery,A.,Wilson,A.CorpusLinguistics[M].Edinburgh: Edinburgh University Press,2001.
Quirk,R.,Greenbaum,S.,Leech,G.,Svartvik,J.AGrammarofContemporaryEnglish[M].London: Oxford University Press,1972.
Shannon,C.E.,Weaver,W.TheMathematicalTheoryofCommunication[M].Urbana:University of Illinois Press,1963.
Sinclair,C.CollinsCOBUILDEnglishGrammar[M].Glasgow: Harper Collins,2005.
Teubert,W.Corpus Linguistics: A Partisan View[J].InternationalJournalofCorpusLinguistics,1999(1).
Thompson,G.,Hunston,S.SystemandCorpus:ExploringConnections[M].London: Equinox,2006.
Tognini-Bonelli,E.CorpusLinguisticsatWork[M].Amsterdam: John Benjamins,2001.