李華勇
(四川文理學(xué)院外國(guó)語學(xué)院,四川 達(dá)州 635000)
1967年在美國(guó)Brown大學(xué)建成100萬詞的現(xiàn)代美國(guó)英語語料庫,是真正意義上的計(jì)算機(jī)語料庫,標(biāo)志著現(xiàn)代語料庫的誕生?!罢Z料庫語言學(xué)”逐漸受到國(guó)內(nèi)外語言學(xué)界的青睞,逐步發(fā)展成為一門極具潛力的交叉學(xué)科。隨著計(jì)算機(jī)和網(wǎng)絡(luò)技術(shù)的迅速發(fā)展,國(guó)內(nèi)外各路學(xué)者都不同程度地加入了語料庫研究大軍——對(duì)語料庫或者利用語料庫進(jìn)行研究,并取得了大量的研究成果。然而,由于各路學(xué)者的學(xué)術(shù)背景、研究目的或使用語料庫的程度各不相同,國(guó)內(nèi)外學(xué)者對(duì)語料庫語言學(xué)的(學(xué)科)地位認(rèn)識(shí)和理解也產(chǎn)生了嚴(yán)重的分歧:第一種觀點(diǎn)認(rèn)為語料庫語言學(xué)只是一種研究方法或研究工具[1],或研究方法上的一個(gè)新視角[2];第二種觀點(diǎn)認(rèn)為,雖然語料庫語言學(xué)有自己特定的研究對(duì)象,目前還難以完全確認(rèn)自己獨(dú)立的學(xué)科地位,但承認(rèn)語料庫語言學(xué)獲得獨(dú)立學(xué)科地位的條件已經(jīng)成熟[3];第三種觀點(diǎn)認(rèn)為語料庫語言學(xué)由于研究對(duì)象不同于一般的理論語言學(xué),其內(nèi)涵已超越了一般意義上的方法學(xué),成為一門具有全新視野和方法的學(xué)科[4-6]。第一種觀點(diǎn)只看到了語料庫語言學(xué)的工具和方法屬性;第三種觀點(diǎn)表面上看是主張語料庫語言學(xué)已具有獨(dú)立學(xué)科地位,就其實(shí)質(zhì)來講是主張徹底的語料庫驅(qū)動(dòng)的方法——它不依靠任何語料庫之外預(yù)設(shè)和給定的理論,強(qiáng)調(diào)語料庫語言學(xué)的自足性,它實(shí)質(zhì)上是語料庫語言學(xué)具體研究方法中的語料庫驅(qū)動(dòng)方法;第二種觀點(diǎn)雖然不完全承認(rèn)語料庫語言學(xué)的學(xué)科地位,但是已經(jīng)上升到不再把它看成一種具體方法和研究工具了。語料庫語言學(xué)經(jīng)過近40年的發(fā)展,現(xiàn)在語料庫語言學(xué)是不是具有了完整的學(xué)科地位呢?經(jīng)查閱最近幾年的相關(guān)文獻(xiàn),國(guó)內(nèi)學(xué)者從語料庫語言學(xué)的方法論和相關(guān)理論[7]、研究視野[8]、研究范式[9]、語言學(xué)思想起源[10]等作了與語料庫語言學(xué)學(xué)科相關(guān)方面的論述,但還沒有對(duì)語料庫語言學(xué)的學(xué)科地位進(jìn)行完整和系統(tǒng)的論述。
語料庫語言學(xué)以經(jīng)驗(yàn)主義和科學(xué)的理性主義為哲學(xué)基礎(chǔ)。經(jīng)驗(yàn)主義(empiricism)是和理性主義(rationalism)相對(duì)立的一種哲學(xué)思想,這兩種哲學(xué)思想深刻地影響著近代語言的發(fā)展和研究。經(jīng)驗(yàn)主義誕生于古希臘,是一種認(rèn)識(shí)論學(xué)說,認(rèn)為人類知識(shí)起源于感覺,并以感覺的領(lǐng)會(huì)為基礎(chǔ)。在英國(guó),大衛(wèi)·休謨(David Hume)、約翰·洛克(John Locke)及喬治·貝克萊(George Berkeley)并稱英國(guó)三大經(jīng)驗(yàn)主義者。理性主義(Rationalism)是建立在承認(rèn)人的理性可以作為知識(shí)來源之上的一種哲學(xué)思想,高于并獨(dú)立于感官感知,17~18世紀(jì)主要在歐洲大陸傳播,以勒內(nèi)·笛卡爾(Rene Descartes)、伊曼努爾·康德(Immanuel Kant)為代表。喬姆斯基(Chomsky)創(chuàng)立的轉(zhuǎn)換生成語言學(xué)就是以笛卡爾的理性主義思想為哲學(xué)基礎(chǔ),認(rèn)為一切語言知識(shí)來源于理性,語言實(shí)質(zhì)上是指語言使用者抽象的語言能力而不是其具體可觀察的語言行為,是不可能通過觀察和分析外在的語言行為事實(shí)獲得的。他認(rèn)為人類的大腦與生俱來就有一種天生的語言習(xí)得能力,作為語言學(xué)家只需要研究存在于人腦內(nèi)部用于生成語言事實(shí)的那些規(guī)則。轉(zhuǎn)換生成語言學(xué)把語言學(xué)家通過自己的“直覺”獲得的內(nèi)省數(shù)據(jù)和編造的句子置于首要的核心地位,聲稱這些內(nèi)省數(shù)據(jù)和句子可以對(duì)語言“進(jìn)行描寫甚至作出解釋”[11]。轉(zhuǎn)換生成語言學(xué)一方面認(rèn)為言語事實(shí)太混沌無序,個(gè)體差異太大,不能成為語言學(xué)研究的對(duì)象;另一方面,在缺乏研究語言材料的情況下,不得不依靠自己的直覺編造出一些句子,并根據(jù)這些句子推理和演繹出一系列生成句子結(jié)構(gòu)的規(guī)則。這其中的矛盾之處在于:一方面認(rèn)為普通人的言語不可靠,不能成為研究對(duì)象,但是另一方面又把自己凌駕于普通人之上,用自己的語言直覺編造出所謂的理性語言來確立解釋語言的規(guī)則。更為重要的是置這些規(guī)則不能解釋日常生活中的大量語言現(xiàn)象于不顧,存在不能對(duì)所有語言現(xiàn)象進(jìn)行全面解釋的不足。
語料庫語言學(xué)是以人們?nèi)粘I钪挟a(chǎn)生的大量真實(shí)語言材料為研究對(duì)象的,通過對(duì)這些海量真實(shí)語言材料進(jìn)行檢索、統(tǒng)計(jì)、分析和解釋來探求語言規(guī)律。真實(shí)語言材料而非“直覺內(nèi)省”語言材料是語料庫語言學(xué)的一大特點(diǎn),由海量語言數(shù)據(jù)的檢索和分析去發(fā)現(xiàn)語言規(guī)律而非從理論到理論的推理得出結(jié)論是其另一大特點(diǎn)。從語料庫語言學(xué)的這兩大特點(diǎn)可以看出其哲學(xué)基礎(chǔ)是經(jīng)驗(yàn)主義的。語料庫語言學(xué)一方面借用現(xiàn)代技術(shù)手段對(duì)大量的真實(shí)語言使用事實(shí)進(jìn)行檢索、統(tǒng)計(jì)和描寫,另一方面還要對(duì)這些語言事實(shí)進(jìn)行更加深入的解釋和概括??梢?,語料庫語言學(xué)一方面強(qiáng)調(diào)對(duì)語言使用事實(shí)的描寫,同時(shí)另一方面也不排斥理論上的演繹推理。這樣看來,語料庫語言學(xué)中也彌漫著理性主義的因素。我們把語料庫中這種彌漫著的理性主義的因素稱作溫和的理性主義或科學(xué)的理性主義:在研究中不把理性推理看成是獲得知識(shí)的首要的決定性的因素,不作理論預(yù)設(shè)或者說不依靠任何理論為前提,只是對(duì)研究結(jié)論進(jìn)行溫和的、適度的和符合語言使用實(shí)際的演繹和推理。
建立在經(jīng)驗(yàn)主義和科學(xué)理性主義融合基礎(chǔ)上的語料庫語言學(xué)是符合現(xiàn)代語言學(xué)研究發(fā)展趨勢(shì)的。雖然從本質(zhì)上來看,經(jīng)驗(yàn)主義和理性主義是根本對(duì)立的兩種哲學(xué)思想,但20世紀(jì)以來,經(jīng)驗(yàn)主義和理性主義并存和整合的現(xiàn)象日趨明顯[12]。這兩種哲學(xué)思想的融合也體現(xiàn)在語料庫語言研究中:隨著科學(xué)技術(shù)的進(jìn)步和發(fā)展,人們對(duì)語言認(rèn)識(shí)的加深,經(jīng)驗(yàn)主義語言觀一方面注重經(jīng)驗(yàn),同時(shí)也汲取理性主義的合理因素;既注重真實(shí)語言事實(shí)材料的收集和觀察,又注重對(duì)這些材料的歸納和推理,同時(shí)還不排斥語言學(xué)家的內(nèi)省和直覺。語料庫語言學(xué)將經(jīng)驗(yàn)主義和理性主義整合的哲學(xué)思想完全符合現(xiàn)代語言研究戰(zhàn)略轉(zhuǎn)移的方向。在戰(zhàn)略轉(zhuǎn)移中,我們應(yīng)像蜜蜂那樣,把理性主義和經(jīng)驗(yàn)主義兩種機(jī)能“更緊密地”、“更精純地”結(jié)合起來,推動(dòng)語言學(xué)的發(fā)展[13]。20世紀(jì)的語言學(xué)發(fā)展史是理性主義與經(jīng)驗(yàn)主義斗爭(zhēng)的歷史,斗爭(zhēng)的結(jié)果是兩種哲學(xué)觀的融合,語料庫語言學(xué)將發(fā)展成為新時(shí)期語言學(xué)研究的主流方法[14]。語料庫語言學(xué)將成為語言學(xué)研究的主要研究范式,并將更好地踐行經(jīng)驗(yàn)主義和科學(xué)的理性主義整合的哲學(xué)思想,揚(yáng)長(zhǎng)避短,推動(dòng)現(xiàn)代語言研究的深入發(fā)展。
語料庫語言學(xué)以弗斯語言學(xué)(Firthian linguistics)思想為語言理論基礎(chǔ)。弗斯(Firth)是英國(guó)語言學(xué)的奠基人和第一位語言學(xué)教授,創(chuàng)立了聲名遠(yuǎn)揚(yáng)的倫敦學(xué)派(London School)。他的語言學(xué)思想和研究方法有別于現(xiàn)代語言學(xué)之父索緒爾(Saussure),也不同于布龍菲爾德(Bloomfield)為代表的美國(guó)結(jié)構(gòu)主義語言學(xué),與喬姆斯基(Chomsky)開創(chuàng)的轉(zhuǎn)換成生語言學(xué)更是差異巨大。他的語言學(xué)思想被稱為弗斯語言學(xué)(Firthian Linguistics),與之相關(guān)的學(xué)者則被稱為弗斯派學(xué)者(Firthians)。McEner、梁茂成把弗斯派的發(fā)展大致分為三個(gè)階段:第一階段,以Firth在世時(shí)及其創(chuàng)立的倫敦學(xué)派時(shí)的主要人員Sydeny Allen,Jack Camochan,Eugenie Henderson,T.F.Mitchell等被劃為弗斯學(xué)派;第二階段,F(xiàn)irth死后,Michael Halliday,John Sinclair,Angus Mcintosh,Peter Strevens繼承并發(fā)展了弗斯學(xué)派語言學(xué)思想和方法:Halliday開創(chuàng)的系統(tǒng)功能語法,Sinclair等人在詞語學(xué)、話語分析和語料庫語言學(xué)取得了豐碩成果,他們被稱為新弗斯學(xué)派(Neo-Firthians);第三階段,20世紀(jì)70年代后,隨著語料庫語言學(xué)的興起和發(fā)展,新弗斯學(xué)派學(xué)者(主要有 Sinclair,Stubbs,Hoey,Teubert,Antoinette)在該研究領(lǐng)域獨(dú)樹一幟,將弗斯的大量語言學(xué)思想運(yùn)用到語料庫語言學(xué)研究的實(shí)踐中,借助通過語料庫獲取的證據(jù)和快速簡(jiǎn)便的計(jì)算機(jī)檢索工具使得弗斯語言學(xué)以前抽象的概念和觀點(diǎn)變得客觀、具體、可信和可操作,他們被稱為后弗斯學(xué)派語料庫語言學(xué)者(Post-Firthian Corpus Linguistics)[9,15]??梢?,語料庫語言學(xué)的研究與弗斯語言學(xué)思想及弗斯學(xué)派的三個(gè)發(fā)展階段密不可分,可以說語料庫語言學(xué)從弗斯語言及第三階段的弗斯學(xué)派語料庫語言學(xué)學(xué)者研究實(shí)踐中獲得語言學(xué)理論基礎(chǔ)。正是在這種語言學(xué)理論思想的指導(dǎo)之下進(jìn)行的各項(xiàng)研究實(shí)踐,才使語料庫語言學(xué)具有了強(qiáng)大的生命力和成為世界語言研究的主流,也才能使語料庫語言學(xué)逐漸成為一門新興的顯學(xué)。
索緒爾把語言看成是一個(gè)完整的符號(hào)系統(tǒng),具有分級(jí)分層的形式結(jié)構(gòu)。喬姆斯基創(chuàng)立的轉(zhuǎn)換生成語言學(xué)把語言看成是一種心智現(xiàn)象,研究核心聚焦于抽象的、存在于人腦的、受普遍語法控制的語言能力。認(rèn)知語言學(xué)同樣把語言觀看成是一種心智現(xiàn)象,盡管在解釋這種心智現(xiàn)象時(shí)強(qiáng)調(diào)社會(huì)環(huán)境和語言使用對(duì)語言知識(shí)產(chǎn)生的重要性,但認(rèn)知語言學(xué)力圖從心智空間、引喻轉(zhuǎn)喻、意象圖式和語法化等機(jī)制來解釋語言的形式和意義。語料庫語言學(xué)另辟蹊徑,把語言視為一種社會(huì)現(xiàn)象、社會(huì)行為,主張語言研究應(yīng)該聚焦于外化的、可觀察的社會(huì)語言行為。弗斯受實(shí)驗(yàn)科學(xué)和經(jīng)驗(yàn)主義認(rèn)識(shí)論的影響,堅(jiān)持反心智主義立場(chǎng),力主基于可觀察的語言事實(shí),用實(shí)證方法研究語言,他明確宣稱:
As we know so little about mind and as our study is essentially social,I shall cease to respect the du-ality of mind and body,thought and word,and be satisfied with the whole man,thinking and acting as a whole,in association with his fellows.[16]
世界著名語料庫語言學(xué)家Teubert明確指出:“Corpus linguistics is based on the concept that language is a fundamentally social phenomenon.”[17]把語言看成一種社會(huì)現(xiàn)象和社會(huì)行為的語料庫語言學(xué),必然要求它的研究對(duì)象是外化的語言而非內(nèi)化的諸如心智、意象、心理空間等抽象的語言概念,必然要采用調(diào)查、統(tǒng)計(jì)、數(shù)據(jù)獲取和處理等社會(huì)科學(xué)研究方法來研究語言的形式、意義和功能等。
語料庫語言學(xué)把語言看成是一種社會(huì)現(xiàn)象、社會(huì)行為,必然堅(jiān)持語言一元論(Monism)的基本立場(chǎng)。索緒爾的結(jié)構(gòu)主義語言學(xué)堅(jiān)持的是二元論立場(chǎng),提出了語言和言語、能指和所指、歷時(shí)和共時(shí)的二元區(qū)分。喬姆斯基從理性主義立場(chǎng)創(chuàng)立的轉(zhuǎn)換生成語言學(xué),提出了語言能力和語言行為的二元區(qū)分,并把研究的焦點(diǎn)放在語言能力上。而語料庫語言學(xué)家堅(jiān)持語言一元論立場(chǎng),從弗斯、Halliday到Sinclair的弗斯語言學(xué)派學(xué)者都堅(jiān)持語言一元論立場(chǎng),認(rèn)為語言既然是一種社會(huì)現(xiàn)象和行為,那么語言與思想、思維、個(gè)性、其他行為一起組成完整的整體,不應(yīng)該作二元區(qū)分。在語料庫技術(shù)和語料庫語言學(xué)產(chǎn)生之前,對(duì)語言進(jìn)行二元區(qū)分有其合理的成分。那時(shí),一方面受結(jié)構(gòu)主義和理性主義思想的影響,另一方面語言學(xué)家可以獲取的語言證據(jù)數(shù)量及其途徑極其有限,受科學(xué)技術(shù)和個(gè)人視野的限制,做出語言和言語、語言能力和語言行為等二元區(qū)分,并將研究聚焦于抽象的語言和語言能力,并憑借語言研究者的個(gè)人語言直覺編造例句對(duì)語言作出解釋,成為一種最簡(jiǎn)便、最容易操作的最佳選擇。隨著計(jì)算機(jī)和網(wǎng)絡(luò)技術(shù)的發(fā)展,語料庫技術(shù)已經(jīng)使語言研究者從數(shù)億級(jí),甚至數(shù)十億級(jí)庫容語料庫中獲取所需特定真實(shí)語料文本變得迅速、簡(jiǎn)便;這些海量的真實(shí)文本不是孤立的、脫離語境的和憑直覺內(nèi)省的句子,而是基于語境的真實(shí)文本,同時(shí)這些文本還兼具共時(shí)和歷時(shí)的特性,(監(jiān)視語料庫)甚至還能提供實(shí)時(shí)詳細(xì)記錄特定語言變化過程的詳細(xì)數(shù)據(jù)和文本。通過語料庫技術(shù)獲取的這些真實(shí)海量文本,很難區(qū)分出它們是語言還是言語,是語言能力還是語言行為,是共時(shí)的還是歷時(shí)的,以前這種二元對(duì)立區(qū)分的界線已經(jīng)被語料庫技術(shù)獲取的這些文本給模糊和消融了??梢姡Z料庫語言學(xué)堅(jiān)決反對(duì)語言的二元對(duì)立區(qū)分,主張語言一元立場(chǎng),把語言這種社會(huì)現(xiàn)象和行為看成與思想、思維、個(gè)性和其他行為一起組成的完整的整體,在一元論立場(chǎng)之上對(duì)語言做出的描寫和解釋是有其堅(jiān)實(shí)的語言使用事實(shí)和科學(xué)依據(jù)的。
由于語料庫語言學(xué)堅(jiān)持一元論的基本立場(chǎng),反對(duì)對(duì)語言進(jìn)行二元區(qū)分,因此它的研究對(duì)象就必然嚴(yán)格限定為真實(shí)的語言使用(即文本)。語料庫語言學(xué)將其研究對(duì)象限定為真實(shí)的語言使用,有利于深化對(duì)語言的型式、規(guī)律、意義和語用等方面的研究,進(jìn)而使得這些問題的研究具有堅(jiān)實(shí)的語言基礎(chǔ)以做出符合語言常規(guī)的全面解釋和得出符合語言使用實(shí)際情況的結(jié)論,從而避免以前那種由理論到理論的空對(duì)空的推演,得出不符合語言真實(shí)使用實(shí)際情況的理論概括的危險(xiǎn)。
語料庫語言學(xué)研究的主要目的是研究語言的意義,這里的意義不是結(jié)構(gòu)主義語言學(xué)那種脫離語境的純形式意義,而是結(jié)合了語境、形式、語義和功能的意義。在語料庫語言學(xué)一元觀中,語言的形式、結(jié)構(gòu)與意義及功能是一個(gè)統(tǒng)一整體,它們都在使用中得以體現(xiàn)[8]。因此,對(duì)語言意義的研究不能脫離形式,也不能不顧及功能,更不得離開語境。語料庫語言學(xué)認(rèn)為任何意義都只能存在于特定的形式和語境之中。對(duì)語言意義的解釋只能使用語言來解釋,只能在文本中獲得解釋,正如Teubert聲稱的那樣:一切知識(shí)和文化都體現(xiàn)在文本中[5,18]。對(duì)意義的研究必須基于文本是語料庫語言學(xué)對(duì)意義研究的一條核心原則。對(duì)意義的研究和解釋,語料庫語言學(xué)和其他語言學(xué)的不同之處在于它既不像結(jié)構(gòu)主義和轉(zhuǎn)換生成語言學(xué)那樣去尋找真實(shí)語言使用之外的“理想語言”,也不像認(rèn)知語言學(xué)和心理語言學(xué)那樣去尋找“心理(智)語言”,更不像邏輯語言學(xué)那樣去尋求“形式化公式”,而是利用真實(shí)使用中的語言,結(jié)合語言的語境、形式、語義和功能來解釋語言。Teubert指出語言只能用語言來描述和解釋,而不是用別的什么[5]。
語料庫語言學(xué)的研究目標(biāo)是通過海量語言的使用實(shí)例的檢索、統(tǒng)計(jì)、分析并結(jié)合相關(guān)語言理論和語言研究者的語言直覺,探索語言各層面的規(guī)律、全面揭示語言本質(zhì)、指導(dǎo)語言學(xué)習(xí)和構(gòu)建語料庫語言學(xué)的應(yīng)用理論。
現(xiàn)代語言學(xué)追求對(duì)語言解釋的普遍性、概括性、科學(xué)性這三重研究目標(biāo),不論是結(jié)構(gòu)主義語言學(xué),還是轉(zhuǎn)換生成語言學(xué)、系統(tǒng)功能語言學(xué)和認(rèn)知語言學(xué)都以此為重要目標(biāo)。語料庫語言學(xué)同樣要追求對(duì)語言解釋的普遍性、概括性和科學(xué)性這三重研究目標(biāo),為了實(shí)現(xiàn)這三重目標(biāo),語料庫語言學(xué)采取基于語料庫和語料庫驅(qū)動(dòng)的研究方法,定性和定量相結(jié)合的方法,實(shí)證為主和內(nèi)省相輔的方法。
Tognini-Bonelli首次將語料庫語言學(xué)的研究方法區(qū)分為基于語料庫(corpus-based)的研究方法和語料庫驅(qū)動(dòng)(corpus-driven)的研究方法[6]?;谡Z料庫的研究方法利用語料庫獲取的大量語言數(shù)據(jù)去證實(shí)或證偽現(xiàn)有的語言理論、語言描述或語言解釋,它不企圖創(chuàng)立新的理論和改變?cè)姓Z言理論的概念范疇體系。從總體上來說,它是一種至上面下(up-bottom)的研究方法,即先有理論后用語料數(shù)據(jù)驗(yàn)證,這種方法只能驗(yàn)證理論不能直接構(gòu)建新的理論。語料庫驅(qū)動(dòng)的研究方法則是以語料庫提供的語料作為出發(fā)點(diǎn)和唯一研究對(duì)象,在對(duì)通過語料庫技術(shù)獲取的語言數(shù)據(jù)進(jìn)行充分觀察、統(tǒng)計(jì)和分析的基礎(chǔ)之上,對(duì)這些數(shù)據(jù)反映的語言現(xiàn)象進(jìn)行全新的描述,然后構(gòu)建新的語言理論來對(duì)這些使用中的語言現(xiàn)象進(jìn)行解釋和構(gòu)建新的語言理論,從而實(shí)現(xiàn)新的理論突破。它是一種純正的至下而上(bottom-up)的研究方法,是完全由語料數(shù)據(jù)到理論的經(jīng)驗(yàn)主義方法的典型代表,它反對(duì)對(duì)語料庫進(jìn)行任何形式的標(biāo)注(tagging)和進(jìn)行理論框架預(yù)設(shè)?,F(xiàn)在的語料庫語言學(xué)在研究方法上呈現(xiàn)這兩種方法相融合的趨勢(shì),揚(yáng)長(zhǎng)避短,以展現(xiàn)語料庫語言學(xué)的強(qiáng)大描寫力和解釋力。
語料庫語言學(xué)還是定性和定量相結(jié)合的研究方法的典型代表。語料庫語言學(xué)中的定性是指對(duì)語料研究的深度即對(duì)語言描寫的精度,它可以幫助我們更加深入地認(rèn)識(shí)語言問題的本質(zhì)和核心,可以對(duì)定量研究所發(fā)現(xiàn)的語言規(guī)律和變化趨勢(shì)做出深度的原因分析。定量是指對(duì)語料研究的廣度即能夠描寫和解釋多少語言素材,可以讓我們更加直觀和廣泛地認(rèn)識(shí)該語言現(xiàn)象,通過定量研究獲取的語言數(shù)據(jù)可以發(fā)現(xiàn)語言發(fā)展和變化的趨勢(shì)。定性和定量研究各有長(zhǎng)短,語料庫語言學(xué)做到了對(duì)這兩種方法的揚(yáng)長(zhǎng)避短,能夠深入和廣泛描寫、解釋日常生活中復(fù)雜的語言現(xiàn)象。
盡管語料庫語言學(xué)是以真實(shí)使用中的語言為研究對(duì)象進(jìn)行的基于觀察、統(tǒng)計(jì)、描寫和分析的實(shí)證研究,但是在通過對(duì)真實(shí)語言數(shù)據(jù)分析得出的結(jié)論做出合理的解釋和構(gòu)建相關(guān)語言理論時(shí),又不得不用到語言研究者的語言直覺和內(nèi)省理性思維。因此,語料庫語言學(xué)又采用以實(shí)證為主和內(nèi)省相輔的研究方法。
語料庫語言學(xué)還采用共時(shí)和歷時(shí)相結(jié)合的研究方法。語言的發(fā)展和變化是在共時(shí)和歷時(shí)兩個(gè)維度上進(jìn)行的,語言在共時(shí)變化時(shí)具有概率性特征,語言歷時(shí)變化具有歷時(shí)和文化繼承性特征,是文化和知識(shí)的積累過程,這些特征都沉積在語料庫的文本中。為了對(duì)語言做出全面合理的描寫和解釋,語料庫語言學(xué)在對(duì)文本進(jìn)行觀察、統(tǒng)計(jì)、分析和解釋時(shí),可以采用共時(shí)和歷時(shí)相結(jié)合的研究方法。
為了能夠迅速方便地建設(shè)和使用語料庫,語料庫語言學(xué)家開發(fā)了一系列的軟件工具。例如,在建庫階段有EditPad Pro等文本編輯工具、Power Grep等文本整理工具、CLAW4和Tree Tagger等自動(dòng)詞類賦碼工具;在語料庫檢索階段有WordSmith Tools、Concordance和Power GREP等工具;在數(shù)據(jù)統(tǒng)計(jì)階段還SPSS等工具。同時(shí)還有各類基于網(wǎng)絡(luò)對(duì)大型語料庫進(jìn)行檢索和分析的工具。語料庫語言學(xué)有了屬于自己的一系列研究工具,順應(yīng)了網(wǎng)絡(luò)技術(shù)和計(jì)算機(jī)技術(shù)的發(fā)展,使語料庫語言學(xué)對(duì)語言的研究帶有了科學(xué)基因,促使語言研究朝著精確化、客觀化、科學(xué)化方向發(fā)展。
語料庫語言學(xué)是順應(yīng)語言研究戰(zhàn)略大轉(zhuǎn)移發(fā)展趨勢(shì)和語言研究朝更客觀化、更精確化和科學(xué)化發(fā)展的要求,并融合了計(jì)算機(jī)技術(shù)、普通語言學(xué)、心理語言學(xué)和外語教學(xué)等學(xué)科而誕生的一門交叉學(xué)科,有著廣泛的應(yīng)用前景。
(1)辭書和語法書編撰?!杜=蚋唠A學(xué)習(xí)詞典》(Oxford Advanced Learners Dictionary),《朗文當(dāng)代英語詞典》(Longman Dictionary of Contemporary English),《柯林斯高階英語學(xué)習(xí)詞典》(Collins Cobuild Advanced learner’s English Dictionary),《當(dāng)代英語語法(1972)》(AGrammar of Contemporaneity English 1972),《英語綜合語法1985》(A Comprehensive Grammar of the English Language 1985)等都是在英語語料庫運(yùn)用在辭書和語法書編撰中產(chǎn)出的杰出代表[19]。
(2)外語教學(xué)。語料庫從一開始出現(xiàn)就與外語教學(xué)有著密切聯(lián)系,通過語料庫來探索外語教學(xué)規(guī)律、組織外語教學(xué)活動(dòng)和為外語教學(xué)獲取真實(shí)語言使用實(shí)例等,都體現(xiàn)了語料庫語言學(xué)服務(wù)于外語教學(xué)的實(shí)踐。
(3)機(jī)器智能翻譯。機(jī)器智能翻譯的實(shí)現(xiàn)一方面依賴于計(jì)算機(jī)對(duì)自然語言處理的研究技術(shù)突破,另一方面也依賴于大型語料庫的數(shù)據(jù)支持。
(4)教材和大綱設(shè)計(jì)?;诖笮驼Z料庫編寫出來的教材和大綱比起基于經(jīng)典文學(xué)作品和編寫者的“語言直覺”編寫出來的教材和大綱更加符合語言學(xué)習(xí)的要求和更能反映真實(shí)的語言規(guī)律,從而有利于語言學(xué)習(xí)者的語言學(xué)習(xí)。
(5)深化對(duì)語言詞匯、短語、句法、語用、語篇和歷史文化的相關(guān)研究層面。利用語料庫可以深化對(duì)該語言從詞匯到語篇和相關(guān)歷史文化的研究,使對(duì)該語言的各層面的研究更加科學(xué)化和客觀化,從而有利用對(duì)該語言的規(guī)律的掌握,這是語料庫語言學(xué)的最重要的研究和應(yīng)用領(lǐng)域。
(6)專門用途語言研究。利用相應(yīng)的專門用途語言文本可以建立專門用途語料庫(Corpora for Special Purpose),通過專門用途語料庫可以對(duì)這些專門用途語言的特點(diǎn)進(jìn)行探索,找到這些專門用途語言的規(guī)律,為專門用途語言的教學(xué)、學(xué)習(xí)和科學(xué)研究服務(wù)。
[1]McEnery T,Wilson A.Corpus Linguistics[M].Edinburgh:Edinburgh University press,2001.
[2]崔艷嫣,黃瑞紅.語料庫語言學(xué)研究方法之哲學(xué)思考[J].云南師范大學(xué)學(xué)報(bào),2010(4):1 -4.
[3]Renouf A.Corpus Linguistics past and Present[C]//衛(wèi)乃興,等.語料庫應(yīng)用研究.上海:上海外語教學(xué)出版社,2005:1-5.
[4]Aarts B.Corpus linguistics,Chomsky and fuzzy tree fragment[C]//Mair C M.Hundt Corpus Lingustics and Linguistics Theory.Amsterdam:Rodopi,2001:5 -13.
[5]Teubert W.Writing hermeneutics and corpus linguistics[C]//Teubert W,Krishnanurthy R.Corpus Linguistics Critical concept in Linguistics.London and New York Routledge,2007:134 -159.
[6]Tognini-Bonelli E.Corpus Linguistics at work[M].Amsterdam and Philadelphia:John Benjamins Publishing Company,2001.
[7]衛(wèi)耐興.語料庫語言學(xué)的方法論及相關(guān)理念[J].外語研究,2009(5):36-42.
[8]李文中.語料庫語言學(xué)的研究視野[J].解放軍外國(guó)語學(xué)院學(xué)報(bào),2010(2):37 -40.
[9]梁茂成.語料庫語言學(xué)研究的兩種范式:淵源、分歧及前景[J].外語教學(xué)與研究,2012(3):323-335.
[10]衛(wèi)乃興.語料庫語言學(xué)的弗斯學(xué)說基礎(chǔ)[J].外國(guó)語,2008(3):23-32.
[11]Chomsky N.Aspects of the theory of Syntax[M].Cambridge:MIT,1965,20.
[12]陳勇.論經(jīng)驗(yàn)主義和理性主義之爭(zhēng)——關(guān)于西方語言學(xué)研究中的認(rèn)知論[J].外語學(xué)刊,2003(3):57-62.
[13]馮志偉.論語言學(xué)研究中的戰(zhàn)略轉(zhuǎn)移[J].現(xiàn)代外語,2011(1):1-10.
[14]梁茂成.理性主義、經(jīng)驗(yàn)主義與語料庫語言學(xué)[J].中國(guó)外語,2010(4):91-95.
[15]McEnery T,Hardie A.Corpus Linguistics:Method,Theory and Practice[M].Cambridge:CUP,2012:122 -143.
[16]Firth J R.Papers in Linguistics:1934 -1951[C].London:OUP,1957 .
[17]Teubert W.Corpus linguistics-A partisan view[J].TELRI Newsletter,1999(8):4 -19.
[18]Teubert W.My version of corpus linguistics[J].International Journal of Corpus Linguistics,2005,10(1):1 -14.
[19]鐘蘭鳳,張王璘.基于語料庫的漢英詞典研編面臨的挑戰(zhàn)及對(duì)策研究[J].江蘇大學(xué)學(xué)報(bào):社會(huì)科學(xué)版,2012(2):62-66.
重慶理工大學(xué)學(xué)報(bào)(社會(huì)科學(xué))2014年7期