劉倬妤
(天津外國語大學濱海外事學院,天津 300204)
語料庫(corpus lingüístico)是一個在真實情況下生成的大量具有代表性的文本,經過明確的語言標準篩選后,由計算機進行數據處理的資料庫。語料庫的使用由來已久,可以追溯到19 世紀末,ALF(Atlas Linguistique de la France)率先以數據為依托,對法國境內的語言使用情況進行全面細致的分析,西班牙對于語料庫的建立始于1931年[1]。但這段時期建立的語料庫,都是人工進行數據處理分析,我們稱之為傳統語料庫。廣義上來說,我國傳統意義上的語料庫的建立可以追溯到周代、秦代——《輶軒使者絕代語釋別國方言》。近現代第一部教學目的而創立的語料庫則誕生于1928年陳鶴琴《語體文應用字匯》。自從M.Baker 將語料庫引入翻譯研究,語料庫就廣泛應用于詞典編撰、語法描述、二語習得、文學研究及翻譯研究等領域;相對于西方,我國的語料庫語言學研究起步較晚,始于80年代上海交通大學科技英語計算機語料庫——JDEST。目前,針對西班牙語研究最著名的語料庫是由西班牙皇家語言學院在1975年創建的CREA[2](El corpus de Referencia del Espa ?ol Actual)語料庫,由寫作語料庫和口語語料庫兩個部分組成。目前,西班牙很多高校已經開始組建針對不同研究方向的語料庫,例如:圣地亞哥德孔波大學(Universidad de Santiago de Compostela)建立了口語語料庫,旨在研究第二外語學生與本國學生在口語表達的差異,以及對詞匯的使用習慣和母語對西班牙語學習的影響。該文使用的語料庫為CINEAS[3](Corpus de Interlengua Espa?ola de Aprendices Sinohablantes) 由西班牙萊里達大學LECEL (Lenguas en contacto y Ense?anza de lenguas)團隊創立,旨在通過對語料庫中的大量文本數據進行分析,找出中國學生在西班牙語學習過程中的難點、疑點,從而幫助教師了解學生對知識的掌握情況,在今后的教學中優化教學方法、提高教學效率。截止到2019年10月底,CINEAS 數據庫共收錄了2 598 篇文本,共計286 112個單詞(數量仍在持續增加中)。依據MECR (歐洲語言共同體框架)[4],分為A1、A2、B1、B2 4個等級。
從外語教學的起步到20 世紀中葉,教師和學生一直通過“文法翻譯法”來進行語言的傳授和學習,但是通過這種方法,學生并不能準確的使用和掌握這門語言。教學的目的不僅是獲得語法知識,而是通過學習能對語言進行靈活的運用和表達。直到20 世紀60年代末,世界上的外語教學領域開始研究語法和語言學習的關系,并認為教學的目的在于提高學生的交際能力,開始了從語法知識向語言技能傳授的轉變。因此可以通過聽、讀、說、寫4 種方式來鑒別語言的能力。我們也可以將其分為兩大類,接受能力(聽、讀)和輸出能力(說、寫)。當然,語法也十分重要,對于文本的生成和理解都至關重要。研究表明,接受過系統教育的學習者比自學者的語法能力更強,但是教師的指導并不能保證學生能夠掌握所有的知識,結果表明受到過教育的學習者會比自學者進步更快,能力更強,水平更高。CINEAS 語料庫中的文本,都是學生對于自己知識掌握的輸出,有助于研究者準確地掌握第一手資料[5]。
西班牙語中詞語的類型和變化種類繁多,雖然西班牙語中副詞數量十分巨大,出現的頻率也很高,但是由于它在使用過程中的不需要發生變化,會忽略對它的研究。因此如今國內學界有關西班牙語副詞研究并不深入;此外,教材中對于副詞的用法的講解也是簡略且分散的,不利于學生系統性的掌握副詞的用法和特點。在西班牙語中副詞的用法大致分為3 類:(1)與動詞連用做景況補語;(2)修飾形容詞或副詞;(3)修飾整個句子。西班牙語副詞的3個特點:(1)都有重音(除tan 和連接詞donde,cuando,como,cuanto,cual 以外);(2)無詞形的變化;(3)有自己獨特的含義。
相較于西班牙語來說,漢語中副詞的用法則更為靈活。漢語中副詞可以修飾名詞,但是這種現象在西班牙語中是不存在的,所以學生在使用習得語言的過程中,或多或少會受到母語的影響[6]。在漢語中將副詞定義為修飾、限定動詞或形容詞,表示程度、范圍、時間、情態、語氣等的詞。漢語中副詞的語法特征:(1)副詞都能作狀語;(2)副詞一般不能單獨使用;(3)部分副詞能兼有關聯作用。副詞的作用在西班牙語和漢語中類似,但是從數量上來說,西班牙語中副詞數量更多。從使用方法看,兩者基本一致,但是略有不同:(1)西班牙語少量副詞可以修飾名詞(如副詞NO:la no resistencia,la no intervención);(2)西班牙語中副詞可以修飾副詞;(3)漢語副詞一般不受其他詞類修飾,也不同介詞結合;(4)漢語絕大多數副詞只能作狀語,只有個別程度副詞可作補語。西班牙語副詞主要充當景況補語、形容詞補語和副詞補語。綜上所述,二者之間還是存在差別,在一定程度上會影響到學生的語言學習[7]。此外,在同樣含義的詞語,在漢西兩種語言中的詞性不同,漢語中用名詞表示時間,西語則用副詞; 漢語中的表示時間、地點、方式等的代詞,在西語中也被看作副詞。在副詞的分類中,漢語中主要按照其功能進行劃分,目前影響比較大的是胡裕樹(1979)、黃伯榮、廖序東(1991)、北大中文系(1991),將漢語的副詞分為6類。西班牙語中副詞的分類更加復雜,西班牙皇家語言學院(2009)提出4 種分類方法,分別為形態結構(estructura morfológica)、含義(significado)、語法功能(naturaleza gramatical) 和句法的關聯性(incidencia sintáctica?)。
該次研究以語言等級為準,隨機抽取CINEAS數據庫中的樣本,每個等級120 份,共計480 份。在隨機抽取的480 份樣本中,共出現了245個副詞和副詞短語,其中A1:83,A2:52,B1:50,B2:60 (以單詞或短語第一次出現的等級為準)。其中出現頻率最高的10個單詞和短語 (見表1),由此我們可以看出,muy 出現次數最多為592 次,每位學生平均使用1.23 次,前10 名中只出現了一個短語por eso。連接詞的使用頻率也很高,分別是第三名的cuando 和第五名的como,說明學生會經常使用時間狀語從句和方式狀語從句[8]。

表1 CINEAS 數據庫副詞高頻詞匯表
下面我們以también 為例,在全部的480 份問卷中,該詞共出現156 次(見圖1)。通過分析可以得出結論,también 是A1 級的詞匯,但是B1 級別的同學卻使用的最多,幾乎占到了一半,根據此線索,教師可以進行分析產生這種現象的原因,掌握學生對詞語的使用習慣[9]。此外我們還可以進行近義詞比較,我們可以比較también 與其近義詞igualmente,además ,incluso 和aun 出現的頻率(見圖2):5個近義詞中,además 和también 從A1—B2 均有使用,頻率也最高,其中B1 使用次數最多;aun 和incluso 首次出現于A2,但是aun 總共出現了兩次,A2,B1 每個級別一次,但是incluso 則出現在了A2—B2 的各個級別,而且出現次數呈上升的趨勢;Igualmente 只在B1 出現了一次。了解學生的詞語使用習慣,有助于優化表達方式,盡量避免詞匯的重復,從語料庫中發現問題找出更合適的表達方式,區分詞語的典型用法和非典型用法,從而提高寫作的質量[10]。

圖1 También 出現次數變化圖

圖2 CINEAS 數據庫副詞近義詞出現次數對比圖(以También 為例)
此外,我們還可以通過語料庫進行錯誤分析,首先找出錯誤進行標記,檢索錯誤出現的次數,進行錯誤分析。分析錯誤的過程需要我們了解學生使用語言的背景,語料庫作為一種工具協助教學,幫助學生通過對比分析,強化語法概念,正確、恰當地使用副詞,提升寫作的流暢度。語料庫不僅能應用于課堂教學,還可以作為語言測試的資料來源,為測試題目的設置提供材料; 此外還可以通過語料庫來比較母語學習者和非母語學習者,或是不同國家的非母語學習者的詞語使用習慣和差別。語料庫依托于現代科學技術來對語言進行對比分析研究,透過科技的便捷性,將研究結果與教學實踐相結合,開辟出一條有別于傳統教學方法的新路子。