哈爾濱師范大學西語學院 欒 曦
語料庫的創建對語言學的研究具有十分重要的作用。不管是語言的基本規則還是多樣性的個體語言,不管是語言的使用還是學習過程,都離不開實際的語言資料,也就是本文研究的主題——語料庫。本為主要研究了小型法語語料庫的創建以及應用。
目前我國對語料庫的研究大都集中在英語學科,而法語語料庫的相關研究非常稀少,更沒有大型法語語料庫的建立。英語語料庫在我國的研究和發展已經比較成熟,而短期內創建大型法語語料庫的條件還不完善。因此,可以首先創建小型的法語語料庫,其創建可以借鑒英語語料庫的一些經驗。
語料的選擇是創建語料庫的第一步,也是最為重要的一步,它包括語料的搜集和篩選,其中搜集的范圍和質量直接決定了所創建的語料庫的類型和質量。因此,在選擇語料時要與研究的目的相匹配。這就是說,在創建語料庫之前就需要決定創建的類型,如英語、法語還是日語等,這是要決定的基本范圍,詳細的還要決定創建的是醫學方面的、教育方面的還是日常生活方面的等,只有把這些確定了,才能在搜集和篩選時有所取舍。此外,選取的語料自身要有代表性,語料庫中選取的內容要能夠最大限度地反映這一語料庫的特點和使用范圍。
原始語料很大一部分是從網絡上下載的,這些文本可能存在不規范的符號、格式等,也可能會帶有多余的空格或空行,是不能直接放進語料庫的,必須對這些原始的語料進行處理,刪除多余的數據,糾正不規范的地方,以防影響今后語料庫調用的準確度。對搜集和篩選到的法語語料進行預處理后,以txt 的格式保存,然后利用專門的軟件對保存到語料庫的內容進行詞性和意思的解釋、標注。對每篇語料都加上文本頭,顯示這篇語料的主題內容、文字來源等信息。
將搜集到的語料進行處理后,要把這些處理完的語料錄入所創建的庫中。在錄入前需要提前創建一套錄入規則,保證語料在錄入時具有規范性。同時還應該使用能夠批量錄入語料庫的軟件,提高效率。將語料全部錄入后,還可以進一步統計分析語料庫中的語料,通過檢索,可以知道高頻詞匯,將所有含有這些詞匯的句子檢索出來,在這些句子里可以總結出該法語詞匯的使用方法和常見搭配。
語言是一個非常復雜的系統,對語言的實際應用比語法系統描述的規則要難很多,因此,只通過學習一門語言的語法規則是很難掌握這門語言的。語料庫中搜集的都是人們實際使用的語言,所以小型法語語料庫創建后,可以對語料庫中的詞匯、語法和話語分析等進行研究,為深入研究法語提供基礎。小型法語語料庫也可以應用到很多方面。
在法語教學中,通過對創建的語料庫進行檢索可得到一些高頻詞匯以及常用搭配,可通過這些常用的詞匯學習近義詞匯的辨析、基本的語法知識等。法語在我國高校中的存在相當于小語種,學習人數相對較少,因此,法語教學還存在很多的問題,教學經驗也很欠缺。語料庫中的索引信息可以幫助教師確定教學的難點和重點,針對學生展開針對性的練習,對于構建多層次的法語互動教學模式有很大的推動作用。
利用小型法語語料庫還可以加強日常生活中與人交流的能力。通常情況下,學習到的法語知識或句子都是比較書面化的,而這些書面化的用語在與人交流時給人一種文縐縐的感覺,讓人產生距離感,不夠親切。而語料庫中收錄的都是使用過的,還有一些本身就是在日常交流中用到的,通過語料庫學習到的日常用語會更加地道,更加適合交流與溝通。
技術的發展和社會的進步對語料庫的創建和發展起到了很大的推動作用,進而推動了語言學的發展和進步。早在20 世紀,語料庫就已經是研究語言的重要工具。近年來,語料庫在外語教學、科研活動和交流溝通中都起到了很大的作用。但是,相較于英語,我國對于法語的研究還很少,而法語語料庫更少,創建小型的法語語料庫對于法語在我國的發展有很大的幫助。