劉夢晨
內容摘要:目前,人類在研究語言學相關內容時,大多青睞于使用語料庫。這是因為語料庫應用范圍比較廣泛,它普遍應用于傳統語言、語言教學等的研究,也是在人類研究語言學時總結出的經驗的基礎上誕生而來的,研究結果比較可靠。因此,文章通過人工方式創建一個俄語語料庫,并將該語料庫應用于俄語教學實踐,旨在驗證自建語料庫在俄語教學應用中的成效。
關鍵詞:語料庫 俄語 教學
一、創建語料庫
1.結合教學實際需求針對性的選擇語料
2014年,秦嘉等學者指出,外語教學中的語料來自于教科書,如教科書中的某些文章、某類詞語。通過分析這些文章和詞語,還能知道教科書編排的內容是否符合教學大綱要求。他們首先針對這些網站設計好爬蟲代碼,然后從這些網站的源網頁把文章下載至本機電腦,文章格式另存為記事本(.txt)文檔。
2.語料庫分析工具的選取
本文使用的語料庫分析軟件為wordsmith5.0。該軟件具有以下功能:第一,查找指定語料。第二,以表格形式呈現詞匯表。第三,分類統計關鍵詞。第四,批理處理純文本文檔、網頁文件。通過實踐發現,wordsmith軟件能夠很好的實現對選定語料的分析,是目前應用最普遍的語料分析軟件。
二、自建語料庫應用于俄語教學
1.辨別指定領域的關鍵詞語
如果語料庫包含龐大的詞匯量,則可將語料庫劃分成若干個子語料庫,每個子語料庫里存放指定領域的文章,與總語料庫的詞語相比,這些文章中詞語出現的機率更高。通過使用wordsmith軟件中的keywords工具能夠快速找到指定領域的詞語,然后依據該詞語在總語料庫及子語料庫里出現的機率確定其重要程度,最后生成指定領域的關鍵詞列表。
2.檢索與搭配
在生成了軍事領域的關鍵詞列表后,接下來需要進一步分析該列表中經常使用的詞語和比較重要的詞語,為俄語教學提供便利。首先調用wordsmith軟件的concord工具,設定查詢關鍵字分別為:“учени^、учени^^、учениями。
三、自建語料庫應用于俄語研究
為提高研究結果的可信度,本文選擇的文章來自于俄國比較有公信力的網站,新聞發生時間為2014-2016年,文章涉及的詞匯量達6000萬。
1.俄語高頻詞匯
本文創建的語料庫出現機率最高的詞匯類型主要為虛詞,如前置詞、連接詞,數量大約為30個,這30個詞形主要包括он,от,России,его,РФ,но,года,в,и,на,по、c、до,то,мы,сказал等。從出現的機率來看,在6000萬個詞匯中,в,и,等詞出現的機率為2%,其中。в出現的機率達到了近5%,и出現的機率緊隨其后,排在第二位。
從上面闡述的內容可以得出以下結論:本文創建的基于指定三個領域的語料庫,詞匯出現頻率最高的主要為虛詞,如前置詞、連接詞等,排在第二位的主要為實詞,如名詞及代詞等。常見的詞匯有в,и,на,по等詞,它們在語料庫中出現的機率至少為1%。
2.語法范疇概率
在分析了詞語的各種呈現形式后發現,語法分布機率呈不規則狀態。因此,需要重新找尋統計語法分布機率的方法。本文在統計詞匯語法分布機率時,主要選取某個特定詞語進行分析統計。例如,本文在統計動詞говорить、сказать的各種語法形式在語料庫中出現的次數時,首先在語料庫中的詞匯列表中找到這兩個詞語的過去時、將來時出現的次數,發現將來時出現的次數近5000次,過去時出現的次數高達10萬次,也就是說,這兩個詞語的過去時在語料庫中出現的機率是將來時的25倍。
四、結論
文章創建的語料庫中涉及的詞匯主要指詞形,無論是在分析詞匯出現的頻率還是分析同一詞語以不同語法形式出現的機率時,研究的對象均為詞形。文章接下來的工作是深層次的加工與標示語料庫中的單詞,以便能夠統計出所有單詞及其變化形式在語料庫中出現的機率。結合當前已有的研究技術來看,下一步的主要工作是解決詞形與單詞匹配精確度的問題。
參考文獻
[1]王金花.“一帶一路”背景下大學俄語教學改革探析[J].內蒙古財經大學學報,2016,(06):124-126.
[2]劉鑫.混合式教學模式在俄語教學中的應用[J].黑龍江科學,2016,(24):112-113.
[3]許波.淺談互聯網資源在俄語教學中的應用[J].民營科技,2016,(12):221.
[4]李明宇.中俄合作辦學鐵路專業俄語教學的特點及教學模式初探[J].鄭州鐵路職業技術學院學報,2016,(04):86-88+91.
(作者單位:四川省都江堰市川外成都學院)endprint