摘要:本文介紹了語料庫在現代語言測試中的四個重要應用,著重分析了語料庫在語言測試中的應用現狀,展望了語料庫在語言測試中的應用發展趨勢和前景,并指出了其存在的一些局限性,以期對語言教學具有一定啟發。
關鍵詞:應用 語料庫 現代語言測試 趨勢
1、引言
現代語言測試伴隨著語言教學出現,到今天已成為一門有自己的研究領域和研究方法的獨立學科。它從語言學、語言教學法和學習論取得科學內容,從心理測量學獲得科學手段。隨著語料庫的建設手段不斷向現代化和自動化發展,語料庫在應用語言學領域已經開始影響語言教學工具、中介語研究和學習者讀寫能力的發展。語言測試、詞典編篡、人工智能等領域對語料庫的應用稍晚于語言教學和研究對語料庫的應用。近十年來,對語料庫在語言測試中的應用開始有人研究,但有人認為語料庫未給語言測試帶來解決方法,且目前語料庫也未對任何語言測試理論問題起到啟發作用。筆者在文中介紹了語料庫在現代語言測試中的應用,說明未來使用語料庫進行語言測試的可能性與方法,提出了對于這種應用所衍生出來的有關研究和發展的可行方法,這將對更好地進行語青教學具有一定啟發。
2、語料庫在現代語言測試中的應用
20世紀90年代,語料庫在語言測試中的應用才受到關注。Alderson(1996)首先大膽構想了語料庫在語言測試開發、選材、編寫、評分等各階段中的潛能。在隨后的十年里,英國和美國的一些語言能力評估機構都在積極嘗試語料庫在語言測試中的應用。在我國,曾用此(見楊惠中等,2005)設計出基于語料庫的中國學生英語詞匯能力診斷測試系統。語料庫在語言測試中的應用包括測試開發、自動評分系統的研制、評分量表的制定和考試大綱中詞匯表的制訂四個方面。
2.1 測試開發
語料庫在測試開發的各階段都發揮著較大作用,尤其在試題選材、編寫和校對方面。在出題過程中,命題人員可一邊通過檢索按選材來源、體裁、社會語言變體、時間或難度等參數標注過的本族語語料庫快速、便捷地查找出試題所需要的真實素材,一邊通過與本族語語料庫的比較,驗證新編制試題材料的代表性和真實性。學習者語料庫尤其是賦碼過的語料庫能幫助命題人員了解學習者在外語學習過程中的難點、歷年考點的分布等信息。語料庫在這方面逐漸成為試題開發和編寫人員的得力助手和參考工具,為試題校正工作提供了實證基礎。
2.2 自動評分系統的研制
現階段自動評分系統主要應用在寫作部分。目前常用的自動評分技術還有文本范疇技術、潛在語義分析技術和多層面語言特點識別技術。雖然以上四種技術各有特點,但它們的共同之處是在對已進行過人工評分的大量樣本的分析基礎之上,找出可參照的語言特點(如句子結構、篇章結構、寫作內容等參數),然后對其它作文評分。語料庫也在評分員培訓、評分過程標準化及在較長時間跨度內維持評分標準的一致性和調查語言測試中的偏差性等方面都提供了重要信息。
2.3 評分量表的制定
評分量表是對語言使用者運用語言能力的一系列描述。通常每個量表由低到高分成幾個不同等級,分別描述語言能力發展的不同階段。在口語或寫作等主觀性較強的考試中,評分量表是評分員對考生語言行為表現評分的主要參考依據。好的評分量表不僅可以反映出不同語言水平考生的典型語言特征,而且具有良好的區分度和可操作性,是提高評分員之間信度的重要保證。無論是在寫作或口語評分量表的制定中,語料庫都發揮了很大的作用,彌補了傳統量表的不足。使評分量表具有更強的真實性、客觀性、可靠性和概括性。
2.4 考試大綱中詞匯表的制訂
考試大綱中的詞匯表可以指導試題編寫人員在出題過程中了解可用范圍內的詞匯和超出考試大綱的詞匯。語料庫應用于現代語言測試領域之前,專家們一般根據自己的知識和經驗來制訂詞匯表,這就帶有較大的主觀性和隨意性。語料庫的出現解決了這個問題。根據本族語語料庫和學習者語料庫,測試專家可制定出客觀、可靠的詞匯表。
3、語料庫在語言測試中的應用趨勢和前景
未來幾年里語料庫在研發和完善自動評分系統和剽竊識別系統兩個領域的運用還將進一步發展。前文提到的作文自動評分技術仍停留在對語言表層特點的分析,而口語自動評分系統還在研制中。只有找出代表寫作和口語能力的典型特點以及不同水平組考生的區別性特征,自動評分系統才能更準確、客觀、公正地反映考生的真實水平。剽竊識別軟件已在國際考試中心得到應用,它的工作原理是將考生的文本與語料庫中的文本進行詞頻、關鍵詞、句子和篇章結構等方面對比,找出相似程度。若相似度超過一個指定數值,則考生的作文有抄襲之嫌疑,然后由專家進行鑒定分析,最后得出定論。語料庫在現代語言測試領域的研究考生寫作和口語能力發展,了解考生答題策略,生成新的題型,調查語言變體等方面有著廣闊的應用前景。
4、結語
語料庫提供的信息可使試題的內容更真實、準確和更具代表性,使評分量表更客觀、可靠和更具概括性。通過語料庫生成試題既能節約教師的時間,提高工作效率,也能讓學習者進行自評,提高學習效率。但是語料庫是創新產物。在利用它時會有一些局限性。不論是外在方面還是語料庫本身都存在缺陷,如果描寫語料庫特點的信息不夠完善,就需補充。另外試題內容和方法特點的細微判別是非常費時和困難的,而機器操縱不可能得到細致特點化的語料庫。另外,某些情況下,語料庫并不能標注所有語言特點。所有這些還需語料庫語言學的進一步發展。我國的語言測試研究者應認識到語料庫在語言測試中的潛力和局限性,并積極運用這一強大的工具改進和完善我國的語言測試。