【摘要】具有實證研究意義的語料庫語言學是近年的研究熱點,三語背景的新疆少數民族學生在英語學習方面具有不同于二語學習者的語言輸出,因而建立新疆少數民族語料庫具有一定的理論和實際意義。本文淺議了新疆少數民族語料庫建庫意義、建庫內容設計以及存在的問難,對新疆少數民族英語學習者語料庫建設進行了探索。
【關鍵詞】新疆少數民族;英語;語料庫
【作者簡介】于慶玲(1988.11-),女,漢族,新疆烏魯木齊人,新疆醫科大學語言文化學院,講師,文學碩士,研究方向:英語語言學。
語料庫語言學是基于大量真實的語言數據,以語料庫為基礎的語言研究方法,主要通過概率統計的方法得出結論,因而具有實證研究的意義。建立大型筆語語料庫并基于語料庫開展語言研究是近年國內外語言教學界研究的新趨勢。已建立起的種類繁多的英語學習者語料庫對二語習得研究起了極大的作用。但是,新疆少數民族學生三語背景下的英語學習不同于內地學生,建立新疆少數民族大學生英語中介語語料庫有著重要意義。
在英語教學界,針對新疆維吾爾自治區少數民族學生英語教學,有關語言習得的研究大多數依然是經驗型的,僅靠例舉少量零散的筆語語料或一次性小規模抽樣,得到的是不夠系統的、缺乏說服力的定性結果。因此,需要研究者采用更科學的方法深入研究英語學習現狀,探索有效的教學方法。目前新疆各本科院校學生英語教學在課程設置、教材選用、教學目標等方面各有不同,少數民族學生的英語習得存在一定問題,因而研究者可通過語料庫研究新疆外語教育現狀,結合學生實際情況對新疆外語教學進行規劃。新疆普通中小學采用維、漢、哈、柯、蒙、錫、俄7種語言進行教學,學生語言背景復雜,不能生搬硬套內地學生的方案。因此建立具有一定規模的少數民族英語學習者筆語語料庫并在此基礎上開展針對大規模語料的系統性研究就顯得十分必要和迫切。
1.建庫意義。
(1)豐富中國少數民族學生語言研究理論。國外的英語學習者語料庫不能直接被用來研究中國英語學習者的學習特點,同樣,國內現有的英語學習者語料庫也難以揭示三語背景的新疆少數民族英語學習者的學習特點和存在的問題。語料庫研究將語料庫和新疆少數民族學生進行銜接,促進了新疆外語教育的研究,形成“一帶一路”戰略背景下的學術理論。
(2)提供詳實的少數民族英語學習研究材料。為研究新疆少數民族大學生英語學習情況提供真實、可靠、豐富的中介語語料,從而推動少數民族英語學習的研究。
(3)提供科學定量的研究方法。對大量的學習者語言進行量化分析,能深化人們對語言學習機制的理解,乃至對語言本身的理解提供依據。語料庫詞表的建立方便詞素、單詞、短語、搭配、結構和句式的語言形式檢索,用一個相對客觀的標準判斷和分析語言現象,通過科學定量的方法研究語料庫,在英語學習過程中起到旁觀者和批判者的角色。
(4)改進英語教學。為深入研究學習者的詞匯、語法、語篇、語用、交際能力的發展提供了充分的數據,而且還為研究學習過程、自主性學習以及大綱制定、教材編寫、語言測試提供重要的反饋和支持。此外,針對新疆少數民族英語學習者語料庫的開發,目的性強,操作靈活,旨在解決給定的語言學習與教學環境中的實際難題:如教材、課堂教學、口語、寫作、閱讀、聽力等,具有更強的針對性和功能性。
(5)填補新疆中介語語料庫建設的不足。近年來,隨著科學技術水平的發展提高,中介語語料庫的建設逐漸成為了熱點。而新疆目前在中介語語料庫建設方面還處于空缺狀態。
(6)“一帶一路”戰略背景下語言學習需求。新疆維吾爾自治區與周邊8國接壤,少數民族文化與“一帶一路”背景下的現代化與全球現代化是一體的,在日益頻繁的國際交流中,英語作為通用語成為各國交流的語言選擇。中亞五國的哈、吉、塔、烏四國語言在新疆有跨境語言的特點,這些語言兼具外國語和新疆少數民族語的雙重屬性,少數民族學生學習這些語言具有不可比擬的優勢,使其在“一帶一路”建設過程中成為重要人才儲備。然而,他們的英語學習存在較多問題,“一帶一路”戰略對他們提出了更高的語言要求,因而基于大量語料的客觀分析緊密貼合時代需求。
2.建庫內容。可建設一個以少數民族本科生為對象的英語筆語中介語語料庫并開展統計分析。以新疆大學、石河子大學、新疆師范大學、新疆農業大學、新疆醫科大學和新疆財經大學等六所本科高校的在校少數民族大學生,包括民考民、民考漢和雙語生為調查對象,語料采集涵蓋性別、族別、母語背景、英語學習的時間、所學的主要英語教材等。六所高校為新疆主要本科院校,能夠反映該區少數民族學生的英語學習現狀。
參照中國學習者英語語料庫的建庫標準和新疆師范大學熊杰和李嘉東(2009)提出的建庫設計,結合新疆醫科大學英語教研室建設的“校級少數民族大學生英語中介語語料庫”建庫經驗,可建立新疆高校少數民族大學生英語筆語中介語語料庫。根據語料來源的不同,將語料庫分為兩部分,即“民考漢學生筆語中介語語料庫”和“民考民、雙語學生筆語中介語語料庫”。建立一個為英語的第二語言教學研究、語言測試、教材編寫和大綱制定等服務的專用型語料庫,其基本特征將是:語料樣本多、涵蓋不同英語水平、語言背景的語料、信息完備、標注內容全面、標注質量優良、檢索方便,能反映學生英語概貌和學生在本科階段英語學習的過程,可以滿足英語教學和研究、教材編寫等眾多需求。
(1)語料標注規范。蘭卡斯特大學計算機語料庫研究中心(University Centre for Computer Research on Language)研制并開發的CLAWS4詞性賦碼器,對英語書面語自動詞性賦碼的準確率達到了96%—97%,有時達到98%以上。語料庫的建立可使用CLAWS4進行詞性賦碼,選用C5第五代賦碼集。
(2)語料檢索系統。運用日本早稻田大學LaurenceAnthony 創立的AntCon3.5.0進行數據統計分析。
(3)數據統計分析。
1)統計形符類符比。待語料庫建成之后,用檢索軟件進行類符/形符比統計,計算出標準化類符/形符比。
2)生成單字和N字語詞頻表。通過詞匯頻數及其頻率來分析少數民族大學英語的使用情況,從而確定教學重點和語言項目的教學次序。
3)生成詞簇表。詞簇表可以用以研究少數民族大學生的詞簇使用和他們的語言水平之間的關系。
4)提取關鍵詞表。語料庫建成后,通過目標語料庫和中國學習者英語語料庫、BNC語料庫對比提取關鍵詞表,找出超用詞、少用詞和常用詞。
雖然語料庫建設具有重要意義,筆者也對建庫內容提出了總體方案,但是少數民族語料庫的建設研究依然面臨一定的困難。首先是文本電子化的任務重。為了保證千余份文本轉化的質量,成員需相對固定,提高錄入要求和統一錄入標準。其次,在語料收集的過程中,如何避免學習者采取回避策略是研究的難點。尤其是民考民和雙語生同學,他們的英語水平較之民考漢學生存在一定的差距,要寫出一篇符合規定的作文需要相應的注意力和投入。為了解決這一問題,研究者可提前與各校相關老師溝通,通過課程任課教師對學生的寫作情況進行實時監督和反饋,以期收集符合要求的文本。此外,新疆多民族地區外語教育具有地域性、復雜性和多樣性的特點。制定適合少數民族學生外語學習的課程標準,提供相應的課程資源都是語料庫研究的難點。
參考文獻:
[1]梁茂成,李文中,許家金.語料庫應用教程[M].北京:外語教學與研究出版社,2010.
[2]梁茂成.微型文本及其在外語教學中的應用[J].外語電化教學, 2009,3.
[3]梁茂成.語料庫語言學團隊建設與學術交流[J].外語教學與研究, 2012,3.
[4]熊杰,李嘉東.建立維吾爾族民考民大學生英語筆語語料庫的設想[J].烏魯木齊職業大學學報,2009:89-91.