999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

新理念大學英語教材語料庫建設研究

2010-01-01 00:00:00季明雨
社會工作與管理 2010年4期

摘 要:文章對新理念大學英語教材語料庫的背景和項目情況作了概述,對基于教材語料庫已取得的階段性研究成果和重要發現進行總結。指出基于語料庫等網絡多媒體教學資源的學習者自主性學習是二語習得研究的一個新方向,對發現二語學習者的學習規律和特點有重要的方法論和實踐方面的意義。

關鍵詞:大學英語 英語教材 語料庫建設 教材語料庫 第二語言習得 自主性學習

中圖分類號:H319.4 文獻標識碼:A 文章編號:1671-623X(2010)04-0005-03

一、引言

經過半個多世紀的發展,計算機輔助語言研究已經成為第二語言習得研究的一個新方向,對語言學研究的各個方面以及第二語言教學實踐都具有重要的參考價值和指導意義,尤其機讀語料庫的發展更是呈現出大幅的增長。目前語料庫的發展越來越趨大型化,無論是庫容還是電腦檢索、查閱、統計功能都有了顯著的提高。新一代的語料庫,更是由于大多采用了較新的KDEM(Kurzweil Data EntryMachine)光電符號識別技術,使得語料的編碼和編輯不再依靠單純的人工輸入,從而大大加快了語料的標注處理。20世紀90年代后,我國也展開了語料庫的建設與研究工作。建成的語料庫有雙語平行語料庫、專門用途語料庫、學習者語料庫和教材語料庫等,它們都具有三個共同點:第一、建設目的主要用于二語習得研究;第二、語料來源主要源于我國學習者對英語書面語和口語的使用;第三、語料庫語言學的研究與我國外語教學的研究需求密切相關。其中影響最大的是學習者語料庫,到2006年底,已經建成或在建的學習者英語口語語料庫有5個,書面語語料庫14個,如2005年由文秋芳教授主編的“中國學生英語口筆語語料庫(Spoken and Written Cor-pus of Chinese Learners,簡稱SWECCL)”,它們可以很好地幫助英語教師和語言研究者去發現中介語發展的重要規律和特點。相較之學習者語料庫,我國教材語料庫的發展才剛剛起步。目前影響比較大的是由上海交通大學鄭樹棠教授等研制開發,規模達到150萬字的《新視野大學英語》語料庫,以及廣東中醫藥大學薜學彥老師建立的COLEN語料庫。前者是為了編寫《新視野大學英語》教材而專門建立的語料庫,后者則包含《21st Century College Eng,1ish》,《College English》,《Complete New CollegeEnglish》,《New College English》等四套教材。語料庫的有效利用離不開配套的檢索軟件,這對于缺乏相關軟件應用知識的普通英語教師和英語學習者來說構成了一個很難跨越的障礙,使他們無法在教學工作或是日常學習中有效地利用語料庫來豐富教學資源或是指導自主性學習。而即使掌握了基本的語料檢索方法,也會在應用過程中感受到它的局限性,例如:檢索結果有時可能沒有包括檢索者所感興趣的條目,有時卻又顯示檢索者不需要的條目或信息;其次,從檢索結果中獲取的知識并不總是和所付出的時間成正比;第三,檢索的結果只提供包含檢索關鍵詞的上下文,需要檢索者自己去檢索、分析和總結。這些使得那些英語水平相對較弱,或缺乏一定觀察、分析和總結技巧的學生,很難真正獲益。同時,如果檢索的內容與學生興趣或學生關注無關,或是教師設計的練習活動只是純粹單一的分析檢索結果,就很難真正激發學生的積極性。英語教師在使用語料庫進行教學活動時,根據不同的教學目的、學生的知識水平及需求進行精心的設計,就可以克服上述的語料庫檢索的局限,獲得理想的教學效果。正是在這一背景下,2007年我院與上海外語教育出版社開展了合作開發新理念大學英語教材語料庫的工作,本文將對該語料庫的性質、特點和功用作一個評述和展望。

二、新理念大學英語教材語料庫項目概述

新理念大學英語教材語料庫收納了由上海外語教育出版社出版的(全新版)大學英語系列教材17本,設計總規模74萬詞,其中綜合教程6本,共計13萬詞;閱讀教程11本,總計61萬詞。本教材語料庫除了包括加了標注的文本文件之外,還將語料檢索需要的軟件進行整合,結合教師的日常教學備課需求和學生的自主學習需要,建立一個用戶平臺。本項目由上海外語教育出版社資助,建成后將填補國內語料庫建設在這一方面的空白。在教師和學生中普及語料庫知識,可以有效地推動我國的英語教學與研究,對英語教材評估、英語測試、網絡課程的建設等具有重大的價值與意義。

1.新理念教材語料庫的規模

本語料庫將對收集入庫的語料進行詞性、語法、篇章三級標注。建立一個大規模具有統一標準和規范的、多領域、多體裁、具有豐富語言信息和語言使用范例的知識庫。具體研究步驟包括:第一,對教材的綜合教程和閱讀教程進行校對等必要的預處理;第二,使用PosTagger對校對后的文本進行詞性賦碼,并對賦碼后的文本進行第二次校對;第三,在詞性賦碼的基礎上對文本進行人工語法標注,并在標注完成后進行第三次校對;第四,在經過詞性和語法賦碼的文本中加入篇章標注碼,方便學生在日后語料庫的使用過程中進行針對文體篇章特征的學習。

針對日常課堂教學和學生自主學習的教材語料庫可以有以下幾方面的應用:第一,作為重要的語言資源,為基于統計的各種英語語言建模、分析提供必要的訓練數據;第二,可以為教師備課、授課和學生自主學習提供語言信息檢索、抽取詞對、短語對提供真實文本標注素材。豐富學生課堂、課后語言訓練素材,為課堂實時教學提供延展空間。

2.新理念教材語料庫建設方案

語料庫的建設工作將分為兩個階段進行。第一階段將由項目組完成對所有語料的編輯、標注和校對工作。第二階段中我們將已經完成標注的語料交給計算機軟件技術人員設計制作用戶界面并制成光盤。整個建庫流程大致如圖1所示。

建庫工作的核心部分是對語料的深加工和處理。語料在經過前期的編輯和校對后,才能入庫。語料在入庫前要經過6個加工步驟。首先,我們在教師和學生中分別進行需求分析,以便準確定位語料庫的功能;其次,對語料錄入和編輯;第三,我們組織教師對語料進行第一次校對;第四,對校對后的語料進行抽檢;第五,對語料進行機器標注,加詞性賦碼;第六,對語料進行手工標注;第七,組織第二次校對,整理語料入庫。

語料入庫后,為了方便終端用戶使用該語料庫,需要將全部的電子語料和相關語料庫檢索軟件整合成一個由五個模塊構成的用戶平臺,各模塊的具體內容如圖2所示。

語料庫前三個階段的標注工作都是為了使最后的用戶平臺具備強大的檢索服務功能。語料庫的用戶可以使用針對性的語料庫檢索軟件來滿足自己的要求。具體說有兩大類,即教師備課和學生自主學習。在語料庫的幫助下,學生可以進行形式多樣的自主學習活動,教師也可以最大限度的利用書面的語言材料,豐富自己的課堂教學。用戶可以通過語料庫平臺實現以下幾種具體功能:

第一,對語料進行關鍵詞檢索(KwIC)。詞語索引是數據驅動學習的常用手段。使用者只要輸入關鍵詞,軟件就會自動檢索語料庫,為每一個搜索到的關鍵詞提供所在行固定數量的語境詞,并以該關鍵詞為中心在屏幕上顯示出來。

第二,對特定詞匯的搭配知識進行學習。詞匯搭配是指兩個或兩個以上的詞在文本中短距離內的共現。對詞匯的搭配進行分析不僅對確立句法結構關系起著一定的制約作用,而且是意義實現以及消除歧義的基本依據。

第三,類聯接研究。類聯接是詞語搭配發生于其中的語法結構和框架。通過類聯接,我們可以發現詞匯的語法模式。因為單詞因意義不同而具有不同的語法型式,而相同語法型式下的不同單詞具有某種意義上的聯系。

第四,主題詞研究。主題詞是語料庫研究常用的文本分析手段。主題詞是指與某一標準相比,在一定文本中出現頻率顯著偏高的詞,偏高的程度為主題詞的“關鍵性”。主題詞與文本的主題密切相關。

第五,擴展語境。語義是詞匯在語境中的功能表現。詞匯因搭配和語法模式的不同而具有不同的語義和語用。在具體的語境中,語用目的使詞項顯示強烈的語義選擇趨向;語義選擇趨向有力地制約著詞項在語境內搭配詞的使用。

第六,句式檢索。經過手工語法標注后的電子文本,可以按使用者的要求,對大學英語教學大綱范圍內的一些特殊的句式以及含有從句的復雜句進行歸類檢索,幫助學習者理解、掌握課本中的長難句。

第七,語法項檢索。學生在對課文進行學習的過程中,常常會對某些語法現象感到困惑。而語法在具體語境中的表現形式,有時因表情達意的不同,又呈現出不同的形式。對教材中的語法現象進行匯總、歸類、標注,可以使學生自主學習成為可能。

三、語料的加工及標注規范

加了詞匯和語法標注的語料庫對自然語言研究具有重要的意義。加了詞類附碼的語料庫(taggedcorpus)是指對每一個詞都加了詞類標記的文章庫。詞類標記軟件稱為詞類附碼器。對單詞的詞性進行標記可以被看作是標記語法的一個階段。它成為一系列其它任務的基礎。它是句法附碼的預備階段,可以作為辨認詞組形式的基礎,以及用于言語識別、信息提取和詞典學研究(1exicography)等。詞類附碼能幫助從文本中提取信息,而對文本含義的解釋并無直接影響。它所提供的信息在詞匯學中有重要用途。因為詞類與詞義常常是聯系的;同時詞類標記軟件能提供統計信息,有助于對文本進行分類。

1.自動詞類附碼系統(Taggers)

詞類附碼器(Taggers)是給文本中的詞形指定出--詞類的計算機程序。評估+詞類附碼器的優劣,主要看它處理已知和未知詞的能力,通過訓練提高效率,達到正確標注詞類的能力。目前比較著名的語料庫,比如LOB,Brown,SEU,SEE,ICE—GB等,都已經做了詞類附碼,擴大了這些語料庫的用途。

本次研究所使用的自動詞類附碼軟件為Go-Tagger,該軟件共使用了48個詞類附碼,對電子文本進行詞性的標注。

2.語料的手工語法標注

在大學英語學習階段,語法已經不是教師課堂教學的重點,而主要依靠學生進行自主的學習與練習,這一點只能通過對教材語料進行語法標注來實現。語法標注軟件目前尚不成熟,主要通過人工操作完成。我們為大學英語課程大綱要求掌握的語法項目設計了語法賦碼,包括了英語的16種時態、六種句型結構、五類從句,被動語態和三類虛擬語氣。標注碼使用英語縮略符號,例如,用[spat]代表一般過去時,用[com,s]代表復合句,用[pasv]代表被動語態等。

3.語料的人工語篇標注

教學語篇中的語言單位除了賦有命題意義或語義意義外,有的只是為話語理解提供信息標記,進而對話語理解進行引導作用的程序性意義。這部分詞句不僅僅具有形式上的特點與功能,更重要的是它們是話語信息組織中的一部分。它們叫作話語標記語。話語標記語的存在將在整體上對篇章的理解產生影響。從銜接的角度,話語標記語可分為:a.連詞;b.部分副詞;c.部分介詞;d.具有插入語性質的一些詞語;e.部分固定的習語或句型。話語標記語在語篇中不直接表達命題內容,而只具有語篇連貫上、和語用上的功能。在大學英語教學中對話語標記的講解是十分必要的,特別是針對口語、聽力、和寫作等科目的學習。通過對語料中的話語標記語進行標注,可以幫助教師和學習者對這些標記語常出現的位置、語用功能及其語篇連貫功能進行講解和自主學習,進而可以了解一些英語使用上的特點,縮小課堂教學與實際英語使用之間的差距。我們對話語標記語在語篇中出現的位置(句首、句子之間,句末或獨立成句)及其語篇連貫關系(如:強調、提示解釋、引導話題等)進行了標注。

四、結束語

新理念大學英語語料庫的建立將會極大方便目前的大學英語課堂教學實踐。通過對紛繁的語言材料進行專業的加工,并將之放在一個用戶友好的平臺上,我們將能幫助不同英語水平層次的學習者平等地站在同一起跑線上。該語料庫也能作為網絡教學的一個輔助部分,幫助學生在進行自主學習時,能更方便、有效地對目的語進行學習,更全面詳細地掌握目的語的知識;而在傳統的學習方式下,學生們只能掌握某個詞在某個語境下的某種詞義或是某種搭配。同時,在教師進行課堂教學時,可以在授課時將目的詞匯所有相關的用法、意義和搭配同時展現給學生看,藉此在學生的腦海中建立這個單詞的關聯網絡。

主站蜘蛛池模板: 国产交换配偶在线视频| 国产一区成人| 久久婷婷五月综合97色| 欧美性爱精品一区二区三区 | 免费欧美一级| 丁香六月激情综合| 免费aa毛片| 国产成人成人一区二区| 亚洲欧洲免费视频| 亚洲高清日韩heyzo| 99久久国产综合精品2020| 国产精品嫩草影院视频| 国产精品无码AV片在线观看播放| 久久精品中文字幕免费| 免费A∨中文乱码专区| 成年人视频一区二区| 国产97视频在线| 91亚洲国产视频| 91福利免费视频| 午夜国产小视频| YW尤物AV无码国产在线观看| 97视频在线精品国自产拍| 国内黄色精品| 亚洲精品大秀视频| 尤物国产在线| 国产极品美女在线观看| 亚洲人成在线精品| 国产美女视频黄a视频全免费网站| 国产99在线| 国产区网址| 亚洲天堂在线视频| 亚洲天堂2014| 91亚洲免费视频| 香蕉久人久人青草青草| 2020国产在线视精品在| 亚洲一级毛片在线观播放| 亚洲精品第一在线观看视频| 亚洲视频影院| 精品综合久久久久久97超人| 国产激情第一页| 99性视频| 国产不卡网| 日本午夜影院| 欧美综合中文字幕久久| 国产免费人成视频网| 国产成人无码AV在线播放动漫 | 欧美在线精品怡红院| 亚洲美女一区二区三区| 国产精品丝袜视频| aaa国产一级毛片| 亚洲无线视频| 3344在线观看无码| 免费激情网址| www.日韩三级| 精品视频91| 波多野结衣的av一区二区三区| 少妇精品在线| 欧美精品不卡| 日韩成人免费网站| 国产一区自拍视频| 久久黄色毛片| 福利在线不卡| 欧美一区二区福利视频| 国产乱子伦无码精品小说| 色噜噜狠狠狠综合曰曰曰| 国产欧美又粗又猛又爽老| 国产在线麻豆波多野结衣| 中国一级特黄视频| 老色鬼欧美精品| 成人午夜视频在线| 欧美劲爆第一页| 国产精品成人免费综合| 亚洲无码高清一区二区| 热思思久久免费视频| 国内精品九九久久久精品| 亚洲天堂.com| 亚洲中久无码永久在线观看软件 | 女人爽到高潮免费视频大全| 国产欧美日韩精品第二区| 色偷偷男人的天堂亚洲av| 99久久国产综合精品2020| 一级毛片a女人刺激视频免费|