999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

建立“語言教材素材庫”的設(shè)想

2008-01-01 00:00:00
現(xiàn)代語文 2008年3期

摘要:語言教材編寫中素材收集的工作量大而繁瑣,本文提出了使用計算機管理素材的設(shè)想。設(shè)計了教材素材庫的基本結(jié)構(gòu),并給出了具體可實現(xiàn)的建議:使用XML文件格式,Oracle或Access數(shù)據(jù)庫來管理素材。

關(guān)鍵詞:語言教材 素材 數(shù)據(jù)庫

一、引言

教材在語言教學(xué)中的的地位很重要,編寫一套優(yōu)秀教材的工作量是非常大的。在教材編寫中要兼顧結(jié)構(gòu)、功能、文化等各種要素。其中,有些工作如收集整理素材比較繁瑣。根據(jù)李泉(2002)統(tǒng)計,“教材的數(shù)量以異乎尋常的速度增長,尤其是20世紀(jì)90年代以來。迄今已有數(shù)百種各類教材問世”,“從1980年算起到2000年近20年的時間,已經(jīng)出版的各類教材應(yīng)該有400~500種。”從教材使用上看,要選擇一本合適的教材是一件十分困難的事,總體上人們對現(xiàn)行教材不滿意的聲音遠高于對教材滿意的聲音”(王金銘2004)。這其中的原因有很多,教材內(nèi)容方面的缺陷是重要的原因之一。孫德坤(1996)指出,教材編寫必須考慮兩個因素:一是內(nèi)容選擇上必須以學(xué)習(xí)者的需求、學(xué)習(xí)者的當(dāng)前水平為依據(jù);二是內(nèi)容的安排必須以學(xué)習(xí)者的學(xué)習(xí)特點、學(xué)習(xí)過程為依據(jù)。另外,傳統(tǒng)的教材編寫周期長,更新慢,難以適應(yīng)時代的需要。如何解決這些問題,我們認(rèn)為需要改進工作方式。以往編寫語言教材,少數(shù)課文由編者直接編寫,多數(shù)課文來自現(xiàn)有的已出版作品。如何在浩如煙海的作品中選擇課文是一件很困難的事情,受制于編者的閱讀量,選擇作品有很大隨機性。我們認(rèn)為使用計算機來管理素材將會是一個有效的解決問題的方法。趙金銘(2004)論述了建設(shè)對外漢語教材素材庫的作用與意義,他指出國內(nèi)已有一些單位開始建設(shè)教材素材庫。但是我們還沒有看到相關(guān)的文獻報告。

二、教材素材庫概述

教材素材庫與為普通語言學(xué)研究而設(shè)計的語料庫不同。素材庫根據(jù)編寫教材的實際需要來設(shè)計,是積累素材和選擇素材的一種便捷的工具,可以取代原有的卡片式工作方法。編寫語言教材通常需要課文、練習(xí)、注釋等文字材料以及圖片、音頻、視頻等多媒體資料。一部分資料是現(xiàn)成的,還有一部分資料是在編寫過程中創(chuàng)作的,比如針對課文中某個詞所做的注釋或者課文朗讀音頻。我們這里的素材主要是指現(xiàn)成的資料。首先我們通過各種途徑收集素材,然后對素材加工整理,把素材加入素材庫中,然后在需要的時候在素材庫中檢索符合我們指定條件的素材。比如設(shè)定檢索條件為內(nèi)容關(guān)于旅游的、難度為中級的文章,系統(tǒng)可以給出素材庫中所有符合條件的文章。

素材庫系統(tǒng)具有以下特點:

1.素材類型多樣,屬性豐富

在素材庫中可以加入文本(課文、練習(xí))、圖片、錄音、錄象等。所以素材都具有關(guān)鍵詞、來源和版權(quán)信息。課文的屬性還應(yīng)當(dāng)包括以下屬性:題材(經(jīng)濟、旅游、問候、就餐等)、體裁(對話、小說、散文、議論文等)、來源、原文、語法點、文化項目、功能項目、難度等級等。錄音和錄像素材有以下屬性:關(guān)鍵詞、時間長度、來源、配文等。

2.檢索方便。以上屬性字段都可以作為檢索條件。

3.引入比較成熟的中文信息處理技術(shù),部分工作可以實現(xiàn)完全或部分自動處理,比如分詞。同時提供一個友好的用戶界面,能夠方便地加工素材和更新素材。

4.素材庫系統(tǒng)各模塊相互獨立,系統(tǒng)具有良好的開放性和可維護性。

三、素材庫系統(tǒng)基本結(jié)構(gòu)

(一)素材處理模塊

素材處理包括素材登錄、素材屬性登錄、語料加工等幾個部分。下面分別敘述這幾個部分的功能。

1.素材登錄

素材登錄就是將原始素材輸入進計算機。文字型的素材可以通過以下幾種方式輸入計算機:鍵盤輸入、直接提交電子文檔、光學(xué)掃描后進行文字自動識別、語音輸入。

2.素材屬性登錄

在素材登錄的同時登錄素材的屬性信息。

3.語料加工

語料加工主要針對文字型素材。針對語言教學(xué)的需要,利用中文信息處理技術(shù)進行必要的加工。比如分詞、詞性標(biāo)注(多義詞消歧)、難度分析等。在分詞過程中生成該素材的字表、詞表。有些素材屬性可以由機器自動分析獲得,比如使用文本自動分類的技術(shù)登錄題材屬性。準(zhǔn)確率通常可以達到70%,如果需要比較高的準(zhǔn)確率,那么自動分析后的結(jié)果仍然需要人工校對。

(二)數(shù)據(jù)庫

數(shù)據(jù)庫存放素材和對素材加工處理的結(jié)果。

(三)用戶檢索模塊

這部分模塊是面向用戶的,提供一個用戶界面,接受用戶的檢索條件,輸出符合條件的檢索結(jié)果。首先選擇素材類型,不同的素材類型屬性不同,檢索入口也不同。所有素材都具有關(guān)鍵詞、來源兩個檢索入口。

課文類型檢索的檢索入口比較多。可以設(shè)置題材、體裁、難度、文化項目、功能項目、語法項目的檢索條件。為了方便用戶在教材編寫或再版時替換課文,用戶可以提供一個詞表,系統(tǒng)檢索出用詞最接近這個詞表或包含這個詞表的文章。

圖片、錄音、錄像主要使用關(guān)鍵詞檢索,檢索符合要求的素材。錄音、錄像素材在登錄時應(yīng)該同時登錄配文,對配文的加工處理和檢索類似于課文。

四、系統(tǒng)實現(xiàn)

1.數(shù)據(jù)庫系統(tǒng)概述

人們借助計算機進行數(shù)據(jù)管理是近30年的事。在應(yīng)用需求的推動下,在計算機硬件、軟件發(fā)展的基礎(chǔ)上,數(shù)據(jù)管理技術(shù)經(jīng)歷了人工管理、文件系統(tǒng)、數(shù)據(jù)庫管理三個階段。

用數(shù)據(jù)庫系統(tǒng)來管理數(shù)據(jù)比文件系統(tǒng)有明顯的優(yōu)點,主要有以下幾個方面:

(1)數(shù)據(jù)結(jié)構(gòu)化

數(shù)據(jù)庫系統(tǒng)實現(xiàn)整體數(shù)據(jù)的結(jié)構(gòu)化,不同的記錄之間可以通過相同的數(shù)據(jù)項建立聯(lián)系。存取數(shù)據(jù)的方式也很靈活,可以存取數(shù)據(jù)庫中的某一個數(shù)據(jù)項、一組數(shù)據(jù)項、一個記錄或一組記錄。

(2)數(shù)據(jù)的共享性高,冗余度低,易擴充

數(shù)據(jù)可以被多個用戶、多個應(yīng)用共享使用。隨著計算機網(wǎng)絡(luò)快速發(fā)展和普及,這一特點尤為重要。

(3)數(shù)據(jù)由DBMS(數(shù)據(jù)庫管理系統(tǒng))統(tǒng)一管理和控制

DBMS提供以下幾方面的數(shù)據(jù)控制功能:數(shù)據(jù)安全性保護、數(shù)據(jù)完整性檢查、多用戶使用時進行并發(fā)控制、數(shù)據(jù)庫恢復(fù)。

目前應(yīng)用的數(shù)據(jù)庫系統(tǒng)主要是關(guān)系型數(shù)據(jù)庫,直觀地看,數(shù)據(jù)庫由許多二維表格組成。隨著XML技術(shù)的發(fā)展和流行,XML數(shù)據(jù)庫也開始發(fā)展并廣泛應(yīng)用。現(xiàn)有的關(guān)系型數(shù)據(jù)庫都在一定程序上支持XML。

2.XML概述

國外建設(shè)的英語語料庫通常采用純文本格式,使用ASCII編碼。我國大陸建設(shè)的漢語語料庫也多使用純文本格式,使用GB碼。語料需要標(biāo)注,具體實現(xiàn)時有多種方法。一種方法是使用自定義的格式,一種方法是使用SGML、XML、TEI等標(biāo)準(zhǔn)化的置標(biāo)語言。國外的文本語料庫都已普遍采用了SGML標(biāo)準(zhǔn)(馮志偉 1999)。XML是SGML的一種應(yīng)用。使用標(biāo)準(zhǔn)化置標(biāo)語言的優(yōu)點是:標(biāo)注類型比較容易擴充和修改;文檔格式容易轉(zhuǎn)換,方便不同語料庫的共享;有一些免費的開發(fā)工具可以使用。

3.素材庫的具體實現(xiàn)方式

孫德坤(1996)論證了建設(shè)課文素材庫的可行性和選材標(biāo)準(zhǔn)。但是他沒有給出具體的實現(xiàn)形式。我們打算采用比較成熟的關(guān)系型數(shù)據(jù)庫系統(tǒng)來建設(shè)素材庫。原因如下:

(1)素材庫包含有文本、錄音、圖片等多種類型。現(xiàn)有的關(guān)系型數(shù)據(jù)庫系統(tǒng)都有豐富的數(shù)據(jù)類型。

(2)關(guān)系型數(shù)據(jù)庫技術(shù)比較成熟,檢索效率也比較高。相當(dāng)多的任務(wù)可以由DBMS完成,不需要另外編寫代碼,開發(fā)速度快,成本低。

目前使用比較廣泛的關(guān)系型數(shù)據(jù)庫有Oracle,Visual Foxpro,Access 等。如果需要網(wǎng)絡(luò)應(yīng)用,比如需要通過網(wǎng)絡(luò)多人共同建設(shè)使用素材庫,那么需要選擇Oracle,MYSQL等支持網(wǎng)絡(luò)應(yīng)用的數(shù)據(jù)庫系統(tǒng)。如果只是單機使用,可以選擇Access。

關(guān)系模型如下:(關(guān)系的碼用下劃線標(biāo)出)

素材(素材號,類型,來源,版權(quán))

課文(素材號,原文,難度,長度,題材,體裁)

詞匯(素材號,詞語)

多媒體素材(素材號,時長,配文)

配文(素材號,原文,難度,長度)

關(guān)鍵詞(素材號,關(guān)鍵詞)

語法項目(素材號,語法點)

文化項目(素材號,文化描述詞)

另外根據(jù)檢索的需要,需要建立多個索引。需要使用VB、VC++等開發(fā)工具設(shè)計用戶界面等。這里不詳細展開。

五、結(jié)語

建設(shè)素材語料庫的軟件系統(tǒng)比較容易,但是充實素材庫將是一個長期的過程。素材語料庫的優(yōu)勢在于可以快捷方便地管理大量素材,如果素材庫規(guī)模小,難以看出計算機管理素材的優(yōu)勢,這意味著需要轉(zhuǎn)變教材編寫中素材管理的工作方式。

參考文獻:

[1]李泉.近20年對外漢語教材編寫和研究的基本情況述評[J].語言文字應(yīng)用,2002,(3).

[2]薩師煊,王 珊.數(shù)據(jù)庫系統(tǒng)概論(第3版)[M].北京:高等教育出版社,2000,(2).

[3]孫德坤.組合式——教材編寫的另一種思路[J].世界漢語教學(xué),1996,(1).

[4]王建新.計算機語料庫的建設(shè)和應(yīng)用[M].北京:清華大學(xué)出版社,2005,(9).

[5]趙金銘.跨越與會通——論對外漢語教材研究與開發(fā)[J].語言文字應(yīng)用,2004,(2).

(陳鋒,南京師范大學(xué)文學(xué)院)

主站蜘蛛池模板: 国产特级毛片aaaaaaa高清| 免费一级α片在线观看| 国产黄网站在线观看| 国产乱子伦精品视频| 日韩二区三区| 久久人妻xunleige无码| 都市激情亚洲综合久久| 欧美一区精品| 国产成人精品亚洲77美色| 国产日韩欧美精品区性色| 久久精品国产一区二区小说| 国产精品免费入口视频| 久久永久视频| 亚洲区第一页| 久久青草免费91线频观看不卡| 国内精品九九久久久精品| 2020国产在线视精品在| 精品无码人妻一区二区| 日韩成人在线视频| 亚洲欧美另类日本| 亚洲精品天堂在线观看| 免费无码又爽又黄又刺激网站| 在线观看亚洲成人| 国产福利小视频高清在线观看| 国产国模一区二区三区四区| 国产在线精品网址你懂的| 国产噜噜在线视频观看| 欧美色亚洲| 91免费观看视频| 成人欧美日韩| 欧美日韩国产系列在线观看| 成人在线天堂| 国产精品成人观看视频国产| 亚洲人成成无码网WWW| 亚洲无码精彩视频在线观看| 国产亚洲高清在线精品99| 国产在线自乱拍播放| 国产欧美成人不卡视频| 五月天福利视频| 女人18一级毛片免费观看| 国产亚洲精| 久热这里只有精品6| 亚洲精品卡2卡3卡4卡5卡区| 美女免费精品高清毛片在线视| 亚洲精品少妇熟女| AV无码国产在线看岛国岛| 国产一线在线| 欧美一级一级做性视频| 国产成人精品午夜视频'| 日韩国产另类| 久久精品亚洲专区| 精品国产美女福到在线不卡f| 国产精品自在线拍国产电影| 91精品视频在线播放| 久久精品人人做人人| 久久综合激情网| 狠狠色丁婷婷综合久久| www亚洲天堂| 亚洲一区色| 日本三级欧美三级| 高清码无在线看| 911亚洲精品| 国产精品专区第一页在线观看| 亚洲精品日产精品乱码不卡| 美女啪啪无遮挡| 国内熟女少妇一线天| 国产va视频| 国产视频一区二区在线观看| 欧美视频在线播放观看免费福利资源 | 91青青草视频在线观看的| 全部免费毛片免费播放| 动漫精品中文字幕无码| 一级一级一片免费| 精品亚洲欧美中文字幕在线看| 一本一道波多野结衣av黑人在线| 成人国产精品一级毛片天堂| 亚洲欧美不卡| 亚洲品质国产精品无码| 欧美日韩专区| 乱人伦99久久| 东京热一区二区三区无码视频| 欧美中日韩在线|