馬曉霞
【摘要】小學語文教學語料庫收集了小說、詩詞、戲劇、散文等類別的文章和一些趣味性比較強的寓言、通話、兒歌、謎語等,提供了根據作者、標題、體裁、內容等檢索,方便教師快速的查找所需要的文獻。為教師的教學和學生的學習都提供了方便。
【關鍵詞】語料庫 小學語文 教學 設計開發
【中圖分類號】G623.2 【文獻標識碼】A 【文章編號】2095-3089(2013)07-0045-02
小學語文教學語料庫主要是借鑒了前人提出的建設原則和檢索功能,使用ASP程序設計語言,SQL SEKVER2000數據庫服務器來采集、加工語料以及開發語料庫檢索功能等,并規定小學語文語料庫的建設目的和樣本大小等,來解決語文閱讀資源中的篇章檢索、詞語檢索和句子檢索所存在的問題。
一、概念
小學語文教學的教學語料庫是為了研究和應用于小學教學而搜集的并且用電子數據的形式保存下來的語言材料,這些內容主要是由書面語或者口語的樣本匯集起來的,它代表著小學語文中的語言。在這一語料庫有了足夠的規模時,能夠反映和記錄小學的語言在實際使用中的情況。這有利于相關人員對于語料庫的把握和研究,借助語料庫可以分析小學學習的語言系統的規律。它無論對教學還是對研究都是極其有利的。
二、建庫注意項
小學語文教學語料庫的建立是有特定的目的,就這個目的和一些專家的觀點,對語料庫的建立原則和方法做出以下總結:
2.1首先就是要明確小學語文教學語料庫的建庫目的。它屬于專型語料庫,專門為小學語文的教學和研究服務的,這種語料庫主要有兩個特點,選擇名家大作和突出趣味性。它收錄的大都是寓言、童話、詩歌、謎語等,對一些政治、文學和經濟方面的內容牽涉較少。
2.2關于語料庫的容量方面的問題。由于我們所建立的語料庫是小學語文的教學語料庫,所以它主要采集的是整個原始文本作為樣本的形式比較合理,可以另外建立數據庫存儲由原始文本分解得來的句子樣本。這樣比采取把原始語料切分為片段的方式要好。
2.3建立小學語文教學語料庫的時候,要注意語料庫樣本的多樣性,因為小學語料庫屬于文科門類,文學類的樣本的多樣性主要是文學門類下的子門類的多樣性。
2.4做好小學語文教學語料庫的預料樣本處理,一定要根據小學語文語料庫的教學和研究的需求。建立比較適合的預料庫檢索方式和存儲方式。
2.4.1要把每個語料庫的樣本都當作一條數據記錄存放在數據表中,這樣有利于查找擴展閱讀所需要的篇章,方式是通過關鍵詞來進行全文的檢索。
2.4.2把需要處理的所有預料劃分為句子,再把每個句子當作數據記錄放在數據表中。這樣做的好處是利用字串、句子和詞語來進行檢索,方式是利用關鍵詞進行句子檢索。
三、開發和研究
小學語文教學語料庫主要是采用的ASP語言寫程序,采用SQL SE1KVE1K2000數據庫服務器做數據存儲服務以及采用IIS60 Web服務器發布語料庫檢索網站。這個過程主要有:語料采集、原料庫加工和開發語料庫的檢索功能等環節。
3.1語料一般都是來源于互聯網上的一些讀書網站,這是主要來源。
3.2在小學語文教學語料庫設計時肯定會碰到難點,在建設資料庫時需要收集的資料并不是匯集在一起的,需要設計者進行搜集,要把這些結構多樣的資源轉化為結構統一的語料庫并不是一件簡單的事,而且很多資源都是網頁形式的,而語料庫的全文卻是文本形式的,這樣就要求設計者進行處理,這也是一項比較困難繁雜的工作。
3.3對于小學語文教學語料庫所遇到問題的解決方法,大多數網站的資源格式基本上都是一樣的。這樣我們就可以利用這些相同點來進行解決,我們可以去發現各個網站對于文章的作者、標題等的標記的規則,將其轉化為我們需要的文本格式,運用到我們的語料庫中。但是在有些情況下某個網站的不同的頁面中對文章的同一部分所用的標記也不相同,這些地方我們的解決方法是尋找兩者之間的共性,尤其是在標記部分的共性,利用這些共性對這兩種標記方式進行統一的表達。
3.4注意結果的統計。小學的語料庫中共收集了一萬零六百六十五篇,這些結果的收集對教學和研究是非常有益的。小學語文教學語料庫的加工要注意句子層次的加工和篇章層次的加工,句子 層次的加工主要是將篇章分割成若干句子,同時確定每句話的長度, 而后將這些句子數據存入句子數據表中。篇章層次的加工在語料采集 過程已經部分的完成,包括對標題、作者、體裁和字數等屬性。
四、開發重點
在小學語文教學語料庫的開發中最為重要的一點就是檢索功能,下面就這以重點進行詳細的分析。
4.1句子檢索
可進行關鍵詞居中(KWIC)檢索,關鍵詞為簡體中文的任意字符串,通過設定跨距(span)來限定檢索關鍵詞的左右語境范圍,跨距要一漢字為單位。返回的檢索結果以原始預料的句子為最大話語單位,作為檢索的上下文語境的最大范圍。如果需要查看更大范圍的上下文語境可以更進一步查看該句子所在的篇章,允許對檢測的結果進行復制和保存。句子檢索功能可實現基于連續字串、短語和復句句型的句子檢索,方便課件制作人員查找關于某個詞語多種應用情景的句子。
4.2篇章檢索
篇章檢索的檢索項有:作者、標題、體裁、語體等,對作者、標題等檢索提高模糊匹配功能。對體裁和語體等則提供全文檢索,檢索全文內容中包含的一項或多項內容。
結語
小學語文教學語料庫的開發以篇章為單位,收集了適合小學語文教學的各類體裁的文獻,在保證知識性、思想性的基礎上,突出了一定的趣味性。收集了一些名家的散文、詩詞、小說、戲劇等。提供了基于作者、題目、體裁、出處等以及全文內容檢索的功能方式,以方便教師快速查找教學所需的文獻和資料,為教學提供了方便。
參考文獻:
[1]何克航.兒童思維發展新論和語文教育的深化改革—對皮亞杰“兒童認知發展階段論”的質疑[J].教育研究,2009,07(02):135—138.
[2]魏順平,何克抗.小學語文教學語料庫的設計與開發[B].中國化教育—學習資源,2009,06(245):148—151.