999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

英語詞匯自適應測試系統中詞匯難度的判定*

2016-05-05 04:00:04胡一平高佳佳山東師范大學傳媒學院山東濟南250014
現代教育技術 2016年3期
關鍵詞:英語詞匯

胡一平 高佳佳 陸 宏(山東師范大學 傳媒學院,山東濟南 250014)

?

英語詞匯自適應測試系統中詞匯難度的判定*

胡一平高佳佳陸宏[通訊作者]
(山東師范大學 傳媒學院,山東濟南 250014)

摘要:針對英語詞匯自適應測試系統中詞匯難度如何量化的現實需求,文章提出了從詞頻、長度、語音書寫和諧程度這三個維度來量化英語詞匯難度的具體方法,并以普通高中英語詞匯為例展示了其量化過程。經過對各個難度子區間的詞匯頻次進行統計后發現,其結果近似呈現正態分布。

關鍵詞:英語詞匯;自適應測試;詞匯難度;項目反應理論

一 問題提出的背景

任何一門語言的掌握和應用都離不開詞匯。詞匯學習是英語學習的一個重要組成部分,是進行語言交際的前提和核心。并且,詞匯能力對語言能力有很強的預測性,因為詞匯能力的發展與語言能力的發展是緊密相關的[1]。基于此,對詞匯能力的測試成為了語言學研究的重點。

隨著計算機技術和網絡技術的飛速發展,以及項目反應理論(IRT)在測試領域受到的廣泛關注,英語詞匯能力測試可借助基于IRT的計算機自適應測試(CAT)得以高效、便捷地實現。基于IRT的英語詞匯自適應測試系統最重要的部分就是題庫建設,而一個優質的題庫系統是CAT系統得以成功實施的前提。但題庫系統是否優質,在很大程度上取決于對英語詞匯難度的量化是否合理,這關系到整個CAT系統的性能。在自適應測試的過程中,CAT系統作為測試的“決策者”,不論它采用何種選題策略(如最大信息量選題法、a分層選題法等),其最終目的都是從題庫系統中選出與被試能力相匹配的試題,因為只有這樣的試題對于被試來說才有價值,而對最終選題結果起決定性作用的正是詞匯難度值。此外,詞匯難度值對后續估計被試的詞匯能力也起到了至關重要的作用,它會對被試最終能力水平的判定產生直接影響,而這關系到測試的可靠性。因此,如何合理地量化英語詞匯難度值,就成為了研究者們關注的焦點。

二 相關研究綜述

基于IRT的英語詞匯自適應測試具有廣闊的前景,這一點毋庸置疑。然而,由于采用的新型教育測量理論涉及相對繁雜的數學運算,且其測驗理念并未完全深入人心,故目前相關的自適應測試系統仍處于一種相對匱乏的狀態。但通過分析有限的案例,可以幫助研究者理清研究脈絡,從中發現問題以便改進。

趙傳海等[2]設計了一個基于IRT的大學英語詞匯在線自適應測試系統,并依據相關理論研究成果,提出英語詞匯自適應測試應在廣度測試的基礎上進行深度測試——然而在廣度測試中,起決定性作用的詞匯難度值卻未得到充分重視。臺灣學者Chen等[3]基于IRT和學習記憶周期理論,設計了個性化英語詞匯移動學習系統,并在系統建設中對每個單詞的難度系數進行標度時,對影響詞匯難度的長度因子和發音因子的權重指定為0.7和0.3——但文中對這種標度的科學性和理論依據,卻未加解釋。此外,陸宏等[4]開發的高中英語詞匯自適應學習系統對詞匯難度的量化進行了改進——然而在對具體的難度影響因子參數的計算上過于簡單,如在統計單詞字母與音節的不和諧程度時,簡單地將其劃分為三個不同的等級,不能較好地體現不同詞匯間不和諧程度的差異,進而直接影響到詞匯最終難度值的合理性。

在詞匯難度定義方面的缺陷,必然會導致整個詞匯自適應測試系統在為用戶選詞、對用戶能力進行評價時不夠精確和科學,其實用價值也會大打折扣。基于此,本研究在文獻查閱的基礎上,提出了一個量化英語詞匯難度的具體方法,使其更具科學性和實用性,并以普通高中英語詞匯為例展示了其量化過程。

三 詞匯難度的判定

本研究選用普通高中英語詞匯作為題庫目標詞。《全日制高級中學英語教學大綱》和《普通高中英語課程標準(實驗)》中規定了高中階段學生應該學習和掌握的詞匯,經統計共3823個,去除129個暫不予以考慮的詞匯(包括body-building等合成詞51個、AIDS等縮寫詞12個、table manners等短語66個),共得題庫目標詞3694個。

1詞匯難度影響因子

一般來說,一個詞匯的難度取決于它是否易于被學習者記憶或認出。對于將英語作為第二外語(ESL)的學習者來說,詞匯的難度受很多因素的影響,如詞頻、單詞的長度、語音與書寫的和諧程度、學習者心理特質、文化影響以及母語的負遷移等。這些因素可歸納為兩大類:詞內因素和詞外因素。由于本研究關注的僅僅是詞匯自身的一些特征對詞匯難度產生的作用,而詞外因素具有難把握性、個體差異性和不可操作性,故本研究將重點放在了影響詞匯難度的客觀詞內因素上。本研究試圖通過文獻查閱的方式,抽取出對詞匯難度影響較大的因子,從而為量化英語詞匯難度奠定理論基礎。

詞匯難度一直是語言學研究者們關注的重點。研究表明,對于ESL學習者來說,難詞在很大程度上是指詞形上難的詞,即容易造成拼寫錯誤的詞[5]。而引起拼寫困難的主要原因,是字母或字母組合與其發音間的不一致、誤讀以及單詞過長[6]。呂文澎[7]針對我國英語學習者的特征,指出一些固有的長詞以及那些至少包含一個不發音字母的單詞都可被視為難詞。Carroll[8]早在2000年就通過音素監察法,驗證了詞頻對于詞匯掌握和理解的重要作用。此外,李永康[9]在對詞匯難度因素的分級研究中指出,詞匯的難易可以用詞匯頻率、雙語語義共享、上下文限制、語音/書寫特征和諧等四種因素來表征。縱觀國內外學者的觀點,同時考慮到最終的詞匯難度值需要依據各個影響因子進行具體量化,故本研究最終提取出最具代表性且同時具有可操作性的三大影響因子:詞頻、單詞的長度、語音與書寫的和諧程度。

(1)詞頻

詞頻可以被看作是詞匯難度的統計學特征,即在一定數量的真實語料中詞匯重復出現的次數。它決定了詞匯的常用程度和學習者對詞匯的熟悉程度,因此是量化詞匯難度的重要影響因子。一般來說,單詞的使用頻率越高,對學習者來說就越常見,在記憶時的難度就會減小;相反,單詞的使用頻率越低,學習者對它的熟悉程度就會越低,在記憶時的難度就會增加。早在20世紀40年代中期,桑代克等語言學家就開始評估詞頻和詞匯難度之間的關系,在計算機技術成熟之前經過人工分析,他們于1944年首次提供了大規模的詞匯頻次表。自那時起,許多詞匯表都是基于單詞的詞頻來設計的,用來指導第二語言詞匯及課程的編纂。目前,以大規模語料庫為基礎的詞頻表已如雨后春筍般出現,并且借助于人工智能技術日漸繁榮。如西方的American Heritage Word Frequency Book、COBUILD Wordlist等詞頻表在國外應用十分廣泛,國內的《新世紀大學英語四、六級詞典》也同樣基于詞頻編纂;我國臺灣地區著名的General English Proficiency Test(GEPT)共分為初級、中級、中高級、高級、優級等五級測驗,且每一級測驗都規定了詞匯考察范圍,而這五個等級的詞匯劃分也參考了詞匯的使用頻率。由此可見,詞頻對詞匯難度的影響不容忽視。

(2)單詞的長度

單詞的長度是單詞的主要內部特征之一,對單詞的認知與記憶影響很大——認知與拼寫單詞時,單詞越長,初學者越容易犯錯誤,母語為非拼音文字者尤其如此。量化英語詞匯的長度可從組成詞匯的字母的個數、音節的數量、詞素的數量等三個角度進行,其中字母個數產生的影響較大[10]。基于此,本研究選用單詞中所含字母的個數來表征單詞的長度。一般而言,單詞越長,音節的結構和拼寫變化就越多、越復雜,學習者的記憶負擔就會相應加重,出錯的可能性也較大,出錯的次數也會增多——這也就是我們通常所說的“詞長效應”。如果將詞長與其它影響詞匯難度的因素妥當分離,那么詞長效應將會更加明顯。

(3)語音與書寫的和諧程度

語音與書寫的和諧程度是指單詞的發音與拼寫之間的一致程度,而單詞發音的正確程度與學習者對單詞的理解、記憶和表述直接相關。呂文澎[7]在對詞匯難度進行研究時指出,至少包含一個不發音字母、易引起吞音現象是難詞的重要特征,這樣的單詞語音與書寫的和諧程度較低。如單詞“accident”和“straight”,兩者均含8個字母,前者讀作/'?ks?d?nt/,后者讀作/stre?t/,而“straight”中的“gh”是不發音的,這對于利用發音記憶單詞的學習者來說無疑增加了難度。相對而言,語音與書寫和諧程度較高的“accident”更容易記憶。

2詞匯難度判定公式

本研究確定了影響詞匯難度的三大因子為詞頻、詞匯長度、語音與書寫的和諧程度,就可借助數學的方法來定義詞匯難度判定公式(見公式1),進而可定量計算出每一個詞匯的難度值。

其中,b是詞匯難度值,F是詞頻參數,L是詞匯的長度參數,H是詞匯的語音書寫和諧程度參數;W1、W2、W3分別是這三個參數的權重,其計算運用了層次分析法——這種用于決策的新方法由美國運籌學家Saaty提出[11],該方法在處理復雜決策問題時所具有的優越性使得它的應用遍及教育、管理等眾多領域。本研究邀請了20位從事英語教學和研究的專家參與其中,他們根據自身的專業知識和經驗,按照這三大影響因子兩兩之間的相對重要程度,并依循1—9標度法在權重評議表上打分。研究者對評議表回收、審核后進行匯總,計算出三大影響因子中某一因子相對于其它因子的相對重要性權重值,得出詞頻、長度、語音書寫和諧程度這三個因子的權重分別為0.44、0.30、0.26。為確保最終權重結果的可靠性,還需進行一致性檢驗,求得隨機一致性比例CR=CI/RI=0.093<0.1(CI代表判斷矩陣一致性指標,RI代表隨機一致性指標),說明權重結果可靠且合理有效。因此,本研究得出的詞匯難度判定公式見公式2:

3 各因子參數的計算方法

(1)英語詞匯詞頻參數F的計算

本研究中詞頻參數的計算與英國國家語料庫(BNC)常用15000詞詞頻排序表(以下簡稱詞頻表)中相應單詞的詞頻密切相關。BNC由牛津大學出版社、大英圖書館等合作開發建立,是迄今為止最具代表性的現代語料庫之一。BNC取樣的文章類型十分廣泛,對文本的來源、語言的難易層次均有明確的規定與比例限制,其詞頻排序頗具代表性和科學性。詞頻表按照單詞的使用頻率高低對單詞進行排序,它所收錄的每一個單詞都有一個詞頻序號,使用頻率最高的單詞詞頻序號為1;隨著使用頻率的降低,單詞的詞頻序號不斷增大。

如前文所述,本研究的題庫目標詞有3694個,然而在詞頻表中檢索后發現gruel等328個單詞并沒有收錄在詞頻表中,故應去除這328個詞,而將剩余的3366個單詞作為最終的題庫目標詞。為了計算詞頻參數,需要在詞頻表中檢索所有目標詞的詞頻序號。根據詞頻序號的查詢結果,將詞頻序號最小的單詞的詞頻參數定義為0,將詞頻序號處于中間水平的單詞的詞頻參數定義為50,而將詞頻序號最大的單詞的詞頻參數定義為100。然后按照一定的映射關系,就可計算出所有單詞的詞頻參數,具體的計算公式見公式3:

其中,F是詞頻參數,VF是詞頻序號,VFmin代表目標詞中詞頻序號最小的值,VFmid是指目標詞中處于中間水平的詞頻序號值,VFmax是指目標詞中詞頻序號最大的值。

(2)英語詞匯長度參數L的計算

在進行長度參數計算之前,首先要做的準備工作是將目標詞的長度分別統計出來。定義長度參數的方法與之前定義詞頻參數的方法類似,即將所含字母個數最少的單詞的長度參數定義為0,將所含字母個數處于中間水平的單詞的長度參數定義為50,將所含字母個數最多的單詞的長度參數定義為100。同樣經過一定的轉換,每一個目標詞的長度參數就可通過公式4得到:

其中,L是詞匯的長度參數,VL是單詞所含的字母個數,VLmin、VLmid、VLmax分別代表目標詞中最短、長度居中、最長的單詞所包含的字母個數。

(3)英語詞匯語音書寫和諧程度參數H的計算

語音書寫和諧程度參數可顯示一個單詞讀音與形態的一致性程度,這里用H來表示。為了計算H的值,需首先定義一個單詞的長度與該單詞音標長度的比,表達式見公式5:

其中,PR是單詞的字母個數與音標個數的比,VL是單詞包含的字母個數,PN代表單詞包含的音標個數。根據PR的定義,可以計算出所有目標詞的PR值。顯然,當PR=1時,該單詞讀音與形態的一致性程度最高;不論是PR>1還是PR<1,都表明該單詞的字母與音標不能一一對應,這樣勢必會造成拼寫困難。在所有目標詞中將PR值與1差值的絕對值最小的單詞H值定義為0,差值的絕對值處于中間水平的單詞H值定義為50,差值的絕對值最大的單詞H值定義為100,每一個目標詞的語音書寫和諧程度參數就可通過公式6計算得出:

其中,H是單詞的語音書寫和諧程度參數,PR是單詞的字母個數與音標符號個數的比,|PR-1|代表PR與1差值的絕對值,|PR-1|min、|PR-1|mid、|PR-1|max分別是所有目標詞中PR與1差值的絕對值的最小值、中間值、最大值。

需要說明的一點是,由于各因子參數的定義范圍均為[0,100],因此按照難度判定公式直接計算出的詞匯難度取值范圍同樣是[0,100]。而在IRT中,一般情況下詞匯難度取值范圍是[-3,3],所以為了獲得相應范圍的難度值,就需做進一步轉換,即將詞匯難度從[0,100]映射到[-3,3]的范圍中。具體的轉換方式見公式7:

其中,b’是指取值范圍在[-3,3]上的詞匯難度,即最終難度值;b是指利用難度公式直接計算出來的詞匯難度,即初始難度值;bmin、bmax分別是指初始難度值的最小值、最大值。

四 詞匯難度值計算過程舉例

前文已經定義了詞匯難度的判定公式以及各因子參數的計算方法,下文將通過舉例使計算過程更加清晰明了——以單詞climb/kla?m/為例,來說明其詞頻參數F、長度參數L、語音書寫和諧程度參數H、初始難度值b以及最終難度值b’的計算過程。

1詞頻參數的計算

通過對本研究中3366個高中英語詞匯在詞頻表中的詞頻信息進行統計后可知:VFmin=1,VFmid=3000,VFmax=14958。單詞climb的詞頻序號VF=3882>VFmid,那么它的詞頻參數F的計算過程如下:

2長度參數的計算

通過對目標詞的長度信息進行統計后可知:VLmin=1,VLmid=8,VLmax=15。單詞climb的長度VL=5

3語音書寫和諧程度參數的計算

4初始難度值的計算

計算出單詞climb的詞頻參數F、長度參數L、語音書寫和諧程度參數H后,就可以根據詞匯難度判定公式來計算climb的初始難度值b:

5最終難度值的計算

對climb的初始難度值b進行一定轉換后,就可以獲得難度范圍在[-3,3]間的最終難度值b’。統計完所有目標詞的初始難度值后可知:初始難度值的最小值為bmin=0.029343114、最大值為bmax=78.23107603,那么最終難度值b’的計算過程如下:

根據以上詞匯難度計算公式和計算過程,就可得出本研究所涉及的3366個詞匯的詞頻參數、長度參數、語音書寫和諧程度參數以及每個詞匯的難度值。將詞匯難度取值范圍[-3,3]平均劃分為12個子區間,分別統計在各個難度子區間上目標詞出現的頻次,結果如圖1所示。從圖1可以看出,詞匯難度頻次近似呈現正態分布,這就驗證了本研究提出的詞匯難度計算方法的科學性。

圖1 詞匯難度頻次分布

基于IRT的CAT系統為英語詞匯測試注入了新鮮血液,其優勢突出。系統的科學性、高效性是CAT得以大規模推廣的前提之一,而在英語詞匯CAT系統中,對系統科學性起決定作用的正是詞匯難度值。本研究結合文獻梳理結果及我國英語詞匯的教學實際,提出了從詞頻、長度、語音書寫和諧程度這三個維度來量化英語詞匯難度的具體方法,其量化過程不涉及繁雜的數學運算,具有實用價值。

參考文獻

[1]段士平.二語詞匯能力及其測試[J].解放軍外國語學院學報,2009,(2):51-54.

[2]趙傳海,吳敏,葉艷.基于IRT的大學英語詞匯在線自適應測試系統的設計[J].現代教育技術,2008,(12):87-90.

[3]Chen C M,Chung C J.Personalized mobile English vocabulary learning system based on item response theory and learning memory cycle[J].Computers & Education,2008,(2):624-645.

[4]陸宏,趙艷萍.高中英語詞匯自適應學習系統的研制[J].現代教育技術,2014,(11):47-52.

[5]Nation I S P.Beginning to learn foreign language vocabulary: A review of the research[J].RELC Journal,1982,(1):14-36.

[6]侯寧海.常考易混英語疑難對詞手冊[M].南京:河海大學出版社,1994:15-17.

[7]呂文澎.英語難詞記憶法:調查與分析[J].外語教學,2001,(3):75-80.

[8]Carroll D W.Psychology of language[M].Beijing: The Foreign Language Teaching and Research Press,2000:34-36.

[9]李永康.第二語言詞匯難度定義的整合研究[J].安徽工業大學學報(社會科學版),2003,(5):122-123.

[10]陳士法,彭建武,楊洪娟,等.英漢心理詞典中英語單詞存儲的詞長效應研究[J].外語教學,2011,(5):45-51.

[11]郭金玉,張忠彬,孫慶云.層次分析法的研究與應用[J].中國安全科學學報,2008,(5):148-153.

編輯:小米

Assessing Lexical Difficulty in English Vocabulary Adaptive Testing System

HU Yi-pingGAO Jia-jiaLU Hong[Corresponding Author]
(School of Communication,Shandong Normal University,Jinan,Shandong,China 250014)

Abstract:Focusing on realistic demand how to quantify lexical difficulty in English vocabulary adaptive testing system,the paper put forward a new approach to assess lexical difficulty in terms of word frequency,word length as well as harmony degree of phonetic and orthographic features and displayed the quantization process of high school English vocabularies.According to the statistically analysis of the vocabulary frequency at each difficulty subinterval,the result shown a normal distribution.

Keywords:English vocabulary; adaptive testing; lexical difficulty; item response theory

收稿日期:2015年9月29日

作者簡介:胡一平,在讀碩士,研究方向為計算機教育應用,郵箱為hypfamily@163.com。

*基金項目:本文為2013年山東省高等學校科技計劃項目“基于項目反應理論的英語詞匯自適應學習系統的研制”(課題編號:J13LN12)的階段性研究成果。

【中圖分類號】G40-057

【文獻標識碼】A 【論文編號】1009—8097(2016)03—0100—07 【DOI】10.3969/j.issn.1009-8097.2016.03.015

猜你喜歡
英語詞匯
初中英語詞匯教學策略初探
甘肅教育(2020年2期)2020-09-11 08:01:08
初中英語詞匯短語識記及應用的有效方法
甘肅教育(2020年2期)2020-09-11 08:00:38
常爸:學好“詞族”,英語詞匯量能猛增
幸福(2019年12期)2019-05-16 02:27:34
高中英語詞匯學習之我見
初中英語詞匯教學初探
人間(2015年10期)2016-01-09 13:12:54
澳大利亞英語詞匯的獨特性
初中英語詞匯教學初探
西藏科技(2015年1期)2015-09-26 12:09:31
我國英語詞匯教學研究述評
擴大英語詞匯量的實踐
散文百家(2014年11期)2014-08-21 07:16:56
來自人名的英語詞匯
海外英語(2013年9期)2013-12-11 09:03:36
主站蜘蛛池模板: 3p叠罗汉国产精品久久| 99久久国产综合精品2020| 另类重口100页在线播放| 国产日韩av在线播放| 国产69精品久久久久妇女| 黄色一及毛片| 女人一级毛片| 国产肉感大码AV无码| av一区二区无码在线| 国产人碰人摸人爱免费视频| 亚洲一区免费看| 九九精品在线观看| 久久青草精品一区二区三区| 91色在线观看| 国产成人无码播放| 欧美综合区自拍亚洲综合天堂 | 九九视频免费在线观看| 欧美成人A视频| AⅤ色综合久久天堂AV色综合| 亚洲天堂日韩av电影| 亚洲国产精品日韩av专区| 在线无码九区| 精品成人免费自拍视频| 国产精品不卡片视频免费观看| 国产黄色免费看| 色哟哟国产精品| 亚洲aaa视频| 久久精品国产免费观看频道| 国产99在线观看| 久996视频精品免费观看| 欧美在线网| 国产成人综合日韩精品无码不卡| 青青草原国产| 依依成人精品无v国产| 久久精品丝袜| 欧美特黄一级大黄录像| 亚洲国产欧美国产综合久久 | 亚洲首页在线观看| 国产一区二区精品福利| 久草热视频在线| 精品国产成人av免费| 在线a网站| 亚洲天堂在线免费| 欧美一区中文字幕| 国产精品综合色区在线观看| 在线精品自拍| 人妻精品久久久无码区色视| 日韩精品亚洲人旧成在线| 欧美激情福利| 国产成人高清在线精品| 国产一区在线观看无码| 亚州AV秘 一区二区三区| 亚洲AⅤ无码国产精品| 国产在线拍偷自揄拍精品| 毛片久久网站小视频| 成人国产精品一级毛片天堂| 欧美高清视频一区二区三区| 国产一区二区影院| 99在线视频网站| 韩国自拍偷自拍亚洲精品| 国产91熟女高潮一区二区| 成人年鲁鲁在线观看视频| 波多野结衣一级毛片| 国产美女人喷水在线观看| 国产成人三级| 久久大香香蕉国产免费网站| 无码高潮喷水专区久久| 亚洲天堂免费在线视频| 国精品91人妻无码一区二区三区| 色婷婷天天综合在线| 久草中文网| 亚洲日韩高清在线亚洲专区| 狼友视频一区二区三区| 中文字幕人妻无码系列第三区| 国产精品午夜福利麻豆| 国产精品无码一区二区桃花视频| 天天色天天操综合网| 中文字幕在线永久在线视频2020| 欧美国产菊爆免费观看| 久久黄色小视频| 中文字幕乱码二三区免费| AV熟女乱|