999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于聯結主義理論模型的留學生復合詞習得考察

2010-01-01 00:00:00陳永朝邢紅兵
現代語文 2010年4期

摘 要:本文使用聯結主義的語義計算模型,通過現代漢語語料和留學生中介語語料對一組復合詞進行了語義抽取試驗,得到一系列語義聚類的網圖(map),并以此作為聯結主義推行的“心理詞典”映射假設,考察了初、中、高三個等級的留學生對復合詞的語義習得情況。實驗研究和理論推測表明:初級水平的留學生還不能很好地識別同家族復合詞的近義、同形關系。隨著水平的提高,留學生掌握同家族復合詞的數量慢慢增加,他們的語義系統逐漸發展。到了高年級水平,留學生已經能夠比較好地識別同家族復合詞的近義、同形等關系,但是仍然不如漢語母語使用者的語義系統完善。

關鍵詞:聯結主義 語義提取 心理詞典 語言習得模擬

一、理論背景

使用聯結主義理論對人類語言習得進行模擬,是近年來興起的一門學科。基于聯結主義的自組織模型的二維網圖可以用來表征語音、詞匯、語法、語義及字形等知識,并用這些網圖映射學習者的心理詞典,以分析探討語言習得的相關問題。這是本研究在理論上的出發點。使用聯結主義的理論模型從中介語語料庫和現代漢語語料庫抽取語義表征值,并進行聚類分析和相關數據分析。本文進行了兩組試驗,試驗一將現代漢語語料和留學生中介語語料進行對比考察,試驗二將留學生中介語語料分成三個等級進行對比考察,以此來探討留學生的復合詞習得情況。

聯結主義一個很重要的特點是對語言知識的看法。它強調知識的分布表征,而不是符號表征(李平,2002)。其對語義知識的認識也獨有見解,聯結主義認為,語義知識也是一些分布表征值,語義的差別在于語義間的距離(李平,2002)。而傳統語義的觀點是“語義是特定的范疇值”。范疇語義觀的假設來自可以分解的語義特征,它們是符號表征。聯結主義的語義觀認為,在心理詞典中,語義聚類的依據是距離。并且,聯結主義提出了一些可以在計算機上模擬的語義提取的模型,FarkasLi(2001)開發的神經網絡模型WCD(a word co-occurrence detector)就是其中一個比較成功的模型,也是本實驗直接利用的模型之一。

聯結主義另外一個很重要的特點是對語言材料和知識獲得的看法。聯結主義在語言習得方面并不否定語言的先天性及內在機制,但是更強調語言材料對語言學習的影響。聯結主義認為學習的過程就是從語言材料中抽取特征的過程,語言獲得的過程是通過特征浮現獲得規則,而不是直接學習規則(李平,2002)。本文以留學生的中介語語料庫和現代漢語語料庫作為分析的語言材料,一般來說,留學生的中介語語料和現代漢語語料基本上能夠代表留學生和漢語母語習得者真實的使用情況。

二、模型介紹

本文采用的模擬算法,是理士滿大學認知實驗室(Farkas,I Li,2001,2002)開發的自組織模擬模型中的語義分析模型WCD(a word co-occurrence detector),該模型能較好地利用真實的語言材料,進行詞語之間的語義聚類,其計算模型的基礎依然是上述提到的分布表征,通過多次試驗、不同語言材料分布表征,浮現語言特征(此處為語義特征值的距離)變化,以此為假設觀察留學生“語義心理詞典”的變化,考察(模擬)留學生習得復合詞的情況。其在和兒童語言習得和雙語模擬(Li Ping,2002、2004)的實驗中均有較好的表現。

該模型有三個參數:一是模型所開的窗口數,如果開三個窗口,就是指在考察的詞的左邊L和右邊R各取三個詞匯統計,計算該詞與這些詞的轉移概率。即圖1所表示的layerA層的[O-3,O-2,O-1,I,O1,O2,O3],layerB層[C-3,C-2,C-1,J,C1,C2,C3]。然后把這些轉移概率映射到一個多維的數組上面(這些數據一般取值在0-1之間,這個也是WCD的第二個參數的設定)。一般來說,模型訓練多少個詞匯,就有兩倍詞匯量的維度(即左邊+右邊的數量),我們要訓練大約500個左右的詞語,則有1000維。第三個參數就是訓練的詞匯個數。

WCD模型為語義的提取提供了可供參數選擇的源代碼。我們就是在這個程序上面訓練語料,調整參數,得出比較滿意的語義表征的。此外,還對這些提取的表征值作了一些測試,檢驗它們的效果,分析我們要考察的問題。

圖1:WCD的原理圖示

三、實驗

(一)實驗一:現代漢語和中介語語義抽取和聚類對比分析

試驗目的和過程描述:選擇現代漢語語料和中介語語料,結合兩個語料庫,挑選出一組復合詞,使用模型訓練,進行語義抽取并聚類得到語義網圖,以此作為其在各自(漢語母語者和留學生)心理詞典表現的假設,考察兩者的異同,并進行相關分析。

語料來源:a.現代漢語語料庫,北京語言大學開發,已分好詞。b.中介語語料庫,北京語言大學開發,已分好詞。

被試詞語確定:a.現代漢語語料庫的被試詞:花架子、花費、花、荷花、櫻花、棉花、花生、花兒、花草、花園、雪花、桃花。b.中介語語料被試詞的選擇:花、荷花、櫻花、桃花、花草、棉花、梅花、雪花、浪花、百合花、花園。

背景詞語確定:a.500個現代漢語高頻詞。b.中介語統計出來的500個高頻詞。

部分詞語標注:現代漢語語料中共有823處“花”單獨作詞語使用。我們把所有代表“花兒”意思的標上“花1”(共330個),代表“花費”意思的標上“花2”(共493個)。中介語語料中共有113處“花”單獨作詞語使用,同樣進行了標注,“花1”(共有61個),“花2”(共有52個)。

實驗結果:每個詞語的語義值表示為一千維的數組(向量),每個值在0~1.0之間。以下直接對數據進行計算分析。我們采取了多維尺度分析(Multidimensional Scaling,MDS),將一千維的數據降到二維的網圖上。多維尺度分析的基本原理是將評價者對各種事物的相似程度,通過適當的降維方法,將這種相似或不相似距離程度在低維度空間中用點與點之間的距離表示出來。

圖2:現代漢語語義聚類網圖

圖3:圖1的虛框部分放大圖

圖4:中介語語料語義聚類網圖

對比上圖可以看出:

1.兩者均能將同義近義聚在一起:“花1”和“桃花”“櫻花”“荷花”等聚在一起,而且內部還有一些細微的差異,“棉花”“雪花”比較遠,“花兒”“花草”比較近。“花2”和“花費”聚在一起,它們與其他的詞語距離都很遠。

2.兩者均能將同形異義分開:“花架子”和“花1”“花2”的距離都很遠,說明模型能夠將這兩個意義絕然不同的“同形詞”區別開。

3.從更細的角度看:現代漢語的語義聚類網圖的層次比中介語更加分明,語義接近的詞語相距得很近,語義差別大的詞語相距很遠。

4.如果把從中介語中提取出來的語義網圖比喻成留學生的語義心理詞典,把從現代漢語中提取出來的語義網圖比喻成漢語母語者的心理詞典,我們認為,留學生在被試的一組詞上面,已經形成比較明確的語義系統,他們能夠很好地區分近義關系,能夠比較好地區分同形的語素和詞語,但是他們的語義系統還不夠完整,不如母語者清晰。

(二)實驗二:中介語分等級語義抽取和聚類對比分析

我們將中介語語料分成三個等級(原始中介語料標有1-9個評級,表明留學生的水平分布):把1-3級的語料分到第一等級;1-6級語料分到第二等級;1-9級語料分到第三等級。我們采用了累加的辦法,這樣較為合乎模型需要的知識累加過程。

我們對中介語語料進行簡單處理分析后發現:第一等級語料中詞語有:櫻花、桃花、眼花、白花、木蘭花、流花、蓮花、油菜花、玫瑰花、開花、花費、鮮花、荷花、桃樹花(偏誤詞,在二年級的語料中以桃花替代)、草花(可能是“花草”的偏誤詞,在高年級中也消失了)。第二等級語料中增加了:棉花、花草、松花、走馬看花、騎馬看花(偏誤詞)、交際花、繁花、五彩花、繡花、梅花、杏花、櫻桃花(櫻花的偏誤詞)、雪花、花生。第三等級語料中又增加了:浪花、花園、花邊、花花綠綠、花生醬、花言巧語、花瓶、御花園、花粉、五花八門、春暖花開、花樣、老花鏡、百合花、心花怒放、水花四濺、花束、花招。“花1”“花2”的標注和背景詞的設定與實驗一致。

圖5:第一等級中介語語料語義聚類網圖

圖6:第二等級中介語語料語義聚類網圖

圖7:第三等級中介語語料語義聚類網圖

從上圖的變化同樣可以看出:

1.同形異義語素慢慢分開。

2.近義語素慢慢聚在一起(相對距離變近)。

3.如同試驗一展示了母語者和留學生語義心理詞典的差異,試驗二展示了初、中、高三個等級留學生語義心理詞典的變化過程:語義系統越來越清晰,層次越來越分明,展現了一個語義系統完善的過程。

四、討論

本文對從現代漢語和中介語語料抽取出來的語義進行了聚類分析,并以此為留學生和漢語母語使用者的心理詞典的假設,對比了他們的異同和變化過程。實驗結果表明語義表征的提取手段在漢語中的應用是可行的,以此為基礎進行聚類分析,心理詞典的假設是有其合理性的,從這些分析中可以得出一些有價值的數據和結論。

從中介語和現代漢語語義聚類結果看,現代漢語的語義聚類更加清晰,有層次,說明留學生的語義系統和漢語母語的語義系統還有一定的差距,有待進一步完善。從分了等級的中介語語料的結果來看,留學生語義系統發展在三個心理詞典上表現明顯的線索,前后有著延續性,是一個逐漸清晰、分明的過程。

從中介語三個等級語義聚類結果看,初級水平的留學生還不能很好識別同家族復合詞的近義、同形關系。隨著水平的提高,留學生掌握同家族復合詞的數量慢慢增加,當他們的語義系統逐漸發展到了高級水平,留學生們才能夠比較好地識別同家族復合詞的近義、同形等關系,但是仍然不如漢語母語使用者的語義系統完善。

由此可以推測留學生復合詞習得存在的一些問題,例如用法太單調,或者使用錯誤,或者不敢大膽使用,導致了在心理詞典表征上的缺陷。產生這個問題的原因,從提取的角度來講,是兩個語料本身的差異。例如,詞語的使用頻率差異、使用的語用語境的差異。從內部原因推導則是:留學生的詞匯使用比較單一,某些詞語僅限于書本上的意思,而且,他們經常會犯一些錯誤(偏誤),使用的語境也不穩定,這些原因導致他們的心理詞典沒有漢語母語使用者那么完善。這些在語料前處理的階段(得到印證),我們發現中介語“花”的構詞家族遠遠不如現代漢語,而且用法遠不如現代漢語靈活多變,同時,還有一些造詞偏誤和用法偏誤現象。當然,使用頻率也大大低于現代漢語,尤其是等級比較高的詞語。

因此,我們認為留學生如果要更好地掌握復合詞的語義和用法,形成完善的語義系統,就需要接觸更多的真實的現代漢語語言材料,否則是不可能真正掌握漢語復合詞中靈活多變的語義和語用特點的。同時,對于對外漢語教學的啟示是:教師要引導學生多在復合詞的語用語義上花功夫,引導學生有條件地擴大閱讀量,全面準確地掌握復合詞的各種特點。

(本文受教育部人文社會科學重點研究基地重大項目“留學生漢語詞匯習得的計算機模擬研究[NO.08JJD7400 63]”資助。)

參考文獻:

[1]李平.語言習得的聯結主義模式[J].當代語言學,2002,(3).

[2]邢紅兵.留學生偏誤合成詞的統計分析[J].世界漢語教學,2003,

(4).

[3]邢紅兵.基于聯結主義理論的第二語言詞匯習得研究框架[J].語

言教學與研究,2009,(5).

[4]Farkas,I and Li.A self-organizing neural network model

of the acquisition of word meaning[C].E.M.Altamann,A.Cleeremans,C.D.Shunn,and W.D.Gray.Proceedings of the Fouth International Conference on Cognitive Modeling.Mahwah,NJ:Lawrence Erlbaum,2001.

[5]Farkas,I and Li.Modeling the development of the lexicon

with a growing self-organizing map[C].H.J.Caulifield et al.Proceedings of the Sixth Joint Conference on Information Science.Durham,NC:JCIS/Association for Intelligent Machinery,Inc,2002.

[6]Li Ping,Igor Farkas,Brian MacWhinney.Early lexical development

in a self-organizing neural network[J].Neural Networks,2004,(17).

[7]Li,Ping,Farkas,I..A self-organizing connectionist

model of bilingual processing[C].R.Heredia, J.Altarriba Bilingual sentence processing,North-Holland:Elsevier Science,2002.

(陳永朝 北京 中國傳媒大學文學院 100024;邢紅兵 北京語言大學漢語水平考試中心 100083)

主站蜘蛛池模板: 在线观看国产一区二区三区99| 在线观看国产一区二区三区99| 91亚洲免费视频| 欧美亚洲国产日韩电影在线| 成人在线观看一区| 亚洲毛片在线看| 在线观看亚洲人成网站| 国产另类视频| 日本国产一区在线观看| 亚洲无码视频一区二区三区 | 国产AV毛片| 色135综合网| 国产日韩av在线播放| 无码电影在线观看| 亚洲成a人片在线观看88| 91视频国产高清| 日本www在线视频| 黄色网址免费在线| 国产精品免费电影| 免费亚洲成人| 欧美激情视频一区二区三区免费| 在线精品欧美日韩| 人妻无码一区二区视频| 一级一级特黄女人精品毛片| 久久99国产视频| 有专无码视频| 亚洲一区二区三区中文字幕5566| 91在线日韩在线播放| 在线亚洲天堂| 午夜色综合| 国产一级毛片yw| 亚洲视频在线网| 久久香蕉国产线| 天天爽免费视频| 欧洲免费精品视频在线| 直接黄91麻豆网站| 亚洲一区二区视频在线观看| 日韩精品免费一线在线观看| 区国产精品搜索视频| a级毛片视频免费观看| 精品国产欧美精品v| 国产精品浪潮Av| 69国产精品视频免费| 国产网站免费| 538精品在线观看| 噜噜噜综合亚洲| 国产av一码二码三码无码| 91精品免费久久久| 免费国产高清视频| 午夜少妇精品视频小电影| 日本高清在线看免费观看| 亚洲第一色视频| 中文字幕资源站| av大片在线无码免费| 国产精品va免费视频| 青青操视频免费观看| 日本成人福利视频| 九色91在线视频| a欧美在线| 成人综合网址| 亚洲一区精品视频在线| 国产日韩久久久久无码精品 | 精品自窥自偷在线看| 欧美另类视频一区二区三区| 亚洲人成网站18禁动漫无码| 久久婷婷综合色一区二区| 国产精品高清国产三级囯产AV| AV老司机AV天堂| 亚洲天堂网视频| 精品国产免费第一区二区三区日韩| www.狠狠| 国产区精品高清在线观看| 日韩视频免费| www.狠狠| 亚洲无码熟妇人妻AV在线| 欧美一区二区精品久久久| 国产在线视频二区| 国产区精品高清在线观看| 成人午夜视频免费看欧美| 日韩欧美中文字幕在线韩免费| 试看120秒男女啪啪免费| 免费视频在线2021入口|