













[摘 要] 本文以全句為窗口,參照《同義詞詞林》對現代漢語和中介語語料庫中動詞“喜歡”的共現詞的語義范疇進行了對比分析,并抽樣考察了漢語二語學習者語義范疇構建的發展過程。結果顯示:(1)和目的語者相比,二語者構建語義范疇表現為語義類的窄化和選用詞語的集中化;(2)語義范疇的構建隨漢語水平的提升而呈現鮮明的發展特點,具體表現為:語義范疇的多樣性、豐富度、匹配度和符號化都隨著漢語水平的提升而提高,但發展到某個階段會出現“化石化現象”;不同水平側重于不同位語義范疇的構建,初中級以高位語義范疇的構建為主,中高級則主要表現為具體詞類的擴展;(3)二語者構建語義范疇的豐富度和匹配度并非正相關,在語義概念一致性相對較高的中類范疇上,匹配度和豐富度表現一致,在差異較大的低位范疇詞群上,匹配度明顯低于豐富度,即語義符號化是二語者習得漢語地道性的主要影響因素,也是詞匯習得的難點。
[中圖分類號] H195.3 " [文獻標識碼] A " [文章編號] 1674-8174(2025)01-0080-12
1. 引言
語義范疇包括兩類,一類是從詞類次范疇小類歸納出來的具有范疇性的語義特征;一類是從詞語組合關系中概括出的范疇化的語義關系,其語義基礎是縱向聚合的語義特征(邵敬敏、趙春利,2006)。也就是說同目標詞組合的語義相關詞縱向聚合形成的語義范疇,構成了該目標詞的使用環境,其語義能從共現的語義相關詞得到凸顯(楊惠中,2002;Durrant,2008;徐婷婷,2020)。
二語者在習得目的語過程中會出現語義偏差,即使用不正確的語義范疇來解釋詞語或進行表達。例如:以下來自漢語中介語語料庫系統(儲誠志、陳小荷,1993)中高水平二語者的產出語料(劃線詞為原語料用詞,括號內為該位置上的正確用詞)。
(1)我們在廣州沒有過(待)很長時間,馬上(就)去了香港。
(2)一五一七年葡萄牙第一次軍隊來澳門一五五七年中國皇帝贊同(同意)葡萄牙人能在澳門和廣州做外貿……
以上語料中,傳統的詞匯偏誤類型“遺漏、誤加、誤代、錯序”(魯健驥,1987)不足以解釋二語產出不地道性的問題。對照《同義詞詞林》進行語義編碼分類可以驗證,例(1)“過”(度過)和“待”(停留)屬于不同的語義范疇,而“馬上-就”和例(2)“贊同-同意”為相同語義范疇下不同的符號表示。所謂詞匯使用不地道性的原因實質上就是語義范疇選擇和特定范疇與符號不匹配的問題。可見,在二語學習中,僅掌握詞匯的意義是不夠的。邢紅兵(2009、2012)認為學習者習得第二語言詞匯的關鍵在于以目標詞在目標語言中的運用為核心的動態詞匯知識體系的構建,即學習者需要理解詞匯在不同語境中的用法,用詞的過程同時也是語義范疇的構建與調整的過程。不同于母語者從用法到意義的獲取方式,二語知識的獲取是從意義到用法的過程,即其在已獲取母語詞匯語義范疇的基礎上選擇合適的目的語符號進行表達(邢紅兵,2020)。
目前我們對二語者語義范疇構建的探討還比較有限。相關研究主要集中在詞匯知識的變化(張江麗,2018)、詞匯豐富性研究(孫曉明,2009;吳繼峰,2016)、心理詞匯的發展(張淑靜,2005;王志軍、郝瑜鑫,2014)、搭配知識的習得(侯曉明等,2022)、詞匯句法框架知識的獲取(趙奕,2013;石高峰、楊彩影,2021)等方面。其中心理詞匯研究涉及到語義范疇,但主要為第一類語義范疇,即具有相同語義特征的詞語的縱向聚類,未充分考慮詞語間組合關系;搭配知識的習得研究考慮到了詞語的組合關系,但其考察窗口有限,無法獲取目標詞的使用環境。曲學智(2012)以動詞“看”為例,提取了全句共現詞并進行語義聚類,獲取了“看”的使用環境,并對比了中介語各水平與現代漢語的語義分布差異,可惜曲文集中于范疇層面的靜態對比未深入至特定符號層面,而二語詞匯動態知識習得的關鍵就在于能否實現由范疇到符號的正確轉化。
基于此,本文將借鑒前人的研究成果,以全句為窗口,動詞“喜歡”為目標詞,擬從語料庫中抽取其語義相關共現詞,構建該動詞的共現語義范疇庫,并與目的語進行對比,考察二語學習者在動詞使用過程中語義范疇的構建過程及范疇到符號的轉化情況,探究影響二語者習得漢語詞匯地道性的深層原因及其在語義方面的具體表現。
2. 語義范疇庫的構建
2.1 構建方法
共現詞語義范疇庫的構建方法分為語義相關共現詞的提取及語義類標注兩部分。搭配關系是共現關系的充分不必要條件,因此適用于搭配的抽取方法同樣適用于語義相關共現詞的抽取。詞語搭配的自動獲取方法可分為統計的方法、規則的方法以及規則與統計相結合的方法三類。其中統計方法主要包括:詞頻統計、平均值和方差、互信息、三次互信息及假設檢驗等(全昌勤等,2005)。本文綜合分析各統計方法,取長補短,使用互信息、t檢驗、卡方檢驗(王大亮等,2008)以及相對詞序比(RRWR)(曲維光等,2004)來確定和目標詞語義相關的共現詞,具體的淘汰指標及流程如圖1所示。
共現詞語義類標注選用《同義詞詞林》。該書是一部由概念到詞匯的漢語義類詞典,最早由梅家駒等人于1983年編纂,對漢語同義詞和同類詞進行劃分和歸類,經哈爾濱工業大學信息檢索研究室的擴展后,現有詞7萬余條,這些詞被分為12個大類,94個中類,1428個小類,小類下進一步劃分為詞群和原子詞群兩級。大類依據詞的邏輯意義劃分,以語義為主,兼顧詞類,大類下依據詞匯意義并參照題材進一步劃分中類,中類下以語義關系密切的標題詞命名為小類,小類下以基本義細分為同義詞群,再根據詞群內部詞義顯示程度和搭配范圍劃分為原子詞群,每一個詞使用一條8位編碼來表示其語義類別。總體來說《同義詞詞林》根據語義形成“范疇-概念-符號”的五層樹狀結構(見圖2)。
語義范疇由高位到低位分別是大類、中類、小類、詞群和原子詞群。以“牡丹Bh02A02=”為例,其編碼結構見表1。
本文對語料庫中含有“喜歡”的全句進行了窮盡式提取,基于統計學模型和《同義詞詞林》進行了語義相關共現詞的提取和語義范疇標注,構建了以全句為窗口的共現詞語義范疇庫,并利用MySQL儲存以便于后續的統計與計算。語義范疇庫的構建基礎、創新點、效果評價及具體操作流程另文詳述。
2.2 構建統計
現代漢語語料選用“國家語委現代漢語通用平衡語料庫”(簡稱“語委語料庫”②),在線檢索語料約2000萬字,17萬詞種數,1300萬詞頻數,語料選材類別廣泛,收錄了人文與社會科學、自然科學及綜合三大類約40個小類的語料。我們提取含“喜歡“的語料1497條,共現詞種數(type)7905個,共現總頻次(token)53819次,經過統計計算和語義匹配,最終確定心理動詞“喜歡”共有3760個語義相關共現詞,3998個語義代碼,分屬于12個大類,94個中類,955個小類,1544個詞群,2445個原子詞群。
中介語語料來自“漢語中介語語料庫系統”。該語料庫選取從學習漢語零起點開始不同社會屬性、母語背景、學習環境和個人特征的學生在學習和習得漢語過程中各個階段的書面語料,其中二語者的漢語水平以學習漢語時長進行劃分。語料庫一百萬字以上,總詞數(去除標點)16852,總頻次429922。從語料庫中共提取含“喜歡”語料905條,共現詞種數(type) 2137個, 共現總頻次 (token)13921次,經過統計計算和語義匹配,最終確定心理動詞“喜歡”共有1347個語義相關共現詞,1533個語義代碼,分屬于12個大類,89個中類,606個小類,843個詞群,1163個原子詞群。
3. 語義范疇構建及發展研究
3.1 研究指標
邢紅兵、辛鑫(2013)將詞匯知識的語料庫對比分析研究中的關鍵因素概括為“四率三度”。其中豐富度可以全面觀察詞語的使用情況,匹配度用來衡量中介語的地道性,匹配度越高,與目的語越接近,并提出二語者是在已有概念系統外學習一種新的語言符號來表達某一概念,其產出能力的高低主要取決于在表達過程中采用的語言形式與目的語間的匹配程度(邢紅兵,2020)。周琳(2020)在Read(2000:200)提出詞匯多樣性的基礎上提出詞義多樣性可用來測量學習者對同一個詞不同義項的掌握程度,并證實用于計算詞匯多樣性的Uber index①公式同樣適用于計算詞義多樣性。
參考以上概念,本文使用豐富度來考察二語學習者語義范疇的構建情況,使用匹配度來衡量二語者構建語義范疇的地道性,使用多樣性來評測學習者對不同語義范疇的選擇能力,同時,為了進一步考察二語者從概念到詞的轉換情況,我們引入語義符號化的概念來具體表征從語義范疇到具體詞項的選擇,將和目的語的共現詞及語義代碼完全匹配作為語義符號化標準,對二語者語義范疇體系的轉換程度進行測量。計算公式分別如下:
(1)語義多樣性=(log所有語義類數)2/(log所有語義類數-log不同語義個數)
(2)語義豐富度=中介語語義范疇類數/現代漢語語義范疇類數
(3)語義匹配度=中介語和現代漢語共有語義范疇類數/現代漢語語義范疇類數
(4)語義符號化=中介語和現代漢語共有共現詞②數/現代漢語共現詞數
3.2 語義范疇對比分析
通過對現代漢語和中介語“喜歡”共現詞語義范疇庫的簡單對比,發現兩個語料庫在最高位的語義范疇上是一致的,都涵蓋了12個大類,也證實了使用不同語言的人的思維對客觀事物的反映基本一致(梅家駒、高蘊琦,1990),二語學習者在學習新語言之前已經形成了完整的范疇概念系統。
3.2.1 語義多樣性
本文首先使用Uber Index對現代漢語和中介語共現詞語料庫的詞匯多樣性及不同位語義范疇上的語義多樣性進行了測量。詞匯多樣性結果分別為26.29和21.29。語義多樣性統計結果見圖3。
統計結果可見,中介語在詞匯多樣性、語義多樣性和現代漢語相比都存在一定的差距。無論是高位語義范疇還是低位語義范疇,差距隨著語義范疇的細化逐漸增大,我們認為二語者習得詞匯不僅在于詞匯本身的音形義,還包括詞匯所在的環境是否能獲取到,由結果可見,語義分類越細,和目的語的差距越大,表明二語學習者在詞匯使用過程中語義范疇構建的難點主要集中在低位語義范疇上。
為了考察在相似語義多樣性的高位語義范疇下的共現詞使用情況,我們分別對兩個語料庫中大類范疇下的共現詞數及其共現頻次進行了統計,其中共現詞出現一詞多義分別計算詞數,對比結果見圖4及圖5。
從圖4和圖5可見,中介語語料庫中“喜歡”共現詞的大類語義范疇詞數和頻次都少于現代漢語語料庫,但表現出相似的模式。從各語義大類詞數和頻次所占比例來看,兩個語料庫中各語義大類的比例分布基本一致,共現詞數前5位語義類依次為:抽象事物(D)、物(B)、活動(H)、特征(E)和助語(K),共現頻次前5位語義類分別為:助語(K)、人(A)、抽象事物(D)、活動(H)、物(B)。依據《同義詞詞林》的編排原則,人、物、抽象事物多屬名詞,特征多屬形容詞,活動多屬動詞,助語多屬虛詞,排名前5的語義類的共現詞主要為實詞所占比例分別為現代漢語57.05%、中介語61.32%,虛詞所占比例分別為現代漢語10.06%、中介語8.94%。各語義類共現詞的動態使用情況表現為現代漢語實詞分布比例(47.43%)少于中介語實詞分布比例(49.35%),而中介語虛詞分布比例(32.43%)高于現代漢語虛詞分布比例(28.91%),明顯可看出二語者使用虛詞時存在集中化趨勢。
3.2.2 語義豐富度
由最初簡單對比可知,中介語和現代漢語在最高位的大類語義范疇的覆蓋上并無差異,因此我們對大類下的中類語義范疇的分布情況進行了對比統計,如表2所示。
從表2可見,中介語基本覆蓋了現代漢語的語義范疇,差異主要表現在人(A)、物(B)、抽象事物(D)和活動(H)四類,依據《同義詞詞林》對詞性的說明,即主要是名詞的差異,具體表現如下(括號內為出現頻次)。
Ac 體態:美人(3)、 胖子(1)
An 丑類:反動派(1)
Bj 微生物:菌(8)、病毒(4)、桿菌(1)
DI 疾病:傷口(6)、 肺炎(1)
Ha 政治活動:階級斗爭(3)、當家作主(1)
對照《漢語水平等級詞匯大綱》,我們發現除“胖子、菌、病毒、肺炎”是丁級詞匯外,其余皆為超綱詞,鑒于詞數和頻次在現代漢語中所占比例極低,且名詞為開放性詞類,我們認為在中類范疇上,二語學習者基本習得了目的語的語義范疇,也間接證實二語者語義范疇構建的難點主要還是體現在低位范疇上。此外,對于現代漢語,沒有發現活動大類下的迷信活動(HL)中類共現詞,可以認為該語義范疇不屬于或不常出現在“喜歡”的語境范疇內。
根據詞林的編寫原則,表示同一基本義的詞放入同一詞群,為了進一步探查二語學習者低位語義范疇的構建情況,我們對詞群的語義分布進行了統計,見表3。
表3可見,隨著語義范疇的細化,共現詞的聚類集中在了特定詞群。在低位語義范疇上,中介語和現代漢語差異顯著。整體來看,中介語詞群豐富度為54.60%,和高位范疇94.62%的豐富度相比,出現了明顯的語義類窄化。12大類中有8大類的詞群豐富度超過了50%,助語(K)大類的豐富度為62.81%,助語類主要是虛詞,助語類豐富度最高的詞群為“非常”(Ka01A)類副詞,表明二語者習得了目標詞“喜歡”的程度語境范疇。語義類窄化更明顯表現在動作類(F)(44.44%)和更抽象的現象與狀態類(I)(37.78%)。
3.2.3 語義匹配度
為了考察二語學習者的地道性情況,我們對詞群的匹配度也進行了統計,結果如表4。
統計結果顯示,中介語聚類的843個詞群中有71.77%和現代漢語相匹配,占現代漢語詞群的39.18%。其中時間與空間(C)、助語(K)大類的匹配度分50%、52.89%,分別占中介語詞群的90.91%和84.21%,表明在最為基礎的時-空范疇的構建上要優于其他類別。匹配度最低的詞群類為敬語(L),敬語類以難歸類的客套語為主,現代漢語中“喜歡”的共現詞“敬語類”聚類有四個詞群且詞數和頻次均為1,可見這類詞顯然不是“喜歡”的核心語義范疇。其次為現象與狀態(I)類,該類詞多為抽象類詞,通過統計數據可以看出,該類中除了始末類(Ig)完全匹配外,其他詞群匹配度均較低。由此可以推測,使用不同語言者在更細化的語義范疇上具有相似性和差異性,相似的語義范疇,比如時間空間范疇,構建要更接近于目的語者水平,抽象化的語義范疇的構建難度較大。
3.2.4 語義符號化
為進一步檢驗二語者從概念到具體詞的選擇情況,本文對現代漢語和中介語最低位語義范疇原子詞群的共有共現詞的語義分布進行統計,總詞數576個,共現總頻次9100次,分屬于70個中類,321個小類,395個詞群,458個原子詞群。統計結果見表5。
統計結果可以看出,中類范疇上,兩個語料庫的總語義分布率均超過了75%,但在詞群范疇上都小于50%且差異顯著,即二語學習者在構建語義范疇時隨著語義范疇的細化出現了語義窄化現象,這一點從單個類的匹配度變化也能體現出來,例如現象和狀態類(I)的匹配度從中類逐漸細化到原子詞群的匹配度分別為100%、20%、4.44%,封閉的虛詞類助語(K)的匹配度分別為100%、52.89%、45.45%,由此可見從概念到符號的轉變確實是二語詞匯習得的難點。
同時我們還對具體語義下匹配的共現詞數和共現頻次分布進行了統計,見表6。
從表6統計可看出,在具體的概念向詞匯的轉換過程中,中介語不僅表現出語義的窄化,還表現出詞語選擇和使用的相對集中化。例如,從句法語義界面(syntax-semantics-inferface)上看,“喜歡”作為突顯人物心理的SE動詞(Subject-Experiencer verb),共現的語義范疇必然包含兩類名詞,喜歡的感受者和對象,在作為感受者的人(A)語義范疇下,兩個語料庫共有詞占現代漢語的19.38%,使用頻率占70.24%,占中介語的詞比例和頻次比例分別為51.11%和92.18%,明顯顯示出詞語選擇和使用的集中趨勢。
3.3 語義范疇發展變化研究
為了觀察二語者的語義范疇構建的發展過程,我們以學習漢語的時長為標準把中介語語料庫分為初級(0.5-1年)、中級(1.5-2.5年)和高級(gt;2.5年)三個子語料庫,采用分層隨機抽樣的方法各抽取124句,并對語義多樣性、語義豐富度、語義匹配度及語義符號化進行了測算和統計。
本文首先對不同水平的二語者構建語義范疇的多樣性發展情況進行了單因素方差分析,結果表明:不同水平的二語者在語義多樣性上沒有顯著差異F(2,366)=1.380,p=0.253,整體多樣性統計結果表明:U值隨著漢語水平的提高而增加,如表7所示,這表明二語學習者會隨著漢語水平的提高呈現語義擴充。我們猜測個體差異并不顯著,這一方面是由于我們考察的是“喜歡”的單句,而單句共現的語義范疇有限,另一方面,語義的發展是一個緩慢的過程,詞語的使用環境在大的范圍下是固定的,我們組建不同的句子也只是在某一語義范疇下挑選不同的詞語,這從不同漢語水平共現詞增長情況也可以看出來,見表8。
從表8可以看出,“喜歡”共現詞無論從詞數還是從所聚類的語義數上來看,中級都比初級有所增加,高級比中級有增長。就共現詞的增長幅度而言,中級至高級低于初級至中級。Selinker(1972)提出“化石化現象”理論,認為絕大多數的二語學習者的第二語言能力發展到一定階段后就會停滯不前。本研究發現也佐證了這一觀點,中級學習者的詞匯發展緩慢并在達到一定水平時發生“化石化現象”。
不同水平的二語學習者語義豐富度和匹配度統計結果如表9所示。表9可見二語者漢語水平的提高會引起所構建的語義范疇豐富度與匹配度的變化。具體表現為隨著漢語水平的提升,二語者構建語義范疇的豐富度和匹配度在中類范疇下逐漸增長,在詞群范疇下,豐富度隨漢語水平的提升增長,匹配度并沒有出現相同的情況,由初級到中級匹配度顯著增長后,至高級階段則維持相似的水平,也就是說隨著學習者詞匯量的增長,在低位范疇下,匹配度和豐富度并沒有呈現正相關。
本研究同時也對不同水平的二語學習者語義符號化情況進行了統計,和目的語相比,初、中、高級共有共現詞數分別為168、217、218,語義符號化比率分別為4.2%、5.4 %、5.5%,和語義豐富度一致,概念到具體詞的轉化情況也隨著漢語水平的提升逐步改善。
4. 綜合討論
以上研究結果表明,和目的語者相比,二語學習者在動詞使用過程中語義范疇的構建主要表現為語義類的窄化和詞語使用的集中化,并且呈現出明顯的發展特點,具體表現為:隨著漢語水平的不斷提高,產生了語義和詞匯的雙重拓展,語義的多樣性、豐富度、匹配度以及符號化程度逐漸提高,而發展到一定階段容易產生“化石化現象”。這也與Schmitt(1998)的研究結論相似,即二語者的詞匯語義的發展是一個緩慢的過程,語義石化現象時有發生。以下我們從三個方面具體討論研究結果。
(1)二語者動詞語義范疇構建呈現語義類窄化和詞語集中化,不同水平階段側重構建不同位語義范疇。和目的語者相比,隨著語義范疇的細化語義多樣性差距逐漸增大,二語者語義范疇的構建難度主要在低位范疇上,雖然在共現詞和使用頻次上表現出和目的語大致相同的模式,但存在著詞語使用集中化的趨勢。例如,中介語中虛詞所占的比例(8.94%)低于現代漢語(10.06%),使用的分布比例(32.43%)卻高于現代漢語(28.91%)。就其發展而言,隨著漢語水平的提升,語義多樣性同步增加,但伴隨語義范疇細化呈現出語義類變窄,詞語集中的特點。在共現詞總量上,二語學習者由初級到高級,單語義詞數、多語義詞數、總語義數均呈現增長趨勢,其中初級至中級的增幅除多語義詞數都高于42%,中級到高級的增幅低于5%,且單語義詞數增幅為2.7%,多語義詞數增幅接近20%。這說明中級到高級語義的多元化發展要大于初級到中級,詞匯量的增加先集中在單語義,隨水平的增長發展多語義,這也是語義多樣性發展的表現。統計中我們還發現在高位語義范疇中類上二語者的語義類逐漸擴充,低位語義范疇詞群上,中級語義范疇類數明顯高于初級,高級和中級之間沒有明顯差異。這一結果說明,漢語學習初、中級階段以高位語義范疇的構建為主,對原有語義范疇進行整合和調整,包括語境語義范疇的擴充,語感的培養;中高級階段側重于具體詞群的構建和同義詞語的擴充,即概念到具體符號的轉化。
(2)二語者動詞語義范疇構建由典型化向非典型化逐步擴充。和目的語者相比,二語者基本已經完成了大類和中類的構建,差異主要表現在低位語義范疇,即詞群的構建上出現了明顯的語義類窄化(54.6%),主要表現在動作類(F)(44.44%)和更抽象的現象與狀態類(I)(37.78%)。語義豐富度也隨漢語水平的變化而發展,說明語義范疇的構建是一個動態的連續統,隨詞匯量擴展和目標詞匯運用的加深,語義范疇逐步擴展,具體表現在匹配的語義類以擴展詞匯為主,非匹配的語義類以拓展語義類為主,例如,中介語和現代漢語完全匹配的時-空范疇(C),從初級的30個詞發展到中級的35個詞再到高級的40個詞,而不完全匹配的大類范疇人(A),初級有5個中類范疇(Aa、Ab、Ah、Aj、Al),中級又增加了職業范疇(Ae),高級階段在前6個中類范疇的基礎上又增加了籍屬(Ad)和身份(Af)兩個中類范疇。無論在高位語義范疇中類上還是在低位語義范疇詞群上,初級到中級的發展都快于中級到高級的發展,并且中類發展的增幅要大于詞群發展的增幅。蔣紹愚(2014)提出一些重要的概念范疇在全人類具有共通性,二語者習得詞匯是以原有概念為前提,學習全新的語言表達形式(邢紅兵,2013),一致性良好的語義概念的習得要優于非一致且缺失性較高者,這從中類的豐富度、匹配度一致,而詞群的豐富度和匹配度卻相差較大也能表現出來。
(3)二語者動詞語義范疇構建逐步趨近目的語者,抽象類范疇構建及語義符號化是其構建的難點。語義匹配度能夠衡量中介語地道性程度,和目的語者相比,時間空間(C)類匹配度最高,占中介語詞群的90.91%,占現代漢語詞群的55%,抽象類現象與狀態(I)匹配度最低,占中介語詞群的52.9%,占現代漢語詞群的20%。可見,抽象范疇的構建是二語學習者構建的難點,相對于范疇一致性的時間空間類主要擴展詞匯而言,抽象類的范疇構建要點主要集中在語義類的逐步增加。此外,統計結果顯示在高位范疇上,豐富度和匹配度發展相一致,即二語者隨著漢語水平的提升,逐漸習得詞語的大類使用環境,但在低位范疇上,即使發展到高級階段,詞群的匹配度也較低且與目的語者存在明顯區別(Singleton,1999),并沒有隨著詞匯量的增長而增大。邢紅兵(2020)認為二語學習者目的語知識體系構建的首要階段是目的語概念與符號聯結體系的建立,石高峰等(2021)提出二語學習者搭配的錯誤主要體現為使用語義相關的詞語進行規則化的不地道產出問題上,從統計結果我們也可以明顯看出,二語者在最低位原子詞群的構建上,即從語義范疇到具體詞項的選擇上表現為詞語的泛化和集中化。例如,人(A)語義范疇下,兩個語料庫共有詞占現代漢語的19.38%,使用頻率占70.24%,占中介語的詞比例和頻次比例分別為51.11%和92.18%。而從發展變化的統計數據來看,語義符號化是發展最緩慢卻最容易出現“化石化現象”,這也從側面說明語義符號化是二語學習者詞匯習得的難點。
5. 結論
本文采用中介語對比分析的方法對二語學習者在動詞使用過程中語義范疇的構建過程進行了考察。主要的研究結論有:(1)和目的語者相比,二語者所構建的語義范疇呈現出語義類窄化和詞語集中化等特點;(2)二語者在詞語使用過程中所構建的語義范疇受漢語水平的影響較大,語義范疇的多樣性、豐富度、匹配度和符號化都隨著漢語水平的提升而提高,但發展到一定階段會出現“化石化現象”;不同水平的二語者語義范疇構建也不平衡,初、中級階段以高位語義范疇的構建為主,中高級階段側重于具體詞群和同義詞語的擴充;(3)二語者構建語義范疇的豐富度和匹配度并非正相關,具體表現在語義概念一致性相對較高的中類范疇上,匹配度和豐富度表現一致;在差異較大的低位范疇詞群上,匹配度明顯低于豐富度,即語義符號化是影響二語者習得漢語地道性的主要影響因素,也是詞匯習得的難點。
另外,作為全句共現語義聚類研究的一次嘗試,本研究也存在不足之處。比如為了自動抽取語義范疇,以《同義詞詞林》為參照資源,在中介語語料庫中漏掉的未登錄詞包含了第二語言學習者特有的偏誤合成詞,該部分詞在認知上所歸屬的語義范疇對于二語學習者語義構建同樣具有一定的價值,這有待進一步的深入研究。
[參考文獻]
儲誠志,陳小荷 1993 建立“漢語中介語語料庫系統”的基本設想[J]. 世界漢語教學(3).
侯曉明,孫培健,張婷婷 2022 整體頻次和搭配強度在母語和二語多詞序列加工中的作用——以漢語雙字副詞短語為例[J].世界漢語教學(2).
魯健驥 1987 外國人學習漢語的詞語偏誤分析[J].語言教學與研究(3).
梅家駒,高蘊琦 1990 語義形式化的研究[J].外國語(上海外國語學院學報)(5).
梅家駒,竺一鳴,高蘊琦,殷鴻翔(編) 1983 同義詞詞林[M].上海:上海辭書出版社.
曲維光,陳小荷,吉根林 2004 基于框架的詞語搭配自動抽取方法[J].計算機工程(23).
曲學智 2017 基于全句內共現的現代漢語和漢語中介語詞匯知識對比研究[D]. 北京語言大學碩士學位論文.
全昌勤,劉 輝,何婷婷 2005 基于統計模型的詞語搭配自動獲取方法的分析與比較[J].計算機應用研究(9).
邵敬敏,趙春利 2006 關于語義范疇的理論思考[J].世界漢語教學(1).
孫曉明 2009 留學生產出性詞匯的發展模式研究[J].民族教育研究(4).
石高峰,楊彩影 2021 漢語動詞句法框架信息加工機制及二語習得研究[J]. 語言教學與研究(1).
石高峰,楊彩影,李梅秀 2021 漢語二語學習者詞匯搭配知識地道性發展研究[J].國際中文教育(中英文)(3).
王大亮,涂序彥,鄭雪峰,佟子健 2008 多策略融合的搭配抽取方法[J]. 清華大學學報(自然科學版)(4).
王志軍,郝瑜鑫 2014 母語環境下美國漢語學習者心理詞匯發展的實證研究[J].語言教學與研究(1).
吳繼峰 2016 英語母語者漢語寫作中的詞匯豐富性發展研究[J].世界漢語教學(1).
邢紅兵 2009 中介語詞匯與現代漢語詞匯對比分析[J]. 對外漢語研究(1).
——— 2012 第二語言詞匯習得的語料庫研究方法[J]. 漢語學習(2).
——— 2013 詞語搭配知識與二語詞匯習得研究[J]. 語言文字應用(4).
——— 2020 第二語言詞匯知識的構成與發展[J]. 華文教學與研究(2).
邢紅兵,辛 鑫 2013 第二語言詞匯習得的中介語對比分析方法[J]. 華文教學與研究(2).
徐婷婷 2020 基于語言事實的動詞信息語義特征知識體系構建[D]. 北京語言大學博士學位論文.
楊惠中 2002 語料庫語言學導論[M].上海:上海外語教育出版社.
趙 奕 2013 基于語料庫的單一動詞句法框架研究及二語習得考察[D]. 北京語言大學碩士學位論文.
張江麗 2018 漢語作為第二語言學習者筆語產出性詞匯研究[J]. 世界漢語教學(3).
張淑靜 2005 從聯想測試看二語心理詞匯之間的聯系[J]. 解放軍外國語學院學報(2).
周 琳 2020 漢語二語學習者詞匯語義系統動態發展研究[J]. 世界漢語教學(1).
Durrant, P. L. 2008 High Frequency Collocations and Second Language Learning[D]. Ph.D Thesis, University of Nottingham.
Read, John 2000 Assessing Vocabulary[M]. Cambridge: Cambridge University Press.
Singleton, D. 1999 Exploring the Second Language Mental Lexicon[M]. Cambridge: Cambridge University Press.
Schmitt, N. 1998 Tracking the incremental acquisition of second language vocabulary: A longitudinal study[J]. Language Learning(48).
A study on the process of constructing semantic categories
of verbs for CSL learners: Taking xihuan (喜歡) as an example
YAN Yaya, XING Hongbing
Key words: second language acquisition; whole sentence co-occurrence; contrastive interlanguage analysis; lexical knowledge; semantic category
Abstract: This study, taking full-sentences as the window and with reference to Chinese Thesaurus, compares the co-occurrence of semantic categories of the verb xihuan(喜歡)in modern Chinese and in the interlanguage corpus, and investigates the construction and development of semantic categories by CSL learners. The results show that: (1) as compared with the target language, the construction of semantic categories by CSL learners is characterized by the narrowing of semantic categories and the concentration of chosen words; (2) the construction of semantic categories shows distinct developmental characteristics with the improvement of Chinese language proficiency, specifically the semantic diversity, semantic richness, semantic matching and semantic symbolization, all of which increase along with the improvement of Chinese language proficiency, but at a certain stage of development, the “fossilization phenomenon” appears; (3) the richness and matching of the semantic categories constructed by CSL learners are not positively correlated; the middle categories, which are the categories with relatively high semantic conceptual consistency, have a consistent matching and richness performance, while as for the lower category word groups with large differences, their matching is significantly lower than their richness, i.e., semantic symbolization is the main influence on bilinguals acquisition of Chinese. In other words, semantic symbolization is the main factor influencing the acquisition of Chinese as well as the difficulty of vocabulary acquisition.
【責任編輯 師玉梅】
[收稿日期] 2023-08-02
[作者簡介] 閆亞亞,女,暨南大學華文學院/國家語委海外華語研究中心,主要從事漢語學習與認知研究,
yan_yaya@foxmail.com;邢紅兵,男,北京語言大學國際學生教育政策與評價研究院,主要從事漢語學習與認知研究,xinghb@blcu.edu.cn。
[基金項目] 北京語言大學一流學科團隊支持計劃項目“語言測試與教育評價研究”(2023YJC02);世界漢語教學學會2023年中青年學術創新項目“‘把’字句對動詞選擇頻率關系的漢語二語習得過程研究”(SH23Y12)