999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

詞語感情色彩極性判斷與強度測量方法研究

2022-07-03 14:58:39李淑云王世昌楊振蘭
現代語文 2022年6期

李淑云 王世昌 楊振蘭

摘? 要:感情色彩是詞義的重要組成部分,目前對感情色彩極性的判斷和強度的測量多采用內省法,尚未形成客觀有效的標準。從語境、語義韻、構形、計算等四個角度,對感情色彩極性與強度的判斷、測量方法進行研究,并以典型的感情色彩種子詞來驗證方法的可行性。希望能夠探索出較為科學客觀的方法,以規避內省法所產生的主觀性偏誤。

關鍵詞:感情色彩極性;感情色彩強度;種子詞;語義韻

一、引言

葛本儀指出:“詞的色彩意義是指詞所表示的某種傾向或情調的意義。”[1](P111)感情色彩作為色彩意義的一種,是詞義的重要組成部分,影響著人們對詞語的理解和認識。

漢語學界對感情色彩的研究主要集中于以下方面:一是對感情色彩分類的探討。其中,影響最大的是傳統的褒義、貶義、中性三分法,除此之外,各家又提出了不同觀點。如章炎又增加了褒貶詞這一類型[2];武占坤、王勤將感情色彩分為敬重禮貌的、喜愛褒獎的、厭惡貶斥的和委屈諱飾的四種類型[3];張可任將感情色彩詞先劃分為中性詞和帶有感情色彩的詞,在此基礎上又進一步細分[4];楊振蘭則從具體內容和性質方面,對感情色彩作出分類[5]。二是對某詞或某類詞的感情色彩、感情色彩演變的研究。如姚曉紅探討了“啊”

“吧”等常用語氣詞所表示的感情色彩及意義[6];陶楓對《現代漢語詞典》三音節詞的色彩義作了分析[7];楊振蘭探究了色彩意義演變發展的語言誘因[8];刁晏斌則對現代漢語詞義感情色彩的兩次大規模變遷進行了論述[9]。

可以說,語言學界關于感情色彩的研究已取得豐碩的成果,不過,對感情色彩極性的判斷和強度的測量大多采用內省法,尚未形成客觀標準。我們試圖運用定性與定量相結合的方法,從語境、語義韻、構形、計算等角度,對這一問題進行探討,然后對照所歸納的典型的感情色彩種子詞,進一步驗證該方法的可靠性。

二、感情色彩種子詞的選取

為了對感情色彩極性和強度進行較為科學的評估,我們主要通過定量等方法進行研究。方法的可行性首先要通過感情色彩明確的詞語來驗證,因此,種子詞的選取是至關重要的。由于本文主要是考察感情色彩的極性和強度,所以我們選取了兩類種子詞:一類是感情色彩極性明確的種子詞,另一類是感情色彩強度分明的種子詞。

(一)感情色彩極性明確的種子詞

楊立公等指出,“情感極性分為兩極,即正面(Positive)的贊賞和肯定、負面(Negative)的批評與否定,也有一些學者在正面和負面之間加入了中性(Neutral)”[10](P1574)。為了選取感情色彩極性較為明確的種子詞,我們使用了情感詞典。情感詞典以收錄感情色彩較為明顯的詞語為主,中性詞較少,并且這些詞語的感情色彩多滲透于詞匯意義之中,而非附加在詞匯意義之上。本文所選取的種子詞以正面感情色彩詞和負面感情色彩詞為主,所探討的也主要是滲透于詞匯意義中的感情色彩。

大連理工大學所研發的中文情感詞匯本體庫[11]是影響較大的情感詞典,共收錄了27466個詞。它不僅對詞作了情感分類,而且對其感情強度進行了分檔,共分為1、3、5、7、9五檔,數字越大,則強度越大。其中,9的強度最大,感情色彩也最為鮮明。我們將這部分共2529個詞提取出來,作為種子詞的備選詞。為了保證種子詞感情色彩的認可度,我們又從知網HowNet情感詞典中選取了836個正面感情色彩詞語和1254個負面感情色彩詞語,并將臺灣大學的NTUSD情感詞典作為參考。本研究將強度為9且同時被另外兩典收錄的情感詞進行提取,共得到42個詞語,我們將這些詞語作為感情色彩明確的種子詞。這42個詞語及其情感詞匯本體庫中的情感類別,如表1所示:

(二)感情色彩強度分明的種子詞

為了對詞的感情色彩強度進行分析,我們也選取了部分種子詞。這些詞語的詞匯意義相同或相近,語法意義相同,感情色彩有差別,并且強度比較明晰。同樣以中文情感詞匯本體庫為基礎,以BosonNLP情感詞典為參照。它們都對詞的感情色彩強度作了標注,情感詞匯本體庫將感情色彩強度分為5檔,BosonNLP情感詞典則有具體情感值的標注。我們對兩典的感情色彩強度和情感值標注作了相關性分析,考察兩典對詞的感情色彩強度的評估是否具有較高一致性。兩典共有詞為9131個,我們對這些詞的感情色彩強度作相關分析后發現,兩典的相關系數為0.08,一致性較低。這說明兩典對感情色彩強度的評估有較大差距。兩典相關性散點圖如圖1所示:

盡管兩典的整體一致性較低,但仍有部分詞語的感情色彩強度標注一致,說明這些詞語的感情色彩強度差異相對明顯。我們提取了情感詞匯本體庫中悲傷類和快樂類的部分感情色彩詞,這些詞的感情色彩強度和BosonNLP情感詞典標注的情感值相吻合,強度越高,情感值越高。我們從中選取了“心花怒放”“雀躍”“歡暢”“滿面春風”“悲痛欲絕”“悲慟”“悲傷”“惋惜”8個詞語,其具體的強度和情感值如表2所示:

從表2可以看出,“心花怒放”“雀躍”“歡暢”“滿面春風”四詞的感情色彩強度是遞減的,“悲痛欲絕”“悲慟”“悲傷”“惋惜”四詞的感情色彩強度也是遞減的。

三、詞的感情色彩極性判斷及強度的測量

為了對詞的感情色彩極性和強度進行判斷,我們提出了四種方法:一是通過語境來判斷感情色彩;二是通過語義韻來判斷感情色彩;三是通過構形來判斷感情色彩;四是通過計算來判斷感情色彩。

(一)借助語境判斷感情色彩

楊振蘭認為,“詞的意義主要講究信息交流的準確、有效、和諧、得體,受語義環境的制約更多一些”。作者還指出,“每種色彩類型在動態應用中都會產生適宜各自特點的語境體系”[12](P37)。在大部分情況下,詞的色彩意義和語義環境是一致的、協調的,只有在這種環境下,信息交流才會準確、得體。因此,以詞語經常出現的語境來判斷其感情色彩是相對合理的。楊振蘭提出,“能為色彩意義提供區別功能的語境為有效語境,否則為無效語境,也可稱之為零語境”[12](P39)。也就是說,找到有效語境就可以幫助我們區分感情色彩。

1.同一語境與不同詞語的適配度

由于語境與在語境中出現的詞語應是協調的,因此,可以采用某個特定語境來檢測意義相近的詞語的感情色彩。我們從BCC語料庫[13]中選取了以下兩個語境:

(1)慕塔芝的死讓大帝? ? ,傳言他一夜白了頭。(維卡斯·斯瓦魯普《貧民窟的百萬富翁》)

(2)當然,大多數是? ? 、同情、好奇,等著看以后的戲。(張潔《沉重的翅膀》)

1)通過語境判斷感情色彩極性

(3)慕塔芝的死讓大帝滿面春風,傳言他一夜白了頭。

(4)當然,大多數是滿面春風、同情、好奇,等著看以后的戲。

在兩個語境中分別放入“滿面春風”,它與句中的“死”“同情”等表示消極傾向的詞具有明顯沖突,句子變得很不合理,在邏輯上也難以成立。由此可以判斷“滿面春風”呈現積極色彩。在情感詞典中,該詞的情感語義屬快樂類,具有積極色彩,因此,即使“滿面春風”的積極情感強度僅僅為1,也難以進入消極色彩較為明顯的語境。這與我們的判斷基本一致。

2)通過語境判斷感情色彩強度

(5)慕塔芝的死讓大帝悲痛欲絕,傳言他一夜白了頭。

(6)慕塔芝的死讓大帝悲慟,傳言他一夜白了頭。

(7)慕塔芝的死讓大帝悲傷,傳言他一夜白了頭。

(8)慕塔芝的死讓大帝惋惜,傳言他一夜白了頭。

這一語境中所出現的“死”“一夜白了頭”,消極程度都比較高。我們發現,詞語悲傷的感情色彩強度越高,整個語境就越合理,可接受程度也越高。如果只是達到“悲傷”“惋惜”的強度,那么就無法與“一夜白了頭”的后果相匹配。

(9)當然,大多數是悲痛欲絕、同情、好奇,等著看以后的戲。

(10)當然,大多數是悲慟、同情、好奇,等著看以后的戲。

(11)當然,大多數是悲傷、同情、好奇,等著看以后的戲。

(12)當然,大多數是惋惜、同情、好奇,等著看以后的戲。

這一語境中所出現的“同情”“好奇”“看以后的戲”等,反映出大多數人持一種“事不關己,高高掛起”的態度。那么,此處所要補充的詞語,其悲傷的感情色彩強度越低,整個語境就越合理。如果達到“悲慟”乃至是“悲痛欲絕”的強度,也就不會出現“等著看以后的戲”這種做法。

通過這兩個語境,可以發現,“悲痛欲絕”“悲慟”“悲傷”“惋惜”的感情色彩強度是遞減的。

為了防止個人判斷出現偏誤,我們還發放了調查問卷對此進行驗證。本次研究共收回97份問卷。研究顯示,在“慕塔芝的死讓大帝? ? ,傳言他一夜白了頭”這一語境中,有86人選擇了“悲痛欲絕”,10人選擇了“悲慟”,0人選擇了“悲傷”,1人選擇了“惋惜”。在“當然,大多數是? ? 、同情、好奇,等著看以后的戲”這一語境中,有83人選擇了“惋惜”,8人選擇了“悲傷”,4人選擇了“悲慟”,2人選擇了“悲痛欲絕”。不難看出,大部分人可以通過具體語境來匹配與其感情色彩強度相當的詞語。同時,第二個語境中的感情色彩強度由低到高,選取的人越來越少,也可以說明,通過語境來確定感情色彩強度是可行的。

2.同一詞語在不同語境的適配度

1)通過語境判斷感情色彩極性

我們從CCL語料庫中選取了四個具有積極傾向的語境,并將“悲傷”放入四個語境中。

(13)當他登上飛機,看到華西新樓成群、田園似錦的興旺景象,禁不住悲傷,熱淚交流。(袁養和、孫海燕《華西村何以能“永葆先進”?》)

(14)我好比暗中忽見燈光,驚喜之下,幾乎悲傷起來。(豐子愷《藝術的逃難》)

(15)從劉老漢臉上,人們看到了一個普通農民實現愿望后的那種滿足與悲傷。(《人民日報》,1995-01)

(16)他不能在一天之內兩次失態,也不能違背自己寬厚的天性,再見了姑娘們笑,便也悲傷地對她們微笑。(杰克·倫敦《馬丁·伊登》)

可以發現,盡管這四個語境的積極傾向不同,但無論是哪一種語境,“悲傷”在語境中的可接受度都很低。可見,“悲傷”的感情色彩極性不是積極的。

2)通過語境判斷感情色彩強度

在不同的語境中,其語義環境所體現的整體感情色彩也是不同的。如果一個詞語所適配的是感情色彩強度更高的句子,那么其感情色彩的強度也就越高。我們從CCL語料庫中選取了以下四個語境,將“心花怒放”分別放入四個語境中,體會哪個的感情色彩與它更為吻合。

(17)當他登上飛機,看到華西新樓成群、田園似錦的興旺景象,禁不住心花怒放,熱淚交流。

(18)我好比暗中忽見燈光,驚喜之下,幾乎心花怒放起來。

(19)從劉老漢臉上,人們看到了一個普通農民實現愿望后的那種滿足與心花怒放。

(20)他不能在一天之內兩次失態,也不能違背自己寬厚的天性,再見了姑娘們笑,便也心花怒放地對她們微笑。

在上述語境中,例(17)中的“熱淚交流”表示的是快樂到流淚,例(18)中快樂的程度是“驚喜”,例(19)中的快樂則與“滿足”相對,例(20)中的快樂所表現出的是“微笑”。顯然,“心花怒放”與例(17)的語境更為契合。

在收回的97份問卷中,我們發現,有27人選擇例(17),占比為27.84%;有15人選擇例(18),占比為15.46%;有46人選擇例(19),占比為47.42%;有9人選擇例(20),占比為9.28%。在原有的整個語境中,感情色彩強度的排列應當是:例(17)>例(18)>例(19)>例(20),“心花怒放”對應的是例(17)這個強度最高的語境;而被試選出的結果卻是例(19)>例(17)>例(18)>例(20)。例(19)被認為是與“心花怒放”相協調的語境,這說明有效語境的選取是有一定難度的。而選擇例(17)、例(18)、例(20)的數量是遞減的,這說明,在剩余的語境中,感情色彩強度越低的語境,在人們的心理感受中,越是難以與強度較高的“心花怒放”一詞相搭配。也就是說,語境是可以判斷感情色彩強度的,但有時也會產生一些問題。

綜上所述,通過語境來判斷詞語的感情色彩比較可靠,操作起來比較方便,與此同時,也存在一定問題。一是語境雖然為感情色彩的判斷提供了方法,但是個人的主觀判斷還是難以避免會帶來一定的偏誤;二是在面對感情色彩的強度這一問題時,通過語境之間感情色彩的細微差別,來分辨詞語之間感情色彩強度的不同,仍然是比較困難的;三是只有在特定的語境中才能夠判斷詞語的感情色彩,這就是所謂的“有效語境”,而有效語境有時是比較難找的;四是關于中性詞判斷的問題,楊振蘭指出,自由語境指稱沒有任何要素限制的語境,中性色彩意義往往出現于自由語境中[12](P39)。本文并未對自由語境進行實驗,主要是因為自由語境的尋找難度更大。

如果能夠找到普適性較強的語境,那么第三個問題就能得以解決。徐建宏指出,“蠻”在作為程度副詞出現時,它所修飾的形容詞不能是貶義的[14]。我們在BCC語料庫中隨機抽取了500條“N(NP)+蠻+A”句型語料,發現僅有6條語料中的形容詞是貶義的,它們分別是“可憐”“荒謬”“坎坷”“壞”“毒”“落魄”。我們可以將“N(NP)+蠻+A”句型作為普適性較強的有效語境,來判斷詞的感情色彩極性,不過,這一語境卻無法判斷感情色彩的強度,并且有更多規則仍有待探索。

(二)借助語義韻判斷感情色彩

衛乃興指出:“一定的詞項會習慣性地吸引某一類具有相同語義特點的詞項,構成搭配。由于這些具有相同語義特點的詞項與關鍵詞項在文本中高頻共現,后者就被‘傳染’上了有關的語義特點,整個語境內就彌漫了某種語義氛圍,這就是語義韻(semantic prosody)。”[15](P300)簡言之,某一詞項在長期的實際使用中,會受到常用搭配詞項的影響,從而感染到與搭配詞相近的語義色彩,最終形成積極語義韻、消極語義韻或是中性語義韻。

1.借助語義韻判斷感情色彩極性

一個詞的語義韻是通過搭配詞的感情色彩而確定的,當一個詞的語義韻被明確后,可以得知它長期實際使用時所出現的語境。我們可以使用已明確語義韻的詞語,來判斷它所搭配詞的感情色彩極性。通過詞語的語義韻來判斷搭配詞的感情色彩,其實也是借助語境來判斷感情色彩,不過,運用語義韻這一方法,能夠借助的語料更多,所運用的計量方法也更為客觀。

王紅旗認為:“在‘有點兒A’‘有點兒A了’這兩種格式中,貶義的和中性的形容詞可以出現,而褒義形容詞則不可以。”[16](P9)因此,我們將“有點兒”作為研究對象,對其語義韻進行探討。通過對BCC語料庫的檢索,共得到“有點兒”的相關語料11442條,我們從中抽取了10000條,基本可以體現其使用的實際情況。在對相關語料進行分詞后,采用AntConc來研究其搭配情況。參照王紅旗所提出的兩種格式,主要探討跨距為右一位置上的詞語的感情色彩,以此來確定“有點兒”的語義韻。本文提取的是MI值大于2的詞,并人工剔除其中的不合理搭配詞,最終得到143個詞語,這些搭配強度較高的詞語的感情色彩,具體如表3所示:

我們發現,“有點兒”呈消極語義韻,搭配詞主要呈現消極感情色彩,與王紅旗的結論基本一致。進一步統計發現,“有點兒”所搭配的3個積極色彩的詞語分別是“甜蜜”“俏皮”“顧盼”,4個中性色彩的詞語分別是“情調”“滿”“調皮”“咸”。由于我們主要探討的是“有點兒A”“有點A了”句型,因此,剔除了7個詞語中的動詞和名詞,僅剩4個形容詞。回到原語境中,如:“說不清的感覺,只是有點兒甜蜜,有點兒擔心、自私。”“好吃啊,就是稍微有點兒咸。”“屁事兒比較多,安排有點兒滿,壓力比較大。”可以看出,這4個形容詞在原語境中仍體現出一定的消極傾向。由此可以判斷,“有點兒”主要與具有消極感情色彩的形容詞搭配。

我們可以以“有點兒”來判斷形容詞的極性,即能與“有點兒”搭配的基本上是消極感情色彩詞。將種子詞放入檢驗后發現,“有點兒震驚”“有點兒無賴”“有點兒心煩意亂”等都是合理的,可以據此判斷這些種子詞的極性是消極的;“有點兒尊崇”“有點兒狂喜”等則可接受度低,可以據此判斷這些種子詞的感情色彩極性是積極的。這與詞典中的標注一致,說明這種方法是相對可行的。

2.借助語義韻判斷感情色彩強度

詞語的語義韻判斷同樣要依賴于語境,而語境整體感情色彩與詞語的感情色彩又往往是協調一致的。因此,我們認為,或許可以借助搭配詞的感情色彩的占比,來判斷節點詞的感情色彩強度。

我們以“悲痛欲絕”和“惋惜”為節點詞,在CCL語料庫中進行檢索,它們的索引行數分別為348和1878。對相關語料進行分詞后,利用AntConc分析其搭配,設左右跨距為3,最低頻次為2。提取兩詞MI值大于4的搭配詞進行分析,其搭配詞的感情色彩分別如表4、表5所示:

從表4、表5可以看出,“惋惜”“悲痛欲絕”的搭配詞以中性色彩居多,兩詞均為中性語義韻。與“悲痛欲絕”相比,在“惋惜”的搭配詞中,消極感情色彩詞占比更低,而且出現了積極感情色彩詞。我們認為,這可能是由于“惋惜”的消極強度更小而導致的。在種子詞表中,“悲痛欲絕”的強度為9,“惋惜”的強度為3,這與上面的判斷結果相一致。雖然詞的語義韻與詞本身的感情色彩極性很有可能不同,不能以此判斷其感情色彩極性;不過,在對比兩詞的感情色彩強度時,我們可以借助語義韻的方式,通過其搭配詞的感情色彩占比來判斷兩詞的感情色彩強度。

綜上所述,利用語義韻來判斷詞語的感情色彩是比較合理的,所得出的結果與種子詞標注基本一致。同時,采用這種方法還需考慮以下問題:一是分詞需要人工校對;二是在搭配強度較高的詞中,有些詞語不太合理,需要再進行人工篩選。

(三)借助構形判斷感情色彩

葛本儀在《現代漢語詞匯學》中指出:“形容詞重疊后除了表示一種‘強調的意味’外,更多的則表示了‘略微的,適中的’語法意義。與此同時,還能夠賦予詞一種喜愛和贊許的感情色彩。”[1](P101)作者還以“甜甜的”“辣辣的”為例加以說明,其中的“辣”和“甜”由原來的中性詞變為了帶有積極感情色彩的詞。那么,重疊主要影響的是哪些詞語的感情色彩呢?楊振蘭在《形容詞的重疊構形試析》一文中指出,在可以重疊的形容詞中,含中性色彩的數量最多。除此之外,帶有一般的褒義色彩或貶義色彩的,有的也可以重疊,只是數量比較少。但褒義色彩、貶義色彩特別強烈者一般不重疊[17]。

1.借助重疊判斷感情色彩極性

我們從種子詞中選取強度為9的形容詞進行重疊,結果如下所示:

煩躁? ? ? ? ?憂愁? ? ? ? 震驚

煩煩躁躁*? ? 憂憂愁愁*? ?震震驚驚*

可以看出,這些強度較高的帶有消極色彩的形容詞重疊后的形式,確實是不易接受的。它們重疊前在BCC語料庫中的詞頻分別為16381、5295、27464,重疊后在BCC語料庫中出現的次數分別是4、7、0。

我們又在情感詞匯本體庫中選取了一部分帶有積極色彩的強度為9的形容詞,對其進行重疊:

美好? ? ? ? 完美? ? ? ? 圣明

美美好好*? ?完完美美*? ?圣圣明明*

可以發現,這些詞語未重疊前在BCC語料庫中的詞頻分別為93602、58718、737,重疊后在BCC語料庫中出現的次數分別為1、6、0。也就是說,這些詞重疊后也不易被人接受。

通過重疊這種構形手段,我們不僅可以判斷出形容詞的感情色彩極性是否為中性,也可以判斷出重疊后不合理的是強度較高的褒義詞和貶義詞。

2.借助重疊判斷感情色彩強度

為了驗證是否感情色彩強度越低,越接近中性詞,其重疊形式越合理,我們又選取了部分強度較低的詞進行重疊,結果如下所示:

昏暗? ? ? ? 柔弱? ? ? ? 光鮮

昏昏暗暗? ? 柔柔弱弱? ? 光光鮮鮮

這些詞語未重疊前在BCC語料庫中的詞頻分別為5869、4826、1866,重疊后在BCC語料庫中出現的次數分別為39、137、11。與感情強度為9的形容詞相比,這些形容詞在未重疊前的詞頻整體較低,但重疊后的詞頻卻較高。這也說明,當一個詞感情色彩重疊的可接受度越高時,其感情色彩強度一般較低。

為了進一步驗證上述結論,我們又在情感詞匯本體庫中選取了強度為1、極性為中性的形容詞予以考察,從中共發現81個詞。這些詞語的感情色彩強度較低,其重疊前后的頻次,如表6所示:

這81個詞語的詞頻總數為817858,重疊后的頻次總數為8665,平均每個詞重疊后出現的頻次約為107。總體來看,感情色彩強度較低的詞,可重疊性更強。

這里只是從情感詞典中隨機抽取了一些詞語進行實驗,選取的數量還不夠多,其可行性仍有待繼續驗證。同時,這種判斷感情色彩的方法也存在一定問題:一是只能判斷形容詞,并且這些形容詞必須是單音節或雙音節的,多音節形容詞則無法判斷;二是存在個別例外情況,如“漂亮”的感情色彩強度較高,但仍然可以重疊,需要具體問題具體分析;三是可以判斷的多為聯合式的雙音節復合詞,有些詞語本身就很難重疊,如“犯愁”。由于諸種條件的限制,在采用這種方法來判斷感情色彩及強度時,可以判斷的詞語較少,而且需要進一步的驗證,以排除例外情況。

(四)借助算法判斷感情色彩

詞語共現法是構建情感詞典時的一種算法,這種算法不僅可以運用于大規模的情感詞典,也可以借此來分析某個詞語的感情色彩。為了保證最終結果的準確性,可以利用多個語料庫進行實驗。詞語共現法首先要判斷詞的共現程度,計算它的逐點互信息,即“PMI值”[18],其公式為:

其中,p(x)表示詞x出現的頻率,p(y)表示詞y出現的頻率,p(x,y)則表示兩詞共同出現的頻率。當數值越大時,兩詞的關系就越緊密。不過,它只能判斷兩個詞的共現程度,判斷極性還需要進一步計算。通過計算詞和負面種子詞或者正面種子詞的緊密關系,最終判斷一個詞的感情傾向。Turney所提出的計算緊密程度的公式為[19]:

其中,w是情感詞,w+表示正面種子詞,w-表示負面種子詞。當SO值為正值時,則表明詞語與正面感情詞關系更為密切。

1.借助情感詞典的算法來判斷感情色彩極性

我們以“尊崇”和“輕蔑”為種子詞,來計算“尊重”與這兩個種子詞的緊密程度。在BCC語料庫中,“尊重”“尊崇”共現的頻次為17,“尊重”“輕蔑”共現的頻次也為17;“尊重”出現的頻次為67898,“尊崇”的頻次為1295,“輕蔑”的頻次為5519。根據公式可得:

這里最終的計算結果為0.64,為正值,證明“尊崇”與“尊重”的感情色彩極性相同。而在情感詞匯本體庫中,“尊崇”的感情色彩強度為9,“尊重”的強度為5,兩者同屬“尊敬”這一感情類別,均有積極色彩,極性相同。由此可見,通過相關計算是可以判斷詞語的感情色彩極性的。

2.借助情感詞典的算法來測量感情色彩強度

“好”和“壞”分別是認可度較高的具有積極色彩的詞和具有消極色彩的詞,我們以這兩個詞為種子詞,分別計算“心花怒放”“滿面春風”與它們的緊密程度。這里采用的語料數據均來自于CCL語料庫。

其中,“心花怒放”的SO值是:

“滿面春風”的SO值是:

可以看出,“心花怒放”的SO值為0.2,“滿面春風”的SO值則為-0.05。數值越大,說明該詞與正面種子詞“好”的關系越緊密。計算結果表明,“心花怒放”的SO值更大,感情色彩強度更高。在情感詞匯本體庫中,“心花怒放”的強度為9,“滿面春風”的強度為3,與我們的計算結果相符。

值得注意的是,通過SO值計算得到的“滿面春風”的極性與詞典不同,這可能是由于該詞本身的感情色彩強度較低而導致的。在我們所選的快樂類種子詞中,“滿面春風”的感情色彩強度最低,計算時極易被處理成中性色彩詞甚至消極色彩詞,這也是今后改善算法時需要關注的問題。

綜上所述,通過計算的方法,可以實現感情色彩極性和感情色彩強度的判斷,但也存在一些問題:一是由于種子詞的選取會影響到最終的計算結果,因此,在選取種子詞時需要十分謹慎,反復實驗;二是在處理感情色彩不夠強烈的詞語時,通過計算的方式很容易產生誤差,需要進一步改善算法;三是語料庫的選取也可能會影響到計算結果,一些小型的數據庫可能存在收詞缺失等問題,這就需要盡可能采用大型的平衡語料庫,也可以考慮同時采用多個語料庫進行計算,盡量避免產生偏誤。

四、結語

總之,關于感情色彩極性的判斷和強度的測量,傳統的內省法由于具有一定的主觀性,很難避免偏誤現象的產生。因此,我們嘗試運用語境、語義韻、構形、計算等方法,來判斷感情色彩極性、測量感情色彩強度,并采用感情色彩種子詞進行驗證。研究表明,這四種方法都有一定的可行性,同時也都存在一些問題。如語境方法,存在有效語境難以尋找、判斷感情色彩強度比較困難等問題;語義韻方法,存在搭配詞需要人工校對等問題;構形方法,存在詞類限制較大等問題;計算方法,存在需要多次驗證、種子詞選取是否得當等問題。這里需要指出的是,要想正確判斷感情色彩極性、測量感情色彩強度,需要綜合運用多種方法;在實際運用時,還需要細化、完善相關規則,以進一步提高結論的可靠性。

參考文獻:

[1]葛本儀.現代漢語詞匯學(修訂本)[M].濟南:山東人民出版社,2008.

[2]章炎.淺談詞語的感情色彩[J].遼寧大學學報(哲學社會科學版),1983,(5).

[3]武占坤,王勤.現代漢語詞匯概要[M].呼和浩特:內蒙古人民出版社,1983.

[4]張可任.詞的感情色彩與辭書編纂[J].辭書研究, 2000,(2).

[5]楊振蘭.現代漢語詞彩學[M].濟南:山東大學出版社, 1996.

[6]姚曉紅.“啊”、”吧”等常用語氣詞所表示的感情色彩及意義[J].新疆職業大學學報,2007,(2).

[7]陶楓.《現代漢語詞典》三音節詞色彩義分析[D].濟南: 濟南大學碩士學位論文,2016.

[8]楊振蘭.色彩意義演變發展的語言誘因[J].文史哲, 2003,(5).

[9]刁晏斌.現代漢語詞義感情色彩的兩次大規模變遷[J].文化學刊,2007,(6).

[10]楊立公,朱儉,湯世平.文本情感分析綜述[J].計算機應用,2013,(6).

[11]徐琳宏,林鴻飛,潘宇,任惠,陳建美.情感詞匯本體的構造[J].情報學報,2008,(2).

[12]楊振蘭.色彩意義與語境的關系[J].世界漢語教學, 2000,(2).

[13]荀恩東,饒高琦,肖曉悅,臧嬌嬌.大數據背景下BCC語料庫的研制[J].語料庫語言學,2016,(1).

[14]徐建宏.試論程度副詞的對外漢語教學[J].語言文字應用,2006,(S2).

[15]衛乃興.語義韻研究的一般方法[J].外語教學與研究, 2002,(4).

[16]王紅旗.語義特征及其分析的客觀基礎[J].漢語學習, 2002,(6).

[17]楊振蘭.形容詞的重疊構形試析[J].文史哲,1995,(3).

[18]Church,K.W. & Hanks,P.Word association norms, mutual information, and lexicography[J].Computational Linguistics,1990,(1).

[19]Turney,P.D.Thumbs up or thumbs down?——Semantic orientation applied to unsupervised classification of reviews[A].Proceedings of the 40th Annual Meeting of the Association for Computational Linguistics[C].Pennsylvania:Stroudsburg,2002.

Judgment and Measurement of the Polarity and Intensity of? Emotional Coloring Meaning

Li Shuyun,Wang Shichang,Yang Zhenlan

(School of Literature, Shandong University, Ji’nan 250100, China)

Abstract:The emotional coloring is an important part of word meaning, and its polarity and intensity are mostly judged and measured by introspection, which is subjective and unreliable. This paper uses contextual method, semantic prosodic method, morphological method and computational method, to study the polarity and intensity of emotional coloring of words. Seed words with clear polarity and intensity of emotional coloring are selected to verify the feasibility of these methods, We intend to find more objective methods to avoid the errors caused by introspection.

Key words:polarity of emotional coloring;intensity of emotional coloring;seed words;semantic prosody

基金項目:山東大學文學院研究項目“情感語義的理論研究與情感詞庫的資源構建”

作者簡介:1.李淑云,女,山東大學文學院碩士研究生;

2.王世昌,男,山東大學文學院助理研究員,哲學博士;

3.楊振蘭,女,山東大學文學院教授,文學博士。

主站蜘蛛池模板: 99热这里都是国产精品| 日本a级免费| 在线观看无码av五月花| 欧洲日本亚洲中文字幕| 国产主播福利在线观看| 色屁屁一区二区三区视频国产| 丁香婷婷久久| 中文字幕自拍偷拍| AV无码无在线观看免费| 亚洲精品无码日韩国产不卡| 无码丝袜人妻| 国产又色又爽又黄| 国产99欧美精品久久精品久久| 精品少妇人妻无码久久| 国产精品无码翘臀在线看纯欲| 91亚洲精选| 国内精品免费| 青青草原国产精品啪啪视频| 在线观看国产一区二区三区99| 农村乱人伦一区二区| 国产精品自拍露脸视频| 国产十八禁在线观看免费| 亚洲AV无码乱码在线观看裸奔| 亚洲国产清纯| 中文成人在线| 国产18在线播放| 久久国产精品夜色| 亚洲AV无码久久精品色欲| 伊人激情久久综合中文字幕| 精品丝袜美腿国产一区| 在线免费亚洲无码视频| 91在线激情在线观看| 99er这里只有精品| 久久久亚洲色| 亚洲成人在线免费观看| 99久久国产自偷自偷免费一区| 青青草国产精品久久久久| 国产精品一区二区在线播放| 久久久受www免费人成| 欧美综合成人| 午夜日b视频| 亚洲第一视频网| 亚洲狠狠婷婷综合久久久久| 青青草原国产| 欧美成人在线免费| 老司机aⅴ在线精品导航| 国产精品所毛片视频| 日本黄网在线观看| 动漫精品啪啪一区二区三区| 亚洲无码不卡网| 国产一区二区三区视频| 精品国产中文一级毛片在线看| 亚洲精品卡2卡3卡4卡5卡区| 亚洲视频免费播放| 无码AV日韩一二三区| 亚洲 成人国产| 亚洲午夜片| 国产精品综合久久久 | 美女国内精品自产拍在线播放 | 亚洲色欲色欲www在线观看| 最新国产网站| 狠狠色丁香婷婷综合| 国产精品99久久久| 美女被狂躁www在线观看| 久久精品一品道久久精品| 精品国产网| 亚洲人精品亚洲人成在线| 国产菊爆视频在线观看| 久久香蕉国产线看精品| 欧美在线视频不卡| 亚洲第一视频免费在线| 青青草国产精品久久久久| 色综合婷婷| 狠狠操夜夜爽| 亚洲中文字幕在线精品一区| 亚洲第一页在线观看| 国产成人综合亚洲网址| 视频一本大道香蕉久在线播放 | 国产亚洲精品97AA片在线播放| 日韩专区欧美| 精品精品国产高清A毛片| 中文天堂在线视频|