程鈺涵 張躍龍
(1.信陽學院,河南信陽 464000;2.漢口學院,湖北武漢 430212)
話語標記語(discourse marker),或語用標記語(pragmatic marker),屬于語法的邊緣化現象,它們是口語或會話交流中的常見現象,其作用主要是動態的,以語境為基礎。[1]轉折性話語標記語是轉折連詞進一步語法化的結果。轉折類復句中的突轉式復句,在語表形式上,前分句沒有預示轉折的標志,后分句前頭用以“但是”為代表的轉折標,例如:
①他有點兒發燒,但是也來上班了。
例①中先說“他有點兒發燒”,聽著并不知道后邊的話將是順承還是逆接。用“但是”所表示的轉折,是沒有轉折預示的突然的轉折。
轉折標包括連詞“但是”“可是”“然而”等,可以替換為“但是”的“不過”“只是”“就是”也常常用來表示轉折,但轉折意味較輕。轉折標還包括關聯副詞“卻”。[2]
話語標記語的恰當使用有助于實現有效交際。近年來,學界對于該類現象關注較多,研究成果較豐。對話語標記語的研究已由“句法/語義—語用”為核心的分析逐步轉向“語用—認知”研究,以揭示其在話語或語篇中存在的理據。[3]如謝世堅對話語標記語重新定義和分類,認為漢語的話語標記語來源于感嘆詞、連詞、副詞、形容詞、動詞、短語、小句以及指示代詞,并由此將話語標記語劃分8種。[4]張健軍、吳長安分析了“但是”和“卻”的轉折屬性及強度,認為“但是1”“但是2”和“卻”的轉折屬性分別為[+強調性]、[+標記性]和[+對比性],并根據三者轉折屬性上的差異得出“但是”與“卻”轉折強度的等級序列為:(但是1+卻)>但是1(卻)>卻/(但是1)卻>但是2。[5]張巍具體分析了以“但是”“可是”和“不過”為代表的轉折性話語標記在話語組織與連貫銜接、話題或話輪的轉換、引起關注等方面的語用功能及其形成機制和認知基礎。[6]曾君、陸方喆以“但是”為例,從語用功能角度分析其話語標記功能是反預期標記進一步語法化的結果。[7]陳禹從表輕轉“只不過”切入,探討了輕轉現象的語用條件、語用動因與語用演化。[8]
綜上所述,前人大多借助部分文學作品語料采用傳統的內省式分析方法探討某個具體轉折性話語標記的語用功能,利用計算機技術更為客觀的分析該類話語標記語的語用功能,特別是近義話語標記之間的話題轉換程度序列鮮有涉及。
有鑒于此,本文基于BCC語料庫,主要研究轉折性話語標記“但是”“可是”“不過”,運用可視化手段,分析其語義距離的遠近與各自在作為轉折性話語標記時所表示的話題轉換程度的大小之間的關系,以期為后續相關研究提供新的思路和方法。
詞向量,是計算機中詞語的向量化數學表示。最早的詞向量表示是使用詞獨熱(One-hot representation)方法,該方法將整個語料庫的詞匯做成序列表,然后依次遍歷每個詞匯,將某詞匯在序列表中出現的位置標記為“1”,其余位置記為“0”,由此產生0和1組成的高緯向量。這種方法較為簡單直接,而且當語料庫中詞匯量較大時會產生“維度災難”問題。同時,由于One-hot只是單純按照詞表順序進行詞編碼,對于詞匯間的語義聯系無法體現,存在“語義鴻溝”問題。
認知語言學認為“象似性”是語言的屬性之一,沈家煊對“距離象似性”做了如下的解釋:“認知或概念上接近的實體,其語言形式在時間和空間上也相接近。”[9]可以進一步理解為,詞匯與其所在的上下文構成了一個“象”,當我們得到兩個相同或相近的“象”時,無論這個“象”的中心詞在字面上是否一致,我們認為它們在語義上是相近或相似的。
基于上述原理,Google公司在2013年完整開源Word2vec詞向量模型。該模式實際上有兩種不同的方法,即CBOW和Skip-gram兩個模型(如圖1所示)。
圖1 CBOW &Skip-gram模型
圖2 “不過”“但是”“可是”語義空間
CBOW模型的輸入是某特定詞匯的上下文詞匯,輸出則是這個詞本身的詞向量,也就是利用上下文對輸出目標做出預測。Skip-Gram模型的輸入則是某特定詞匯的詞向量,輸出則是該詞匯對應的上下文詞匯向量。當使用Word2vec方式得到詞向量后,將句子所包含詞的詞向量進行平均,就可以得到句向量。
語義距離是指在語義空間中,用來度量兩個詞語、短語或句子之間的語義相似性或差異性的概念。它用于衡量語義上的接近程度或相似程度,可以幫助我們理解和比較不同語義單位之間的關系。語義距離計算步驟如下:
1.將語料庫中詞項(但是、可是、不過)的前后句作為數據集導出;
2.依次生成前后句的句向量,并計算前后句之間的余弦距離;
3.將整個數據集句子的余弦距離求平均,作為結果輸出。
計算結果如表1所示:
表1 “不過”“但是”“可是”語義距離計算結果
計算結果顯示,“不過”“但是”“可是”前后句的平均語義距離依次為0.245,0.24,0.238,這表明轉折性話語標記“不過”的前后句語義距離最遠,即代表該詞項的話題轉換能力最強。
為進一步觀察數據結果,本文將三個詞項前后句的高維句向量進行降維,并將之投射至三維空間。其中,前后句的句向量分別用藍色與綠色圓點表示,具體如下圖所示:
從可視化圖例中可以看出,“不過”的語義空間最為稀疏,“但是”次之,“可是”的語義空間分布最為緊密,符合上節的計算結果。
綜上,基于Word2vec詞向量生成工具,對BCC語料庫中的相關語料進行計算分析,結果顯示,轉折性話語標記“不過”“但是”“可是”的語義距離序列表現出不平衡特征:“不過”的語義空間最為稀疏,語義距離最遠;“但是”次之;“可是”的語義空間最為緊密,語義距離最近。這種不平衡特征影響著各自的話題轉換能力,也即“不過”的話題轉換能力最強,“但是”次之,“可是”最弱。
上文提到,轉折性話語標記“但是”“可是”“不過”存在語義距離和語義空間的不平衡性,這種不平衡性影響了各自的話題轉換能力。誠然,這種不平衡性也在一定程度上影響著它們的語用功能。
①現在我們觀察到的北極星,是小熊星座星,但是《尚書?堯典》所記載的,卻是公元前2600年左右的星空。
②高寒缺氧的路途中向偉所經歷的艱難險阻是常人難以想象的,但是他兢兢業業地一干就是10年。
③我的腿以前曾被槍彈打穿,雖然不礙走路,但是一遇天氣變化就感到痛楚難堪。
上述三例中,均使用“但是”一詞作為話題的轉換標記。“但是”用在半句話里表示語義的轉折。作為具有轉折性的話語標記,“但是”的轉折意味較強,其所連接的前后兩個分句的語義距離較大,甚至是相反或矛盾的。如例①中,前一個分句在說“現在”而后一個分局則是轉到了“公元前2600年左右”,前后所說的時間間隔較大;例②為了凸顯主人公的堅毅精神,用“但是”加以轉折,以長時間的堅守來襯托這種堅毅的精神;例③的后一分句與前一分句所描述的情況基本矛盾,體現出“但是”轉折后的情況,前后形成對比。
④我們一直在看神經科的專家門診,可是一點用也沒有。
⑤宣慈說得太過分了,可是依照事實狀況來看,又的確是如此。
⑥我曉得你一向公事公辦,可是你這次實在是太沖動了些.
上述例句中,均使用“可是”一詞作為話題的轉換標記。“可是”也表示轉折,但其轉折意味較“但是”弱,其連接的前后兩個分局在語義距離上也不及“但是”遠。有時,“可是”能夠與“但是”互換,此時兩者表達的轉折意味是相近的。如例④⑤⑥三句中的“可是”均可換成“但是”。
⑦感性的東西,也許有,不過只能放在次要位置。(微博)
⑧會議終于結束咯,可瑜伽泡湯了,不過今天一切都很順利。(微博)
⑨至于另外三家,目前還是三緘其口,不過從他們所持的H股和B股可見,摩根士丹利的選股范圍集中在鋼鐵、汽車、航空。(都市快訊 2003-7-12)
⑩記者昨日從一位政府相關部門的負責人處獲悉,即將于年底到期的“限價令”明年還將繼續,不過具體標準和持續時間還不得而知。(微博)
上述例句中,均使用“不過”一詞作為話題的轉換標記。“不過”用在后半句的開頭,表示轉折,對上半句話加以限制或修正。例⑦⑧⑨⑩中,“不過”后面所承接的句子,更能表達出說話人的交際意圖。
從上述分析可以看出,“但是”“可是”“不過”三者均可表示對比或轉折,但其語用功能在語氣輕重、話語重點、話語語體等方面均存在細微差別。“但是”前后承接的分句語義距離較遠,“可是”前后承接的分句語義距離較近,“但是”的轉折語氣較“可是”更重一些,有時兩者可以互換使用。使用“但是”作為轉折話語標記時,說話人要強調的重點可以在前一分句,也可以在后一分句;“不過”所承接的前后分句的語義距離最遠,與前兩個標記語有所不同的是,它后面所承接的分句,更能表現出說話人的交際意圖,是話題的焦點所在。此外,從上述分析中,我們可以看出,“但是”多用于書面語,而“可是”“不過”常用于口語,因此它們在慣用語體上有所差別。
“但是”“可是”“不過”,它們都是表轉折的話語標記,但是作為近義詞,其語義距離、話題轉換能力以及轉換語氣都是有差別的。我們考察這樣的差異性,有利于漢語學習者在適當的語境中恰當地使用這些話語標記,以達到說話人的真實交際目的,形成有效交際。同時也能夠為漢語教師在進行相關教學時提供可視化參照,為漢語教材相關語法點的編撰提供借鑒。
與以往現代漢語轉折性話語標記研究的內省式研究方法和思路不同,本研究以計算語言學中的Word2Vec算法作為輔助研究工具,采用可視化手段分析現代漢語轉折性話語標記,以更加科學客觀的方式呈現該類詞匯的語義距離及各自話題轉換程度輕重,并在此客觀計算結果的基礎上,做進一步的語用功能分析,為后續相關研究提供新的研究方法和思路。