薛宏武
(重慶師范大學(xué)文學(xué)院,重慶 401331)
?
面向計(jì)算的現(xiàn)代漢語雙音詞分離及其語法意義與特性研究
薛宏武
(重慶師范大學(xué)文學(xué)院,重慶 401331)
漢語缺乏嚴(yán)格的形態(tài)束縛,在句子里雙音詞經(jīng)常由于嵌入相關(guān)句法成分而呈現(xiàn)出分離。為了提高自然語言處理中語段分詞、詞性標(biāo)注及基于規(guī)則的句子語義計(jì)算的準(zhǔn)確性與有效度等,文章系統(tǒng)考察了現(xiàn)代漢語里典型詞與離合詞的分離現(xiàn)象,挖掘并刻畫出它們各自形成的語法動因、條件、意義以及分離而成的成分的語法特性等,從而對現(xiàn)代漢語中雙音詞的分離做出了系統(tǒng)多層級的理論思考。文章指出典型詞的分離是語用作用的結(jié)果,分離結(jié)構(gòu)的意義是主觀的;而離合詞分離是句法語義作用的產(chǎn)物,意義是客觀的。
面向計(jì)算;雙音詞;分離;語法意義與特性;現(xiàn)代漢語
漢語缺乏印歐語那樣的嚴(yán)格形態(tài)束縛,數(shù)量占優(yōu)勢的雙音詞(形式簡稱為m1m2,m表示語素)經(jīng)常在句子里由于嵌入相關(guān)句法成分而被動態(tài)分離,從而呈現(xiàn)出復(fù)雜多樣的形式變化(變形)與語法單位級別的變化(變性)。這是本體研究與應(yīng)用研究都必須面對的重要課題。其中有兩個密切相關(guān)的根本問題表現(xiàn)得更為突出: 一是定性與定量,前者是確定分離后m1與m2的語法身份,包括是否為語法單位、有何語法性質(zhì)及其句法身份;后者指m1與m2若是作為句法成分的語法單位,那么在句中還涉及到對其計(jì)數(shù)——即算幾個。二是指雙音詞分離前后,其語法意義或功能有何不同。
目前雙音詞分離的本體研究,可概括為事實(shí)上的不周延及止于外延上的“例”“類”刻畫(token & type),表現(xiàn)為將可分離的雙音詞局限于離合詞上(Separable word,下文簡稱SW),然后分類刻畫其組配模式、嵌入成分的類特征、m的類特征及其語法活動的特征等。事實(shí)上離合詞僅是詞與短語之間的一個連續(xù)范疇(continuous category)。離合詞是不典型的詞,因此,離開了對典型雙音詞(Prototype word,下文簡稱PW)的分離考察,研究是有缺失的。
計(jì)算機(jī)語義識別的起點(diǎn)是能對語段做出連續(xù)一致的詞語切分與詞性標(biāo)注。目前這兩方面在效度與準(zhǔn)確度上是有問題的。典型的事實(shí)表現(xiàn)之一,就是對自由文體(free style)中雙音詞分離后的m1與m2的處理。由于對雙音詞分離缺乏一個系統(tǒng)的理論認(rèn)識,因此在對雙音詞分離的語段進(jìn)行詞語切分與詞性標(biāo)注時,現(xiàn)有的各種操作是不相一致的。而這又會直接影響到基于規(guī)則的句子語義理解。
本文擬從動、靜兩個語法層級,通過真實(shí)文本語料去系統(tǒng)考察PW與SW因嵌入詞語而出現(xiàn)分離的動因、條件、m1與m2的語法特征及意義等。以期為中文信息處理中的詞語切分、標(biāo)注及基于規(guī)則的句子語義理解作出應(yīng)有的理論支持。為表達(dá)方便與集中,把嵌入成分碼化為(x)、y,小括號是選擇性(optional)符號,下文亦如此。三音節(jié)之上的PW與SW分離,可以根據(jù)本文的思路類推。
在語言活動中不同性質(zhì)與不同組配模式的PW,常常被嵌入相關(guān)句法成分產(chǎn)生動態(tài)分離。下面將其語法表達(dá)式形式化為式(1)。
D{λ[x、y](m1m2)}→(x)m1ym2
(1)
含義是(x)m1ym2形成的充分條件是λ[x、y]代入m1m2要得到D準(zhǔn)允(licensing)。D指動態(tài)性(dynamic)語用因素。這種在D作用下,m1m2由于嵌入相關(guān)詞語而在句子里出現(xiàn)的變形或變性及其所產(chǎn)生的語法意義,是語用組形[1]。在此稱之為語用構(gòu)形(pragmatical configuration)。
2.1 合成詞分離
2.1.1 名詞分離
請觀察:
例1 老葛頭說,一塊兒當(dāng)兵的,和我有點(diǎn)表親關(guān)系。(《荒草青青》)
“老葛頭”可分析為“葛”嵌入“老頭”中形成的定中結(jié)構(gòu),“葛”是定語,“老頭”是中心語;也可分析為“老”前加于“葛頭”上,“老”是定語,“葛頭”是中心語。著眼于漢語句法系統(tǒng),只能作前者分析,因?yàn)椤案痤^”在普通話中是不成單位的。*漢語有“葛頭”等“姓+頭”說法,但語義指姓葛的小頭目或小領(lǐng)導(dǎo),與本文討論對象不是嚴(yán)格的同一。請觀察:
例2 a.北京南路 b.演兩個小時戲 c.這么大點(diǎn)兒 d.教他英語
例2的四短語分別由“南”“兩個小時”“大”“他”嵌入m1m2形成。其中a是“南”嵌入“北京路”形成的定中短語,“老葛頭”與之同一。盡管b、c、d的m1m2與“老頭”性質(zhì)不同,語法級別也不同——是短語與詞的差異,但都是通過嵌入手段形成的。b是“演戲”嵌入“兩個小時”的擴(kuò)展式,d是“教英語”嵌入“他”形成的動賓短語擴(kuò)展式;而c是中心語“大”嵌入其狀語“這么點(diǎn)兒”形成的[2]。
例1“老葛頭”較之“葛老頭”,表達(dá)了人際感情上的可愛與親切等意義。例2a的意義主要是韻律,“北京南路”比“南北京路”要順口。至于例2b、c與d,是句法語義表達(dá)的需求。這方面可參考3.1節(jié)的論述。再如:
例3 他的開蒙老師常說: “藝術(shù)”“藝術(shù)”,有藝還得有術(shù)。(《當(dāng)代野人》)
例3做賓語的小句主語“藝術(shù)”是反復(fù)強(qiáng)調(diào)式,為了保持句子前輕后重的信息分布規(guī)則,謂語對其進(jìn)行了分離,形成并列動詞結(jié)構(gòu)“有藝還得有術(shù)”,不僅實(shí)現(xiàn)了對主語“藝術(shù)”的語義強(qiáng)調(diào)與評注,而且也維系了句子平衡。
2.1.2 形容詞分離
例4 現(xiàn)在看來你不但認(rèn)了真了,而且認(rèn)真得一塌又糊涂。(《笑傲江湖》)
形容詞“認(rèn)真”中嵌入“了”變?yōu)閯淤e短語,強(qiáng)調(diào)“認(rèn)”之對象“真”。其形式標(biāo)記是不能像“認(rèn)真”一樣再帶補(bǔ)足語(complement)說成“認(rèn)了真了得一塌糊涂”而只可說“認(rèn)真得一塌糊涂”。同樣“一塌又糊涂”是強(qiáng)調(diào)“一塌糊涂”的消極狀態(tài)的,句法上“一塌”與“糊涂”做“認(rèn)真”的合成補(bǔ)足語,語義與語法功能相當(dāng)于兩個“一塌糊涂”。
2.1.3 動詞的分離
例5 出路還在改革,非改革不可……真正依靠工人階級來改,來革。(《人間正道》)
例6 從這二人轉(zhuǎn)開始,他這個小女婿就當(dāng)上了,后老悔了。(《父親情深母親意濃》)
例5的“來改,來革”是“改革”中嵌入停頓(書面逗號)與“來”形成的分離式。句法上分離式構(gòu)成的句子是個并列復(fù)句,語義功能上兩個小句都相當(dāng)于“改革”。分離式的意義是強(qiáng)調(diào)說話人對“改革”的意向與信念。例6的“后悔”分離為“后老悔”,已由狀中結(jié)構(gòu)的詞變成了述賓短語,方位名詞“后”在現(xiàn)代漢語里也只能被重新理解(reinterpretate)為動詞,如可帶體成分“了”“過”(aspectual constituents)說成“后了/過悔”。分離的目的也是強(qiáng)調(diào)“悔”的程度之深。
2.2 單純詞分離
雙音節(jié)的單純詞也可分離,像例3~6一樣,分離也必得在句中進(jìn)行。分離而成的兩音節(jié)是句子的兩個句法成分,意義同樣還是表達(dá)強(qiáng)調(diào)。例如:
例7 誤解是: 以為把人逗笑的東西就是幽默,而其實(shí)它既不幽也不默。(《人生圓桌》)
“既不幽也不默”做“它”的合成謂語,強(qiáng)調(diào)“幽默”(humor)的性質(zhì)量?!坝摹迸c“默”均是其不可或缺的音節(jié),二者語義語法上都相當(dāng)于形容詞“幽默”。
2.3 派生詞分離
一位難眠的妻子聽到一點(diǎn)響動,推醒了酣睡的丈夫后有這樣一個對話:
例8 a. 好像有老鼠,你看看去。
b. 老什么鼠!快睡吧。
派生詞“老鼠”中嵌入責(zé)問否定等功能的“什么”被分離為“老什么鼠”,表達(dá)了丈夫強(qiáng)烈的不耐煩情緒等,將b與其變換式b1做一比較就會看到這一點(diǎn):
例8 b1.老鼠什么!快睡吧。
顯然b1與b的真值(truth-condition)相等,但沒b的情感色彩強(qiáng)。需指出的是b的“老”已不是詞綴,而是“老鼠”的自反性提及用法(mention of reflexivity)。即已經(jīng)變性且升級為動詞了,因?yàn)槔?b句義相當(dāng)于“別說或提什么老鼠”。即“老”的功能是提及對象“老鼠”;“鼠”則是“使用”(use),是“老”的賓語。因此例8b的句義形式應(yīng)是或者說深層句義(deep-structure)是:
例8 b2.[老鼠什么老鼠]
不過b2在表征(represent & project)為b時,將前一個“老鼠”之“老”保留而刪去了“鼠”,后一個相反。這種表征方式是“老鼠”雙音節(jié)性造成的,這可從單音詞“提及”用法得到說明。如例9b:
例9 a. 爸爸,我的書呢? b. 書什么書?就像你是個學(xué)習(xí)的。
“書”是單音詞,在例9b不管是作為提及用法的第一個“書”還是作為用法的第二個“書”,都只能采取一個形式??梢?,例8b在提及上用“老”而用法上用“鼠”,這是為了表達(dá)簡要經(jīng)濟(jì)而按照二者在詞中的語素序位次第缺省(ellipse & omit)音節(jié)形成的。綜合起來看,例8b的“老什么鼠”是述賓性結(jié)構(gòu),“老”與“鼠”相當(dāng)于兩個詞。
總之PW由m1m2分離為(x)m1ym2,造成的變形與變性可概括為扭曲(screw),包括長度、內(nèi)部的結(jié)構(gòu)或性質(zhì)等,動因是D。λ[x、y]使得m1m2由概念表達(dá)變?yōu)?x)m1ym2上的人際表達(dá)(interpersonal expression),即表達(dá)語用意義。這是像似原則(iconic coding principles)的生動體現(xiàn): 語言實(shí)體若代表的是不尋常獨(dú)特的事物,那么其語法形式的編碼相應(yīng)的就要復(fù)雜與多維度(complex and multidimensional)[3]。
3.1 SW分離的動因、條件、意義與句法特征
例10 洗澡→a.洗一次澡∣b.洗十分鐘澡∣c.洗熱水澡
在靜態(tài)語法環(huán)境“洗澡”就可分離,不僅前后性質(zhì)不變,而且“洗”與“澡”的結(jié)構(gòu)關(guān)系也不變,只是由詞升級為短語。嵌入成分語義或指向“洗”,如a與b;或修飾“澡”,如c。真值義上“洗一次/十分鐘/熱水澡≠洗澡”,即“洗澡”的三個分離體都表達(dá)概念。總的看,“洗澡”的嵌入分離成分在句法語義上是必有的(obligatory)。換言之,SW分離動因有兩種情況: 一是語義表達(dá)需要,如“洗熱水澡”較“洗澡”的外延小。二是句法機(jī)制調(diào)控,理論上“洗澡”在與“一次/十分鐘/熱水”的組配時存在嵌合與拼合兩種句法模式,例如,
例10′ a. 洗一次澡 ∣*洗澡一次 b. 洗十分鐘澡 ∣*洗澡十分鐘 c. 洗熱水澡 ∣*洗澡熱水
語義上“一次”“十分鐘”是計(jì)算動作或行為的“量”的,本身又有陳述性(可直接做謂語),與“洗”的概念聯(lián)系是天然的,且性質(zhì)相近,所以它們自然緊鄰而且成為一個句法組塊兒,是個有效(well-formed)組配。靜態(tài)環(huán)境中帶星號的拼合式是不可受的,是違反了共同命運(yùn)原則(proximity iconicity)[3]??梢姟跋丛琛狈蛛x動因就是句法語義表達(dá)的需要。在句子里進(jìn)一步觀察,會看到“澡”還能進(jìn)行句法活動。不僅可話題化(topicalization),甚至在語境充分下可以把“澡”缺省掉。例如,
例11 一個月他也不洗一次澡。 →a.澡,他一個月也不洗一次。 →b.一個月,他連一次澡也不洗。 →c.他一個月也不洗一次。 →d.一個月,他連一次也不洗。
基于本節(jié)分析,把SW分離動因與條件的表達(dá)式形式化為如下式(2)。G/S表示句法與語義箭頭方向表示話題化或移位,括號內(nèi)的m2表示可缺省。
↓ |
G/S{λ[x、y](m1m2)} →____(x)m1y(m2)
(2)
3.2 PW分離條件、動因、語法表現(xiàn)及其意義
PW與SW分離上存在著諸多不同,主要表現(xiàn)有以下四點(diǎn)。
1. PW分離必須得在句子里(sentence)進(jìn)行,靜態(tài)層級上不能成立。例如,
例12 a.*認(rèn)了真 |b.*一塌又糊涂 |c.*來改來革 d.*既不幽也不默|e.*老什么鼠 |f.*后老悔
短語a能說,不過已經(jīng)是個支配性的動詞結(jié)構(gòu),語義語法功能不同于“認(rèn)真”。而b—e靜態(tài)層面都不成立。f可說,但其結(jié)構(gòu)、性質(zhì)及語義已經(jīng)也不同于“后悔”。順及指出,2.1.1節(jié)“老葛頭”能說,是它在現(xiàn)代漢語已經(jīng)詞匯化了(lexicalized)。例3的“有藝還得有術(shù)”也可說,但“藝”與“術(shù)”所指之和是不等于“藝術(shù)”的。而SW在詞與句之上都可以分離,如例10、11所示。
2. PW分離后m1與m2在句子里的位置固著(bound),沒有語法活動能力。如且不管例4的“認(rèn)了真”相對于“認(rèn)真”所發(fā)生的結(jié)構(gòu)與性質(zhì)變化,就“真”而言,是絕不能話題化的,只能固著在“認(rèn)”后。而SW分離后沒有這樣的限制,如例10、11所示。
例4′ *現(xiàn)在看來,真你不但認(rèn)了,而且認(rèn)真得一塌又糊涂。
3. PW的分離結(jié)構(gòu)(x)m1ym2中,各成分的語法特性也與SW的不同,主要體現(xiàn)為:
(1) x與y的句法特性。與SW((x)m1ym2)比,PW的x或y羨余(redundancy)。把2.1節(jié)各例句的x與y刪去,典型PW的分離式所在的句子的真值義及其結(jié)構(gòu)都不變。比較例5及其變換式例5′。
例5′出路還在改革,非改革不可……真正依靠工人階級改革。
它與例5的真值相同。結(jié)構(gòu)上例5的謂語中心是聯(lián)合動詞短語[真正[依靠工人階級[來改,來革]]];而例5′的是詞[真正[依靠工人階級[改革]]]。二者都是狀中式謂語。當(dāng)然有的嵌入成分羨余性不強(qiáng),如例6的“老”,是“后悔”傾向SW。
(2) PW分離式的m1與m2的語法特性極不勻質(zhì)(homogen eous)。靜態(tài)地看,有的是無義的音節(jié),如“一塌”“幽”“默”等;有的是詞綴,如“老鼠”之“老”;有的是不成詞語素,如“革”“術(shù)”。它們都不能做句法成分。有的是自由成詞語素,能做句法成分,但所指或功能都要產(chǎn)生一定的變化: 如“藝”所指與“藝術(shù)”不等值,“后老悔”之“后”“悔”的功能不同于“后悔”之中的。它們都可視作動態(tài)言語成分,具有超語法單位(super-grammar units)的特性。意義上或m1=m1m2或m2=m1m2,或m1與m2同時等于m1m2句;句法上m1∧m2。即PW動態(tài)分離出的m1與m2,語義或語法功能增殖、變性了。
(3) PW的分離成分m1與m2在作為動態(tài)句法成分使用時,得同時滿足下列兩個方面的句法條件,而SW分離成分則不受此條件約束(bind)。
首先,一般有先行句做鋪墊且先行句有m1m2,否則,孤立的“(x)m1ym2”可受性都有問題。把例7與例7′做一比較就會看到,如:
例7′*逗笑人的東西既不幽也不默。
語感上例7′ 突兀不自然。例7有先行句“誤解是: 以為把人逗笑的東西就是幽默”做鋪墊,且“幽默”分布其中,所以“既不幽也不默”小句不僅可受而且還有“幽默”不具有的強(qiáng)調(diào)效果。再如把例8的“老什么鼠”句孤立出來,簡直是不知所云。值得指出的是例4與例6,“認(rèn)真”分離為“認(rèn)了真”時,是沒有含有“認(rèn)真”的先行句做鋪墊,這是由“認(rèn)真”的特征決定的。PW與SW是連續(xù)的(continuous),“認(rèn)真”就處在連續(xù)環(huán)節(jié)上,傾向SW。例6的“后悔”雖不及它傾向SW,但也具有SW的特征。
其次,m1與m2在句中必須彼此照應(yīng),且其位序要與它們在PW中的語素位平行。“照應(yīng)”是指m1與m2必須是彼此緊鄰且呼應(yīng)。如例4′的“真”被置于句首,離“認(rèn)”太遠(yuǎn),缺乏緊鄰呼應(yīng),故不可受。同樣m1離開了m2或者是m2離開了m1,句子可受性都會有問題的,即是二者缺一不可的。例如,
例6′*從這二人轉(zhuǎn)開始,他這個小女婿就當(dāng)上了,老悔了。
例8′ a. 好像有老鼠,你看看去。 b.*什么鼠!睡吧。
例6′的“老悔”語義上與“后老悔”相當(dāng),但二者畢竟不是等值的: 前者的語法中心是“悔”,后者的中心是“后”。例8′的“什么鼠”語義表示“鼠”的類別,不同于“老什么鼠”。
分離形成的m1、m2的“位序要與PW的語素位平行”,是指m1與m2作為句法成分時是不能易位的,一般得與它們在詞內(nèi)時的序位平行一致,如例4的“一塌又糊涂”語感上不宜說成“糊涂又一塌”。
4. PW分離式是主觀化的,而SW是真值性的。這體現(xiàn)在PW分離式的形成必需得到句法環(huán)境中D的準(zhǔn)允。D具體說就是情態(tài)(modality),包括認(rèn)識(epistemic)、道義(denotic)與動力(dynamic)三類。
認(rèn)識情態(tài)是說話人對行為(action)、事件(event)或事態(tài)(affair-state)等的確定性所持的信念狀況(status attitude)。比如例4的“看來”,例5的“真正”,例6的“了”(即“了2”)*蕭國政(1999)從靜態(tài)句法出發(fā)將“了”析離為八種意義,其“強(qiáng)調(diào)、偏離、委婉”本質(zhì)上就是“了2”的認(rèn)識情態(tài)的三方面表現(xiàn)。薛宏武(2012)也認(rèn)為“了2”有語用軟化功能,是認(rèn)識情態(tài)詞。,例7的“以為……就是”與“其實(shí)”,例8的“什么”。道義情態(tài)是說話人按照某種道義責(zé)任,實(shí)施或制止某種行為;或者就某事件、行為與事態(tài)提出自己道義或責(zé)任等方面的看法,如例3的“得”,例5的“非……不可”。動力情態(tài)是體現(xiàn)與說話人能力、意愿等相關(guān)的行為、事態(tài)。行為與事態(tài)一般是在說話人主觀干預(yù)與動力施加基礎(chǔ)上進(jìn)行的,如例5的“要”與“來”,分別是體現(xiàn)說話人意愿與指向說話人行為去向的;例8的語氣詞“吧”的作用是緩解祈愿口氣的等,而“什么”則是否定說話人提及的“老鼠”這一行為本身的,語法功能相對于意愿否定詞“別”“不”“甭”。
說話人的情緒、意向、態(tài)度等情感是體現(xiàn)語句主觀性的重要方面[4]。若說話人說出一段話的同時,表明自己立場、態(tài)度和感情便是主觀性表達(dá),而為了表達(dá)主觀性而采取的相應(yīng)結(jié)構(gòu)形式便是主觀化(subjectivization)[5]。由此看來,PW分離式“(x)m1ym2”是主觀化結(jié)構(gòu),體現(xiàn)在: 一是它與情態(tài)成分是互動的,不僅“(x)m1ym2”的形成要有情態(tài)成分,并且它的出現(xiàn)也一定要有情態(tài)成分;二是“(x)m1ym2”及其主觀意義在漢語表現(xiàn)得相當(dāng)廣泛與突出,如例3的“有藝還得有術(shù)”就是對“藝術(shù)”的評注與態(tài)度;例4的“認(rèn)了真”就是說話人對“你”的“認(rèn)真”的看法及對之給予的委婉的定性評論。
那么,PW分離式的主觀義形成機(jī)制是什么呢?請觀察并比較例5的四個小句。
例5出路還在改革i,非改革i不可……真正依靠工人階級來改ji,來革ki。
第一個小句(clause)對“改革”的強(qiáng)調(diào)是通過自然重音與詞匯標(biāo)記實(shí)現(xiàn)的: 一方面“改革”是自然焦點(diǎn),具有[+突出];另一方面又通過“在”的時空定向功能對其焦點(diǎn)身份進(jìn)行了標(biāo)記。即該小句的強(qiáng)調(diào)義是通過“改革”的雙重焦點(diǎn)身份獲得的。第二句的強(qiáng)調(diào)義是由“改革”的自然焦點(diǎn)身份與道義情態(tài)詞語“非……不可”的詞匯義加合產(chǎn)生的。第三、四小句則并列起來強(qiáng)調(diào)“改革”。這兩個小句的謂語中心正是由“改革”的兩個分離成分充當(dāng)?shù)?,?dāng)然這種表達(dá)方式是極其依賴兩個先行句里“改革”的提示(index),表示為i=ij+ik。唯此,才能明確識解(construe)這兩個并列小句的語義與語法功能。基于此,再加上指向說話人行為取向的“來”所具有的意向義、“改”與“革”自然焦點(diǎn)的[+突出]特征以及二者并列帶來的語義增殖,才可得出“來改,來革”的完整意義。由此推理,例5的“信息峰”(information peak)就是由“改革”分離而成的兩個并列小句“來改,來革”。
“來改,來革”是說話人為了強(qiáng)調(diào)對“改革”行為持有的堅(jiān)定意向而有意將之分離的,其主觀義的形成不僅包括如上所述的句法運(yùn)算,還有一定的語用推理,因?yàn)樵撘饬x的形成離不開兩個先行小句的提示,即有語境因素在內(nèi)。正因?yàn)槿绱?,它才具有兩個先行小句所不具有的表達(dá)力——主觀性。再如例7,“幽”與“默”原本不能在句子里成形與成活的,但它是構(gòu)成先行句焦點(diǎn)的兩個音節(jié),在其提示下,受話人(addressee)才能夠把“幽”與“默”同時識解為“幽默”。也正是以此為前提,受話人才能推導(dǎo)出它的意義。這也就解釋了PW分離式作為動態(tài)言語單位的m1與m2在做句法成分時,必須具有兩個條件的內(nèi)在因素。
基于第2、3節(jié)的系統(tǒng)考察,可把PW分離的表達(dá)式及其規(guī)則系統(tǒng)刻畫如下:
Sa.__PW__,……,S。__(x)m1(,)__ym2……
下標(biāo)Sa是先行句(antecedent clause),S是PW分離形成的句子??瞻拙€表示其上可分布的句法成分,省略符表示可出現(xiàn)的小句。
(1) PW分離一般得有先行句做信息鋪墊,且先行句通常要有PW。它是PW分離的語境提示;
(2) PW分離后的音節(jié)都是獨(dú)立的句法成分,且都是動態(tài)言語詞;性質(zhì)上,得結(jié)合PW及其m1、m2特性進(jìn)行辨析;
(3) 分離式所在的句子得有情態(tài)成分D。D是封閉的系統(tǒng),包括有認(rèn)識、物力與道義類詞語,祈使及否定句類;
(4) m1與m2做句法成分,序位要跟其詞內(nèi)序位平行一致,并且它們在句內(nèi)不能移位與缺省。它們是動態(tài)言語成分,語義語法功能都等值于PW;
(5) 嵌入成分x與y在真值上是羨余的。
基于這個規(guī)則系統(tǒng),就可對含有PW分離式的語段進(jìn)行分詞并給予其定量、定性標(biāo)注。當(dāng)然這跟對規(guī)范文本中的規(guī)范句子在技術(shù)處理上有點(diǎn)不同。例如(只標(biāo)注討論對象),
例4現(xiàn)在看來你不但認(rèn)v了真n了,而且認(rèn)真得一塌a又糊涂a。
例5非改革(i+j)不可……真正依靠工人階級來改(i+j)/v,來革(i+j)/v。
例6從這二人轉(zhuǎn)開始,他這個小女婿就當(dāng)上了,后v老悔n了。
例7以為把人逗笑的東西就是幽默(i+j),而其實(shí)它既不幽(i+j)/a也不默(i+j)/a。
例8a.好像有老鼠(i+j),你看看去。 b.老(i+j)/v什么鼠(i+j)/n!快睡吧。
例9a. 爸爸,我的書呢? b. 書v什么書n,就像你是個學(xué)習(xí)的。
以例4為例,“認(rèn)真”分離后是兩個詞,“一塌糊涂”分離后也是兩個詞?!罢J(rèn)”與“真”分別是動詞(v)、名詞(n);“一塌”在現(xiàn)代漢語只能依據(jù)“糊涂”“一塌糊涂”確定為形容詞(a)。
SW分離無需PW的五方面規(guī)則。只要句法語義上需要,就可進(jìn)行分離為短語。因此對其進(jìn)行切分、標(biāo)注跟對規(guī)范句子的處理一致,例如,
例11 一個月他也不洗v一次澡n。 a. 澡n,他一個月也不洗v一次。 b.一個月,他連一次澡n也不洗v。
不管SW還是PW,分離后都短語,只不過PW分離成的短語是動態(tài)言語性的。因此對SW、PW進(jìn)行詞語切分是可統(tǒng)一起來的。當(dāng)然在標(biāo)注m1、m2性質(zhì)的依據(jù)上不同,SW的m1、m2與其語素性質(zhì)一致;而PW標(biāo)注得遵循規(guī)則(2)。
詞語分離不僅是本體語法研究關(guān)注的重要現(xiàn)象,更是中文信息處理中詞語切分、詞性標(biāo)注以及基于規(guī)則的句義計(jì)算等無法回避的加工對象。本文結(jié)論是,任何音節(jié)上≥2的實(shí)詞語都可在句子里分離,根據(jù)動因、條件與意義的不同可分為SW與PW兩個類。二者的不同,表現(xiàn)為(x)y、m1、m2的語法特性、句法活動及分離語法意義等方面。采取標(biāo)記理論概括,SW分離是無標(biāo)記的句法現(xiàn)象,語義是客觀的;PW分離是有標(biāo)記的語用現(xiàn)象,它在一定程度上是體現(xiàn)漢語語法特性的主觀化結(jié)構(gòu),語義是主觀的。本文說明,根植于印歐語的理論與方法至少在處理漢語詞語分離的事實(shí)上存在著不足,如表達(dá)主觀義,印歐語在句法上一般按照合乎語法的硬規(guī)則去表征,類似漢語的PW分離是不可思議的。究其原因,是印歐語語法單位及其句法活動受著嚴(yán)格的形態(tài)束縛,可分離的對象與句位表達(dá)極其有限。漢語沒有印歐語那樣僵死的形態(tài)束縛,易于對語法單位發(fā)揮作用而使之分離,從而造成其靈活多變的句法表現(xiàn)以及不同“層”“級”上的語法意義。
從本文推論開來,m1m2式的虛詞也可做PW分離。如語感上最起碼可以提取出“m1什么m2”式,如“所什么以,隨什么著,憑什么借”等。當(dāng)然x與y在類聚個體上有限。
[1] 薛宏武.現(xiàn)代漢語語用組形研究[R].上海: 復(fù)旦大學(xué)中文系,2009.
[2] 蕭國政.漢語語法研究論[M].武漢:華中師范大學(xué)出版社, 2001:160-161.
[3] Givón T. Syntax: A Functional typological Introduction [M](vol. II ). Amsterdam/Philadelphia: John Benjamin Publishing Company,1990:968-970.
[4] Finegan E. Subjectivity and Subjectivisation: an Introduction[A]. Subjectivity and Subjectivisation[C], Edited by Dieter Stein and Susan Wright. Cambridge:Cambridge University Press, 1995.
[5] Lyons J. Semantic[M]. Cambridge: Cambridge University Press, 1977:739.
[6] 蕭國政.現(xiàn)代漢語句末“了”的意義的析離[C],陸儉明.面臨新世紀(jì)挑戰(zhàn)的現(xiàn)代漢語語法研究. 濟(jì)南: 山東教育出版社,1999.
[7] 薛宏武.“有著”語義語法功能的形成及其“著”的問題[J].漢語學(xué)習(xí),2012,(5):62-72.
A Grammatical Analysis of Disyllable Word Split in Modern Mandarin: A Computational Linguistic Perspective
XUE Hongwu
(College of Arts, Chongqing Normal University, Chongqing 401331, China)
With flexible morphological rules, Chinese is common to be observed for the disyllable word split by intserting some syntactical constituents of a sentence. To facilitate the word segmentation, part-of-speech tagging and semantic computing, the paper systematically discusses two types of the disyllable word split in Mandarin: one for the the Separable word, and the other is for the Prototype word. It examines describes the grammatical movitation of their formation, properties. and meanings, indicating that 1) the Prototype word split is caused by pragmatic factors, with subjective structures and grammatical meanings; yet 2) the Separable word split is caused by the syntactic and semantic expression, with objective structures and meanings.
oriented to computation; disyllable word; clefting; grammatical meanings and properties; Mandarin

薛宏武(1970—),博士,教授,主要研究領(lǐng)域?yàn)闈h語句法學(xué)。E?mail:xuehongwu386@sina.com
1003-0077(2015)03-0021-06
2013-04-08 定稿日期: 2013-07-31
國家自然科學(xué)基金(61202193);中央專項(xiàng)配套資金青年人才培訓(xùn)與研究支持計(jì)劃(WXY201F032);重慶師范大學(xué)基金(14XYY032)。
TP
A