趙建軍,楊曉虹,楊玉芳
(1. 遼寧師范大學(xué) 文學(xué)院,遼寧 大連 116021;2. 中國(guó)科學(xué)院心理研究所 腦與認(rèn)知科學(xué)國(guó)家重點(diǎn)實(shí)驗(yàn)室,北京 100101)
?
記敘文語篇修辭結(jié)構(gòu)對(duì)焦點(diǎn)分布影響的研究
趙建軍1,2,楊曉虹2,楊玉芳2
(1. 遼寧師范大學(xué) 文學(xué)院,遼寧 大連 116021;2. 中國(guó)科學(xué)院心理研究所 腦與認(rèn)知科學(xué)國(guó)家重點(diǎn)實(shí)驗(yàn)室,北京 100101)
該研究讓20名被試對(duì)30篇漢語記敘文進(jìn)行焦點(diǎn)標(biāo)定,在焦點(diǎn)標(biāo)定的基礎(chǔ)上,結(jié)合文本標(biāo)注和統(tǒng)計(jì)分析,對(duì)語篇修辭結(jié)構(gòu)對(duì)焦點(diǎn)分布的影響進(jìn)行了探討。結(jié)果主要發(fā)現(xiàn),記敘文語篇中有大約30%的小句沒有獲得焦點(diǎn);核心性對(duì)焦點(diǎn)的分布有重要影響,大約80%的核心句中有焦點(diǎn),而只有60%的輔助句中有焦點(diǎn);最高層級(jí)的小句焦點(diǎn)數(shù)量相對(duì)較少;記敘文語篇主要由10種修辭關(guān)系構(gòu)成,聯(lián)合關(guān)系和闡述關(guān)系小句中焦點(diǎn)數(shù)量最多,歸屬關(guān)系小句中焦點(diǎn)數(shù)量最少。
記敘文;語篇修辭結(jié)構(gòu);焦點(diǎn)分布
焦點(diǎn)是句子中語義上最重要的、說話者著重強(qiáng)調(diào)的成分。抓住了焦點(diǎn),也就抓住了語言理解的核心。因此,焦點(diǎn)是音系學(xué)、句法學(xué)、語義學(xué)、話語分析等語言學(xué)各個(gè)學(xué)科共同感興趣的問題,也是形式語言學(xué)、功能語言學(xué)等語言學(xué)各個(gè)學(xué)派共同感興趣的問題[1]。在關(guān)于焦點(diǎn)的研究中,焦點(diǎn)如何分布是一個(gè)重要的理論問題,同時(shí)在信息抽取、言語工程等領(lǐng)域也具有重要的應(yīng)用價(jià)值。焦點(diǎn)分布的影響因素有很多,本文主要探討語篇結(jié)構(gòu)對(duì)焦點(diǎn)分布的影響。
焦點(diǎn)位于句法、韻律、語義和語用相互作用的交界面上,不同的研究者從各自不同的研究立場(chǎng)出發(fā),給焦點(diǎn)賦予了不同的含義。本研究為了探討文本語篇的語篇結(jié)構(gòu)對(duì)焦點(diǎn)分布的影響,對(duì)焦點(diǎn)概念作如下操作性界定: 焦點(diǎn)就是閱讀者在語篇理解的基礎(chǔ)上,認(rèn)為語義上最重要的、作者著重強(qiáng)調(diào)的句子成分。
對(duì)語篇結(jié)構(gòu)的描述,本文采用修辭結(jié)構(gòu)理論(Rhetorical Structure Theory, RST)。RST是美國(guó)學(xué)者M(jìn)ann and Thompson 于20 世紀(jì)80年代初創(chuàng)立的,從功能角度對(duì)語篇結(jié)構(gòu)進(jìn)行描述的理論[2]。
RST創(chuàng)立之后,在語言工程應(yīng)用領(lǐng)域得到了廣泛的應(yīng)用。由Daniel Marcu博士主持的研究小組以RST為基礎(chǔ)建立了語篇標(biāo)注語料庫(kù),極大地豐富和發(fā)展了RST 理論[3]。Reitter利用RST開發(fā)出了文本分析剖析器,對(duì)篇章分析和文本處理起到很大的推動(dòng)作用[4]。在理論研究方面,Hanny den Ouden, Leo Noordman, Jacques Terken 利用RST對(duì)新聞報(bào)道語篇的修辭結(jié)構(gòu)和韻律結(jié)構(gòu)的關(guān)系進(jìn)行探討,結(jié)果發(fā)現(xiàn),小句的層級(jí)越高,小句前停頓的時(shí)間就越長(zhǎng),同時(shí)小句高音點(diǎn)也越高;重要小句的語速慢于不重要的小句;與其他關(guān)系的小句相比,因果關(guān)系的小句間的停頓時(shí)間較短,語速較快[5]。
近年來,國(guó)內(nèi)一些研究者將RST理論用于漢語語篇結(jié)構(gòu)分析也取得了一些成果。樂明對(duì)于漢語篇章修辭結(jié)構(gòu)的標(biāo)注規(guī)則進(jìn)行了深入探索,制定出詳細(xì)的標(biāo)注工作手冊(cè),并對(duì)97篇財(cái)經(jīng)評(píng)論文章的修辭結(jié)構(gòu)進(jìn)行了標(biāo)注,驗(yàn)證了修辭結(jié)構(gòu)理論在漢語篇章分析中的可移用性[6],孔慶蓓利用修辭結(jié)構(gòu)理論對(duì)漢語敘述語篇和描寫語篇進(jìn)行對(duì)比研究,擬構(gòu)出兩類語篇的修辭結(jié)構(gòu)模型[7],楊曉虹、楊玉芳對(duì)漢語語篇修辭結(jié)構(gòu)邊界的韻律表現(xiàn)進(jìn)行分析,發(fā)現(xiàn)小句邊界處無聲段和高音點(diǎn)重置是語篇修辭層級(jí)結(jié)構(gòu)的主要聲學(xué)線索[8],胡苑艷、陳莉萍通過實(shí)例分析證明,漢語語篇也應(yīng)由基本語篇單位構(gòu)成,其抽象結(jié)構(gòu)也應(yīng)為樹型圖,對(duì)漢語語篇的修辭關(guān)系進(jìn)行分析時(shí)可以套用修辭關(guān)系理論的關(guān)系集[9]。
一系列研究表明,RST能很好地刻畫語篇中小句之間的語義關(guān)系。而焦點(diǎn)是小句中語義的核心,因此采用RST能很好的反映出語篇結(jié)構(gòu)對(duì)焦點(diǎn)分布的影響。
RST主要從核心性、修辭關(guān)系和層級(jí)3個(gè)角度對(duì)語篇中小句之間的關(guān)系進(jìn)行描述。核心性主要反映小句之間的相對(duì)重要性;修辭關(guān)系主要用來刻畫小句之間的語義關(guān)系;層級(jí)性反映了建立在修辭關(guān)系基礎(chǔ)之上的小句之間的層級(jí)關(guān)系。本文將從核心性、修辭關(guān)系和層級(jí)3個(gè)角度分別考察語篇結(jié)構(gòu)對(duì)焦點(diǎn)分布的影響。
本研究所使用的語料為30篇自然敘事語篇,每個(gè)語篇平均約50個(gè)小句,600個(gè)漢字。這些語篇包括文化教育、科普和歷史3類題材,每類題材各10篇。首先對(duì)每個(gè)語篇進(jìn)行自動(dòng)切分和詞性標(biāo)注(利用北京大學(xué)計(jì)算語言學(xué)研究所開發(fā)的“漢語詞語切分與詞性標(biāo)注軟件”),本文作者對(duì)自動(dòng)分詞結(jié)果進(jìn)行人工校對(duì)。在此基礎(chǔ)上,進(jìn)行焦點(diǎn)標(biāo)定。參加焦點(diǎn)標(biāo)定的是14名在校大學(xué)生和6名研究生,均具有較好的語文基礎(chǔ)。文本語篇以打印材料呈現(xiàn)給被試。請(qǐng)被試認(rèn)真閱讀每個(gè)語篇至少兩遍,確保對(duì)語篇準(zhǔn)確理解。在理解的基礎(chǔ)上,請(qǐng)被試逐句找出自己認(rèn)為每個(gè)句子中在語義上最重要的、作者著重強(qiáng)調(diào)的詞項(xiàng),并在詞的下方劃一橫線。告訴被試,每個(gè)句子中所劃出的詞項(xiàng)可以是一個(gè),也可以是兩個(gè)或更多個(gè);如果認(rèn)為整個(gè)句子的語義在語境中不重要,可以不作任何標(biāo)記。對(duì)理解和標(biāo)定的時(shí)間均沒有限制。
語篇修辭結(jié)構(gòu)由一名博士研究生利用RSTTool軟件進(jìn)行標(biāo)注。對(duì)標(biāo)注結(jié)果中有爭(zhēng)議的地方由本文作者和該標(biāo)注者討論后確定最終結(jié)果。
最后利用SPSS15.0對(duì)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析,探討語篇修辭結(jié)構(gòu)對(duì)焦點(diǎn)分布的影響。
3.1 語篇修辭結(jié)構(gòu)標(biāo)注結(jié)果
本文對(duì)修辭結(jié)構(gòu)的標(biāo)注,參照Mann and Thompson提出的修辭關(guān)系集,同時(shí)考慮到漢語的特點(diǎn),提出了一個(gè)針對(duì)漢語的修辭關(guān)系集。該修辭關(guān)系集把修辭關(guān)系分為兩大類別: 主次關(guān)系和并列關(guān)系,也即單核(Mononuclear)關(guān)系和多核(Multinuclear)關(guān)系。主次關(guān)系包括29種;并列關(guān)系包括10種。主次關(guān)系的兩個(gè)小句,一個(gè)是核心句,一個(gè)是輔助句;并列關(guān)系的兩個(gè)小句都是核心句。
本文對(duì)小句的修辭關(guān)系和層級(jí)作如下界定: 小句的修辭關(guān)系只考慮每個(gè)小句的最底層的修辭關(guān)系,不考慮更高層的修辭關(guān)系;把小句到語篇最高節(jié)點(diǎn)所經(jīng)歷的節(jié)點(diǎn)數(shù)作為小句的層級(jí)數(shù)。這樣,每個(gè)小句就獲得了唯一的修辭關(guān)系和層級(jí)。
30個(gè)語篇的核心性標(biāo)注的結(jié)果為: 共有966個(gè)核心句,466個(gè)輔助句。核心句的數(shù)量是輔助句的兩倍多。這主要是因?yàn)樗胁⒘嘘P(guān)系的小句都是核心句,而記敘文語篇中有大量序列關(guān)系或聯(lián)合關(guān)系的并列小句。
30個(gè)語篇的層級(jí)標(biāo)注的結(jié)果如表1所示。

表1 各RST層級(jí)的小句數(shù)
由于高層級(jí)和低層級(jí)的小句數(shù)量較少,不便于統(tǒng)計(jì)。因此,把1、2、3層級(jí)合并為一級(jí),稱為1級(jí),即最高層級(jí),共213個(gè)小句;原始層級(jí)中的4、5、6、7級(jí)各減去2,變成合并后的第2、3、4、5級(jí);把8、9、10、11、12合并為一級(jí),稱為6級(jí),即最低層級(jí),共282個(gè)小句。層級(jí)的高低反映了小句在語篇結(jié)構(gòu)中的內(nèi)嵌深度,層級(jí)數(shù)越大,內(nèi)嵌越深,層級(jí)越低。
30個(gè)語篇的修辭關(guān)系標(biāo)注的結(jié)果如表2所示。

表2 各種修辭關(guān)系的小句數(shù)
從表2可以看出,30篇記敘文的1 432個(gè)小句主要包括10種修辭關(guān)系,其中8種是主次關(guān)系,兩種是并列關(guān)系。這10種修辭關(guān)系的小句占所有小句數(shù)量的85.3%。這10種修辭關(guān)系的小句數(shù)量,從高到底的排序依次為: 聯(lián)合關(guān)系>因果關(guān)系>闡述關(guān)系(序列關(guān)系)>轉(zhuǎn)折關(guān)系>背景關(guān)系>環(huán)境關(guān)系>條件關(guān)系>目的關(guān)系>歸屬關(guān)系。這個(gè)結(jié)果跟孔慶蓓對(duì)漢語敘述語篇的研究結(jié)果基本一致。該研究發(fā)現(xiàn),漢語敘述語篇中,出現(xiàn)概率較高的修辭關(guān)系為: 序列關(guān)系、環(huán)境關(guān)系、并列關(guān)系(即本研究中的聯(lián)合關(guān)系)、闡述關(guān)系、原因關(guān)系、結(jié)果關(guān)系[7]。說明漢語中同一種文體的語篇的修辭關(guān)系具有較高的一致性,文體對(duì)修辭關(guān)系具有較強(qiáng)的約束和選擇功能。
本文考察修辭關(guān)系對(duì)焦點(diǎn)分布的影響時(shí),主要分析這10種修辭關(guān)系對(duì)焦點(diǎn)分布的影響。
3.2 焦點(diǎn)個(gè)數(shù)的確定
對(duì)每個(gè)被標(biāo)定為焦點(diǎn)的詞進(jìn)行統(tǒng)計(jì),20個(gè)被試的標(biāo)定一致性高于70%(至少14個(gè)被試都標(biāo)為焦點(diǎn))的詞最終被確定為焦點(diǎn)詞。通過焦點(diǎn)標(biāo)注實(shí)驗(yàn),確定出了30個(gè)語篇中共2 027個(gè)焦點(diǎn)詞。但一個(gè)焦點(diǎn)詞不等于就是一個(gè)焦點(diǎn)。焦點(diǎn)有寬焦點(diǎn)和窄焦點(diǎn)之分。寬焦點(diǎn)包括謂語焦點(diǎn)和句子焦點(diǎn),這兩類焦點(diǎn)通常是由一個(gè)短語或者一個(gè)句子構(gòu)成。因此,焦點(diǎn)的個(gè)數(shù)一定會(huì)少于焦點(diǎn)詞的數(shù)量。要考察語篇修辭結(jié)構(gòu)對(duì)焦點(diǎn)數(shù)量分布的影響,首先要確定出各個(gè)焦點(diǎn)。
本文把小句中連續(xù)的句子成分充當(dāng)?shù)慕裹c(diǎn)確定為一個(gè)焦點(diǎn);把小句中不連續(xù)的句子成分充當(dāng)?shù)慕裹c(diǎn)確定為兩個(gè)焦點(diǎn)。例如,“秦王令趙王彈瑟”(著重號(hào)表示被標(biāo)注為焦點(diǎn))。這個(gè)小句被看作是一個(gè)焦點(diǎn),即句子焦點(diǎn)。“北京人孝心最強(qiáng);上海人孝心最弱”。這兩個(gè)小句被確定為各包括兩個(gè)窄焦點(diǎn)。
30個(gè)語篇的2 027個(gè)焦點(diǎn)詞最終被確定為1 034個(gè)焦點(diǎn)。平均每個(gè)小句有0.72個(gè)焦點(diǎn)。說明語篇中有大量的小句沒有獲得焦點(diǎn)。這一點(diǎn)跟孤立句有很大的差別。通常情況下,一個(gè)孤立小句有一個(gè)焦點(diǎn),是該句的語義重心所在,是說話者向聽話者傳遞的新信息。但當(dāng)小句進(jìn)入語篇之后,由于受到語篇結(jié)構(gòu)的影響,在語篇中的功能和地位有很大差異。有些小句在語篇中承擔(dān)著語義和結(jié)構(gòu)上的重要功能,對(duì)語篇的連貫和理解起著重要作用;而另外一些小句在語篇中只是用來提供背景性信息或者補(bǔ)充說明性的信息,對(duì)語篇連貫和語篇理解的貢獻(xiàn)相對(duì)較小,在語篇中只起輔助功能。這些起輔助功能的小句很可能會(huì)由于語境的影響而失去焦點(diǎn),成為語篇中的無焦點(diǎn)句。
3.3 層級(jí)和核心性對(duì)焦點(diǎn)分布的影響
焦點(diǎn)在層級(jí)及核心句、輔助句中的分布結(jié)果如表3所示。

表3 焦點(diǎn)在層級(jí)及核心句、輔助句中的分布
從表3可以看出,焦點(diǎn)在核心句中的數(shù)量遠(yuǎn)多于輔助句中的數(shù)量。但在層級(jí)之間的分布沒有太大差異。但僅僅從焦點(diǎn)數(shù)量來比較,不能準(zhǔn)確的看出層級(jí)和核心性對(duì)焦點(diǎn)數(shù)量分布的影響,因?yàn)楦鱾€(gè)層級(jí)中小句的數(shù)量分布是不均衡的。因此,要考察層級(jí)和核心性對(duì)焦點(diǎn)數(shù)量分布的影響,需要求出各個(gè)層級(jí)中焦點(diǎn)在小句中分布的平均數(shù)。
本文采用焦點(diǎn)比率來描述各個(gè)小句中焦點(diǎn)的平均數(shù)。焦點(diǎn)比率=焦點(diǎn)數(shù) /小句數(shù)。各層級(jí)及核心句、輔助句中的焦點(diǎn)比率如表4所示。

表4 各層級(jí)及核心句、輔助句中的焦點(diǎn)比率
首先,對(duì)核心性對(duì)焦點(diǎn)比率的影響進(jìn)行分析。從表4中可以看出,核心句中平均每個(gè)小句有0.78個(gè)焦點(diǎn),輔助句中平均每個(gè)小句只有0.60個(gè)焦點(diǎn)。通過雙比率檢驗(yàn)發(fā)現(xiàn),核心句的焦點(diǎn)比率要顯著高于輔助句(p<0.01)。這說明,核心性對(duì)焦點(diǎn)數(shù)量的分布有顯著的影響。大量的輔助句由于在語篇中的重要性較低而失去焦點(diǎn)。
從表4中也可以看出,有大約20%的核心句沒有焦點(diǎn)。核心句沒有焦點(diǎn)主要有兩個(gè)方面的原因。第一個(gè)原因跟本文對(duì)小句的界定有關(guān)。本文把插入語、引語成分、附加成分均視為獨(dú)立的小句。一些引語成分往往會(huì)成為歸屬關(guān)系或闡述關(guān)系的核心句,這種小句基本上沒有焦點(diǎn)。例如,“武帝對(duì)一位劉姓的大臣說,夫人肯定非常傷心。”。這兩個(gè)小句的修辭關(guān)系是歸屬關(guān)系。“武帝對(duì)一位劉姓的大臣說”是歸屬關(guān)系中的核心句,該小句沒有焦點(diǎn)。這是無焦點(diǎn)核心句的一個(gè)重要來源。第2個(gè)原因是,核心句充當(dāng)更高層次結(jié)構(gòu)的輔助成分。這也會(huì)造成這種核心句沒有焦點(diǎn), 這種情況如圖1所示, 這3個(gè)小句都是核心句,第一個(gè)小句整個(gè)句子都是焦點(diǎn),后面兩個(gè)小句都沒有焦點(diǎn)。因?yàn)楹竺鎯蓚€(gè)小句構(gòu)成一個(gè)聯(lián)合關(guān)系的結(jié)構(gòu)段,這個(gè)結(jié)構(gòu)段又是更高層目的關(guān)系結(jié)構(gòu)段的輔助成分。由于這兩個(gè)聯(lián)合關(guān)系的小句在整體結(jié)構(gòu)中的重要性相對(duì)較低,造成這兩個(gè)小句沒有焦點(diǎn)。這是無焦點(diǎn)核心句的另一個(gè)重要來源。

圖1 核心句無焦點(diǎn)的情況
然后,對(duì)層級(jí)對(duì)核心句的焦點(diǎn)比率的影響進(jìn)行分析。通過雙比率檢驗(yàn)發(fā)現(xiàn),層級(jí)1的焦點(diǎn)比率要顯著低于層級(jí)2、3、4、5(p<0.05);層級(jí)4的焦點(diǎn)比率要顯著高于層級(jí)1、3、5、6(p<0.05);其他各層級(jí)之間沒有顯著差異(p>0.05)。這說明,最高層級(jí)的核心句的焦點(diǎn)數(shù)量相對(duì)較少,中間層級(jí)的焦點(diǎn)數(shù)量相對(duì)較多。
最后,對(duì)層級(jí)對(duì)輔助句的焦點(diǎn)比率的影響進(jìn)行分析。通過雙比率檢驗(yàn)發(fā)現(xiàn),層級(jí)1的焦點(diǎn)比率要顯著低于層級(jí)4(p<0.05),其他各層級(jí)之間沒有顯著差異(p>0.05)。這表明,最高層級(jí)的焦點(diǎn)數(shù)量要少于中間層級(jí)。
綜合上述層級(jí)對(duì)核心句、輔助句中的焦點(diǎn)比率的影響可以看出,在最高層級(jí)中,無論是核心句還是輔助句,焦點(diǎn)數(shù)量都相對(duì)較少。在本研究的30篇記敘文中,最高層級(jí)的小句通常有以下幾個(gè)方面的功能: ①提供敘事的背景信息。大部分語篇的起始段落,或某些段落的起始句,會(huì)介紹事件或人物的背景信息。這些提供背景信息的小句,雖然不是語篇的核心成分,不是整個(gè)事件的主線,但這些小句的層級(jí)一般都比較高;②引出后文。引語成分往往也在語篇中處于比較高層級(jí)的位置。例如,“據(jù)記載”、“事實(shí)表明”、“楚懷王說”等;③總結(jié)性描述。在一個(gè)事件結(jié)束后,在段末的位置,經(jīng)常會(huì)有對(duì)整個(gè)事件的總結(jié)性描述。例如,“由此形成了七夕節(jié)”、“這就是赤條蜂”。這種總結(jié)性描述也處于比較高層級(jí)的位置。這3種功能的小句,在語篇中的層級(jí)都很高,但在語篇中的重要性都相對(duì)較低,句子中往往沒有焦點(diǎn)。這是高層級(jí)中焦點(diǎn)數(shù)量相對(duì)較少的主要原因。
3.4 修辭關(guān)系對(duì)焦點(diǎn)分布的影響
各種修辭關(guān)系中焦點(diǎn)數(shù)量的分布如表5所示。從表5可以看出,10種主要修辭關(guān)系中焦點(diǎn)的數(shù)量占總焦點(diǎn)數(shù)量的85%。不同修辭關(guān)系的焦點(diǎn)數(shù)量的分布有很大差異。考慮到各種條件下句子數(shù)量不同, 下面仍然用焦點(diǎn)比率對(duì)各種修辭關(guān)系中焦點(diǎn)的分布進(jìn)行分析。主要修辭關(guān)系的焦點(diǎn)比率如表6所示。

表5 各修辭關(guān)系中焦點(diǎn)數(shù)量的分布

表6 主要修辭關(guān)系中的焦點(diǎn)比率
從表6可以看出,并列關(guān)系的兩種修辭關(guān)系中,聯(lián)合關(guān)系的焦點(diǎn)比率要顯著高于序列關(guān)系(p<0.01)。結(jié)合表4的結(jié)果可以看出,序列關(guān)系的焦點(diǎn)比率要顯著低于核心句的焦點(diǎn)比率的平均值0.78(p<0.01)。記敘文中的序列關(guān)系的小句通常用來描述一系列連續(xù)的行為或事件。這些序列小句雖然在語篇的連貫性上很重要,是整個(gè)事件中不可或缺的情節(jié)之一。但這些小句描述的事件往往在整個(gè)事件中的重要性并不高,只是一些重要性事件之間的過渡性的事件,語篇中也沒有對(duì)這些事件進(jìn)行詳細(xì)的描述。因此,序列關(guān)系的小句雖然在語篇連貫性上很重要,但在語義上并不是很重要,所以小句中的焦點(diǎn)數(shù)量要顯著少于其他核心句。
接著,對(duì)主從關(guān)系中的八種修辭關(guān)系的焦點(diǎn)比率的差異進(jìn)行分析。通過雙比率檢驗(yàn)發(fā)現(xiàn),闡述關(guān)系的焦點(diǎn)比率顯著高于其他各種修辭關(guān)系(P<0.05),歸屬關(guān)系的焦點(diǎn)比率顯著低于其他各種修辭關(guān)系(P<0.001),其他6種修辭關(guān)系的焦點(diǎn)比率相互之間沒有顯著差異(P>0.05)。
綜上所述,不同類型的修辭關(guān)系中,焦點(diǎn)分布的規(guī)律不一致。聯(lián)合關(guān)系和闡述關(guān)系小句中焦點(diǎn)數(shù)量明顯多于其他各種修辭關(guān)系小句。歸屬關(guān)系小句中焦點(diǎn)數(shù)量明顯少于其他各種修辭關(guān)系小句。
本研究讓20名被試對(duì)30篇漢語記敘文進(jìn)行焦點(diǎn)標(biāo)定,在焦點(diǎn)標(biāo)定的基礎(chǔ)上,結(jié)合文本標(biāo)注和統(tǒng)計(jì)分析,對(duì)語篇修辭結(jié)構(gòu)對(duì)焦點(diǎn)分布的影響進(jìn)行了探討。結(jié)果主要發(fā)現(xiàn),(1)記敘文語篇中有大約30%的小句沒有獲得焦點(diǎn)。這一點(diǎn)跟孤立句有很大的差別。通常情況下,一個(gè)孤立小句有一個(gè)焦點(diǎn)。但當(dāng)小句進(jìn)入語篇后,很多小句由于語境的影響而失去焦點(diǎn),成為語篇中的無焦點(diǎn)句;(2)核心性對(duì)焦點(diǎn)的分布有重要影響。大約80%的核心句中有焦點(diǎn),而只有60%的輔助句中有焦點(diǎn);(3)在最高層級(jí)的小句中,無論是核心句還是輔助句,焦點(diǎn)數(shù)量都相對(duì)較少;(4)記敘文語篇主要由10種修辭關(guān)系構(gòu)成。聯(lián)合關(guān)系和闡述關(guān)系小句中焦點(diǎn)數(shù)量明顯多于其它各種修辭關(guān)系小句。歸屬關(guān)系小句中焦點(diǎn)數(shù)量明顯少于其它各種修辭關(guān)系小句。
本文只對(duì)記敘文語篇中修辭結(jié)構(gòu)對(duì)焦點(diǎn)分布的影響進(jìn)行了初步探討,后續(xù)還將從以下方面進(jìn)行深入的研究: (1)不同體裁的語篇的修辭結(jié)構(gòu)有何異同?對(duì)焦點(diǎn)的分布有何影響?(2)除了語篇修辭結(jié)構(gòu)之外,其它語篇結(jié)構(gòu)對(duì)焦點(diǎn)分布的影響如何?例如,語篇的意圖結(jié)構(gòu)。對(duì)語篇焦點(diǎn)分布規(guī)律的探討不僅有重要的理論價(jià)值,而且對(duì)提高自動(dòng)文摘系統(tǒng)的精度(傅間蓮)[10]和文本信息抽取的有效性都有一定的應(yīng)用價(jià)值(袁毓林)[11]。
[1] 徐烈炯, 潘海華. 焦點(diǎn)結(jié)構(gòu)和意義的研究[M]. 北京: 外語教學(xué)與研究出版社. 2005:34-47.
[2] Mann William C, Sandra A. Thompson. Rhetorical structure theory: toward a functional theory of text organization [J]. Text, 1988, 8(3):243-281.
[3] Marcu D. The Theory and Practice of Discourse Parsing and Summarization [M]. Cambridge, Massachusetts: MIT Press, 2000.
[4] Reitter D, Manfred S. Step by step: Under-specified markup in incremental rhetorical analysis[C]//Proceedings of EACL 4th International Workshop on Interpreted Corpora. Budapest, Hungary, 2003.
[5] Hanny den O, Leo N, Jacques T. Prosodic realizations of global and local structure and rhetorical relations in read aloud news reports [J]. Speech communication, 2009,51:116-129.
[6] 樂明. 漢語篇章修辭結(jié)構(gòu)的標(biāo)注研究[J]. 中文信息學(xué)報(bào), 2008,22(4):19-23.
[7] 孔慶蓓. 從修辭結(jié)構(gòu)理論看敘述語篇和描寫語篇的區(qū)別[J]. 南開語言學(xué)刊, 2008,2:92-104.
[8] 楊曉虹,楊玉芳. 漢語語篇修辭結(jié)構(gòu)邊界韻律表現(xiàn)[J]. 清華大學(xué)學(xué)報(bào)(自然科學(xué)版), 2009,49(S1):1375-1379.
[9] 胡苑艷,陳莉萍. 修辭結(jié)構(gòu)理論與漢語篇章結(jié)構(gòu)[J]. 長(zhǎng)春大學(xué)學(xué)報(bào), 2011,21(1):39-43.
[10] 傅間蓮,陳秀群. 基于規(guī)則和統(tǒng)計(jì)的中文自動(dòng)文摘系統(tǒng)[J]. 中文信息學(xué)報(bào), 2006,20(5): 10-16.
[11] 袁毓林. 信息抽取的語義知識(shí)資源研究[J]. 中文信息學(xué)報(bào), 2002,16(5):8-14.
An Analysis of Discourse Rhetorical Structure Influence on Focus Distribution in the Narrative Discourse
ZHAO Jianjun1,2,YANG Xiaohong2, YANG Yufang2
(1. The School of Chinese Language and Literature, Liaoning Normal University, Dalian, Liaoning 116021, China;2. State Key Laboratory of Brain and Cognitive Science, The Institute of Psychology, Chinese Academy of Sciences, Beijing 100101, China)
Based on 30 narrative texts of mandarin Chinese with the sentence focus annotated by 20 subjects, a statistical analysis is conducted to examine the influence of discourse rhetorical structure on focus distribution. The result shows that about 30% of the sentences in the narrative discourse have no focus. It is further revealed that the nuclearity has remarkable influence on focus distribution: about 80% of the nucleus sentences had focus but only 60% of the satellite sentences had focus. The sentences of the highest hierarchy have less focus. The narrative discourses consist of ten main rhetorical relations, in which the conjunction relation and the elaboration relation have the most sentences with focus and the attribution relation has the least sentences with focus.
narrative discourse; discourse rhetorical structure; focus distribution

趙建軍(1976—),博士,主要研究領(lǐng)域?yàn)轫嵚蓪W(xué),認(rèn)知語言學(xué)。E?mail:zhaojianjun768@163.com楊曉虹(1984—),博士,助理研究員,主要研究領(lǐng)域?yàn)檠哉Z認(rèn)知。E?mail:yangxh@psych.a(chǎn)c.cn楊玉芳(1950—),博士,研究員,主要研究領(lǐng)域?yàn)樾睦碚Z言學(xué)。E?mail:yangyf@psych.a(chǎn)c.cn
1003-0077(2015)01-0038-06
2012-06-21 定稿日期: 2012-09-27
國(guó)家社會(huì)科學(xué)基金(14BYY147);教育部人文社會(huì)科學(xué)青年基金(11YJC740153);中國(guó)博士后科學(xué)基金(20110491445);江蘇省博士后科研資助計(jì)劃(1002068C)
TP391
A