■ 李佐文 李 楠
人工智能和大數(shù)據(jù)正在改變媒體,智能化成為媒體未來(lái)的發(fā)展趨勢(shì)①。目前,大數(shù)據(jù)、深度學(xué)習(xí)、人工智能等概念層出不窮,逐漸進(jìn)入媒體行業(yè)的同時(shí)也改變著媒體行業(yè),智能新聞寫(xiě)作、智能分發(fā)、情感分析、個(gè)性推薦等成為智能媒體關(guān)注的內(nèi)容。自然語(yǔ)言處理作為人工智能的重要組成部分,需要分析話語(yǔ)的宏觀和微觀結(jié)構(gòu),分析語(yǔ)義的不同層次,對(duì)內(nèi)容進(jìn)行分類,才能在真正意義上實(shí)現(xiàn)上述目標(biāo)。智能化計(jì)算機(jī)需要通過(guò)大量的文本分析,抽取樣本特征,才能學(xué)會(huì)如何提煉主題、分析情感,像人類一樣理解我們?nèi)粘=涣鞯脑捳Z(yǔ);只有掌握了語(yǔ)篇層面的結(jié)構(gòu)特征和語(yǔ)義特征,才能學(xué)會(huì)產(chǎn)生出更加自然、符合邏輯且富有變化的文章,而不是停留在模板填充的水平上。同樣,個(gè)性化新聞推送也需要讓計(jì)算機(jī)學(xué)習(xí)如何對(duì)新聞分類,才能使新聞的分發(fā)和推送更有針對(duì)性。基于神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)使自然語(yǔ)言處理不再只停留在字、詞的層面,而是開(kāi)始探討包括語(yǔ)境和相關(guān)背景知識(shí)在內(nèi)的整體話語(yǔ)層次。
話語(yǔ)計(jì)算就是依賴話語(yǔ)的形式特征來(lái)實(shí)現(xiàn)對(duì)語(yǔ)義或意向成分主動(dòng)控制的處理過(guò)程。在語(yǔ)言學(xué)理論框架下,用可計(jì)算的形式抽象出話語(yǔ)意義的操作模型是計(jì)算話語(yǔ)學(xué)(computational textlinguistics)的基本任務(wù)。在人工智能領(lǐng)域,智能計(jì)算本質(zhì)上是基于自然語(yǔ)言的計(jì)算,真正智能的計(jì)算機(jī)需要像人類一樣,使用語(yǔ)言作為媒介來(lái)計(jì)算。話語(yǔ)的可計(jì)算性特征就是用結(jié)構(gòu)化的形式描寫(xiě)話語(yǔ),用清晰明確的程式化方式來(lái)表征話語(yǔ)結(jié)構(gòu),命題關(guān)系,然后通過(guò)推理和語(yǔ)義操作來(lái)實(shí)現(xiàn)話語(yǔ)處理的目的。話語(yǔ)計(jì)算是求解問(wèn)題、做出評(píng)價(jià)的過(guò)程。
可計(jì)算特征實(shí)際上就是話語(yǔ)的計(jì)算模型,該模型具有以下性質(zhì):第一,它是對(duì)話語(yǔ)本質(zhì)特征的抽象描述;第二,它是語(yǔ)篇層面的整體特征,而不是詞和句法層面的特征;第三,它具有計(jì)算的可操作性。特征的抽取沒(méi)有統(tǒng)一的標(biāo)注和規(guī)范,而是與完成的目標(biāo)有關(guān)。
新聞話語(yǔ)是語(yǔ)言系統(tǒng)在媒體中的應(yīng)用,是指對(duì)某一事件或現(xiàn)象的報(bào)道。新聞話語(yǔ)有廣義和狹義之分,狹義上僅指消息,廣義上則指消息、通訊、特寫(xiě)、評(píng)論等形式。消息用概括的敘述方式、簡(jiǎn)明扼要的文字,迅速及時(shí)地報(bào)道國(guó)內(nèi)外最新發(fā)生的事件。新聞話語(yǔ)具有顯著的語(yǔ)類特征,比如新聞報(bào)道通常由標(biāo)題、導(dǎo)語(yǔ)、正文組成,內(nèi)容的組織也通常有金字塔結(jié)構(gòu)和倒金字塔結(jié)構(gòu)等比較固定的形式。新聞話語(yǔ)的計(jì)算主要是對(duì)語(yǔ)義進(jìn)行處理,其特征包括語(yǔ)義的結(jié)構(gòu)性、語(yǔ)句的連貫性、語(yǔ)義的層次性和話語(yǔ)的主題性。
隨著人們對(duì)自然語(yǔ)言中詞語(yǔ)、句子等語(yǔ)言單位的語(yǔ)義表示和自動(dòng)理解研究的逐漸深入,篇章級(jí)的語(yǔ)義表示和自動(dòng)分析逐漸成為研究的焦點(diǎn)。對(duì)語(yǔ)篇進(jìn)行語(yǔ)義分析與語(yǔ)篇的組織結(jié)構(gòu)密切相關(guān),如果計(jì)算機(jī)能夠從整個(gè)篇章的視角把握全文的結(jié)構(gòu),就能更好地把握文章的主題或中心思想,就能準(zhǔn)確地分析篇章級(jí)的意義。
語(yǔ)篇的結(jié)構(gòu)是語(yǔ)篇的形式特征,是語(yǔ)篇各個(gè)組成部分的搭配和排列。為實(shí)現(xiàn)計(jì)算機(jī)自動(dòng)分析語(yǔ)篇的結(jié)構(gòu),需要從語(yǔ)言學(xué)的篇章結(jié)構(gòu)理論出發(fā),結(jié)合計(jì)算機(jī)進(jìn)行篇章結(jié)構(gòu)自動(dòng)分析的實(shí)現(xiàn)要求,對(duì)語(yǔ)篇的組織結(jié)構(gòu)進(jìn)行形式化的描述,這是計(jì)算機(jī)進(jìn)行篇章結(jié)構(gòu)自動(dòng)分析的前提。
對(duì)于語(yǔ)篇的結(jié)構(gòu)研究已經(jīng)有很多的成果,如van Dijk的宏觀結(jié)構(gòu)理論、Mann& Thompson的修辭結(jié)構(gòu)理論、廖秋中的論證結(jié)構(gòu)研究、拉波夫的敘事結(jié)構(gòu)研究、婁開(kāi)陽(yáng)的新聞?wù)Z篇的結(jié)構(gòu)研究等,這些理論和研究對(duì)于計(jì)算機(jī)進(jìn)行語(yǔ)篇結(jié)構(gòu)分析具有一定的意義。
智能媒體的發(fā)展使人們?cè)絹?lái)越關(guān)注新聞話語(yǔ)的結(jié)構(gòu)特征。新聞話語(yǔ)研究的重點(diǎn)應(yīng)該是構(gòu)成新聞內(nèi)容的結(jié)構(gòu)框架,Van Dijk在他出版的《作為新聞的話語(yǔ)》②一書(shū)中認(rèn)為,新聞話語(yǔ)有特定的新聞圖式,已經(jīng)形成了既定風(fēng)格的語(yǔ)類。我們先看一個(gè)例子,摘自2018年7月25日《北京日?qǐng)?bào)》第13版③。
例1:男性遭電擊超過(guò)八成
①有一種非常奇怪的現(xiàn)象,就是男性與女性被雷擊的概率天差地別;②據(jù)美國(guó)疾病控制與預(yù)防中心的數(shù)據(jù)顯示,被閃電擊中的受害者中,男性超過(guò)了八成;③此外,高達(dá)85%的閃電致死事故都發(fā)生在男性身;④原因是男性比女性更偏愛(ài)戶外運(yùn)動(dòng);⑤而他們從事的職業(yè),相比女性來(lái)說(shuō)也更偏向戶外型;⑥此外,男性通常比女性膽子更大,不肯放下手頭的事情,就算雷雨交加,依然我行我素地踢足球、釣魚(yú)、打高爾夫球等。
這篇報(bào)道共有6句話,說(shuō)明一個(gè)觀點(diǎn):男性遭電擊比例超過(guò)八成。構(gòu)成一個(gè)論證結(jié)構(gòu)。
根據(jù)廖秋忠提出的論證結(jié)構(gòu)模型,可形成如下結(jié)構(gòu):A(argument)指論題,P(position)指觀點(diǎn),CL(clarify)指澄清,E(evidence)指論據(jù)④。根據(jù)該結(jié)構(gòu)模型,例1可以表示為下列樹(shù)圖:

圖1 論證結(jié)構(gòu)示意圖
鐘茂生等在廖秋忠的論證體篇章結(jié)構(gòu)研究和姜岷山的篇章系統(tǒng)性理論的基礎(chǔ)上,對(duì)論證體篇章結(jié)構(gòu)的形式化描寫(xiě)進(jìn)行了擴(kuò)充。基本論證結(jié)構(gòu)(Elementary Argumentation Structure,簡(jiǎn)稱EAS)是包括一個(gè)A(論證結(jié)論)、至少一個(gè)P(論題)、最多一個(gè)I(引言)、最多一個(gè)C(結(jié)尾)和多個(gè)E(論據(jù))構(gòu)成的論證結(jié)構(gòu)⑤。

根據(jù)上述規(guī)則,例1話語(yǔ)結(jié)構(gòu)可以表示為:

話語(yǔ)的結(jié)構(gòu)和語(yǔ)義密切相關(guān),計(jì)算機(jī)如果能夠自動(dòng)獲取話語(yǔ)的整體結(jié)構(gòu),就能實(shí)現(xiàn)話語(yǔ)層次的自動(dòng)語(yǔ)義分析。
話語(yǔ)連貫是指話語(yǔ)單位(語(yǔ)句或語(yǔ)段)之間的各種語(yǔ)義聯(lián)系。不論是書(shū)面語(yǔ)還是口頭話語(yǔ),其中的句子或段落之間都不是隨意堆砌起來(lái)的。學(xué)界對(duì)于它們之間關(guān)系的建立有兩種認(rèn)識(shí):一些研究者(Van Dijk、Brown & Yule等)認(rèn)為話題是建立話語(yǔ)單位之間連貫關(guān)系的依據(jù);另外一些研究者(Mann and Thompson、Shiffrin等)認(rèn)為話語(yǔ)的各個(gè)部分之間隱含著各種邏輯關(guān)系,如因果、詳述、對(duì)比等,是這些關(guān)系將話語(yǔ)單位聯(lián)系在一起。從自然語(yǔ)言處理的角度出發(fā),我們將連貫關(guān)系分為兩類:顯性連貫關(guān)系和隱形連貫關(guān)系。顯性連貫關(guān)系是指用語(yǔ)言手段標(biāo)示出來(lái)的語(yǔ)義關(guān)系,如上篇報(bào)道中,第四、第五、第六句開(kāi)頭的“原因是”“而”“此外”等表示因果關(guān)系、轉(zhuǎn)折關(guān)系和添加關(guān)系的詞語(yǔ);隱性連貫關(guān)系在自然話語(yǔ)中更為常見(jiàn),它沒(méi)有明顯的邏輯關(guān)系詞來(lái)表示,而是靠命題之間的語(yǔ)義關(guān)系進(jìn)行推斷。
我們把例1中報(bào)道的各句之間的連貫關(guān)系標(biāo)示如圖2:

圖2
例2:向逆風(fēng)而行的身影道聲辛苦⑥
①風(fēng)雨中的身影搖晃,卻給人們帶來(lái)安心,帶來(lái)感動(dòng)。
②臺(tái)風(fēng)“山竹”來(lái)襲,風(fēng)雨交加。在大家避風(fēng)的時(shí)候,卻有一群人逆風(fēng)而行。
③有一組網(wǎng)上熱傳的視頻可作見(jiàn)證。
④視頻中,江門(mén)市上川島,氣象站工作人員冒著13級(jí)大風(fēng)擦拭儀器鏡頭,保障記錄準(zhǔn)確性;廣東東莞,供電工人頂著風(fēng)雨巡查設(shè)備,不讓城市陷入黑暗;深圳,樹(shù)會(huì)倒,柵欄會(huì)跑,交警們依然在冒雨執(zhí)勤,清除隱患;佛山,民警在轉(zhuǎn)移群眾、逆風(fēng)奔跑;記者頂著風(fēng)帶來(lái)最新播報(bào);人民子弟兵時(shí)刻準(zhǔn)備生死馳援……
⑤他們?cè)陲L(fēng)雨中的身影有點(diǎn)搖晃不穩(wěn),卻給人帶來(lái)安心、帶來(lái)感動(dòng)。
例2報(bào)道中的連貫關(guān)系標(biāo)示如下:

話語(yǔ)連貫關(guān)系的處理是話語(yǔ)語(yǔ)義計(jì)算的核心內(nèi)容,通過(guò)上圖可以清楚地看到,在整篇報(bào)道中,第一句是全文的核心內(nèi)容,其余各個(gè)句子都圍繞它展開(kāi)。這就是新聞導(dǎo)語(yǔ)自動(dòng)生成的語(yǔ)義基礎(chǔ)。
那么如何讓計(jì)算機(jī)來(lái)識(shí)別這些連貫關(guān)系呢?梁國(guó)杰從計(jì)算機(jī)自動(dòng)處理語(yǔ)篇的需求出發(fā),從連貫關(guān)系和標(biāo)記的角度,針對(duì)漢語(yǔ)記敘文語(yǔ)篇提出了一套連貫關(guān)系集,歸納了30種連貫關(guān)系和與之相對(duì)的詞匯標(biāo)記形式,為計(jì)算機(jī)識(shí)別連貫關(guān)系提供了可行的語(yǔ)言知識(shí)資源⑦。張牧宇等對(duì)中文語(yǔ)篇的句間關(guān)系識(shí)別進(jìn)行了探索,針對(duì)顯性連貫關(guān)系,他們提出了基于連接詞規(guī)則的方法進(jìn)行識(shí)別,取得了很好的效果。針對(duì)隱形連貫關(guān)系,他們抽取詞匯、句法、語(yǔ)義等特征,采用最大熵和支持向量模型進(jìn)行了識(shí)別嘗試,推動(dòng)了連貫關(guān)系自動(dòng)識(shí)別的研究⑧。
話語(yǔ)是人們交流思想、表達(dá)情感的語(yǔ)言形式。無(wú)論哪種形式的言語(yǔ)交際,從語(yǔ)義角度上說(shuō),話語(yǔ)都包括兩個(gè)層面:基本話語(yǔ)(primary discourse)和元話語(yǔ)(metadiscourse)。基本話語(yǔ)表達(dá)話題的命題信息,是話語(yǔ)的主體;元話語(yǔ)告訴讀者如何理解,評(píng)述關(guān)于話題的命題信息。交際過(guò)程中,交際者為了順利完成交際任務(wù),要把主要信息編碼成銜接連貫的語(yǔ)句,依次表達(dá)出來(lái)。在這一過(guò)程中,交際者要選擇恰當(dāng)?shù)恼Z(yǔ)言成分來(lái)有效地組織話語(yǔ),使其條理清晰、結(jié)構(gòu)合理、符合邏輯。同時(shí)還要根據(jù)自身體驗(yàn)和感受,把自身的態(tài)度、觀點(diǎn)和評(píng)價(jià)也融入話語(yǔ)表達(dá)之中。
例3:
①坦率地講,我不想評(píng)價(jià)這部電影。
②今年的經(jīng)濟(jì)形勢(shì)依然嚴(yán)峻,但是我們有信心改善民生。
第一句應(yīng)理解成“發(fā)話者坦率地說(shuō),我不想評(píng)價(jià)這部電影”,要表達(dá)的主要意思是“我不想評(píng)價(jià)這部電影”,屬于基本話語(yǔ)層面。“坦率地講”并沒(méi)有介入主要命題,而是表明了他自身的態(tài)度,體現(xiàn)了發(fā)話者的存在。第二句中的“但是”也沒(méi)有介入話語(yǔ)的命題,卻起到了有效組織話語(yǔ)的作用,體現(xiàn)了信息的轉(zhuǎn)折。諸如此類的詞、短語(yǔ)或句子就是元話語(yǔ)。
基本話語(yǔ)和元話語(yǔ)的區(qū)別體現(xiàn)在三個(gè)方面:第一,內(nèi)容不同。基本話語(yǔ)傳遞命題信息,它們是言語(yǔ)交際的主體,如敘述某個(gè)事件、論證某個(gè)觀點(diǎn)等。元話語(yǔ)并不介入話語(yǔ)的基本命題信息,而是起到評(píng)價(jià)、表明觀點(diǎn)和引導(dǎo)話語(yǔ)的作用。第二,目標(biāo)不同。基本話語(yǔ)的目的是傳遞信息,元話語(yǔ)的目的是評(píng)價(jià)和調(diào)控話語(yǔ),使讀者更好地接受信息。從這個(gè)意義上講,二者的終極目標(biāo)是一致的,都是為了順利完成交際任務(wù)。第三,作用方式不同。基本話語(yǔ)是直接傳遞信息,元話語(yǔ)是通過(guò)對(duì)信息的組織和評(píng)價(jià),表達(dá)發(fā)話者的態(tài)度,是間接的傳遞信息。總的來(lái)說(shuō),作為話語(yǔ)現(xiàn)象,二者密切聯(lián)系,是不能截然分開(kāi)的,它們的共同作用使話語(yǔ)成為完整有機(jī)的一體。
Lyons認(rèn)為,說(shuō)話人在說(shuō)出一段話的同時(shí)表明自己對(duì)這段話的立場(chǎng)、態(tài)度和感情,從而在話語(yǔ)中留下自我印記⑨。在話語(yǔ)中,作者的主體意識(shí)總是以這樣或那樣的形式表現(xiàn)在話語(yǔ)中,體現(xiàn)著作者的觀點(diǎn)、情感和感受。
元話語(yǔ)層次為話語(yǔ)的情感計(jì)算奠定基礎(chǔ)。研究表明,這些詞是觀點(diǎn)和情感的主要承載詞。
情感分析是一種利用可計(jì)算的方法從自然語(yǔ)言文本中提取觀點(diǎn)和情感信息的研究課題。情感分析是一個(gè)語(yǔ)義分析問(wèn)題,目標(biāo)是從話語(yǔ)中分析出人們對(duì)于實(shí)體及其屬性所表達(dá)的觀點(diǎn)、態(tài)度、評(píng)價(jià)等,因此更加聚焦于理解與情感觀點(diǎn)有關(guān)的語(yǔ)義內(nèi)容,需要加入更深層次的語(yǔ)言理解和分析。通用的自然語(yǔ)言處理方法由于需要考慮多方面的因素,很難對(duì)情感這樣的特定目標(biāo)進(jìn)行精準(zhǔn)分析和處理,元話語(yǔ)為實(shí)現(xiàn)情感分析提供了語(yǔ)言材料。
話語(yǔ)是人們?cè)谝欢ǖ恼Z(yǔ)境下,為表達(dá)一定的意圖而說(shuō)出或?qū)懗龅囊贿B串語(yǔ)句。這些語(yǔ)句總是圍繞一個(gè)中心或主題展開(kāi)。從聽(tīng)者或讀者的角度來(lái)看,人們通過(guò)聽(tīng)讀,在句子或段落間建立起一定的連貫關(guān)系,將話語(yǔ)所描述的內(nèi)容與自身的經(jīng)驗(yàn)和知識(shí)結(jié)合形成微觀結(jié)構(gòu),再通過(guò)選擇、概括和建構(gòu),表征出發(fā)話者要傳達(dá)的主要意義和觀點(diǎn),也就是話語(yǔ)的主題(subject matter)。
話語(yǔ)的主題沒(méi)有固定的表現(xiàn)形式,有時(shí)包含在某些句子之中,有時(shí)體現(xiàn)在某個(gè)短語(yǔ)中,有時(shí)隱含在字里行間。這些命題和實(shí)體之間的語(yǔ)義關(guān)系,體現(xiàn)出語(yǔ)篇的文脈,構(gòu)成連貫的話語(yǔ)整體。
語(yǔ)篇的主旨很多情況下由大小主題構(gòu)成,這些大小主題可以用包含命題句子或包含實(shí)體的短語(yǔ)體現(xiàn)。小主題為大主題服務(wù),比如小主題可以是背景,可以是論據(jù),可以是細(xì)節(jié),等等,它們相互關(guān)聯(lián),按序列連貫推進(jìn),構(gòu)成整個(gè)語(yǔ)篇的主題鏈。因此Givon認(rèn)為,語(yǔ)篇的基本構(gòu)建單位是表達(dá)同一話題并趨向重復(fù)同一話題的句子。這就為主題計(jì)算提供了語(yǔ)言學(xué)理論基礎(chǔ)⑩。
詞匯鏈理論(lexical chain theory)由Morris & Hirst于1991年提出來(lái)。詞匯鏈?zhǔn)侵冈谝粋€(gè)主題下的一系列相關(guān)的詞共同組成的詞序列。該算法的基本假設(shè)是:用于描述特定主體的多個(gè)詞語(yǔ)在語(yǔ)義層面上應(yīng)該是相關(guān)的,并且圍繞特定主體展開(kāi)構(gòu)成一條相關(guān)詞匯的鏈條。以詞匯語(yǔ)義為核心的話語(yǔ)語(yǔ)義分析中,話語(yǔ)的語(yǔ)義信息通過(guò)詞匯間的語(yǔ)義關(guān)聯(lián)體現(xiàn)。具體來(lái)說(shuō),語(yǔ)義相關(guān)的詞匯、實(shí)體在話語(yǔ)過(guò)程中的分布情況也可以體現(xiàn)話語(yǔ)的行文結(jié)構(gòu)及各部分之間的語(yǔ)義關(guān)聯(lián)。詞匯鏈理論通過(guò)分析普通詞匯,包括名詞、形容詞等的語(yǔ)義信息構(gòu)建主題詞匯鏈,利用詞匯之間的分布和轉(zhuǎn)移方式分析話語(yǔ)語(yǔ)義。
主題模型有不少算法,最經(jīng)典的兩個(gè)是:概率隱語(yǔ)義分析PLSA(probabilistic latent semantic analysis)和潛在狄利克雷分布LDA(latent dirichlet allocation)。PLSA是一種生成模型。如下圖所示。

圖3 PLSA生成模型圖
(d表示每一篇文檔,z表示每一個(gè)隱含主題,w表示具體的單詞。N表示每篇文檔的單詞數(shù),M表示文檔集D內(nèi)的文檔數(shù)。)
首先假設(shè)文檔、單詞和隱含主題的關(guān)系可以通過(guò)貝葉斯網(wǎng)絡(luò)表示。灰色節(jié)點(diǎn)文檔(d)和文檔中的單詞(w)是人們可以觀測(cè)的變量;白色節(jié)點(diǎn)z是隱含的主題變量。文檔生成會(huì)經(jīng)過(guò)三個(gè)步驟,一是通過(guò)概率p(d)選定文檔,二是通過(guò)概率p(z|d)選定主題,三是通過(guò)概率p(w|z)從主題中選定單詞。
LDA(latent dirichlet allocation)主題模型由 David Blei,Andrew Ng和 Michael I.Jordan于2003年提出,是一種主題生成模型。LDA根據(jù)詞的共現(xiàn)分析,擬合出詞-文檔-主題的分布,進(jìn)而將詞和文本都映射到語(yǔ)義空間中。LDA認(rèn)為語(yǔ)篇通過(guò)六個(gè)步驟生成:一是確定詞匯和主題的分布;二是確定語(yǔ)篇和主題的分布;三是隨機(jī)確定該語(yǔ)篇中的詞匯數(shù)量,假設(shè)數(shù)量是N;四是若當(dāng)前生成的詞匯數(shù)量少于N就進(jìn)入下一步,若達(dá)到N則進(jìn)入最后一步,即語(yǔ)篇生成;五是根據(jù)文檔和主題分布隨機(jī)生成一個(gè)主題,再由這一主題和詞匯分布隨機(jī)生成一個(gè)詞,然后返回第四步,直到詞匯數(shù)量達(dá)到N;第六步就是語(yǔ)篇生成結(jié)束。
以上我們介紹了新聞話語(yǔ)語(yǔ)義宏觀層面的語(yǔ)義計(jì)算特征,單就計(jì)算特征而言還有其他的方面,如新聞話語(yǔ)書(shū)寫(xiě)排版方面的特征,段落的規(guī)則特征,排版字號(hào)大小的特征,都代表不同層次的語(yǔ)義重要性,標(biāo)題和導(dǎo)語(yǔ)都要突出主題等。
Schank& Brustein的調(diào)查顯示,大約有一半的新聞故事是程式化的,而純新聞?wù)Z體的程式化程度幾乎達(dá)到百分之百。新聞?wù)Z篇相對(duì)固定的模式是其語(yǔ)篇結(jié)構(gòu)化可計(jì)算的關(guān)鍵條件之一。如前文所述,話語(yǔ)的可計(jì)算性特征就是用結(jié)構(gòu)化的形式描寫(xiě)話語(yǔ),用清晰明確的程式化方式來(lái)表征話語(yǔ)結(jié)構(gòu)、命題關(guān)系。話語(yǔ)意義是計(jì)算、求解問(wèn)題和做出評(píng)價(jià)的過(guò)程,在此過(guò)程中通過(guò)推理和語(yǔ)義操作來(lái)實(shí)現(xiàn)話語(yǔ)處理的目的。本文從話語(yǔ)的結(jié)構(gòu)性、連貫性、層次性和主題性四方面分析了新聞話語(yǔ)的可計(jì)算特征,為智能新聞寫(xiě)作、智能分發(fā)、情感分析及個(gè)性推薦等智能媒體的發(fā)展提供了語(yǔ)言學(xué)基礎(chǔ),有助于其進(jìn)一步發(fā)展并加速自然語(yǔ)言處理的技術(shù)突破。
注釋:
① 沈浩、元方:《智能化媒體與未來(lái)》,《新聞戰(zhàn)線》,2018年第1期。
② TA.Van Dijk.NewsasDiscourse.London:Lawrence Erlbaum Associate Publishers.1988.p.73.
③ 司馬一:《男性遭電擊超過(guò)八成》,《北京日?qǐng)?bào)》,2018年7月25日,第13版。
④ 廖秋忠:《篇章中的論證結(jié)構(gòu)》,《語(yǔ)言教學(xué)與研究》,1988年第1期。
⑤ 鐘茂生、江超、王琪:《論證體篇章結(jié)構(gòu)的形式化描述》,《現(xiàn)代語(yǔ)言學(xué)》,2017年第5期。
⑥ 周珊珊:《向逆風(fēng)而行的身影道聲辛苦》,《人民日?qǐng)?bào)》,2018年9月18日,第13版。
⑦ 梁國(guó)杰:《面向計(jì)算的語(yǔ)篇連貫關(guān)系及其詞匯標(biāo)記研究》,中國(guó)傳媒大學(xué)博士學(xué)位論文,2016年,第4頁(yè)。
⑧ 張牧宇、宋原、秦兵、劉挺:《中文篇章級(jí)句間語(yǔ)義關(guān)系識(shí)別》,《中文信息學(xué)報(bào)》,2013年第6期。
⑨ Lyons,J.Semantics.Cambridge:CambridgeUniversityPress.1977.p.452.
現(xiàn)代傳播-中國(guó)傳媒大學(xué)學(xué)報(bào)2018年12期