吉 暉
(武漢大學,武漢 430072)
提 要:本文基于知識圖譜理論,利用Citespace軟件對2001至2016年國外話語標記研究熱點及主要領域進行可視化分析。當前國外話語標記研究熱點從理論建構向應用研究轉移,關注本體屬性、二語習得、自然語言處理、社會語言學、機構話語等多個領域。其研究方法的多樣性、研究視角的多維性、語料選擇的開放性對于國內相關研究均具有重要借鑒意義。
從20世紀70年代開始,話語標記(discourse markers)作為一個語言實體(linguistic entity)進入人們的研究視野(Labov,F(xiàn)anshel 1977:156)。在此后的研究中,盡管各界學者在話語標記的命名、定義、成員類型上存在諸多異見,但話語標記是在話語層次上起作用的單位、表程序意義而非概念意義、標識前后語段關系等觀念已成為大家的共識。經過近四十年的發(fā)展,國外語言學界的話語標記研究從個案分析、本體屬性考察逐步延伸到二語習得、自然語言處理、社會語言學和機構話語等多個層面和領域。本文借助科學知識圖譜軟件Citespace對2001至2016年間國外重要期刊的相關研究進行可視化分析,結合共詞網絡分析與文本深度閱讀的方式,挖掘國外話語標記研究熱點,冀望當前最新的研究視角、研究方法及研究成果能給國內話語研究帶來一些啟發(fā)和幫助。
本文考察文獻來源于美國(Web of Science,簡稱WOS)核心合集數(shù)據庫。筆者以discourse markers為主題,檢索文獻類型包括 Article,Pro?ceedings paper,Review,檢索年限為2001至2016年,共檢索到相關成果525篇。經過Citespace數(shù)據查重清洗,最終考察文獻為499篇,文獻年度分布狀況如圖1所示。

圖1 2001至2016文獻年度數(shù)量分布
從圖1的數(shù)據來看,2001-2005年間,話語標記研究持水平發(fā)展,年均發(fā)文20篇;2006-2011年間,話語標記研究出現(xiàn)平緩增長;經過2012、2013年的短暫下降后,話語標記研究在2014、2015年出現(xiàn)顯著增長,2015年發(fā)文81篇,達到峰值。
科學計量學認為,關鍵詞是作者對文章核心研究內容的精煉,學科領域里高頻出現(xiàn)的關鍵詞和從數(shù)據樣本中提取分析出的名詞短語可被視為該領域的研究熱點(趙蓉英 許麗敏 2010:66)。表1是對前20位熱點關鍵詞的詞頻及中心性的統(tǒng)計。其中,關鍵詞的中心性越大,其研究的吸附力也越大,在連接其它節(jié)點的過程中發(fā)揮更重要的作用。

表1 前20位關鍵詞
分析表1可知,最大的3個熱點分別是會話(conversation)、英語(English)和語法化(gramma?ticalization),它們分別代表語料類型、語種對象、理論解釋3個研究維度。首先是語料類型,學界對話語范圍存在不同理解,大部分學者采用狹義的概念,因此互動會話成為當前研究的主體。但也有不少學者認為應從更寬的范圍理解話語,除會話外,獨白型語料也應該成為話語標記研究的對象。與話語研究匹配的主要研究方法是語料庫語言學方法。其次是語種對象,英語是主要研究語種,well是一個研究熱度很高的英語話語標記。此外學界對西班牙語的關注度也很高。第三是理論解釋,話語標記的形成是語法化的結果,這已成為很多文獻的共識。同時,話語標記的某些變異現(xiàn)象與語言接觸(language contact)也存在一定關聯(lián)。當前的研究熱點還包括人們對話語標記的一些普適認識:話語標記來源于副詞(adverb)、連詞(connective)等功能詞;話語標記是一種話語策略(strategy),起關聯(lián)(relevance)、連貫(coherence)、組織(organization)語篇、說明(account)語境的作用;話語標記在計算機識別自發(fā)言語(spontaneous speech)的過程中具有十分重要的作用。
如果說熱點探測解決“點”的問題,那么聚類分析將解決“面”的問題。Citespace的核心功能之一就是在熱點探測的基礎上,對關鍵詞網絡進行聚類分析,通過圖譜解讀,我們可以探尋當前話語標記研究分布的主要領域。
得到話語標記研究共詞聚類網絡圖(圖2)。圖2中,聚類模塊性(Modularity)Q 值為 0.9111,大于0.3,說明此次聚類效果良好,社團結構顯著(李杰 陳超美 2016:150),輪廓值在0.5以上的合理聚類有27個①,#后為聚類編號及聚類名稱。
結合圖譜分析和文本閱讀,我們對當前聚類進行二次整合與重命名,當前話語標記研究主要分布在本體屬性研究、二語語用習得研究、自然語言處理研究、社會語言學應用研究、機構話語研究等5大領域,進而可細分為14個分領域,詳述如下。

圖2 話語標記研究共詞聚類網絡圖
4.1.1 話語標記形成演化研究
話語標記的形成往往經歷一個從實到虛不斷語法化的過程,語法化是當前學界解釋話語標記演進的主要理論依據。語法化理論在眾多個案研究的基礎上不斷豐富和完善。一般認為,語法化后話語標記在話語層面的功能會不斷增強,而原有語法約束會大大弱化甚至消失。但Koops(2015:232-259)發(fā)現(xiàn),話語標記的語序具有較大約束性,其原因在于話語標記的特殊語法化軌跡使其仍然保留原有句法類型特征,看似自由的語序正是這種句法特征起作用的主要表現(xiàn)。話語標記形成過程十分復雜,諸多因素互為條件、相互影響。Rhee(2015:10-26)在研究韓語認同類話語標記時發(fā)現(xiàn),除語義弱化外,省略機制與交互主觀化在語法化過程中都發(fā)揮重要作用。不同語種的個案分析讓我們對話語標記系統(tǒng)的認識更科學、更全面。
4.1.2 話語標記韻律特征研究
韻律特征是說話者準確傳達話語內容、表達思想感情、以求得到聽話者準確理解的必要手段(單誼2015:70)。在語言技術的支持下,話語標記韻律特征研究成果不斷豐富。Gonen(2015:69-84)采用儀器分析法,分析希伯來語口語中話語標記axshav(now)的韻律特征。Tanghe(2015:125-147)在口語數(shù)據庫的基礎上,分析西班牙語話語標記anda,vamos的超音段參數(shù)特征。當前的研究表明,話語標記在停頓、音長、音高及音強等方面的韻律特征將其與對應的實詞性語言單位區(qū)分開來,同時不同的韻律特征對應不同的語用功能,韻律是理解話語的重要語境線索。
二語學習者對話語標記的準確理解和得體使用,本質上是對二語語用能力的習得。話語標記習得研究主要解決3個方面的問題:二語學習者話語標記的使用特征、話語標記習得的影響因素及話語標記教學。
4.2.1 二語學習者話語標記的使用特征
對比母語使用者,二語學習者話語標記的使用具有如下特征:(1)二語水平不高的學習者使用話語標記的頻率較低;(2)二語越熟練的學習者使用話語標記的頻率越高,有時甚至超過母語使用者;(3)話語標記使用越多的第二語言學習者更傾向于融入他國的文化與生活(Hellermann,Vergun 2007:157)。
4.2.2 話語標記習得的影響因素
影響二語語用能力發(fā)展的因素很多,其中學習者語言水平、學習環(huán)境、目的語接觸時間、語言教學以及學習者個體因素(包括年齡、性別、動機、社會心理距離)等的影響較大(戴煒棟楊仙菊2005:2)。學習者的語言水平影響話語標記的使用類型及功能。話語標記的習得有一個內在順序,其規(guī)律是:接近語義平面的話語標記具有更大的語義權重,會被首先習得和使用,而那些更純粹的表示語用和人際功能的話語標記則習得較晚且很難習得。
在目的語環(huán)境中學習、延長與目的語的接觸時間對語用能力的習得有積極的作用。學習者在目的語環(huán)境中會經歷一個語言的社會化過程,即在日常交往中無形地習得社會規(guī)范。話語標記的使用正是學習者語言使用社會化的結果。
話語標記的過度使用現(xiàn)象在成年學習者中十分普遍(Polat 2011:3745)。這種“過分使用”可被視為語言的“安全策略”。當一位成年語言學習者具有較強的學習動機后,他會努力模仿當?shù)氐恼Z用模式以尋求認同并融入當?shù)厣鐣_^頻使用話語標記是一種語用復制機制,學習者往往忽略形式背后微妙的語用功能。
4.2.3 話語標記教學研究
在很長一段時間里,語用能力的教學并沒有真正進入外語課堂。Hellermann(2007:157)在研究中發(fā)現(xiàn),話語標記并不屬于課堂講授語言格式與功能特征的一部分。大量研究表明,語用能力是可以教的,而課堂教學在第二語言語用能力發(fā)展中起著重要作用。Hellermann認為應該結合學生的語言程度以及話語標記習得程度的分析,適時地在課堂教學中引入話語標記的教學。Her?nandez(2011:159-182)探討顯性教學(explicit instruction,EI)與輸入流教學法(input flood,IF)結合對學生習得西班牙語話語標記的作用,并與單獨的輸入流教學效果進行比較。測試表明,兩種方式都對學生使用話語標記產生積極效果。顯性教學更利于學習者語用能力的習得。
話語標記的識別對于自動偵測口語話語邊界和提取關鍵句具有十分重要的意義(Kawahara et al.2004:409)。話語標記一般用于句子開頭部分,并伴有語音停頓及其他語言模式信息。因此,話語標記在位置、語音上的特征成為機器識別關鍵句及切分語句的重要參數(shù)。Kawahara(2004:409)設計自動提取話語標記的流程:利用停頓信息勘定話語邊界—建立語言模型—詞頻、句頻統(tǒng)計—索引出話語標記(如圖3所示)。這個實驗表明,相比單一的僅用停頓作為基線的方法,話語標記參數(shù)的介入使話語邊界檢索表現(xiàn)更為突出,同時也很好地克服話語識別的錯誤。
Popescu?Belis和 Zufferey(2011:499-518)則采用依據詞匯、句法位置、韻律、社會語言學等特征進行自動分類的方法。分析表明,詞匯搭配是最可靠的分類指標,隨后是韻律特征,而社會語言學特征的作用最小。同時,對各種話語標記進行程序化處理可以提高分類的準確性,不同類型的話語標記需要做個別化處理。

圖3 話語標記自動提取流程
4.4.1 性別差異與話語標記使用
Escalera(2009:2479-2495)認為,以往的研究將兒童語言性別的差異歸結于內在的因襲,男孩和女孩在互動語境中都要盡力去完成他們的社會和認知的目標,差異性來自對性別角色、地位的社會模式的習得。但這些研究忽視會話語境在分析性別模式差異時的作用,而恰恰正是語境在兒童如何學會會話及會話模式的時候產生巨大的影響。活動語境是引發(fā)兒童語言性別差異的主因。Escalera的實驗表明:兒童使用話語標記存在功能上的差異;話語活動存在性別差異,不同的話語活動使用的話語標記的功能不一樣;保持活動的持續(xù)性可以降低語言的性別差異。
4.4.2 年齡差異與話語標記使用
很長一段時間里,研究者們關注日常會話層面以及分析在這種語境下成人如何使用話語標記,而關于兒童是如何學會在對話中標記不同層次的話語及如何使用話語標記的研究卻并不多見。Furman和 Ozyurek(2007:1742-1757)發(fā)現(xiàn),話語標記的使用頻率和功能隨著年齡的變化而變化。兒童在話語標記的使用上表現(xiàn)出與成人不同的特點,最突出的特點是兒童在話語標記的功能使用上具有局限性,特別是對于那些多功能的話語標記,兒童尚無法破解多功能形式的特殊用法。即便是有些兒童已經掌握話語標記的某些復雜用法,但要像成人一樣地使用還需要時間。
年輕人群體總是和語言的變異創(chuàng)新聯(lián)系在一起。Tagliamonte(2005:1896-1915)發(fā)現(xiàn),對某些特定話語標記(如 like,just,so)的高頻使用是年輕人話語的顯著特色,其中15-16歲的年輕女性頻率最高。這與年輕人強烈的語言求異心理有密切聯(lián)系。在年輕人中,女性更容易尋求并推進語言的新變化。年輕人的話語標記使用特征并不是偶發(fā)的、隨機的或是任意的,而是受社會文化因素的深刻影響。
4.4.3 病患者話語標記使用
語言是人類行為的重要組成部分,語言運用過程中表現(xiàn)出來的障礙、缺陷或失調一般是某種疾病的癥狀。語言行為成為臨床診斷各類疾病的重要依據(衛(wèi)志強 1987:61)。Lai和 Lin(2012:1982-2003)研究兩組使用漢語的老年人(有阿爾茲海默癥和無阿爾茲海默癥)在話語標記使用上的區(qū)別。實驗發(fā)現(xiàn),阿爾茲海默癥患者與正常老年人相比,在話語標記的使用頻率和變化上更少。阿爾茲海默癥患者雖然像普通人一樣使用話語標記,但不能像正常人一樣完全掌控話語標記的功能。造成這種差異的原因包括:患病因素、話語標記類型因素和話語標記功能因素。而失語癥患者話語標記使用的情況就不太一樣。Neu?mann?Werth(2010:204-205)發(fā)現(xiàn),失語癥患者在進行語碼轉換和使用話語標記上比正常人更加頻繁。但是,失語癥患者的話語選擇僅僅出于結構上的需求,缺少深層的語用心理動機。
4.4.4 網絡數(shù)字論壇話語標記使用
隨著信息技術的發(fā)展,人們在網絡虛擬空間中的交流越來越頻繁。除使用即時通訊軟件(如MSN)外,很多人還選擇在網絡論壇中進行更廣泛的交流,網絡論壇中的交流與即時通訊交流存在很大差異。Landone(2012:1799-1820)發(fā)現(xiàn),口語對話中的互動性話語標記也同樣頻繁出現(xiàn)在網絡論壇的文字交流中,網絡論壇語境下互動性話語標記與單向獨白性話語標記的并存,可以實現(xiàn)對話者之間的高度互動與參與。在網絡論壇語境下,話語標記成為凸顯對話者態(tài)度的線索,他們被用于實現(xiàn)各種對話式功能(建構對話交換,表達道義情感,表達確定性等)。其中,技術性因素及論壇的參與框架創(chuàng)造話語標記的特定媒介模式,這種模式可以幫助參與者的言行達到期望值并合理地應對在線辯論。
機構話語(institutional discourse)指在特定機構語境中進行的話語活動,會話的一方具有相關職業(yè)背景,會話活動交際目的明確,機構語境對話語的理解具有限制作用。機構話語研究關注話語在機構中的呈現(xiàn)方式及話語與機構相互作用、相互影響的關系。機構話語中話語標記研究主要集中在公共演講、醫(yī)患語言、法庭語言和媒體語言等領域。
4.5.1 公共演講話語標記研究
在話語標記研究過程中,大部分學者長期以來主要關注毗鄰語對或較長對話中的話語標記,很少有人關注獨白語篇中的話語標記。話語標記一般被認為主要出現(xiàn)在即席話語中,可以看作即席話語的顯性化特征。作為非即席有準備的獨白性語篇,公共演講中其實也廣泛地使用話語標記。
在公共演講語境下,話語標記主要在理解話語及取得話語關聯(lián)上發(fā)揮作用,包括闡釋觀點、解釋原因、顯示兩段信息的不同、展示系列事件的順序、做出推論或做出總結,等等(Han 2011:2776),話語標記的這些功能基于公共演講的特殊語境形成。公共演講和日常話語具有很多共通性,它們的主要目的都是為了傳遞信息、說服或娛樂他人等。但與日常交談不一樣的是,在公共演講的過程中,語流的方向往往是單向的,即從演講者到聽眾,聽眾很少有機會與演講者進行言語交流。因此,公共演講需要具有更強的結構性,演講者必須要能預想到聽眾可能會產生的疑問,從而進行更仔細、更詳盡的計劃與準備。話語標記可以讓演講線索更加明確,指引話語的邏輯性,最大可能地避免演講過程中話語理解的問題。
4.5.2 醫(yī)患語言話語標記研究
在醫(yī)療語境下,醫(yī)生和患者之間存在兩種基本關系:角色關系和權勢關系。醫(yī)生具備專業(yè)的醫(yī)學知識和技能,患者求醫(yī)問診、缺乏相關知識,醫(yī)患之間處于不對等的角色關系。角色關系的不對等決定話語權勢的不對等。在問診過程中,醫(yī)生主導創(chuàng)設特定的話語語境,即他可以選擇專業(yè)的醫(yī)療語態(tài)(medical?empathetic voice),也可以選擇平等的教育語態(tài)(educational?empathetic voice)。教育語態(tài)具有勸說、指導、懇請的功能。在教育語態(tài)下,患者往往具有更多的話語權。在咨詢話語中患者頻繁而且重復地使用話語標記便是他們話語權提高的顯著標志(Cepeda 2006:357)。通過對話語標記的研究,我們可以觀察醫(yī)患雙方話語權勢是否均衡、醫(yī)生話語策略是否得當,對于研究、改善醫(yī)患話語關系具有重要參考價值。
4.5.3 法庭語言話語標記研究
法庭語境具有3個特征:審判活動的程序性,交際角色的對抗性及會話結構的不對稱性。以往話語標記研究的數(shù)據主要來自小范圍的社會訪談,一般屬于友好語境。語料數(shù)據極少涉及法庭這種既對抗又合作的話語語境。
法庭語境下話語標記使用具有獨特性。話語標記在法庭語境下主要發(fā)揮語境線索的作用,保持話語的連貫與前后邏輯的統(tǒng)一,同時揭示說話人的對事件的反應及看法態(tài)度。話語標記不僅僅是語篇關聯(lián)手段,更是一種社會性指數(shù)。Innes(2010:95-117)發(fā)現(xiàn),法庭語境下女性使用話語標記的頻率高于男性。同時,處于權力低位的證人和辯護律師使用話語標記的頻率最高。法庭語境下話語標記獨特性的根源就在于話語權力的差異及交際目的的差異。
4.5.4 媒體語言話語標記研究
從20世紀50年代開始,隨著現(xiàn)代媒體的發(fā)展,越來越多的學者開始深入研究電視訪談、電臺訪談等媒體交流類型。與日常口語及其它機構性話語相比,媒體訪談的顯著特征是話語的半機構性(Semi?institutional),即具有日常口語與機構語言的雙重話語特征(Ilie 2001:209)。媒體訪談半機構話語特性對話語標記使用有深刻的影響。首先是節(jié)目類型影響話語標記的功能分布及使用頻率,專訪節(jié)目話語標記的頻數(shù)往往高于談話節(jié)目。其次是同一節(jié)目內部,主持人、嘉賓及參與者之間的話語標記存在差異。主持人更多地使用話語標記實現(xiàn)對訪談進程的控制;而嘉賓則更多地使用話語標記來合理地組織語篇,實現(xiàn)回應問題、敘述事件或是評述話題、表明觀點等目的。第三,媒體訪談中話語標記實現(xiàn)的不只是語篇組織功能,還有人際功能、話語標記功能的豐富性也是日常口語的重要特征。對媒體語言話語標記的深入了解也將幫助我們構建對領域話語研究的整體認識。
縱觀近十五年國外話語標記研究的發(fā)展,除已經取得的理論研究成果,在研究方法、研究視角及語料選擇等方面的顯著特色也給國內相關研究帶來重要啟示。
5.1.1 共時研究與歷時研究結合
話語標記的形成過程往往具有某些共性,如:結構成分的一體化,詞匯意義的虛化、主觀化,句法位置的漂移,等等。如果要發(fā)掘某一具體的話語標記的形成過程,除共時平面的語料分析外,還需要從歷時的角度追溯其語用根源。共時研究與歷時研究結合的方法在國外研究中使用較為普遍,如 Lewis(2011:415-443),Naya(2006:141-169)等。國內學者大多采用相同的研究范式,從歷時平面考察話語標記的生成機制及演變過程一直是國內話語標記研究的熱點和重點。大多數(shù)研究者將話語標記的生成視為一種典型的語法化現(xiàn)象,話語標記來源于表達概念意義的詞匯成分或詞匯序列,經歷泛化、主觀化、去范疇化、重新分析、語音弱化等過程(吳福祥2005:25)。
5.1.2 雙語或多語對比研究
基于跨語言的話語標記的對比研究,往往能獲得某些對人類語言共性的認識,因而具有重要的語言類型學意義。Dafouz?Milne(2008:95-113)以兩份知名報紙(英國的《泰晤士報》和西班牙的《國家報》)為語料來源,比較分析英語和西班牙語話語標記在建構和生成勸說性話語中的作用。Vandenbergen和 W illems(2011:333-364)考察英語和法語的兩個同源表達的案例(actually,actuellement;in fact,en fait/de fait/au fait),通過考察它們的歷時演變,萃取兩組詞匯項目語法化過程的類型學意義。相比國外學者進行的雙語話語標記對比研究,國內的語言對比研究主要集中在句法和詞匯領域,基于話語標記的語用對比研究很少見。在今后的研究中,我們應該嘗試漢外話語標記對比研究,以及在此基礎上進行的漢語學習者話語標記的習得研究。
5.1.3 語料庫分析方法
任何可信結論的獲得,都建立在豐富真實的語料基礎上。國外話語標記豐碩的研究成果離不開強大語料庫數(shù)據的支持。Popescu?Belis(2011:499)在研究話語標記like,well的自動識別時,研究語料來源于ICSI?MR語料庫,該語料庫包含75場會議錄音,轉寫文本時長超過80個小時,數(shù)量達80 萬詞;Kawahara(2004:409)的研究語料來自日本的CSJ語料庫,該庫包含500小時、7百萬詞量的日語公開學術演講語料;Hellermann(2007:157)使用的學習者互動語料庫由3,000個學時錄音組成,其中有15,000分鐘的分組互動對話錄音被轉寫成文本。特別值得一提的是,Polat(2011:3745)建立一個發(fā)展型語料庫Belz and Vyatkina,用來考察一個成年語言學習者在一年中對話語標記的使用。Polat的研究證明成長型學習者語料庫對于研究語用習得具有十分重要的意義。國內學界對基于語料庫的分析也十分重視,但國內研究者的最大掣肘是缺少各類可利用的大型開放口語語料庫資源,大多數(shù)研究者使用自建的小型語料文本庫進行研究分析,如許家金(2009)、劉麗艷(2011)等。開放共享已有口語語料庫資源、合力創(chuàng)建多類型口語語料庫將會給國內話語研究帶來極大裨益。
話語標記研究是一項跨學科、多領域的研究,具有多維、開放、立體的特性。近十五年來,國外話語標記研究重心實現(xiàn)從理論研究向應用研究的轉變:越來越多的文獻開始關注醫(yī)患語言、法庭語言、媒體語言等機構語言的話語特征;計算機識別、提取話語標記,從語言信息處理的角度研究話語標記;關注性別、年齡、生理、特定社群(年輕人社群、網絡社群等)等因素對話語標記使用特點和傳播特點的影響,從社會語言學及應用的角度研究話語標記;關注雙語使用者話語標記使用特點(Torres 2008:263,Hlavac 2006:1870)等。這些都是對傳統(tǒng)研究領域的突破,進一步拓寬我們的研究思路。就國內而言,我們應改變研究力量過于集中、各研究領域發(fā)展不均衡的現(xiàn)狀,嘗試從更多的角度對話語標記進行探索。
國外話語標記研究具有開放性,其語料選擇也具有開放性,語料類型包括如下幾類:日常會話語篇 (Escalera 2009:2479,Tagliamonte 2005:1896)、獨白演講語篇(Han 2011:2776,Kawahara 2004:409)、非即時書面交流語篇(Landone 2012:1799)、課堂會話語篇(Hellermann 2007:157)、媒體訪談語篇(Maschler 2012:419)、書面語篇(Da?fouz?Milne 2008:95)等。國內話語標記研究的語料類型主要是日常會話語篇和書面語篇兩種。語料的選擇受限于研究對象和研究目的。只有拓寬研究視角,探索新的研究領域,我們才會對豐富的語篇類型有更多的關注。
本文基于知識圖譜理論,對2001至2016年國外話語標記研究進行量化統(tǒng)計分析。15年間國外話語標記研究熱點從理論建構向應用研究轉移。當前,國內話語標記研究在引進、吸收國外話語標記理論的同時,在話語標記的個案研究上做出較多有意義的嘗試。誠如前文所述,國內當前研究尚存在諸多空間,我們應努力嘗試從應用的角度尋找突破口。話語標記研究,尤其是漢語話語標記研究,依然是一片尚待深入探索而大有可為的領域。
注釋
①部分聚類因與中心聚類關聯(lián)較小,分布比較偏遠,因此不能在圖中顯示。