唐佳梅,何子杰
(廣東外語外貿大學 新聞與傳播學院,廣東 廣州510006)
長期以來,語料庫方法作為語言學重要方法論之一,豐富了語言學的研究內容,為其提供了新的研究視角。世界上第一個機讀英語語料庫(布朗語料庫,Brown Corpus)誕生于20世紀60年代初期的美國布朗大學。隨后美國和英國學者分別在70年代建立了美國英語書面語語料庫BROWN(Brown University Standard Corpus of Present—Day American English)和英國英語書面語語料庫LOB(The Lancaster-Oslo/Bergen Corpus of British English)。BROWN 和LOB語料庫的建立有助于將美國英語和英國英語進行系統的比較研究[1]。但作為一種研究性工具,語料庫在新聞傳播研究領域出現的時間較晚。直到20世紀90年代,有學者在充分認識到互聯網時代下的新聞語言之后,依據語言學理論、統計學理論以及新聞學理論等對新聞類語言進行了廣泛研究,并建立新聞類語言語料庫[2]。由此,語料庫方法在新聞傳播研究領域的應用逐步開展起來。
在中國知網上搜索“語料庫”,有6 252篇文獻,其中大部分集中在外國語言文學、中國語言文學以及計算機軟件與計算機應用這三個學科方面。通過關鍵詞搜索“語料庫”并選擇“新聞與傳媒學科”,僅得文獻67篇,表明語料庫研究方法在本學科的研究基礎薄弱。
喻國明和李慧娟在《大數據時代傳播研究中語料庫分析方法的價值》中指出:大數據思維對當下新聞與傳播研究造成強烈的沖擊,傳統的文本分析手段拘泥于有限的文本數量和定性研究的窠臼,無法滿足大數據時代對內容深度和廣度的挖掘需求。在這種情況下,來源于應用語言學的語料庫研究方法對于文本數據庫的建立成為一種可能[3]。筆者在上述67篇文獻中,剔除4篇與語料庫研究相關度不高的文獻,將剩余的63篇文獻通過分析歸類,得出以下幾種類型:
第一,語料庫在應用傳播研究領域的運用。應用傳播包括國家形象或城市區域形象傳播、健康傳播以及公共傳播等。齊佩在研究美國媒體對中國經濟形象的構建時,通過選取2008年 9月 18日 至2010年12月 31日期間的美國三大報紙對中國經濟報道的文本,自建有關中國經濟形象的專用語料庫,從關鍵字索引、搭配和詞簇等方面入手,分析美國各大報的報道框架并進一步研究外媒報道框架對中國經濟形象的構建及其影響[4]。除了通過媒介報道來呈現國家或區域城市形象外,趙凌則通過語料庫工具,挖掘個體傳播和國家形象傳播的互動關系,另辟蹊徑研究國家形象傳播[5]。
健康傳播是近20-30年來在中國逐漸興起的一項有關健康的傳播學科,但運用語料庫作為健康傳播研究工具的文獻匱乏。中國知網論文數據庫僅有3篇健康傳播的文獻與語料庫有關聯性,且研究對象集中在太極拳以及中醫藥兩個方面。這三篇文獻通過運用語料庫相關功能來分析太極拳和中醫藥在國外的傳播現狀及特點,進而得出我國該如何運用民族文化精髓來提高對外傳播能力的結論。
公共傳播的研究主要涉及民生問題、公共基礎建設以及公益事業等。廖衛民在“浙江省民生新聞傳播與社會幸福感評估”這一課題研究中就引入語料庫研究方法,從新視角(即媒體對民生新聞的報道反映人民的幸福指數)切入分析[6]。該研究以《杭州日報》民生新聞報道作為語料庫來源,利用頻率詞分析媒介報道文本的呈現與人民幸福感的關系,指出民生新聞的不足與缺陷。谷羽在其博士論文《微博客平臺的企業公益傳播》中提到:運用語料庫分析軟件的統計功能對具體詞語的使用頻率,詞語搭配結構等語言學特征進行統計,以此為基礎運用詮釋型內容分析法,通過精讀、理解并解釋文本內容,從整體和更高層次上把握文本內容的復雜背景和思想結構[7]。由此可見,在新聞傳播學領域,語料庫作為一種具有定性研究方法特點的工具,其重要性越來越顯著。
第二,語料庫在新聞理論和實踐研究領域的應用。新聞理論與新聞實踐隨著社會發展而不斷發展,但研究方法卻沒有取得突破性的創新。同質化、低水平的研究泛濫,嚴重阻礙新聞與傳播學科的發展,而語料庫作為應用語言學的研究工具,與新聞學研究中的內容分析法有異曲同工之處。
值得一提的是,在基于語料庫對新聞理論和實踐研究的文獻中,多數研究者以外國語言學相關背景為主,運用語料庫方法對外媒報道中國的文本進行研究,進而得出相關結論。當然,也有少數新聞傳播領域里的學者在研究新聞實務的過程中引入語料庫研究方法,如喻國明運用語料庫主題詞檢索的分析方法,預測互聯網時代數字報紙的發展前景及人民對其發展的信心度[8]。體育新聞寫作研究中也逐漸呈現引入語料庫這一研究工具的趨勢。鄭麗杰在分析網絡體育新聞標題時指出:基于語料庫的體育新聞標題研究能夠運用計算機技術對大量文本進行定量統計和定性描述,讓語言分析朝著更加縱深的方向發展[1]。該研究通過統計標題中出現的主題詞頻率以及主題詞的搭配方式等,全面系統地剖析標題的感情色彩以及標題結構,為網絡標題寫作研究提供理論層面的支撐。
第三,基于語料庫的輿論輿情研究。互聯網的廣泛使用促使輿情的不斷變化,大數據時代對輿情的研究不斷增長,語料庫方法作為一種能夠大規模運作、分析以及統計文本詞條的研究方法,無疑與輿情研究有著天然的契合點。喻國明就語料庫對輿論研究的作用指出:通過語料庫研究方法可以檢測輿情的動態情況以及輿論熱詞的分析處理,通過建立相關的數據庫可以更好發現和建立輿論應對模型,以預防和應對輿論的發生。在一項對2011-2013年全國兩會輿情中心詞和關聯詞的分析中,他將語料庫和大數據選擇的研究方法相結合,將輿論熱詞切分成兩個維度進行探索,為輿情研究提供了一種新思路[3]。
20世紀90年代,國外學者開始運用語料庫對新聞實踐展開研究,其中路透社語料庫(Reuters Corpus)(第1版)在2000年已開發完成,收錄了路透社從1996年8月20日至1997年8月19日發布的新聞語篇樣本 806 791篇,詞匯量達2億次[2],為英國通訊社語言的研究提供了重要的參考作用。此外,國外對語料庫的使用不局限于根據不同研究目的建立不同語料庫,而且對語料庫的實踐運用,在方法論要求上具有不同特點。
第一,基于語料庫的研究對象廣泛。其一,在新聞報道文本的研究上,學者根據不同的研究目的而使用語料庫方法從不同方面對文本進行解構,最終發現某種共性,進而得出相應的結論。這類研究以英國曼徹斯特大學學者Kyung Hye Kim關于美國媒體對韓國的報道研究為代表,通過研究新聞文本的詞頻、詞語感情色彩以及報道框架來分析媒體報道的相關特點[9]。這類研究以應用型研究為主,通過探索研究對象在媒體上的呈現來評價其實際作用、傳播策略或傳播效果等。其二,對政府或企業的報告文本進行研究。社會的激烈競爭使得人們越來越重視發展戰略的研究,語料庫作為一種文本分析工具也被大量引入到相關公文和報告的研究中。加拿大學者Francis Cornut等人就政府公共部門在發展戰略上的相關公文進行了一系列研究,運用語料庫分析方法對相關文本的類型、戰略關鍵詞的頻率以及戰略目標的特點來進行分析并評估預期的效果[10]。也有學者運用語料庫研究方法通過企業發展報告來研究其商業傳播價值,如學者Brian A和Rutherford關于企業年度報告的體裁分析,等等。不管是政府或者是企業,對這些文本的研究目的大多數在于完善傳播戰略,更好地促進發展并進行前景預測。其三,運用語料庫方法分析特定語境下短信息以及書面話語的作用及特點。1999年至2017年的國外文獻中,關于語料庫在新聞傳播領域的研究對象呈現從文本—語段—詞條的趨勢,研究發展趨勢不局限于書面文本,維系人們日常生活的口語以及短信息逐漸進入學者的視野當中。學者Brian P.Jenssen等在網絡時代對青少年影響的一項研究中,采用SNS網頁留言板的記錄作為語料基礎。SNS網站是一個以青少年為目標受眾的網絡社區,青少年可在該社區上分享信息以及互動對話。研究者通過收集346名參與者瀏覽網站并互動所產生的147 432個單詞作為文本語料庫,以詞頻和關鍵詞關聯的方法來研究該網絡社區對青少年的影響[11]。
綜合國外對語料庫的使用情況來看,研究對象從以往的長篇文本逐漸發展到對某個核心詞的分析,研究不斷深入。在研究成果方面,國外的語料庫一般偏向應用研究,通過對某一對象存在的問題進行分析,發現問題的本質并提出建議或者預測發展前景。
第二,將語料庫方法和批評性話語分析理論相結合。批評性話語分析通過分析言語特征及其生成的文化背景來挖掘出隱含于語言中的意識形態,進而揭示語言、權力以及意識形態之間的復雜關系。換而言之,批評性話語的基礎是文本,對文本的篩選、統計、解析和驗證是批評性話語分析法的第一步。語料庫方法與批評性話語分析相結合的運用使研究得出的數據和結論更為客觀、權威更具有深度。除了與批評性話語分析理論相結合外,國外的研究也開始嘗試將語料庫研究方法與其他分析理論結合起來,如馬丁的“評價理論”等。
從語料庫方法在國內外新聞傳播領域內的應用來看,作為語言學的一種重要研究工具,語料庫已逐漸進入新聞傳播的研究視野,拓寬了該領域的研究范圍創新了研究方法,但在使用語料庫作為研究方法和研究工具上仍存在一些局限。
一是國內相關研究主要把語料庫作為大數據時代下一個大規模的文本分析工具,作為一個抓取關鍵詞以及頻率詞的統計工具,卻在詞匯詞性、短語結構、詞語背后的感情色彩、詞語的隱喻等方面涉及較少。國內新聞傳播學領域里仍有為使用語料庫研究而研究的現象,未能把語料庫研究方法與本學科的方法與理論相契合,因此,今后亟需深挖語料庫功能,對其應用方法方式進行突破創新。
二是有關新聞傳播領域大規模、權威型語料庫需要不斷構建。我國第一個大型的基于新聞的現代漢語標注語料庫是由北京大學計算語言學研究所和日本富士通公司合作完成的《人民日報》標注語料庫[2]。相比國外的語料庫建設,我國在新聞傳播學領域創建語料庫的時間較晚,選擇樣本的歷時較短。當前運用語料庫分析方法的前提是自行建立研究對象相關的語料庫,缺乏可以參照和對比的同類型權威語料庫,分析結果也局限于研究者自身抽樣的范圍,缺乏一個更系統規范的檢驗標準。此外,在相關抽樣過程中的主觀性也是影響最終分析結果的一個重要因素,如何為自建語料庫抽樣提供更加客觀完善的標準?值得我們繼續思考。
三是在新聞傳播學領域內,語料庫的語料基礎比語言學領域更薄弱。對新聞傳播研究自建相關的語料庫,一般是選取一家或者幾家報紙的報道文本來作為樣本容量,雖然符合語料庫研究樣本數量的規定,但是由于新聞報道的偏向性。因此,報紙的立場或研究者自身的經驗等因素也會影響文本詞匯的使用,而且抽取的樣本歷時性局限也難以系統而全面地分析文本,得出的結果只能是某個階段的發現,難以形成一個完整的研究體系。
本文對語料庫方法在國內外新聞傳播研究領域中的應用進行了初步探索。通過對國內和國外的相關應用情況進行分析和歸納總結,發現語料庫作為研究工具在國內國外新聞傳播領域的應用中存在差異。大數據時代下,傳統定性定量研究方法已難以滿足新聞傳播學發展的需求,語料庫方法的應用為該領域提供了一種全新的跨學科研究方法及路徑。國內外的相關研究顯示語料庫方法在新聞傳播領域里未能充分發揮其應有的作用,研究程度還不夠深入。進一步探索語料庫的相關功能,構建更多的新聞傳播類語料庫,拓寬其在新聞傳播研究領域內的應用范圍,結合語言學的視野進行跨學科的研究,將是今后研究中亟待解決的問題。
[1]鄭麗杰.基于語料庫的網絡體育新聞標題研究[D].北京:北京體育大學,2009.
[2]黃艷軍.基于語料庫的國內外主要新聞語料庫綜述[J].讀與寫,2011(5):89-90.
[3]喻國明,李慧娟.大數據時代傳播研究中語料庫分析方法的價值[J].傳媒,2014(2):64-65.
[4]齊佩.從關系過程看美國大報中的中國經濟形象[D].石家莊:河北師范大學,2011.
[5]趙凌.個體傳播與國家形象傳播互動路徑探究——以姚明個體傳播為個案[J].當代傳播.2012(6):49-52.
[6]廖衛民.民生新聞傳播與社會幸福感評估——基于浙江省媒體語料庫的實證分析[J].當代傳播,2012(3):21-25.
[7]谷羽.微博客平臺的企業公益傳播[D].武漢:華中科技大學,2013.
[8]喻國明,李慧娟.從“付費門”到“付費墻 2.0”:數字報紙盈利模式的景氣度研究[J].當代傳播,2014(4):21-22.
[9]Kyung H K.Examining US news media discourses about North Korea:A corpus-based critical discourse analysis [J].Discourse&Society,2014(2):221-223.
[10]Francis C,Hélène G,Ann L.The strategic plan as a genre[J].Discourse&Communication,2012(1):21-24.
[11]Yoshiko O.A case study of US deaf teens’ text messaging:Their innovations and adoption of textisms[J].New Media&Society,2013(8):1224-1240.