鄧海龍
摘 要: 美國有線電視新聞網(CNN)是美國的主流媒體之一,在較大程度上反映了美國政府的基本立場和態度。本文從CNN官方網站上采集歷時十五年的節目腳本材料,建成語料庫,使用語料庫檢索分析方法,考察了自2000年以來CNN涉華節目的基本演變過程及總體形態。數據顯示,隨著中國國力增長,CNN對中國的關注度持續上升;近十五年,我國受到的關注度明顯高于日本和印度,除少數波動外,總體上高于俄羅斯。
關鍵詞: 美國有線電視新聞網 涉華報道 語料庫
一、引言
憑借強大的政治、經濟和文化影響力,美國媒體在世界上扮演著重要角色。深入研究美國主流媒體中的涉華報道特點,有助于理解以美國為首的西方人是如何看待中國的。以他人為鏡,可以知己所短,有利于改進我國國家形象建構的具體策略和實現手段。另外,西方國家成熟的新聞報道模式有不少值得借鑒與參考之處,從而進一步提高和改進對外新聞報道水平。
美國有線電視新聞網(Cable News Network,以下簡稱CNN)是美國乃至全球具有重要影響力的媒體,其新聞報道及時、深度和全面,與此同時,由于它與美國政府之間關系緊密,在較大程度上反映了美國政府的意識形態和政治立場,其新聞報道常常被指責帶有一定的偏見(任亞娜, 2009)。本文選擇以CNN為研究對象,通過采集CNN的節目文本材料,建設大規模歷史文本語料庫,使用大數據分析手段,考察從2000年以來CNN涉華節目的基本演變過程及總體形態。
二、基于大規模文本語料的研究方法
近年來,國內針對西方發達國家主流媒體的涉華報道相關研究層出不窮(張天培, 2008;任亞娜, 2009;田維鋼, 2013 )。從掌握的文獻來看,當前的研究還以定性分析為主,偏重于宏觀考察和個案剖析;雖然有部分基于數據定量,但語料庫規模較小,時間跨度不長。隨著網絡傳播的日益普及和計算機技術在各個領域的廣泛滲透,基于大規模語料展開語言和傳播研究越來越為學界接受、認可乃至推崇(宋紅波 & 王雪利, 2013;喻國明, 2014)。基于語料展開研究具有一定的優勢,容易做到研究結果可驗證,研究過程可重復,達到一定程度上的客觀性。
目前,CNN網站提供了公開播映節目轉寫而成的文本材料(transcripts)供大家閱讀使用(詳見http://transcripts.cnn.com/TRANSCRIPTS/ ),使我們基于大規模文本語料開展CNN涉華報道研究成為可能。筆者通過編制程序批量下載收集該網站上的新聞腳本,經過加工建成語料庫,以供檢索和研究之用。根據需要和現實條件,本研究總共收集了從2000年1月到2014年12月間CNN節目的轉寫文本,歷時15年,包含19萬多期節目。每個月的語料集中儲存在一個文本文件中,累計有180個文本文件,全部占硬盤空間達4.28G。語料容量粗略估計超過6億詞次(token),在自建專門用途語料庫中已經達到較大規模語料層次。需要說明的是,據CNN網站聲明,該網站上的節目轉寫文本并非固定不變,還會時不時地更新,包括增加轉寫的節目數或者修改轉寫錯誤等。
三、語料檢索說明
為檢索方便,本研究對下載后的CNN節目轉寫文本進行了簡單清理和格式化儲存,采用XML標記將節目標題、轉寫文本、播出時間和下載鏈接等元信息進行標注管理和保存。由于個人電腦的負載能力或者軟件設計的應用目標等限制性因素,目前流行的免費語料檢索軟件AntConc在檢索超過一百兆的文本文件時,經常容易卡死。如果將180個文件分開檢索,然后逐個登記,則容易出錯。為此,本研究使用編程語言python中的正則表達式模塊進行批量檢索。經過抽檢少量文本進行對比,發現與AntConc的檢索結果一致,說明該檢索結果是準確的,可以采用。
作為研究前提,這里對涉華節目的界定及其檢索作簡要說明。從公開發表的期刊論文來看,很少有學者明確定義“涉華報道”這個概念,基本上把它作為一種默認常識。面對小規模語料的時候,這種依賴常識的辨識方法是可以適用的。一旦推廣到大規模語料,任何檢索對象就必須清晰地得到界定。因為不同概念定義,就會有千差萬別的檢索結果。有學者采用檢索英語新聞報道標題中是否含有 “China”一詞確定它是否為涉華報道(司國安 & 蘇金遠, 2007),這有它的合理性,因為標題一般反映了新聞報道的中心意思。本研究參考了這種做法,但采取了檢索正文內容是否包含“China”的做法。理由是,有些標題中沒有包含 “China”的節目,有可能也是涉及中國的。這樣雖然增加了誤判率,卻提高了命中數。考慮到語料規模比較大,本研究只是基本趨勢分析,這樣做是合理的。
為了簡化問題,本研究中只用“China”進行檢索,沒有考慮使用 “Chinese”,以及中國港澳臺地區中涉及的詞匯,如“Hong Kong”,“Macau”,“Taiwan”等。同理,對比檢索其他國家(日本、印度和俄羅斯)時,只使用了 “Japan”,“India”,和“Russia”等詞,沒有使用其他形式。另外,本文沒有檢索涉及歐洲等發達國家節目,主要原因是考慮到可比性,因為美歐有著許多共同背景,他們之間的相互關注度和認同度應該不是亞洲國家能夠與之相比的。個別國家,如英國,在實際搜索上也有具體困難,因為它的英語名稱較多,包括U.K.,United Kindom,Britain等,檢索比較復雜。
四、涉華節目的年度走勢
在CNN節目轉寫文本語料庫中檢索 “China”得到涉華節目數量,按年度匯總,除以年度總節目得到涉華節目比率,繪制成圖表如下。
從圖1可以看出,CNN的涉華節目從2000年至2014年,整體走勢是上升的,可以反映出CNN等美國媒體在最近十幾年以來,對中國的關注度不斷加強,意味著中國在國際上的地位是逐年攀升的。具體而言,大約分為三個階段。第一階段是低谷期。2000到2002年,涉華節目平均只占約6%,2002年略有下滑跡象。這個階段,中國的GDP總量還相對較低,沒有引起美國媒體足夠重視。第二階段是上升期。從2003年起,直到2008年,急劇上升,很快達到了近十五年來的關注度高點。從經濟發展來看,這個階段的中國GDP不斷趕超法國、英國、德國,直逼日本,引起國際社會的廣泛關注。第三階段,穩定期。從2009到2014年,其中2012年達到另一個頂峰。在這個階段,中國GDP超過日本,成為全球第二大經濟體,國際地位達到新的高度并得到鞏固。另外,這個階段正值我國政府換屆,引起西方媒體更多關注也是理所當然的。
檢索日本、印度和俄羅斯相關節目,并與涉華節目數量繪制成折線圖進行比較。如下圖2所示。
由圖2可以清晰地看出,中國在CNN中受到的關注度在總體上顯著超過了其他三個國家。從涉及各國節目數量來看,日本和印度兩國根本無法跟中國相提并論,近十五年一直在我國之下。只有俄羅斯在2002、2003、2013、2014這四個年度超過中國,而其中2013~2014兩年應該與俄羅斯在烏克蘭克里米亞問題引起國際社會關注有較大關聯。
五、涉華節目的月份熱點
將十五年的涉華節目百分比按月份進行匯總,繪制成圖3所示,可以分析CNN涉華節目在每個年度內的走勢傾向。
從圖3可以看出,每年的3、4、5、11月份是CNN涉華報道熱點,而這些時段恰好與我國上半年的“兩會”(全國人民代表大會和中國人民政治協商會議)和下半年的中共中央委員會全體會議相契合,這兩個時間段都事關中國重大政治生活,影響未來發展方向。由此可見,外媒對中國的關注還是著眼于我國重大政治事件,尤其高度關注每年上半年兩會期間。
六、結語
通過檢索和分析大規模CNN節目轉寫文本語料可以看出,中國在美國媒體中受到較高程度的關注,近十五年完全高于日本和印度,除了少數波動年份外,總體上高于俄羅斯。我國作為國際大國的地位在西方主流媒體上得到鮮明體現。因此,可以推斷中國對世界的影響越來越大,在國際舞臺上扮演著越來越重要的角色。另外,數據表明,CNN涉華節目報道與我國國內的政治生活緊密相關,反映出國內政治活動的活躍程度。
當然,本研究還存在一些不足之處。首先,檢索方式相對簡單。僅用國家名稱進行檢索,雖然有利于簡化問題,適應大規模數據批量檢索方式,但分析的深度卻略嫌不足,對現象描述還停留在宏觀層次。其次,分析的內容相對簡單。比如,由于數據量較大,本研究對涉華節目中表現出來的態度傾向等沒有進一步深入挖掘。在后續研究中可以進一步挖掘和揭示CNN節目轉寫文本語料中反映出來的傳播規律和語言特征,并設計和編制更完善的檢索工具,使語言分析更全面和深入。
參考文獻:
[1]任亞娜. 論cnn對華態度在變化中的守衡[J]. 青年記者, 2009(23):66-67.
[2]司國安, 蘇金遠. 2006中國國家形象——基于《紐約時報》涉華報道的文本分析[J]. 新聞知識, 2007(05):51-53.
[3]宋紅波, 王雪利. 近十年國內語料庫語言學研究綜述[J]. 山東外語教學, 2013(03):41-47.
[4]田維鋼, 楊蒙, 郎靖和. 五大西方主流媒體涉華報道的特點[J]. 現代傳播(中國傳媒大學學報), 2013(04).
[5]喻國明. 基于語料庫方法的輿論熱詞數據庫的構建——以2011—2013年全國兩會輿情中心詞和關聯詞的發現與分析為例[J].新聞與寫作, 2014(01):54-60.
[6]張天培. 從cnn事件看美國媒體對華負面報道的根源和形成原因[J]. 理論界, 2008(08):214-215.