摘要:文本挖掘運用定量手段挖掘大量文本數據,并找到其中的規律和趨勢,為社會科學研究提供了一種新的研究方法。本論文基于葛巖等學者在2019年提出的基于認知圖式的形象理論模型,通過算法分類和計算挖掘美國三大商業廣播電視公司新聞網站文本,研究美國主流媒體中的相關報道的“孔子學院”媒體形象,并針對挖掘結果進行特征描述,分析其成因,并提出應對策略。
一、相關研究理論
孔子學院的迅猛發展,相關海外的媒體相關報道也不斷增多。在國際上處于話語主導地位的主流英語媒體,在塑造和傳播孔子學院媒體形象中扮演著重要角色,直接影響了國際社會對孔子學院文化形象乃至中國國家形象的認知。面對大時間跨度的海量媒體報道,如何從中提取和分析有關信息是媒體形象研究的重要問題。傳統研究方法因其具有主觀偏差,費時費力等局限性在當前海量文本內容分析中已不再適用。文本挖掘可以利用機器學習、自然語言處理等計算機技術從大量文本數據中發現模式、規律、趨勢等,其在社會科學領域研究中的應用得到了學者們越來越多的關注。葛巖等在2019年提出了基于認知圖式的形象理論模型(Schemata-based Image Theory或 SIT)來研究國家和地區的媒體形象[1]。人們對外部事物的知覺和判斷通過認知圖式完成,而圖式中穩定存儲的所涉事物的屬性和及其默認值會影響注意力、記憶和判斷,從而影響對外部事物的形象構建。結合文本挖掘技術挖掘媒體報道中穩定關注的事物及其評價,挖掘結果可視為媒體認知圖式中屬性及其默認值的映射,運用可視化技術能夠幫助刻畫、分析媒體報道中的國家、地區甚至機構形象。這一理論和研究方法對于孔子學院海外媒體形象的研究提供了新的視角。
以美國主流新聞媒體為代表的英文媒體具有國際性的特征。因此,本研究基于認知圖式的形象理論模型這一新的理論和分析方法,通過算法分類和計算挖掘美國主流網絡新聞文本,研究美國主流媒體中的相關報道的孔子學院媒體形象,并針對挖掘結果進行特征描述,原因分析并提出應對策略。
二、研究方法與研究流程
1.研究方法
本研究擬建立語料庫,運用文本挖掘技術提取高頻詞匯,計算其權重以及與非關鍵詞匯的出現頻率(即詞匯共現率cooccurrence)來反映孔子學院形象基本屬性的字匯表征模式,全面和客觀的總結孔子學院海外媒體形象的屬性和默認值。通過挖掘技術的使用,能夠對大量新聞報道的數據,乃至研究總體做出分析,最大限度地減少對孔子學院形象研究的主觀偏差,具備以往文本閱讀,內容分析和傳統量化分析方法無法相比的客觀性和全面性。
2.工作流程
(1)總體下載
以“Confucius institute”為關鍵詞,檢索和下載全美三大商業廣播電視公司(即美國廣播公司ABC,全國廣播公司NBC和美國哥倫比亞廣播公司CBS)新聞網站5年來的相關英語新聞報道。
(2)文本處理
網絡版新聞報道是一種文本文件格式,相對于數據庫中信息屬于非結構化信息,因此要進行文本的預處理,去除停用詞。
(3)算法計算
本研究采用詞頻-逆文本詞頻(term frequency-inverse document frequency,TF-IDF)計算方法進行新聞文本高頻詞的權重值計算,以及高頻關鍵詞和非關鍵詞同時出現的頻度,即詞匯的共現率。
(4)形象生成
將算法計算出的高頻詞權重和詞匯共現率通過數據可視化處理,生成新聞報道詞匯表征模式的直觀形象。

三、研究結果分析
葛巖等提出的SIT理論指出“認知圖式中穩定出現的屬性是形象的重要構成元素,最容易得到關注,對知覺與判斷最具影響力。”[1]本研究通過TF-IDF算法計算孔子學院相關報道中的高頻詞及其權重,通過可視化處理如圖所示,直觀反映出美國主流媒體對這一主題認知圖式最關注的屬性。圖中圓點的大小表示各個高頻詞權重值的差別,而連線表示關鍵詞匯共同出現的連帶關系。圖中按照權重大小列舉的高頻詞分別是:“language(語言)”,“security(安全)”,“concern(擔憂) ”,“education(教育)”,“political(政治的)”,“government(政府)”,“culture(文化)”,“ financial(經濟的)”,“propaganda(宣傳)”, “funding(資助)”,“threat(威脅)”,“transparency(透明度)”等。可以看出,媒體報道中的關鍵詞“焦慮”,“安全”的權重與“語言”,“文化”的權重是相當的。美國媒體一方面關注到了孔子學院推廣漢語語言,教育教學和傳播文化,而另一方面也體現了美國對于孔子學院的擔憂。中國國家綜合實力大大增強,成為美國在世界上的強有力競爭對手,甚至被其視為威脅。特朗普2017年執政后,貿易戰、科技競爭以及兩國人文教育領域的博弈使得中美人文交流日益趨緊。孔子學院作為中國在美國傳播中國文化的重要機構,自然也被美媒塑造成中國政府海外政治宣傳工具。
另外,以美國政府問責辦公室為首的部門對包括孔子學院在內的許多人文項目進行了嚴格的審查和監控,其主要關注點之一在于孔子學院在美國是如何建立、運營和接受資助(funding)的。美媒對于孔子學院相關的報道又是如何的呢?因此,本研究還選取圖1中TF-IDF值較高的關鍵詞匯“funding”,計算其與別的關鍵詞匯以,及與非關鍵字詞匯同時出現的頻度(co-concurrence)。結果顯示:“security”,“government”,“propaganda”,“political”等高頻關鍵詞匯和 “foreign(國外的)”,“underreported(低估的)”,“ adversarial(敵對的)” “interference(干擾)”等非高頻關鍵詞匯與“funding”共現頻率較高。連線線條的粗細體現出兩個詞匯共同出現的頻度關系,線條越粗,詞匯間聯系緊密度越高。另外,共現詞對關鍵詞的修飾作用決定了關鍵詞的情感評價響度,即其正面或負面評價。可以看出,關鍵詞“funding”所表達的屬性經過作為屬性默認值的共現詞修飾之后,呈現出的孔子學院形象是相對負面的。
孔子學院一直在西方國家的爭議中發展,西方媒體對其的質疑甚至批評從未中斷。中美文化的巨大差異是孔子學院在美國遭遇誤解和質疑的首要原因。其次,中美兩國之間一直處于博弈和競爭的狀態。近年來中國綜合國力全面提升,與美國差距逐漸減小,2017年以來的美國政府把中國視為威脅。作為海外傳播漢語和中國文化的重要窗口,孔子學院自然成為新聞媒體攻擊的 “靶子”。美國主流媒體以孔子學院由中國政府出資創辦為由,質疑其作為中國文化傳播機構的性質,甚至被一些媒體批評為“文化入侵”“滲透”[2],對其正當的辦學性質傳遞了消極和負面暗示,目的在于誘導美國等海外讀者對孔子學院的合法地位產生質疑甚至抵制。“虛化孔子學院的具體文化交流活動和運作模式,把中國孔子學院塑造成政府海外擴張行動的一部分,從而構建孔子學院為政治宣傳服務的刻板印象”[3]。
孔子學院要想在海外取得更進一步的發展,積極應對西方媒體中的相關負面輿情,首先需立足于改革自身發展模式。“2020年7月,教育部發文決定將孔子學院總部(國家漢辦)更名為教育部中外語言交流合作中心,孔子學院品牌由多家高校、企業和社會組織發起成立的中國國際中文教育基金會全面負責運行。”[4]孔子學院向市場化、民間化的轉制,符合國際慣例,有利于漢語教育在國際的長遠發展。其次加大孔子學院的輿論宣傳。雖然國際新聞媒體話語權主要被西方新聞媒體掌控,孔子學院仍然要積極尋求各種宣傳渠道,主動地推廣和介紹自己,發出自己的聲音。例如:加強與國內外宣媒體如China Daily,Global Times,Xinhua New,CGTN的合作,利用好YouTube,Instagram,Twitter等國際社交媒體,加大對海外年輕受眾的宣傳,并借助海外華文媒體講好中國故事,讓西方媒體和普通民眾有更多機會、更多途徑了解孔子學院的改革與發展,爭取國際新聞話語權,逐步突破西方媒體輿論困境。
四、結語
本研究結果表明,美國主流媒體對于孔子學院的報道存在負面因素,這對于孔子學院在海外尤其是西方的形象建構不利。 因此,我們應該關注負面輿情,掌握和分析孔子學院在西方新聞報道中的語言表達特征,有針對性地加大正面宣傳力度,不斷增強媒體話語權,只有這樣才能在輿論困境中有所突破,促進孔子學院在海外的長遠發展。 PR
本文系2020年度廣西高校中青年教師科研基礎能力提升項目:基于文本挖掘的孔子學院海外媒體形象研究(項目編號:2020KY04015)。
參考文獻:
[1]葛言,趙海,秦裕林等.國家地區媒體形象的數據挖掘—基于認知心理學與計算機自然語言處理技術的視角[J].學術月刊,2015(07):163-170.
[2]白紫薇.孔子學院轉型發展研究[J].中國人民大學教育學刊,2020(04):63-72.
[3]焦俊峰,劉美蘭.英美媒體對孔子學院文化形象構建研究[J].天津外國語大學學報,2019(04):13-23.
[4]語言交流合作中心中外語言交流合作中心設立公告[EB/OL]. http: / /www.hanban.org /article / 2020-07 /05 /content_810091. htm,2020-07-05.
(作者簡介:譚敏冬,碩士,講師,研究方向:修辭學,大學英語教學)
(責任編輯:李雪威)