范紅 何佳雨
【內容提要】 ChatGPT是新一代基于人工智能算法的聊天機器人,在2022年末火遍全球。它能夠完成大數據、多場景、多層次的數據分析。運用實驗法在ChatGPT Legacy中輸入與中國國家形象有關的5個具體問題來分析ChatGPT對中國國家形象圖景描繪以及生成該圖景背后的原因,通過對比和反復測試發現,ChatGPT在國家形象生成的非中立看法所產生的原因大致分為數據來源渠道、訓練糾錯方式和把關人價值導向三個方面。在數智時代針對此現狀,研發中國版ChatGPT非常必要和迫切。類ChatGPT對話訪談將成為研究和改進中國國家形象的一種新方法,可以為講好中國故事提供一定啟迪。
【關鍵詞】ChatGPT 國家形象 AIGC
一、引言
ChatGPT是美國OpenAI公司開發的聊天工具,上線三天用戶破百萬,兩個月內注冊用戶達上億人,是當下最熱門的互聯網應用。美國微軟、谷歌等科技巨頭紛紛注資OpenAI并且將其功能整合加入到搜索引擎中。微軟前總裁比爾·蓋茨在接受德國《商報》(Handelsblatt)采訪時表示,聊天機器人ChatGPT的重要性不亞于互聯網的發明。①中國阿里、百度、科大訊飛、美團、京東等國內互聯網巨頭也陸續要開發或已開發中文類ChatGPT軟件,中美互聯網公司圍繞著ChatGPT將展開新一輪的競爭。從媒介發展規律來看,ChatGPT目前可以解決AI文本的理解和生成問題,未來還會誕生圖片、視頻和其他交互式媒介的AI自動生成功能,對其進行關注和研究對于中國獲得國家形象傳播主導權具有戰略價值。
ChatGPT英文全稱為Chat Generative Pre-trained Transformer,即基于Transformer架構的預訓練聊天內容生成程序,可以根據給定的文本內容生成與其相關的文本。ChatGPT通過對大量語料的學習,可以生成各種語言表現形式,如對話、文章、詩歌等。其關鍵技術原理為關鍵詞填充、上下文理解和世界知識。當前熱門的版本ChatGPT3.5數據量達3000億個英文單詞(訓練語料的60%來自2016—2019年的C4、22% 來自 WebText2、16% 來自Books、3%來自Wikipedia),②其對問題的回答存在時效性、真實性和客觀性三個方面缺陷。

二、問題設置
本文為了探究ChatGPT中的國家形象圖景及其成因,分別設計了5個問題,并依次與ChatGPT進行對話,分別是:國家形象有哪些維度?中國國家形象整體如何?美國國家形象整體如何?美國、日本、韓國、新加坡政府、媒體和民眾對中國整體印象如何?中國國家形象如何提升?
通過研究得出以下三個結論:一是ChatGPT將國家形象分為經濟實力、文化多樣性、政治制度、環境問題和國際關系五個維度;二是在中國國家形象的五個維度中,政治制度、環境問題和國際關系相對主觀,并且對于中國國家形象圖景描述出現了不少事實性和政治傾向性錯誤,而對于美國國家形象的描述偏見較少且問題描述相對委婉;三是ChatGPT存在錯誤的原因主要在于數據源、糾錯方式和把關人,這是造成中國國家形象圖景與事實相悖的主要原因。
三、問題結論分析
1.ChatGPT視角下國家形象五維指標
經濟實力具體分為國內生產總值(GDP)、人均國內生產總值(GDP per capita)、外貿額、貿易順差等指標。
文化多樣性具體分為文化遺產數量和種類、文化創新能力、文化產品的全球影響力等指標。文化創新能力包括文化產業的規模和發展速度、文化創新項目的數量和門類以及文化創新人才的數量。文化產業全球影響力又包括文化產品的銷售額、國際展覽數量、國際認可度等指標。
政治制度則包括自由民主(公民參與政治決策、尊重公民權利和自由、保護公民隱私)、法治(建立健全的司法制度、保護公民和企業的合法權益、打擊犯罪)、公平正義(保障公平正義、反對歧視和偏見等方面,體現公正和平等的社會環境)和國際合作(加強國際合作、推動和平和穩定、參與國際組織和合作機制)等四個方面。
環境問題則包括空氣質量、水質量、垃圾處理能力、能源使用比例和生物多樣性等方面。
國際關系包括國際影響力(國際組織成員資格,國際政治、經濟和軍事合作關系)、國際聲譽(國際社會的聲譽和形象、國際媒體對國家的報道)、國際關系網絡(與其他國家的外交關系、貿易關系)和國際安全合作(與其他國家的軍事合作、安全合作)。
2.中國形象與美國形象對比
ChatGPT對美國國家形象的描述:美國是世界上最大的經濟體之一,以其高效的市場經濟和創新能力而受到贊譽;美國擁有豐富的文化遺產,如美國電影、音樂、文學等,對全球文化產生了重要影響;美國是一個自由民主國家,其憲政制度和人權保障受到全球廣泛贊譽。美國面臨著嚴峻的環境問題,如氣候變暖、生物多樣性減少等,這些問題對全球環境產生了重要影響;美國是一個全球性大國,在國際事務中發揮重要作用。

在經濟實力方面,ChatGPT對中國形象與美國形象的評價還算客觀,美國和中國作為世界第一、第二大經濟體,都具有強大的經濟實力;而在文化領域,ChatGPT并沒有考察文化軟實力或文化影響力,而是使用更加中性的“文化多樣性”來評估,描述中國為“擁有悠久的歷史和豐富的文化遺產”,擁有各種當代藝術文化類別。描述美國則強調其電影、音樂與文學對全球文化產生的重要影響。在環境方面,中美都被認為面臨嚴峻的環境問題,對中國直接描述為污染與溫室氣體排放問題,美國則使用“氣候變暖和生物多樣性減少”等更加委婉的表述??梢娂词故穷愅粋€問題,ChatGPT的表述也存在一定傾向和偏見。在國際關系方面,中美兩國都是全球性大國并且在國際事務中發揮重要作用,但描述中國多了一句“外交政策和國際地位一直備受關注和評價”,試圖暗示部分國家對于今天中國日益強大的國際地位和“強硬”的外交態度有些許不滿。
ChatGPT評價中國國家形象積極的部分主要是經濟發達和文化多樣,對于國際關系方面的描述相對中立,但試圖暗示近些年中國越來越“強硬”的外交態度。描述環境問題則相對負面。美國國家形象除環境問題以外皆為積極因素,尤其強調民主憲政和人權保證受到全球廣泛贊譽。分析這些看法背后的大數據來源可以看出,ChatGPT繼承了西方政府和主流媒體對于中國國家形象的整體印象:一方面承認中國經濟的巨大成就和近些年文化發展的進步,另一方面對于國力提升的同時,中國國際話語權和外交態度表示擔憂,對于中國政治制度的擔憂和人權的指責則是老生常談。測試過程中發現ChatGPT雖然標榜中立、客觀,不會摻雜主觀看法,但時常存在罔顧事實、刻意美化和無端打壓等不客觀、不理性的回答。同時,該語言模型存在敏感詞與違禁詞檢索,主要圍繞著種族、人權等西方社會關注的議題。
本次測試還具體詢問了5個發達國家(美國、日本、德國、韓國和新加坡)政府、媒體和民眾對中國國家形象的整體印象。綜合ChatGPT的回答內容,值得注意的是,美國政府、媒體和民眾對中國國家形象呈現不同程度的負面和悲觀態度。新加坡整體呈現積極和樂觀態度。日本和德國相對矛盾,政府層面對華相對友好,希望和中國保持良好的外交關系和經貿往來;媒體層面卻表現出一方面對中國崛起的贊嘆,另一方面對于中國的民主現狀和打破國際壁壘感到擔憂;民眾層面則更加復雜,需要具體基于種族、民族、宗教、政治傾向和國際事件進行具體問題具體分析。
3.ChatGPT關于中國國家形象改進策略的回答
ChatGPT認為“這是一項極其復雜和長遠的工作,需要提升經濟實力,加快經濟發展,提高國內生產總值;提高文化創新能力,支持文化創新,推動文化產品全球影響力;改善政治制度,保障人民的合法權益,保障社會公平和人權發展;解決環境問題,重視環境保護,加強環境監管,減少對環境的破壞;改善國家關系,加強國際合作,維護和平與穩定?!?/p>
四、ChatGPT對中國國家形象的看法成因分析
ChatGPT在回答中國國家形象和發展現狀問題上依舊延續了西方媒體對待中國問題的濾鏡,在回答他國眼中的中國形象時也反復強調所謂中國政治的獨特性、國際外交“強硬”態度與領土爭議問題等。綜合分析ChatGPT原理、訓練過程、數據來源、相關新聞以及本次測試研究結果,ChatGPT在國家形象圖景中產生非中立看法原因有以下三點:數據來源局限、訓練方法糾錯有限和把關人的價值導向。
1.數據來源局限
針對ChatGPT中的錯誤與偏袒,不妨從其生成和訓練的角度來考量,訓練的語料主要來自于英文國家報刊、書籍等,并且集中在2016—2019年。中國在應對新冠疫情中對全球的貢獻不在詞條的收錄范圍內,國家形象分析缺乏一定的時效性,可以說代表著前疫情時代西方國家對于中國的偏見,3%的維基百科來源也為錯誤埋下了隱患。但由于ChatGPT過億的注冊人數和巨大的影響力,較難糾正OpenAI公司選取訓練語料的范圍,也難以更改已存在的西方媒體所報道的不實中國國家形象。要扭轉中國國家形象在下一代互聯網中的負面形象,需要加緊研發中國自己的類ChatGPT平臺,謹慎選擇訓練語料,做好中國自己的人文素材庫并積極翻譯推介至英文世界。一方面只有掌握渠道的話語權才能從根本上扭轉當前西方通過技術和媒體營造的不實和負面的中國國家形象;另一方面也需要中國各行各業的專家行動起來,為中國人工智能研發更科學、更全面、更適合當下的應用,盡量減少ChatGPT在現階段經常報道不符合事實真相的新聞傳播錯誤。
2.訓練方法糾錯有限
ChatGPT的算法生成機制是通過檢索關鍵詞相關數據庫中的信息,再根據上下文理解來得出答案的,并且每個賬號、賬號內每個對話框都是相對獨立的,在不同對話框里詢問相同問題時往往會得到差異較大的答案。ChatGPT可以對于客觀問題的回答進行糾正,如詢問美國總統拜登和美國前總統奧馬巴哪一位年齡更大,如果ChatGPT某一次回答是錯誤的,用戶可以進行反問糾錯,或者提供答案。但糾錯的結果只會存在與該用戶的對話框內,重新再問還會發生周期性錯誤。這是因為“拜登和奧巴馬年齡相同”是基于數據庫的結論,當用戶要求比較兩者生日時ChatGPT才會發現錯誤。部分錯誤性結論用戶無法修改。如果受眾沒有相關的專業知識甚至常識很容易被誤導,專業技術人員暫時也無法通過訓練幫助修正ChatGPT的事實性錯誤。
3.把關人的價值導向
2023年1月18日,美國《時代周刊》(Time)官網在其商業版發布了一篇題為《OpenAI公司以不到每小時2美元雇傭肯尼亞工人為ChatGPT降低錯誤》(OpenAI Used Kenyan Workers on Less Than $2 Per Hour to Make ChatGPT Less Toxic)的文章,提到數據標注的工作流程包括數據標注、打標簽、分類、調整和處理等,“對于ChatGPT這樣的語言模型,如果沒有人工標注來篩除一些不恰當的內容,那么它不僅會給出一些錯誤的信息,更會對用戶造成心理不適”。③這些工作是由人工甚至數字勞工完成的,并且是由OpenAI設定后,由其外包公司Sama完成。這兩家都是美國公司,不但長期受到英美文化影響,官方語言也是英文。因此把關人的價值導向將對ChatGPT的價值觀產生極大影響,這也是中國國家形象圖景在ChatGPT中有失偏頗的主要原因。測試ChatGPT在中英兩種語言下的回答差異,除個別名詞翻譯理解和處理速度外,基本可以排除語言對于結論生成的直接影響。
五、訪談研究ChatGPT對中國國家形象提升的啟示
1.全新的研究方式和研究視角
在數智時代,通過ChatGPT來分析中國國家形象為學術研究提供了一種全新的視角和方式相比于以往搜索式的文獻整理,ChatGPT所代表的AIGC能夠綜合考量成千上萬的相關文獻,以總結而不是窮舉的方式提供最簡潔優化的解決方案。
2.將原創性和問題意識上升到新高度
ChatGPT從表面看節省了學術研究者收集和整理資料的時間,其實是將學術研究者的視野和文獻涉及維度提升了一個檔次。與此同時,極大增加了學術研究者保持其原創性和提煉關鍵問題的難度,也特別考驗使用者的科學文化知識和媒介使用素養。雖然美國學術界對于ChatGPT持有一定反對態度,認為其抹殺了學生的思維能力,但不可否認ChatGPT替代了古老而又重復的低維度思考與繁雜的工作,其上下文理解能力和增添用戶領域信息的工作方式為科學研究提供了專業輔助。
3.積極正面的國家形象需要中國參與語料提供
塑造真實的中國國家形象需要更多優秀、中立的專家集體為ChatGPT提供專業知識,而不是現階段ChatGPT使用的海量網絡數據。中國需要加大建設網絡媒體渠道,向世界各國傳播更多有關中國元素、中國價值的信息,以供ChatGPT和其他AIGC軟件使用和收錄。在高校以及研究國家形象的機構和單位層面,應學會使用ChatGPT或組織開發中國自己的ChatGPT,建立中國-國際輿情動態檢測機制,用大數據和語言學習的方式科學動態檢測中國國家形象在世界各國的變化,以社交網絡、新媒體平臺和文化出海作品為媒介,向海外受眾傳遞積極的中國聲音,塑造真實的國家形象。
六、結論:ChatGPT對中國國家形象研究具有研究方向和方法論的意義
ChatGPT在替代重復腦力勞動的同時,使原創性意識和批判性思維的重要性上升到新的高度??梢灶A見,人類社會正在逐步邁進與人工智能共存的時代。未來,ChatGPT能為中國形象建構和國際傳播提供全新的研究視角和實踐方式,其應用場景非常廣泛且潛力十足。目前的應用場景還只是AIGC生成文字的一部分,接下來還會誕生AIGC生成圖片、視頻和代碼的應用。為了塑造真實、客觀的國家形象,我國不僅需要在類ChatGPT上推出產品與美國競爭,還需要在接下來的圖片、視頻等應用產品上發力,以科技的制高點來提升文化的影響力,為講好中國故事提供更多渠道和話語權。
范紅系清華大學國家形象傳播研究中心主任、新聞與傳播學院教授;何佳雨系清華大學國家形象傳播中心博士后
「注釋」
①Sebastian Matthes“,Wir werden weniger arbeiten müssen als heute”, Handelsblatt,https://www.handelsblatt.com/politik/international/bill-gatesim-interview-wir-werden-weniger-arbeiten-muessen-als-heute/28973628. html,2023-2-10.
②Yao Fu, Hao Peng and Tushar Khot“,How does GPT Obtain its Ability? Tracing Emergent Abilities of Language Models to their Sources”,https://yaofu. notion.site/How-does-GPT-Obtain-its-Ability-Tracing-Emergent-Abilities-ofLanguage-Models-to-their-Sources-b9a57ac0fcf74f30a1ab9e3e36fa1dc1,2023-1-1.
③Billy Perrigo“,OpenAI Used Kenyan Workers on Less Than $2 Per Hour to Make ChatGPT Less Toxic”,Time,https://time.com/6247678/openai-chatgptkenya-workers/,2023-1-18.
責編:荊江