999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

大數據與雙邊關系的量化研究:以GDELT與中美關系為例

2019-09-10 10:08:27池志培侯娜
國際政治科學 2019年2期
關鍵詞:大數據

池志培 侯娜

【內容提要】 大數據事件庫的出現給量化國家間關系提供了一種新的可能路徑。本文利用目前全球最大的事件數據庫GDELT來測量1993—2016年的中美關系,并探討五種不同的計算方法及其問題。本文討論了如何判斷測量的準確性問題,并將結果與清華大學的“中國與大國關系數據庫”中同時段的中美關系測量值進行比較,證明基于大數據的測量具有一定的價值。本文同時分析了大數據測量方法存在的問題,并探討了其解決方法。

【關鍵詞】 GDELT 大數據 事件 雙邊關系測量 中美關系

【作者簡介】 池志培,中央財經大學國防經濟與管理研究院助理研究員,中央財經大學全球經濟與可持續發展研究中心兼職研究員。

國際關系的研究對象是國與國之間的關系,但由于國與國之間的關系往往是多維和復雜的,因而對關系的判斷通常只能依賴于研究者的經驗、直覺和理論偏好,這也就意味著不同的研究者對于國與國之間關系的判斷差異很大。要解決這個問題,一個方法是對于國家間的關系進行量化研究。量化是當代社會科學研究的趨勢,通過準確的數據,我們才能進行跨時段、跨國的比較,從而發現趨勢與規律,甚至提供某種預測。但是要將國家間關系轉化成單一維度的數字來測量還面臨著方法論和實際操作中的巨大困難。

目前衡量國家間關系的主要方法是分析事件數據。從理論上來說,如果能對國家之間發生的所有事件進行統一的分析,那么應該就能很好地把握它們之間的關系,因為關系必然要通過事件來體現。如果所有的事件都能通過一個統一的測量標準進行衡量,再將這些測量的結果進行匯總,那么就能對關系進行量化。由于雙邊關系是所有關系的基礎,多邊關系可以還原成多組雙邊關系,所以本文的研究將聚焦于雙邊關系的測量。

近年來,隨著計算機技術和智能硬件技術的飛速發展和普及以及網絡社會的形成和算法的進步,人類得以累積了海量數據,即所謂的大數據。雖然不同的學者或者機構對于大數據的定義有所區別,但是對于大數據的一些共性特征,各方還是有一些共識——大數據包含了3個V關于大數據的不同定義,可以參見:Jonathan Stuart Ward and Adam Barker, “Undefined By Data:A Survey of Big Data Definitions,” arxiv.org/abs/1309.5821.關于大數據的簡要歷史,可參見:Gil Press,”A Very Short History Of Big Data,” Forbes, May 9, 2013, https://www.forbes.com/sites/gilpress/2013/05/09/a-very-short-history-of-big-data/#5db944eb65a1.此外,亦有觀點認為大數據還需要第四個V,即veracity,指數據的真實性。:量(volume),數據量非常巨大;種類(variety),即數據類型多樣,從文本到圖像、視頻,等等;速度(velocity),即數據產生和處理的速度非常快。本文討論所涉及的目前全球最大的社會科學數據庫GDELT(Global Database of Events, Language, and Tone)就是其中一個,它從全世界超過100種語言的媒體中收集信息,并通過特定的編碼體系由計算機自動將其編碼成一個個事件,時間跨度從1979年到今天,并持續每天更新。目前已經收集了超過2.5億個事件的信息,包括事件的發起者、對象、地理位置、事件類型、信息來源等32個變量。就傳統國際關系關注的國家之間的關系而言,這個數據庫幾乎涵蓋了所有已經公開的事件。正如維克多·麥爾-荀伯格(Viktor Mayer-Schnberger)所提及的,抽樣數據會變得過時,因為我們可以獲得全部的數據Kenneth Cukier and Viktor Mayer-Schoenberger, “The Rise Of Big Data:How It's Changing the Way We Think about The World,” Foreign Affairs, Vol.92, No.3, 2013, pp.28-40.。如果能充分利用這些巨量的事件大數據,那么就應該可以相當準確地對雙邊關系的現狀和趨勢作出判斷。那么,使用這些海量數據能否得到可靠的結論,與現有的方法相比如何呢?同時,使用這些大數據可能遇到的問題和可能的解決方式又有什么呢?本文將以中美關系為例,通過對GDELT事件數據的使用來探討這些問題。

一、 事件數據與雙邊關系:歷史與文獻回顧

雖然大數據事件庫是近些年才出現的,但是人類通過記錄事件數據來發現和研究社會已經有很長的歷史了,一個例子就是對犯罪事件的記錄。當代學術意義上的通過事件數據來考察兩國之間的關系開始于1960年代,隨著社會科學中的行為主義革命而產生。行為主義革命者希望采用能觀察到的變量和計量方法來研究社會現象。對于國際關系、外交政策的分析而言,這個能被測量的對象就是事件(event)。關于事件數據庫的起源與行為主義革命的關系以及早期發展,可以參見:Stephen J.Andriole and Gerald W.Hopple, “The Rise and Fall of Event Data:From Basic Research to Applied Use in the US Department of Defense,” International Interactions, Vol.10, No.3-4, 1984, pp.293-309; John Lewis Gaddis, “Expanding the Data Base:Historians, Political Scientists, and the Enrichment of Security Studies,” International Security, Vol.12, No.1, 1987, pp.5-7; Philip A.Schrodt, “The Statistical Characteristics of Event Data,” International Interactions, Vol.20, No.1-2, 1994:35-53.關于政治學中的行為主義革命的特征及其簡要歷史,可以參見:Robert Dahl, ?“The Behavioral Approach in Political Science:Epitaph for a Monument to A Successful Protest,” American Political Science Review, Vol.55, No.4, 1961, pp.763-772; David Easton, “Introduction:The Current Meaning of ‘Behavioralism’ in Political Science,”in J.S.Charlesworth, ed., The Limits of Behavioralism in Political Science (Philadelphia:American Academy of Political and Social Science,1962), pp.1-25; David Easton, “Political Science in the United States:Past and Present,” International Political Science Review, Vol.6, No.1, 1985, pp.133-152.查爾斯·麥克萊蘭(Charles McClelland)最早從他對外交史的研究開始了這種嘗試。最初的事件數據的生成采用的是人工手動編碼的方式。由于人工編碼需要大量的人力,研究者不得不在分析的廣度和成本之間作取舍Richard L.Merritt, “Measuring Events for International Political Analysis,” International Interactions, Vol.20, No.1-2, 1994, p.6.。覆蓋的來源越多、廣度越大,就意味著研究成本的急劇上升,因此研究者不得不選擇很有限的幾個事件的數據來源。同時,人工編碼也容易受個人身體狀態(比如疲勞等)和主觀判斷的影響在關于事件數據庫的研究開始以后,研究者對于人工編碼存在的各種可能的問題也進行了研究,包括利用同一數據來源來比較不同編碼者之間的差異,不同的編碼者和數據庫的表現差異很大,有從40%到90%不等的可靠性。參見:Philip A.Schrodt and Christopher Donald, “Machine Coding of Events Data,” paper presented at the International Studies Association meetings, Washington DC, April 1990, p.6.,因此,事件分析方法的局限比較明顯。早年的代表性數據庫有魯道夫·魯美爾(Rudolph J.Rummel)的“國家的維度”(Dimensionality of Nations,DON; Rummel, 1972),查爾斯·赫爾曼(Charles Hermann)等的“國家事件比較研究”(Comparative Research on the Events of Nations,CREON; Hermann et al., 1977),愛德華·阿薩爾(Edward Azar)的 “沖突與和平數據集”(Conflict and Peace Data Bank,COPDAB; Azar, 1980, 1982; Azar and Sloan, 1975),查爾斯·麥克萊蘭(Charles McClelland)的“世界事件互動測量” (World Event/Interaction Survey,WEIS; Charles McClelland,1976)等。這些數據庫被廣泛應用于國際關系研究,尤其是關于沖突、動亂和戰爭的研究。Philip A.Schrodt, “The Statistical Characteristics of Event Data,” International Interactions, Vol.20, No.1-2, 1994, pp.35-6.其中COPDAB和WEIS的數據在經濟相互依賴與沖突的研究中時常被使用。Solomon W.Polachek, “Conflict and Trade,” Journal of Conflict Resolution, Vol.24, No.1, 1980, pp.55-78; Mark Gasiorowski and Solomon W.Polachek, “Conflict and Interdependence:East-West Trade and Linkages in the Era of Détente,” Journal of Conflict Resolution, Vol.26, No.4, 1982, pp.709-729; Jon C.Pevehouse, “Interdependence Theory and the Measurement of International Conflict,” The Journal of Politics, Vol.66, No.1, 2004, pp.247-266.在1970年代末和1980年代初,美國的政府機構如國務院和國防部也組織了類似的項目,主要用于沖突預警。

在計算機廣泛應用于社會科學研究之后,有學者將計算機程序自動編碼引入事件分析之中,以解決廣度和成本的矛盾。從1980年代末和1990年代初開始,美國國家科學基金會(National Science Foundation, NSF)支持了“國際關系中的數據發展”項目(Data Development in International Relations, DDIR),利用計算機來自動編碼新聞事件。在這項資金的支持下,堪薩斯大學的美國政治學家德波拉·耶納(Deborah J.Gerner)和菲利普·斯洛德特(Philip Shrodt)等人利用WEIS的事件編碼系統,實現了自動事件編碼處理,形成堪薩斯事件數據系統(Kansas Event Data System,KEDS),成為當時最大的事件數據庫。耶納和斯洛德特等后來開發了新的編碼系統——沖突和調停事件觀察(Conflict and Mediation Event Observations, CAMEO),并為后來的大型事件數據庫所廣泛使用。另一個不太常用的自動編碼系統是the Integrated Data for Event Analysis (IDEA),為另一個自動事件數據項目the Protocol for the Assessment of Nonviolent Direct Action (PANDA)所使用。斯洛德特還開發了使用這個編碼系統的程序——以強化替換說明進行的文本分析(Textual Analysis by Augmented Replacement Instructions, TABARI)。

2008年,美國國防部下的國防高級研究計劃局(Defense Advanced Research Projects Agency,DARPA)資助了一個事件數據庫項目“綜合沖突早期預警系統”(the Integrated Conflict Early Warning System,ICEWS),通過收集事件數據來進行風險預警,主要是針對亞太地區。該項目資助開發了新的自動編碼程序BBN ACCENT,達到了相當高的準確率,與人工編碼比照,大概在80%左右。Elizabeth Boschee, et al., “ICEWS Coded Event Data,” Harvard Dataverse, V22, 2015, https://doi.org/10.7910/DVN/28075; BBN ACCENT Event Coding Evaluation.updated v01.pdf這個數據庫在3年的試驗期后轉交給了美國海軍。其數據涵蓋了1995年到當下,并且大量數據已經放置于哈佛的開源數據庫(Harvard Dataverse)中,不過開源部分的數據只能到當前年份的前一年。美國國家科學基金會在2013年也再次資助了事件庫的開發和研究,目前有一個歷史數據庫(Cline Center Historical Phoenix Event Data)和一個實時數據庫(Phoenix Near-Real-Time Data),可以回溯到1945年,但是新聞來源相對有限。

the New York Times (1945—2005), the BBC Monitoring's Summary of World Broadcasts (1979—2015) and the CIA's Foreign Broadcast Information Service (1995—2004).目前最新的仍在進行的工作是重新開發新的編碼系統——可驗證事件數據的政治語言本體(Political Language Ontology for Verifiable Event Records, PLOVER)和編碼軟件——文本解析與相關編碼體系的派森引擎(Python Engine for Text Resolution and Related Coding Hierarchy,PETRARCH-2),而這將是事件數據庫發展的一個新階段,將取代目前主要數據庫所采用的CAMEO編碼系統。同時這些最新的開發工作都是開源的,源代碼都放在了開源社區Github中。

與前面述及的這些數據庫相比,GDELT要更為龐大。它是由卡勒夫·李塔魯(Kalev Hannes Leetaru)和斯洛德特在2012年啟動的一個項目。它也是使用計算機自動編碼的方式,從全球超過100種語言的媒體中自動挖掘信息,將新聞信息編碼成一個個事件的輸入。其中,最重要的3個信息來源是法新社、美聯社和新華社。時間范圍是從1979年到現在,并將擴展到1800年。同時,計算機每天都會從世界各地的媒體中持續收集信息,日增約10萬個事件。編碼體系采用的是CAMEO系統。在CAMEO系統中總共有20個大類超過300種不同的事件類型。而GDELT又將300多類的事件最終分成4個大類,即言語合作(verbal cooperation)、現實合作(material cooperation)、言語對抗(verbal conflict)和現實對抗(material conflict)。GDELT項目的每一個輸入包含了許多不同的信息項目,從1979年到2013年3月31日止的輸入包含57個信息,而2013年4月1日開始則增加到58個信息,增加了信息的來源以便核對。這些信息包括每個事件的時間,行為主體和行為對象的國家、名字、組織、類別,事件本身的性質、影響程度、在所有來源中被提及的次數,描述的語氣,事件的地理信息(包括經緯度等)以及錄入日期、信息來源,等等。目前的數據已達數以億計,并可以免費獲得。

數據規模的龐大以及容易獲得使得GDELT一經推出就引起了廣泛關注和討論,雖然事件數據庫主要用于沖突研究,但也已經有一些研究嘗試利用GDELT來測量雙邊關系。如帕斯卡·阿卜(Pascal Abb)和蓋爾·斯特伍(Georg Strüver)的文章利用GDELT來衡量中國與東盟各國的關系,即利用GDELT事件數據中每個事件的Goldstein分值來衡量雙邊關系。Goldstein分值衡量了沖突或者合作事件的強度。他們將中國與東盟各個國家每年所有相關事件的Goldstein分值的平均值作為測量方式。Pascal Abb and Georg Strüver, “Regional Linkages and Global Policy Alignment:The Case of China-Southeast Asia Relations”, SSRN, March 15, 2015, https://ssrn.com/abstract=2600419 or http://sci-hub.tw/10.2139/ssrn.2600419.

國內利用事件數據庫來測量雙邊關系開始得相對較晚。最早的研究來自李少軍,他2002年的一篇文章從《人民日報》中選取了克林頓政府期間中美關系的642個事件,并通過給每個事件賦值然后再求和計算的方式來判斷中美關系的沖突與合作水平。李少軍:《“沖突—合作模型”與中美關系的量化分析》,《世界經濟與政治》2002年第4期,第43—49頁。而最有影響力的研究是來自清華大學閻學通團隊的系統工作。他們建立了一套自己的編碼體系,然后采用了人工編碼的方式見“事件分值基準表”,閻學通、周方銀:《 國家雙邊關系的定量衡量》,《中國社會科學》2004年第6期,第101—103頁。,主要基于《人民日報》和外交部的數據,系統地梳理了從1953年開始的最為重要的中國雙邊關系的月度變化數據,包括中國與美、日、俄、英、法、澳、越、印尼、巴基斯坦的關系。通過對每個月發生的雙邊關系事件的賦值打分和加總計算,展示了中國這些重要雙邊關系的演變,為實證研究雙邊關系的變化及其影響提供了非常重要的數據支持,產生了一系列重要的學術成果。但是,由于基于人工編碼的方式,所涉及的工作量極大,也因而難以擴展到更多的信息來源,而這也是許多評論者認為還需要改進的方面。陳定定:《定量衡量的得與失——簡評〈中外關系鑒覽1950—2005:中國與大國關系定量衡量〉》,《國際政治研究》2010年第4期,第163頁;董青嶺:《從事件賦值走向關系賦值:雙邊關系的定量衡量——評〈中外關系鑒覽1950— 2005:中國與大國關系定量衡量〉》,《外交評論》2011年第2期,第155頁。

事件大數據的出現提供了一個新的機會來重新思考雙邊關系的度量,在這種全覆蓋的方式下我們是否可以獲得更為準確的數值呢?接下來本文將以中美關系的測量為例,探討如何利用事件大數據來度量雙邊關系,并討論其準確性以及潛在的問題和應對。

二、 GDELT與中美關系(1993—2016)的測量

(一) 計算方法

雖然GDELT包含了海量數據可供進一步分析,但是我們仍需要將這些事件通過一定的算法進行處理來變成一個關系的量值。基于GDELT中能夠獲取的信息,有五種方式可以構建出關系量值。

第一,由于GDELT中每一個事件最終都可以歸結成沖突事件或合作事件,所以計算每年合作數量與沖突數量的比值就可以衡量出雙邊關系的好壞。如果合作事件與沖突事件的比值很高,那么說明合作事件的數量要遠多于沖突事件,那么就可以認為雙邊關系處于較為良好的狀態。通過觀察年度數據的變化,自然也就可以衡量出雙邊關系的變化。這種方式的問題在于沒有將事件的強度考慮進去,有些事件可能比另外一些事件對雙邊關系的影響更大。

第二,也可以將合作事件數量減去沖突事件數量的差值作為雙邊關系的一個衡量。但是這個方法在當下使用會遇到嚴重的問題,即事件數量的逐年增加。由于過去幾十年中技術的飛速進步、網絡對社會生活滲透程度的巨大變化以及跨國交往的急劇增加,數據庫收錄的事件數量越往后越多,直接的差值也會隨著年份往后而急劇變大,因而很難用來測量雙邊關系的變化。當然,如果將來技術和社會變革到了平臺期,這種方式可能也可以較好地反映雙邊關系的變化。此外,這種方法也沒有考慮到事件之間強度的差異。

第三種方法略有不同。由于GDELT也給出了每個事件的Goldstein分值,這個值衡量了事件的強度,因此也可以用這個值來構建雙邊關系的值。可以將所有事件的Goldstein分值相加,最后的結果即雙邊關系的賦值。這種測量方式的問題是事件的影響并不能相互抵消,即即便一個合作事件與一個沖突事件的影響的Goldstein值相同,在計算中會相互抵消,但是現實中對關系的影響也可能依然存在,尤其是在雙邊的復雜關系中。同時,一個Goldstein值為-10的事件對關系的影響也很難同10個Goldstein值為-1的事件的影響等同。此外,這種計算方式也無法反映出事件數量。而在雙邊關系的大部分事件為低烈度事件的時候,事件數量可能比強度能更好地把握雙邊關系。同時,這個方法也會受到事件數據的自然膨脹的影響,遇到與第二種方法類似的問題,所以如果要使用大數據事件庫來測量計算的話,這個方法會有內在缺陷,導致它也不是很適合使用。李少軍利用事件數據來衡量中美關系的論文實際上就是采用了這個計算方法,當然,他的數據來源是單一的,不存在逐年自然擴張的問題,因此準確度要更高一些。

第四種方法基于Goldstein分值的計算,是在將所有事件的Goldstein分值加總以后,再除以事件數,得出所有事件的平均Goldstein值作為雙邊關系的一個度量。阿卜和斯特伍的文章對于中國與東南亞國家關系的度量即采用了這種方法。這種方法解決了事件數量隨年份增加的問題,但是也沒有解決事件之間相互抵消的問題。當然,這也是所有通過事件來衡量關系的方法都會遇到的問題,即一個正值事件與一個負值事件或者一個高值事件與多個低值事件之間的權衡問題。

第五種方法也是基于Goldstein分值,即分別計算沖突事件和合作事件的Goldstein分值的平均值,然后以兩者比值的絕對值作為雙邊關系的衡量。由于沖突數據的Goldstein分值為負數,所以最后比值也為負數,故取絕對值。取平均值是為了避免事件數量在不同年份的巨大差異。這種方式測量的雙邊關系值是合作事件和沖突事件的平均強度的比值。這里也會遇到與第三種方法相同的問題,即無法反映出事件的數量。同時也會遇到事件之間的折算問題,比如,一個Goldstein值為5的事件是否對雙邊關系的影響等于5個Goldstein值為1的事件。同時,在對計算值的解釋上也會有一定的困難。雙邊關系中合作事件和沖突事件的平均強度的比值作為雙邊關系的衡量不夠直觀,在具體進行研究的時候會遇到對結果的闡釋問題。

除計算方法外,這里還會涉及時間段的選擇問題。用事件數據庫的方法來進行測量,我們必須選擇特定的時間段即一個時期內發生的事件,這個時期可以是一周、一個月、一年或者任意長度的時間段。閻學通和周方銀對李少軍以及一般的用事件數據來衡量關系的一個批評,是事件分析法沒有將歷史考慮進去,基于事件的分析總是從零開始計算關系。某個月沒有發生沖突或者合作的事件,雙邊關系也并不會是零。如果某個月都是負值事件,也不表示兩國關系就是以沖突為主。閻學通、周方銀:《 國家雙邊關系的定量衡量》,《中國社會科學》2004年第6期,第92頁。這一批評有一定的合理性,但是并不完全準確。這個問題的實質是時間段選擇的問題。一個月內發生的事件可能具有一定的偶然性,一個月內可能確實不會發生大的事情或者都是同一方向的,但是如果選取的時間段足夠長,那么對該時間段內所有雙邊事件的考察應該足以反映出雙邊關系。在較長的一個時間段內,兩國關系的種種不同方面應該都會通過事件反映出來,畢竟歷史本身也就只是一個時間段。筆者認為,在用事件衡量雙邊關系時,一年是一個比較合適的時間區間。一年內發生的事件應該足以體現雙邊關系的歷史性基礎,因為人類社會的計劃周期也一般以一年為基礎,比如年齡計算、預算周期、工作報告,等等。而在政治世界中,年度周期也是比較明顯的,比如年度峰會、年度會晤、年度報告,等等。考慮到當今世界雙邊關系的互動程度,在一年之內沒有發生合作或者沖突事件或者只發生一種類型事件的可能性是可以忽略的。還有一個考量是基于與現實的其他數據庫的匹配,政治類的數據庫多以年度更新為主,故以年度事件數據為依據計算也便于結合其他的數據進行分析。因此,在以事件數據來計算雙邊關系時,采用年度變化值是比較合適的,基本能夠避免測量非歷史性的批評。

(二)測量的準確性

討論完測量方法之后的另一個問題,就是如何知道我們的測量是否可靠地、比較真實地反映了雙邊關系的事實,而這也是測量最為重要的一個方面。

最為直接和常見的方法當然是與我們的常識相比較,如果度量的結果過于反常識,可能就意味著測量或者計算的方法有一定的問題。比如,如果兩國之間發生戰爭,雙邊關系的值反而顯示出雙邊關系更為友好,那么對雙邊關系的測量顯然是有嚴重的偏誤。比常識更為嚴格的檢驗是專業人士的共識,畢竟專家們能夠掌握更多更全面的信息,對雙邊關系這種復雜事實的把握要比常識更為可靠,所以我們的測量值也可以同專家們比較一致的意見相比較來考察其準確度。但是這兩種方法都是定性的考察,而我們的測量則是定量的。要想較為準確地比較定性和定量的分析存在方法論上的困難,畢竟定性語言的含混性與定量語言的準確性之間有難以彌合的鴻溝。定性語言的區分度要更低一些,從數值3到3.5或者4的變化在定性研究者看來也許都屬于友好關系,難以再進行進一步的區分。

如果我們使用定量的方法來檢驗,那么我們可以使用的方法包括與現成的數據庫相比較,又或者通過替換數據源的方式。具體到用GDELT的數據來衡量中美關系,我們可以與清華大學中國與大國關系數據庫中的中美關系值相比較。由于后者已經給出了中美關系的月度變化值,所以將計算結果與之比較就能考察利用事件大數據進行雙邊關系測量的準確性,并且由于清華大學的數據來自于人工篩選和計算,這種比較就顯得更有價值。需要說明的是,由于基本方法論和計算方式上的差別,直接的數值比較并沒有意義,能夠進行比較的應該是對趨勢的把握,即雙邊關系的變化趨勢在兩種測量方式下的比較。

當然,定性和定量的方法在思考測量的準確性時可以同時使用,并非相互排斥。

(三) 中美關系(1993—2016)

基于前面的論述,這一部分將具體討論用GDELT來測量雙邊關系。由于中美關系的重要性,現有的通過事件數據來測量雙邊關系的研究都特別關注中美關系,也選取中美關系進行測量,而這也有利于將本文的研究置于對中美關系的普遍關注和討論中。另一方面,GDELT中,時間越往后,數據的數量越多,所以本文選擇的時間范圍是冷戰結束以后,即克林頓執政(1993年)以后。由于用于比較的數據可獲得性的原因,本文數據截止于2016年底。因此,本文研究的時間范圍是1993年至2016年。在這段時期內,中美關系整體上處于一個較為穩定的狀態。

筆者首先從GDELT提供的數據中選取了從1993年到2016年中美政府間的事件,將其按照4個大類計算;同時由于區分了施動者,所以又可以分為中國對美國的事件和美國對中國的事件,簡單的總和計數如表1所示。可以發現,合作事件要遠遠多于沖突事件,而言語合作事件又要多于言語沖突事件。并且中美各自發起的沖突和合作的事件數量也大體相同,體現了兩個大國之間較為對等的關系。合作事件要遠遠多于沖突事件,這應該也是符合常識和多數專家意見的,即中美兩國雖然時有沖突,但是還是合作更多。

清華大學的中國與大國關系數據庫顯示,中美關系在這個區間內也是正值要遠多于負值(按該數據庫的定義說明,關系在普通區間以上,即合作多于沖突)。學術界的普遍看法是,冷戰后從克林頓政府開始,美國對華采取了接觸政策(engagement)為主的戰略,強調以合作塑造中國的行為,對這一政策的反思近年來在美國學界和政界頗多,可參見:Kurt Campbell and Ely Ratner, “The China Reckoning:How Beijing Defied American Expectations,” Foreign Affairs, Vol.97, March/April Issue, 2018, pp.60-70.這篇Foreign Affairs上的文章引發了一些最為知名的中美關系學者對美國對華政策以及中美關系的討論,參見:Wang Jisi et al., “Did America Get China Wrong?:The Engagement Debate,” Foreign Affairs, July/August Issue 2018, https://www.foreignaffairs.com/articles/china/2018-06-14/did-america-get-china-wrong.對美國政府對華政策的內部考量,還可參見:Michael Green, By More Than Providence:Grand Strategy and American Power in the Asia Pacific since 1783 (New York:Columbia University Press, 2017).另一方面,雖然承認中美之間在利益上有差異和沖突,但國內學者也認為合作是冷戰后的中美關系的基本基調,參見:王緝思:《淺論中美關系的大環境和發展趨勢》,《美國研究》2006年第1期,第89—96頁;金燦榮、段皓文:《當前中美關系的問題與出路》,《國際觀察》2014年第1期,第71—83頁。 當然,主流的說法是“中美關系好不到哪里去,也壞不到哪里去”,強調對分歧的管控。

前文已經討論了5種將事件轉化為關系的算法,在現有的GDELT中,不同年度收錄的事件數據有著比較大的差異,并且越往后的年度數據越多,因此基于差值計算的方法將會面臨年度數據越往后越大的問題,很難反映出是關系的變化還是數據收集技術的變化帶來的差別。本文采用合作與沖突事件次數的比值和年度平均Goldstein分值的方法進行計算。

首先是用合作和沖突事件次數比值的方法。這種計算方法暗含的假定是所有事件的權重相同。閻學通和周方銀的文章已經證明,即便只計算事件的個數(假定權重賦值都相同),得出的結果依然是相當準確的。閻學通、周方銀:《 國家雙邊關系的定量衡量》,《中國社會科學》2004年第6期,第96頁。筆者隨后計算了中美從1993年到2016年每年的合作和沖突事件的比值(圖1)。可以看到,合作事件遠多于沖突事件,兩者的比值較大。但是隨著時間的推移,雖然具體年份值的高低并不是一個線性的變化過程,但是這個值有減少的趨勢,也就是說沖突事件的比例在上升,這意味著雙邊關系有逐漸緊張的趨勢。需要說明的是,雖然有這種趨勢變化,但中美之間仍是合作遠多于沖突。這符合我們一般的對中美關系的認知,即中美關系總體是和平合作的,而隨著中國國力的逐漸增強,中美之間競爭的一面會越來越強。閻學通將中美關系總結為“假朋友關系”,兩者之間關系不穩定,時有沖突,長期來看對抗的趨勢不可避免。另外一個有意思的現象是,在GDELT測量值中,一般在總統選舉年中美關系的值都處于低值(除了1996年),這大概與選舉年美國的政客需要表現強硬有關系,雙方的言語沖突會更多一些。

如前所說,GDELT的所有事件都區分了施動者和受動者,所以我們也可以將中美對對方的政策給出類似的測量,用來衡量政策的合作和沖突的程度(圖2)。與雙邊關系的總體情況類似,兩國的政策也是合作為主,但是競爭的一面隨著時間的推移在緩慢地增加。并且相對而言,中國的政策穩定性可能要更強一些(趨勢線的斜率要略小于美國),但是近年來兩國的政策越來越趨近。但是這個結果受到1998年的異常值影響較大。如果在數據中刪除1998年的值,則中美兩國的趨勢線則幾乎是平行的。這種測量是相對于清華大學中國與大國關系數據庫的一個優勢,在清華數據庫中并不能區分出行為方向,而是從一個第三者的角度去觀察。在某些研究中,這種對雙方政策的描述會有重要的用途,比如考察中美兩國對對方的政策如何影響其他國家的相關政策。

從常識和專家意見來看,通過GDELT大數據的直接測量可以抓住雙邊關系的一些基本事實。為了進一步考察其準確性,筆者將其與清華大學中國與大國關系數據庫中的中美關系值作了比較。由于計算方法不同,所以兩者的分值不能直接比較,這里比較的是趨勢變化。由于GDELT中計算出來的值較大,為了便于觀察,從GDELT中計算的值都除以10。同時,對清華大學的月度數據分別采用取年平均值和年末月度值的方式來轉化成年度值。由于年末的數據反映了當年前11個月的雙邊關系運行的結果,所以第12個月也可以作為當年的關系值。圖3和圖4即結果。

簡單來看,兩種方式計算的值的變化比較相似,比如,不管哪種測量,都認為冷戰后中美關系的峰值在1998年,但是谷值卻有所不同。其中的差異在于,如果某年發生了極為負面的事件,在清華大學的數據里面影響要更大一些,而由于只是事件計數,如果當年也發生了很多合作性的事件,那么從GDELT中計算出來的數值就不會是極低值。比如在1996年,雖然臺海危機導致兩國關系非常緊張,但是在當年3月危機之后,兩國關系即過了最低點,緊接著1997年和1998年雙方元首互訪,并將關系定位于“戰略伙伴關系”,因此1996年在GDELT的測量值中不會出現極低值。類似的是2001年,雖然發生了南海撞機事件,但是“9·11”事件之后兩國關系的迅速改善也使得當年的值不會是極低值。這種差別也貫穿在其他年份中,比如1997年和2004年。也需要看到,清華大學數據本身的年平均值與年末值也有差異。GDELT計算的數據與清華大學的數據在2005年之后的變化曲線要更為相似一些,這可能與GDELT的數據來源有關,事件越早,GDELT中的數據越少,所以偏誤的可能性也更大,這在后文討論大數據的缺陷和問題時再進一步討論。

當然,最根本的區別在于趨勢線,不管是用年平均值還是用年末值來計算,清華大學中國與大國關系數據庫的年度數據都有上升的趨勢,即雙邊關系有逐步改善的傾向,只是在2016年奧巴馬執政的最后一年有一個急劇的下滑。具體來看,清華大學數據顯示,奧巴馬時期的中美關系總體要好于小布什時期,除了最后兩年的急劇下滑。但是GDELT數據顯示,奧巴馬時期總體不如小布什時期,最后兩年的下滑也沒有那么戲劇化。這種差別很可能源于GDELT對于南海中美沖突事件的抓取要多于清華大學,畢竟清華大學的主要源數據來自于外交部和《人民日報》,相關內容的報道比GDELT數據源要少。總體來看,通過計算GDELT中合作和沖突事件的比值來度量中美雙邊關系具有一定的學術價值,值得進一步考察。

另一種測量方法是計算Goldstein年平均值(圖5、圖6)。這個值波動幅度很小,在整個時間段內都在2~3之間浮動,整體趨勢略微向下。如果我們關注其折線變化的話,可以發現其波動變化趨勢與合作沖突比計算結果的變化幾乎是一致的,只是幅度要小得多,而與清華數據也有一定程度的相似性。最為明顯的差別是在2015年、2016年,Goldstein分值的平均值計算顯示雙邊關系有好轉,與其他測量都是相反的結果。此外,與其他測量值相比,Goldstein平均值這種計算方法似乎沒有很好地反映出雙邊關系的波動性,其年度之間的變化強度比其他度量要更小。可能的原因是在當前中美關系的情勢下,事件數量比權重的考慮更為重要。在低烈度競爭狀態下,將所有事件的權重近似為相同得出的結果可能更能把握雙邊關系的實質,與前文所引的閻學通和周方銀的結論類似。而這可能也是用GDELT事件數量比值的測量更能把握雙邊關系趨勢的一個原因。

三、 大數據測量雙邊關系的問題與解決方法

雖然基于如GDELT這種大數據事件庫的測量為雙邊關系度量帶來一種新的覆蓋面更廣也更為簡便的實現方法,但是它也存在著很多問題需要解決。需要說明的是,這些問題很多也存在于人工編碼的事件數據庫中,并且人工編碼還涉及不同的編碼者之間不一致的問題,所以并非人工編碼就一定優于機器編碼。接下來這一部分將側重探討機器編碼事件大數據庫可能遇到的問題及其可能的解決途徑。

(一) 數據來源的質量問題

對于所有的大數據研究來說,數據來源的可靠性問題都是最為重要的。如果數據的源頭被污染,那么所有結論都會被質疑。具體對于如GDELT這種事件數據庫而言,其數據質量問題也一直是有爭議的,很多學者也主張數據在使用之前需要進行“數據清洗”董青嶺:《反思國際關系研究中的大數據應用》,《探索與爭鳴》2016年第7期,第91—94頁。。數據質量問題的原因有很多種,比較嚴重的包括報道視角、重復和新聞質量。

在所有的新聞報道中,報道者都有其視角,因此必然會包含其對問題有意識或者無意識的特定看法,這無疑會導致由此生成的事件數據也帶有同樣的偏見,進而難以用來客觀地測量雙邊關系。當然,這不僅僅限于大數據事件庫,在人工數據庫中,由于涉及大量的勞動力和高強度的重復工作,往往只能有選擇性地偏重于特定數據來源。比明顯的偏見更為嚴重的問題則涉及更為根本的哲學爭論,即對事件的報道并不是一個完全客觀的問題,報道者及闡釋者都參與建構了事實。事件數據庫往往只選擇了特定解釋、“唯一的”解釋、假想的“上帝視角”客觀無偏差地看待一件事的發生。Gavan Duffy, “Events and Versions:Reconstructing Event Data Analysis,” International Interactions, Vol.20, No.1-2, 1994, pp.147-167.現實情況是同一個事件存在著多個不同版本的敘事,而對于計算機編碼而言,被編碼成不同事件的可能性很大。這就涉及收錄新聞事件重復的問題。如果是對同一事實不同角度的表述,那么是否屬于重復就需要進一步探討。

除了新聞事件中的多重視角和建構問題,重復錯誤也是大數據事件庫中普遍存在的一個問題。在今天媒體活躍的時代,同一個事件在一定時間內會被反復地、類似地描述和報道,并被大量的媒體轉載報道。在這種情況下,計算機可能會自動抓取這些重復數據,使得數據庫中收錄的事件數據要(大大)多于實際所發生的數據。沃德(Ward)等人則將GDELT與另一個機器自動編碼的事件數據庫ICEWS相比較,他們發現GDELT編碼的事件與ICEWS編碼有相當的出入,前者要比后者數量龐大得多。他們認為GEDLT編碼的事件比實際要多Michael D.Ward et al., “Comparing GDELT and ICEWS Event Data,” Analysis, ?Vol.21, No.1, 2013, pp.267-297.,而ICEWS則比實際少。在某些受事件數量影響的特定算法下,這可能會嚴重干擾雙邊關系測量的準確性。

事件數據庫還存在著源新聞質量的問題,即新聞錯誤甚至是假新聞,尤其是在媒體和自媒體更為發達的今天,在這個極為強調媒體時效性的時代,新聞出現錯誤甚至是故意制造假新聞的情況都不罕見。2016年的美國總統大選就飽受假新聞困擾,假新聞甚至被認為對最后結果產生了巨大影響。如果沒有甄別出來這種新聞錯誤或者假新聞,事件數據庫的客觀性必然會受到影響,進而影響到對雙邊關系的客觀測量。

針對這些問題,也有特定的途徑來解決或者減少它們對于最終數據和結果的影響。首先,擴大數據源和增加更多數據。更多數據和更廣覆蓋范圍可以使得偏見問題得到部分解決,如果我們認為人的偏見是內在的、難以避免的,那么包含了所有偏見的數據比只包含特定偏見的數據就要更為準確和客觀。同時,如果我們能夠增加更多可靠的數據源,那么假新聞和新聞錯誤的影響也會被相應地縮小。當數據量極大的時候,即便存在一部分錯誤和重復,其對最終結果也不會有影響。其次,利用人工智能識別假新聞和新聞錯誤。深度學習很適合用于發現數據中的特定模式,因此,通過訓練能讓機器自動過濾很多假新聞和新聞錯誤。目前,很多大科技公司已經在利用類似的算法來識別和過濾假新聞Josh Constine, “Facebook Chose To Fight Fake News With AI, Not Just User Reports,”Tech Crunch, Nov 15, 2016, ?https://techcrunch.com/2016/11/14/facebook-fake-news/.。最后,適時的人工干預。對最終數據進行人工篩查依然是最為可靠的解決方式之一。當然,這種方法隨著數據量的增加會越來越不現實和低效,但是這種工作可以依靠計算機輔助,有選擇性地對特定數據進行篩查以提高效率。

(二) 編碼系統與編碼程序

事件數據庫面臨的第二個挑戰來自自動編碼系統和編碼程序。目前自動編碼系統生成的事件數據庫使用的基本都是CAMEO,而編碼程序則有斯洛德特的TABARI和ICEWS自己開發的BBK-ACCENT。根據與人工編碼的數據比較,目前BBK-ACCENT編碼程序的準確率可以達到80%左右,但這也意味著仍然有數量相當巨大的錯誤編碼事件存在。錯誤編碼事件自然會影響事件數據庫的準確性以及最終測量的雙邊關系的準確性。目前的編碼程序采用的是基于字典的稀疏句法分析(dictionary driven sparse parsing) Philip Schrodt and Jay Yonamine, ?“A Guide To Event Data:Past, Present, And Future,” All Azimuth:A Journal of Foreign Policy and Peace, Vol.2, No.2, ?2013, ?pp.12-13.,即基于新聞中的有效信息與字典的匹配進行事件分類。這種方法導致計算機對于復雜語言的分析能力并不強,分析語境或者分析使用修辭語的復雜語言的能力很有限。比如,很可能分不清一場拳擊賽與一場沖突之間的區別,又或者大量使用比喻等。當然,在主要的媒體新聞尤其是國際新聞中,句法一般不會太復雜。

但進一步而言,這個問題還需要區分隨機錯誤與系統錯誤。隨機錯誤即錯誤的出現是無規律的。就GDELT中的測量而言,錯誤出現在合作和沖突事件庫中的可能性是一樣的,這種情況對于最終結果的影響相對要小,尤其是當數據量極大的時候,這種影響甚至可以忽略。而如果是系統性的錯誤,那么對結果的影響就將是顯著的。比如,如果編碼程序的錯誤導致其偏好合作事件,那么最后測量的關系值必然也會偏向合作。系統性的錯誤無法通過增加數據量來解決。

對于編碼程序的質量和錯誤問題,一方面是要增加數據量,解決大數據問題的一個重要方法永遠是更多更大的數據,以此來使得其中的錯誤微不足道,不會影響到對關系的測量。另一個途徑則是增加方法和數據的透明度,以便學界能夠清楚地知道數據的產生過程,并能共同改進。在2013年4月1日以后的事件中,GDELT都提供了信息來源,以方便研究者進行進一步的數據篩查,而這將有助于事件數據準確性的提高。最后一個也是最基本的方法,是改進編碼系統和編碼程序的分析能力。目前學界已經在積極地改進編碼系統和編碼程序,新一代系統(Patriarch 2)正在開發之中。這一發展將進一步使得利用大數據進行雙邊關系研究更具有可信度。目前,飛速發展的人工智能深度算法分析語言和句法的能力大大增強,在智能手機上廣泛使用的語音識別工具(如蘋果的SIRI),其所表現出的語言識別能力已經非常驚人,將它與事件分析相結合,將能很大程度解決目前編碼程序遇到的問題。John Beieler, “Generating Politically-relevant Event Data,” arXiv, 2016, preprint arXiv:1609.06239.

(三) ?事件的性質與數量的關系

關于雙邊關系的量化度量,一致存在的爭論是關于事件性質與數量的取舍。對于雙邊關系來說,對單個事件賦值與只考慮事件的數量,哪個能更加有效地測量雙邊關系值呢?前文對這些問題已經有所討論,很大程度上,對事件權重與數量的取舍取決于研究問題和對于雙邊關系的一般判斷。一般而言,當事件數量很少時,就不得不考慮事件的權重;而當事件數量非常巨大時,單個事件的權重就不那么重要了。

另一個問題是,言語和行為需要區別對待嗎?在政府與政府的交往中,言語行為與實際行為往往一樣重要,它們都對雙邊關系有著巨大影響。比如,雙方領導人關于雙邊關系定位的言論對雙邊關系起指導作用。因此,言語本身是測量雙邊關系的一個重要指標,不需要將它與實際行為分離考慮。

當然,在實際進行測量的時候,依然需要針對具體研究問題來設計,設計取決于我們更關注重大事件還是整體圖景對雙邊關系的影響。在設計時,要根據研究問題來選擇變量的測量。

(四) ?數據來源的轉換翻譯問題

目前的事件數據庫都基于英語,而自動編碼程序使用的字典也是英文的,所以其他語言的新聞是通過谷歌翻譯然后再用程序進行抓取。這會直接導致一個問題,即翻譯過程中的意義損失。沒有任何翻譯是完美的,尤其是機器翻譯。雖然隨著人工智能的發展,機器翻譯的質量有了飛速提高,但是由于語言對于社會背景與傳統的依賴,不同語言之間的翻譯依然意味著很多意義可能流失,進而影響對事件的理解。

這個問題的解決方法是給不同語言的新聞編輯以同種語言的字典。關于中文句法分析,在Stanford Universal Dependencies項目下已經有了中文字典,但是事件數據自動處理中的中文字典還沒有。如果將來中國要建立類似GDELT的事件數據庫,那么編撰自動編碼系統的中文字典是首先需要完成的工作之一。

四、 結 論

大數據事件庫的出現為國際關系研究提供了新的數據來源,也為量化研究和實證檢驗國際關系理論提供了計算基礎。通過對從GDELT中數據生成的中美關系值與清華大學中國與大國關系數據庫中的中美關系值以及相關的定性研究對比,本文證明利用大數據度量雙邊關系具有一定的學術價值與進一步發展的潛力。而雙邊關系作為更為復雜的多邊關系的基礎,應用在雙邊關系上的方法也可以很容易地擴展到多邊關系的研究上。因此,大數據對整個國際關系的量化具有潛在的重大貢獻。本文是這種努力的一個初步嘗試。

當然,沒有數據和方法是完美的,大數據的事件依然存在種種問題,但是這些問題大都能在某種程度上得到緩解。隨著新一代自動編碼系統、編碼程序以及人工智能的發展,事件數據庫的質量也將進一步提升,而利用事件數據庫的大數據來進行國際關系研究的前景將更為廣闊。研究者在利用這些新工具時,也需要時刻意識到它可能存在的缺陷并通過研究設計來盡量避免這些不足。在大數據時代,最終決定研究質量的仍將是研究者的研究設計和分析方法。Gary King:《大數據與數據無關》,鐘楊主編:《實證社會科學》(第三卷),上海交通大學出版社,2017年,第10—16頁。

猜你喜歡
大數據
基于在線教育的大數據研究
中國市場(2016年36期)2016-10-19 04:41:16
“互聯網+”農產品物流業的大數據策略研究
中國市場(2016年36期)2016-10-19 03:31:48
基于大數據的小微電商授信評估研究
中國市場(2016年35期)2016-10-19 01:30:59
大數據時代新聞的新變化探究
商(2016年27期)2016-10-17 06:26:00
淺談大數據在出版業的應用
今傳媒(2016年9期)2016-10-15 23:35:12
“互聯網+”對傳統圖書出版的影響和推動作用
今傳媒(2016年9期)2016-10-15 22:09:11
大數據環境下基于移動客戶端的傳統媒體轉型思路
新聞世界(2016年10期)2016-10-11 20:13:53
基于大數據背景下的智慧城市建設研究
科技視界(2016年20期)2016-09-29 10:53:22
數據+輿情:南方報業創新轉型提高服務能力的探索
中國記者(2016年6期)2016-08-26 12:36:20
主站蜘蛛池模板: 久久久久夜色精品波多野结衣| 99ri精品视频在线观看播放| 无码久看视频| 国产婬乱a一级毛片多女| 激情综合网址| 一本综合久久| 日韩成人在线网站| 国产欧美精品一区二区| 一区二区午夜| 色视频久久| 69综合网| 久久精品国产国语对白| 九九久久精品免费观看| 午夜精品区| 日本人真淫视频一区二区三区| 99色亚洲国产精品11p| 综合社区亚洲熟妇p| 国产va在线观看| 久久亚洲国产视频| 亚洲三级视频在线观看| 亚洲天堂网在线播放| 成人福利在线视频| 亚洲欧美一区二区三区蜜芽| 人与鲁专区| 国产青青操| 国产在线小视频| 国产91蝌蚪窝| 国产欧美精品专区一区二区| 欧美精品高清| 国产精品免费电影| 欧美日韩第二页| 国产婬乱a一级毛片多女| 亚洲第一色网站| 亚洲天堂在线视频| 久久国产精品夜色| 午夜综合网| 亚洲无码高清一区二区| 亚州AV秘 一区二区三区 | av性天堂网| 高潮爽到爆的喷水女主播视频| 国产一区二区精品高清在线观看| 伊人精品视频免费在线| 黄色成年视频| 在线看片免费人成视久网下载| 青青草国产精品久久久久| 日韩欧美中文字幕在线精品| 亚洲一区无码在线| 亚洲五月激情网| 性色在线视频精品| 亚洲精品在线观看91| 亚洲国产精品无码久久一线| 国产精品永久在线| a级免费视频| 中日无码在线观看| 毛片网站在线播放| 国产91全国探花系列在线播放| 99热这里只有精品在线观看| 无码丝袜人妻| 99视频有精品视频免费观看| 久操线在视频在线观看| 18禁影院亚洲专区| 亚洲第一极品精品无码| 国产精品亚洲专区一区| 91视频日本| 99热最新网址| 在线国产91| 人妻丰满熟妇αv无码| 中文字幕久久波多野结衣| 日韩欧美国产另类| 成人在线观看不卡| 国产69囗曝护士吞精在线视频| 99精品在线看| 一本大道香蕉高清久久| 亚洲国产中文精品va在线播放 | 中国精品自拍| 欧美精品啪啪一区二区三区| A级毛片无码久久精品免费| 亚洲中文字幕在线精品一区| 思思热在线视频精品| 九九热免费在线视频| 精品少妇人妻av无码久久| 国产欧美综合在线观看第七页|