999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

熵權法在中國國際關系可視化分析中的應用

2023-06-25 03:40:55陳思杭王文宏曾夢緣宋文明姜思羽
現代信息科技 2023年4期
關鍵詞:數據分析

陳思杭 王文宏 曾夢緣 宋文明 姜思羽

摘? 要:近年來全球局勢緊張,大國關系愈發錯綜復雜,對當前國際形勢進行研究分析已成為各國政府的重要使命。采用大數據與數據挖掘等技術,對中國與別國于各領域的往來數據進行采集,并通過NLP、熵權法等方法對所得數據做分析處理,最后以數據可視化技術將其呈現,以直觀展示中國國際關系的變化,令更多民眾了解國家外交之動態與大國之風采。其數據結果呈現方式多樣,為促進民眾了解當前國際形勢及中國國際關系提供了一定研究思路。

關鍵詞:國際關系;數據分析;數據可視化;爬蟲技術;自然語言處理

中圖分類號:TP391? 文獻標識碼:A? 文章編號:2096-4706(2023)04-0177-04

Application of Entropy Weight Method in Visualization Analysis of China's International Relations

CHEN Sihang1, WANG Wenhong1, ZENG Mengyuan1, SONG Wenming2, JIANG Siyu1

(1.School of Information Science and Technology, Guangdong University of Foreign Studies, Guangzhou? 510006, China;

2.Guangzhou Automobile Group Co., Ltd., Guangzhou? 510623, China)

Abstract: In recent years, the global situation has become increasingly tense, and the relations between major countries have become increasingly complex. It has become an important mission of national governments to study and analyze the current international situation. This paper uses big data, data mining and other technologies, collects the communication data between China and other countries in various fields, analyzes and processes the obtained data through NLP, entropy weight method and other methods. Finally, it visually shows the change of China's international relations with data visualization technology, which makes more people understand the dynamic of national diplomacy and great power of country. The data results are presented in various ways, which provides some research ideas for promoting the public to understand the current international situation and China's international relations.

Keywords: international relations; data analysis; data visualization; crawler technology; natural language processing

0? 引? 言

邁入21世紀,當今世界正由“信息時代”逐步轉向“數據時代”[1],隨著全球關系的日益緊密,國家貿易交易金額、投資額等海量數據不斷累積,一系列數據清晰反映了國際關系的動態變化。而近年來伴隨著新冠疫情復雜嚴峻的發展態勢[2]、俄烏戰爭爆發等一系列國際事件的影響,國際形勢不穩定性、不確定性大幅增加,大國關系更趨錯綜復雜,國與國之間的貿易、經濟和文化等發展情況多元且不可測,其不穩定性與可塑性均有所上升。對國際交往中的海量數據進行合理分析,可清晰地掌握各國國際關系及當前國際形勢,并幫助相關從業人員在處理有關事務時作出更為準確的判斷。對此,本文基于自然語言處理與大數據技術,結合數據挖掘與數據可視化方法,對中國與其他各國在政治、經濟、文化等六大領域的往來數據[3]進行采集與分析,并將相關結果以可視化形式動態呈現,使數據豐富立體化,旨在展示中國國際關系變化情況,同時更直觀地觀察各國與中國在經濟、文化等方面的聯系密切程度,令更多群眾了解國家外交之動態與大國之風采,系統主體框架如圖1所示,具體實現過程如下:首先利用Python所提供的BeautifulSoup等相關庫,對國別區域與全球治理數據平臺、外交部官網等相關網站的文本及數值數據進行采集,并對所獲數據通過Python及Excel等工具進行數據清洗與預處理;隨后對于所得數據利用熵權法等算法進行國家合作度評分、話題熱度指數等計算;最后采用詞云圖、氣泡圖等方式進行文本數據可視化,通過繪制餅圖、折線圖、儀表盤等方式對數值型數據進行可視化呈現。

1? 相關研究

國際關系歷來是相關領域學者重點研究的議題,對國際關系展開研究,有利于我國了解國際形勢,把握自身國際地位,在國際交往中掌握主動權。然而其復雜性、不確定性以及龐大的數據量也為相關的研究分析帶來巨大挑戰。近年來,基于國際關系分析的研究多以文本或研究報告的形式展示,各學者研究角度亦有所不同。南京師范大學薛浩男等以網絡新聞文本為數據源,結合信息計算與地理視角,力圖將國際關系與地理學相融合,對國際關系進行分析[4]。吉林大學齊嘯天則利用大數據分析技術,將大數據研究與國際政治預測相結合,通過文獻梳理、實例分析及比較研究等方法對國際關系及國際形勢作出研判預測[5]。北京郵電大學王駿提出了基于文本挖掘的國際關系網絡研究,通過文本挖掘從大規模文本中構建國際關系網絡,同時利用可視化技術對所構建的網絡進行分析與展示[6]。綜上所述,當前有關國際關系的研究已經取得一定成果,但目前從可視化角度出發對相關結果進行分析展示的研究仍相對較少,因此本文立足于國際關系分析與可視化技術,力圖將分析所得數據與可視化展示相結合,打造良好呈現效果。

2? 模型和算法

本文采用熵權法進行國別合作度評分計算。熵權法是一種客觀賦權方法[7],在具體使用過程中,該算法根據各指標數據的分散程度,利用信息熵計算出各指標的熵權,再根據各指標對熵權進行一定的修正,從而得到較為客觀的指標權重;因此,結合熵權法與國家信息中心所供評分標準[8],可對中國與其他各國的合作度作出評價。

國別合作度評分是考量中國和其他國家關系的重要指標,能夠直觀地體現兩國之間的關系,合作度評分越高,則兩國關系越緊密,如評分20以下為其他關系,評分90以上則為戰略協作伙伴關系等。對于國別合作度的評分計算,結合國家信息中心大數據發展部[9]提供的國別合作度測評指標,本文決定采用“投資合作”“會議報道”“文件項目”“貿易合作”等10項指標評價中國與其他國家合作度綜合評分。首先,將歸一化后的指標數據按式(1)計算概率:

(1)

其中,pij表示第i個數據的第j項指標所對應的概率,rij表示第i個數據的第j項指標所對應的歸一化結果,n表示數據的數量。

而為了更好地確定各指標的權重,本文采用信息熵來描述各指標含量的不確定性,按式(2)計算信息熵:

(2)

其中,Ej表示第j項指標的信息熵,pij表示第i個數據的第j項指標所對應的概率,n表示數據的數量。

為提高數據的抗干擾能力,本文對所得信息熵按式(3)計算冗余度:

Dj=1-Ej? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?(3)

其中,Dj表示第j項指標的冗余度,Ej表示第j項指標的信息熵。得到冗余度后,按式(4)計算權重:

(4)

其中,Wj表示第j項指標的權重,Dj表示第j項指標的冗余度,m表示指標的數量。以中國與新加坡國別合作度為例,本文對相關指標進行權重計算,并對權重排名前5的指標進行展示,如表1所示。

最后,依據式(5)求出合作度綜合得分:

(5)

其中,aij表示第i個數據的第j項指標所對應的數值,Wj表示第j項指標所對應的權重,m表示指標的數量。綜合得分越高,說明該國家與中國的國際關系越密切。

3? 數據可視化

本文參考國別區域與全球治理數據平臺所構建的數據分類模式,分別從政治、經濟、文化等六大領域對中國國際關系展開分析,并對所得文本及數值型數據以詞云圖、折線圖、氣泡圖等形式進行可視化呈現。

此處以新加坡與中國國際關系有關數據為例進行部分指標可視化展示,其中,“投資合作”指標和“旅游與文化”指標采用折線圖的可視化方式,“會議報道”和“文件項目”指標采用詞云圖的可視化方式,“貿易合作”指標采用氣泡圖和折線圖相結合的可視化方式。本文選用10個指標進行熵權法計算,最終采用儀表盤的形式將國別合作度評分結果進行可視化。

3.1? “投資合作”和“旅游與文化”指標

“投資合作”指標是中新國別合作度綜合評分計算的重要指標之一,如圖2所示,本文通過熱度指數計算得到一定時間區間內中新兩國之間與“通信”相關的投資合作熱度指數的變化,并采用折線圖的方式進行呈現。與此同時,本文將熱度指數進行歸一化,以更好地將其作為評價指標之一帶入熵權法的合作度評分計算中。

如圖3所示,本文將中新兩國自1994年至2016年以來的旅客入境情況繪制成折線圖,一方面實現數據可視化展示,另一方面該數據也屬于國別合作度評分中“旅游與文化”這一指標的一部分,從圖中可看出從1994年至2016年中新經濟“旅客入境”數量總體呈上升趨勢,進而得出中新旅游業發展關系密切的結論。

3.2? “會議報道”和“文件項目”指標

TF-IDF算法是一種用于信息檢索與數據挖掘的統計方法,其中TF表示詞頻,IDF表示逆文本頻率指數,該算法用以評估一字詞對于一個文件集或一個語料庫中的其中一份文件的重要程度[10],字詞的重要性隨著它在文件中出現的次數成正比增加,但同時會隨著它在語料庫中出現的頻率成反比下降。TF-IDF算法對使用熵權法計算合作度評分中確定“會議報道”和“文件項目”這兩個指標的權重有著重要作用。本文將前期所采集到的中國與其他國家在經濟、文化、政治等方面的有關文章使用Python所供jieba庫進行分詞與去除停用詞后最終得到有效詞語,再通過TF-IDF算法進行計算,將得到的詞語按TF-IDF值進行排序。

圖4為中國與新加坡兩國在經濟類別中TF-IDF值排名前50的詞語,從圖中可以看出,中新兩國經濟在“通信”“信息”與“創新”等關鍵詞中交流密切,聯系緊密。

3.3? “貿易合作”指標

本文采用“時間軸”和“比例氣泡圖”相結合的方式對“貿易合作”指標的相關數據進行呈現。圖5展示了中國與新加坡兩國間進出口產品的占比情況,氣泡越大,則占比越大,該可視化方式有利于直觀地展示在同一年內不同類型產品所占比例的情況。經過觀察可知,該數據具有差異性和可對比性,有利于增大“貿易合作”指標的權重。

點擊圖5氣泡圖中的任意氣泡,即可呈現該類產品從1993年至2021年的出口總額變化情況,圖6為中新兩國經濟“藝術品”出口總額變化圖,從中可看出在此二十余年間兩國在該類產品的最高出口總額出現于2010年,約為225億美元。

3.4? 熵權法——國別合作度評分

通過采用熵權法進行計算,本文得出中新兩國間的國別合作度綜合評分為60.84分,并判定中新關系為“戰略伙伴關系”,其詳細結果如表2所示。由結果可知,經過熵權法計算所得國別合作度評分相比多元線性回歸方法的計算結果更接近國家信息中心所供的標準參考[9],因此其結果更具備參考價值。

如圖7所示,本文采用“儀表盤”的可視化方式,生動地對中新關系進行展示。

4? 結? 論

本文基于熵權法等相關算法,以國別區域與全球治理數據平臺等官方網站所得數據為數據源,對中國國際關系展開可視化分析。結合國家信息中心所供的國別合作度指數進行比對,本文所用方法對于國別合作度評分等計算具有一定參考意義。同時,本文以詞云圖等多種方式實現可視化呈現,為幫助普通群眾與相關領域研究者快速了解當前國際形勢及中國國際關系提供了較好的研究思路。

參考文獻:

[1] 大數據時代:數字政府建設成為新趨勢 [N].社會科學報,2019-06-13(1).

[2] 中國社會科學院國際形勢報告(2022) [J].拉丁美洲研究,2022,44(3):159.

[3] 外交領域的突破與創新 [J].人民論壇,2017(2):39.

[4] 薛浩男.基于新聞文本的國際關系時空信息獲取與分析方法研究 [D].南京:南京師范大學,2021.

[5] 齊嘯天.大數據分析方法對傳統國際政治預測的改進 [D].長春:吉林大學,2021.

[6] 王駿.基于文本挖掘的國際關系網絡研究 [D].北京:北京郵電大學,2013.

[7] 邵俊,倪楓,劉姜,等.基于熵權法的軟件開發項目進度風險影響因素分析研究 [J].項目管理技術,2022,20(10):7-10.

[8] 王彤. 基于熵權法的QS園林公司財務風險評價研究 [D].遼寧:沈陽工業大學,2022.

[9] 于施洋,王璟璇,楊道玲.數說“一帶一路”國別合作度 [J].中國投資,2018(19):106.

[10] 張明陽,劉盼盼,文申平.基于TF-IDF分類算法的電磁態勢情報分發 [J].航天電子對抗,2022,38(4):31-35.

作者簡介:陳思杭(2001—),女,漢族,廣東潮州人,助教,學士學位,研究方向:軟件工程;通訊作者:姜思羽(1992年—),女,滿族,黑龍江齊齊哈爾人,講師,博士,研究方向:人工智能。

收稿日期:2022-12-01

基金項目:廣東省哲學社會科學規劃一般項目(GD22CTS02)

猜你喜歡
數據分析
電子物證檢驗的數據分析與信息應用研究
基于matlab曲線擬合的數據預測分析
商情(2016年40期)2016-11-28 11:28:07
分眾媒體趨勢下場景營銷的商業前景
商(2016年32期)2016-11-24 17:39:41
佛山某給水管線控制測量探討
科技資訊(2016年18期)2016-11-15 18:05:53
SPSS在環境地球化學中的應用
考試周刊(2016年84期)2016-11-11 23:57:34
大數據時代高校數據管理的思考
科技視界(2016年18期)2016-11-03 22:51:40
我校如何利用體育大課間活動解決男生引體向上這個薄弱環節
體育時空(2016年8期)2016-10-25 18:02:39
Excel電子表格在財務日常工作中的應用
淺析大數據時代背景下的市場營銷策略
新常態下集團公司內部審計工作研究
中國市場(2016年36期)2016-10-19 04:31:23
主站蜘蛛池模板: 欧美激情综合| 日韩毛片免费视频| 丁香五月激情图片| 无码aaa视频| 嫩草国产在线| 欧美综合区自拍亚洲综合绿色 | 97se亚洲综合在线韩国专区福利| 国产在线观看91精品| 亚洲成人一区在线| 色成人综合| 国产亚洲精品在天天在线麻豆 | 国产电话自拍伊人| 台湾AV国片精品女同性| 日韩 欧美 国产 精品 综合| 国产成人无码综合亚洲日韩不卡| 国产男人天堂| 国产综合网站| av一区二区三区高清久久| 91精品国产自产91精品资源| 中文字幕免费视频| 日本亚洲最大的色成网站www| 91精选国产大片| 亚洲水蜜桃久久综合网站| 91麻豆精品国产高清在线| 国产乱人伦精品一区二区| 国产成人AV综合久久| 国产欧美精品午夜在线播放| 国产视频自拍一区| 亚洲成aⅴ人片在线影院八| 国产毛片网站| 国产午夜无码片在线观看网站| 国产高清免费午夜在线视频| 就去吻亚洲精品国产欧美| 亚洲一区二区三区国产精华液| 成人国产精品网站在线看| a在线亚洲男人的天堂试看| 亚洲一级毛片免费观看| 亚洲无码37.| 国产高清无码第一十页在线观看| 日韩视频免费| 久久这里只有精品2| 国产白浆在线| 毛片在线看网站| 亚洲人成成无码网WWW| 伊人91视频| 亚洲美女久久| 久久久久国产精品熟女影院| 天堂亚洲网| 国产香蕉97碰碰视频VA碰碰看| 91在线一9|永久视频在线| 色婷婷丁香| 免费在线成人网| 国产高清在线观看| 久久中文无码精品| 欧美日韩北条麻妃一区二区| 欧美亚洲第一页| 日韩欧美国产精品| 亚洲欧洲天堂色AV| 国产成人久久综合777777麻豆| 久久久久久国产精品mv| 久操线在视频在线观看| 国产人人干| 在线99视频| a亚洲视频| 欧美色图久久| 成人综合网址| 亚洲天堂成人在线观看| 国产伦精品一区二区三区视频优播| 91偷拍一区| 九九九久久国产精品| 狠狠综合久久| 亚洲欧美日韩成人在线| 在线无码九区| 99re免费视频| 伊在人亚洲香蕉精品播放| 91国语视频| 亚洲高清国产拍精品26u| 精品一区二区三区视频免费观看| 99草精品视频| 亚洲成a人片77777在线播放| 国产欧美自拍视频| 99久久精品久久久久久婷婷|