999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于Python的國際學術會議數據分析研究

2022-07-10 13:45:45呂霞蔡婷婷肖芳
現代信息科技 2022年5期
關鍵詞:數據分析

呂霞 蔡婷婷 肖芳

摘 ?要:Python在科學計算和數據可視化等領域的應用越來越廣泛。使用Python對國際會議平臺中教育系統國際會議數據進行清洗和處理,深入挖掘會議學科、地域等不同維度的相關信息,對申報會議的主題詞、雙一流高校月度會議量和雙一流高校地域分布進行可視化分析,深入挖掘各類學術會議信息的科學價值,助力國際學術會議平臺的管理和國家學科建設地區分配改進和優化,推動我國教育系統科技信息交流平臺的建設和發展。

關鍵詞:國際學術會議;會議平臺;Python;數據分析

中圖分類號:TP391 ? ? ? 文獻標識碼:A文章編號:2096-4706(2022)05-0038-04

Research on Data Analysis of International Academic Conferences Based on Python

LYU Xia, CAI Tingting, XIAO Fang

(Huazhong University of Science and Technology Library, Wuhan ?430074, China)

Abstract: The application of Python is more and more extensive in the fields of scientific computing and data visualization. In this paper, it uses Python to clean and process the international conference data of the education system in the international conference platform, and digs deeply into the relevant information of different dimensions such as subject and geographical on the conference, and carries out visual analysis of the theme words of the application meeting, the monthly meeting volume of double first-class universities and the regional distribution of double first-class universities, and digs the scientific value of various academic conference information deeply. It helps the management of international academic conference platform, help to improve and optimize the management of international academic conference platform and regional distribution of national discipline construction, promotes the construction and development of science and technology information exchange platform in China’s education system.

Keywords: international academic conference; conference platform; Python; data analysis

0 ?引 ?言

科學的決策離不開會議商討,前沿科學技術的研討也離不開會議交流。在當今這個信息交流的時代,會議已然成為教育系統各學科學術交流的主要方式。國際學術會議是國際科學研究和交流的重要支撐。

每年,我國教育部直屬高校和科研院所都會舉辦大量的國際性學術會議,在促進國際交流的同時產生了龐大的會議數據,形成了教育系統國際性學術會議的大數據。從國家層面上看,高水平的科學研究和交流需要建立在高端的信息交流平臺上。華中科技大學圖書館受教育部國際司委托,建設并運維中國教育系統國際學術會議云平臺[1],建立了一套完善的會議管理機制,管理和積累了我國教育系統國際性會議的大數據,為進一步對會議數據進行挖掘和分析奠定了良好的數據基礎。

1 ?研究現狀

以“學術會議”或“會議平臺”為關鍵詞在CNKI中國資源總庫檢索篇名,除去國際學術會議廣告性質文獻,得到55篇相關研究文獻,國內對學術會議和會議平臺的討論主要及集中在如下幾個方面。

1.1 ?學術會議的組織管理

范敏敏等[2]探討了高校學術會議團隊的工作組織技巧,孟凡力[3]總結了高校大型學術會議的各種組織經驗,呂鍵[4]從學院組織國際學術會議的實踐出發,探索會議組織和管理的有效方式。這些研究都是從實際工作實踐出發,探索學術會議更有效的組織技巧和管理模式。

1.2 ?學術會議與學術出版

學術會議和學術期刊都是學術交流有效的傳播方式,兩者的關系和發展模式也是學術討論的熱點。黃明睿[5]從學術會議與期刊的起源、組織和交流形式、內容和功能上分析和探索兩者的相互關系;邵玉嫻等[6]從學術會議的特點、會前準備、會中宣傳和組稿以及會后整理和跟蹤等方面探討編輯如何借助學術會議提升科技期刊學術水平和影響力;初景利[7]認為應利用技術構建開放的學術會議系統,建設線上線下結合、傳統媒體與新媒體融合的學術傳播模式,探索與國家科技創新需求相一致的學術交流模式。

1.3 ?學術會議與人才培養

學術會議和學術會議平臺的學術交流聚集效應無疑為學術人才的發展提供了廣闊的平臺。馮全功等[8]探索高質量主題學術會議作為學術交流手段凝聚學者共識,促進了學科建設和發展;高會軍等[9]從實踐工作出發,認為國際學術會議為博士生高質量培養搭建了國際化平臺;張天綱等[10]認為學術會議是研究生高質量培養的重要途徑。

1.4 ?學術會議平臺的建設

國內學術會議平臺的建設實踐主要集中在技術對會議平臺建設的重要作用等研究方面。魏生輝等[11]針對傳統會議組織和管理方式在信息采集、流通、存儲和共享方面的不足,探索基于云服務的會議服務平臺的構建;林曉靜等[12]探索互聯網+環境下傳統學術會議平臺功能和組織的升級與發展。

從以上文獻調查可以看出,目前國內針對國際會議平臺和學術會議的研究主要集中在相關功能構建和組織管理等方面,對學術會議信息數據的挖掘研究乏善可陳。本文依托本校管理的中國教育系統國際學術會議云平臺,使用Python語言對平臺中教育系統國際會議信息數據進行統計分析,深入挖掘會議學科和地域信息,進一步助力我國教育系統未來的學科發展和國際會議平臺數據管理。

2 ?Python 數據分析

數據時代,越來越多的研究人員通過數據分析挖掘數據的價值。Python語言是一種具有解釋性、交互性和面向對象的計算機編程語言。Python 簡潔明了、便于擴展,具有龐大的標準庫和第三方庫,且具有強大的數據分析功能,逐漸成為數據分析領域的首選工具[13]。

在對數據進行價值挖掘的過程中,Python包含有Pandas、Numpy、Seaborn、Matplotlib等數據分析庫,輔以分詞包Jieba、Wordcloud等進行解釋和分析。在結構化數據的處理中,Pandas 能夠提供大量函數和數據結構;Numpy提供的多維數據組對象,ndarray能夠直接進行數學和元素級別的運算;Seaborn和Matplotlib的功能主要體現在數據圖表的繪制方面。

通過收集、整理和可視化,Python數據分析技術能夠對國際會議平臺產生的大量數據從不同維度進行分析,深入挖掘會議學科信息。國際會議信息挖掘的處理流程如圖1所示。

圖1 ?國際會議信息挖掘的處理流程

3 ?基于python的國際會議信息數據分析

中國教育系統學術會議云平臺2018年5月上線以來,系統運行穩定。2020年1月以后,因新冠疫情原因,國際學術會議無論是參與專家人數還是會議數量都受到巨大影響,因此此次研究統計截止時間為2019年12月31日。經統計,自平臺上線到2019年12月31日,平臺注冊的高校和科研院所用戶4 000多人,在平臺上共申報國際會議4 028個,終審通過的國際會議有3 461個,產生了大量相關的國際學術會議數據。

在我國,雙一流高校是我國高校的代表,本研究主要針對平臺中國家首批42所雙一流高校舉辦的會議數據進行統計分析。

3.1 ?數據清理和關鍵詞抽取

3.1.1 ?數據清理

在數據分析時,原始數據中存在著大量不完整、不一致、有異常的數據,嚴重影響到數據分析的結果。所以清洗數據的目的有兩個:(1)通過清洗使數據可用;(2)讓數據變得更適合后續的分析工作。數據清洗過程如圖2所示。

圖2 ?數據清洗過程

如圖2,數據清洗過程分為以下三個階段:

(1)數據預處理。預處理階段主要是檢查數據的可用性。對國際會議數據預處理包含兩個部分:一是提取元數據信息,包括字段解釋、數據來源、代碼表等一切描述數據的信息;從數據庫中的各種數據表提取主要字段,主要數據表包含國際會議申報信息表、國際會議預報信息表、國際會議變更表、國際會議人員信息表、國際會議總結表等,提取的字段包括會議名稱、會議時間、會議地點、總人數、主辦單位、會議議題或主題、會議總結等。二是抽取部分數據,通過Pandas庫查看數據概況,對數據本身有一個直觀的了解,并進行初步發現和總結,為之后的數據處理做準備,部分操作參考下文代碼:

import pandas as pd

data = pd.read_csv(filename,encoding="gbk") ? ? ?#加載數據

data.head(n=5)#查看數據前五行

data.shape#查看數據維數

data.info() ? ? ? ? #檢查缺失值情況

data.describe() ? ? #查看統計值,包括平均數,標準差,中位數,最小值,最大值,25%分位數,75%分位數

(2)數據格式和內容清洗。數據格式內容清洗是為了規范數據,以便于統一處理。由于國際會議數據是用戶在會議平臺中填寫而來,很大可能存在格式和內容問題。常見問題有:日期、數值、全半角等存儲格式不一致;無效填報數據,比如會議舉辦地點中出現多余的空格,或者出現中、英文描述導致數據不統一等。這些情況需要以半自動校驗、半人工方式來檢查并找出可能存在的問題,以去除不需要的字符。部分清洗方式可參考下文中的處理代碼:

pd.read_csv(filename,encoding=“unicode_escape”) ? #在Python中,unicode是內存編碼集,一般我們將數據存儲到文件時,需要將數據先編碼為其他編碼集,比如utf-8、gbk等。但是還有一種unicode-escape編碼集,他是將unicode內存編碼值直接存儲:因此讀取數據的時候需要通過同樣的編碼集進行解碼,否則就會出現數據加載異常。

data[‘HYZRS’].astype(‘int’) ? ?#更改數據格式(參會總人數)

data[‘city’].replace(‘shanghai’,‘上海’)

data[‘city’].replace(“ “,””) ? ?#去除全部空格

(3)缺失數據處理。處理缺失數據是為了保證數據的完整性。缺失數據處理主要包括兩個部分:一是去除不需要的字段,包括審核、擴展字段等;二是補全缺失的內容,比如會議總結、會議變更表中的主題、會議日期、地點等,可對數據表中的對應字段進行補充。

3.1.2 ?關鍵詞抽取

對會議平臺中提取的原始數據清洗完成之后,還需要對各數據表中的數據根據需要進行字段抽取和字段拆分,重新建立新的索引,為下一步的數據可視化分析打下基礎。

(1)字段抽取和拆分。通過數據表關聯關系,提取會議名稱、舉辦城市、會議時間、參會人數、會議主題、學科、申報單位等字段重新組合數據表。

(2)設置索引,依據統計分析需求對重新組合的數據表進行索引設置。例如,通過會議開始結束時間計算會議持續天數,重新設置索引,數據默認的索引是從0開始的有序整數。如果想把某一列設置為新的索引,可以用.set_index()實現,比如把申報單位這列設為新索引。部分處理方式可參考下文中的代碼。

data.set_index(“申報單位”,inplace=True)

data[‘HYKS’] = pd.to_datetime(data[‘HYKS’]) ?# 將文本格式轉換為日期格式

data[‘HYJS’]= pd.to_datetime(data[‘HYJS’])

data[‘TS’] = data[‘HYJS’] - data[‘HYKS’] + timedelta(days=1) #計算時間差

data[‘TS’] = pd.to_timedelta(data[‘TS’]).dt.days ? ?#獲取會議持續天數

3.2 ?國際會議信息可視化分析

3.2.1 ?主題詞詞云圖

對申報會議的主題詞進行分詞,統計分析得出會議主題詞詞云圖。如圖3所示,材料、人工智能、能源、生物等為高頻熱點主題詞,充分反映了在當前我國經濟高速發展時期,國際學術會議主題緊扣國家重要發展方向。

圖3 ?國際學術會議主題詞詞云圖

3.2.2 ?雙一流高校月度會議量統計分析

如圖4所示,按月對所有會議和雙一流高校辦會總量進行統計,提取雙一流高校每月辦會數量,計算出雙一流高校會議占總數的比例。從雙一流高校會議規模的統計柱狀圖可以看出,國際學術會議的召開具有很強的時間性,在上半學年和下半學年期間的辦會量明顯大于寒暑假期間。從雙一流高校舉辦會議數量月分布來看,雙一流高校會議數量占比在62.5%到88.57%之間,占據了全國高校會議數量的絕大多數,展現了雙一流高校雄厚的學術和辦會實力,也體現了國家政策對雙一流高校學術交流和學科建設的大力支持。

圖4 ?雙一流高校會議規模及其占比

3.2.3 ?雙一流高校會議分布

高校學術的建設和發展高度依賴國家和所處地域在經濟等各方面的支持。如圖5所示,按高校名稱統計各校主辦會議數量(去除從未主辦會議的高校,取其中32所),展示了雙一流高校主辦會議的分布情況。從圖中可以看出,清華大學、浙江大學、復旦大學、北京大學和上海交通大學以絕對數量優勢排名前列。這幾所高校常年盤踞各大高校綜合指數排名前列,也坐落于我國經濟、政治和文化最發達的北京市和長三角地區,從一定程度上反映了國家和地域的各項發展對學術建設的支持;同時也反映出,學術的發展對國家和地域的各項發展也發揮著重要的促進作用。

圖5 ?42所雙一流高校會議分布

4 ?結 ?論

國際會議平臺中龐大的會議數據不應該只作為一種“資產”沉睡在會議平臺數據庫中,而是應該借助各種像Python這樣的分析統計工具,將采集到的數據信息進行分析處理,助力國際學術會議平臺的管理和國家學科建設地區分配改進和優化,為我國打造國家科技信息高端交流平臺,增強國家國際競爭力和科技可持續發展能力貢獻智慧力量。

參考文獻:

[1] 中國教育系統學術會議云平臺.國際會議平臺名 [EB/OL].[2021-12-01].http: //econf.hust.edu.cn/.

[2] 范敏敏,唐艷,王迪,等.高校學術會議服務團隊工作技巧探討 [J].辦公室業務,2018(22):113-114.

[3] 孟凡力.高校大型學術會議組織經驗探討 [J].教育教學論壇,2016(34):202-203.

[4] 呂鍵.國際學術會議的組織與管理經驗探索——以麗水學院為例 [J].開封教育學院學報,2019,39(5):155-156.

[5] 黃明睿.論學術會議與期刊的關系 [J].編輯學報,2016,28(1):18-20.

[6] 邵玉嫻,王小玲,楊雪,等.借助學術會議提升科技期刊學術水平和影響力 [J].編輯學報,2019,31(S1):73-76.

[7] 初景利.高端交流平臺建設需要創新學術交流模式 [J].智庫理論與實踐,2021,6(1):7-9.

[8] 馮全功,棗彬吉.學術平臺、學者成長與學科建設——以浙江大學中華譯學館為例 [J].上海翻譯,2020(6):91-94.

[9] 高會軍,邱劍彬.依托國際化平臺提升博士生培養質量的探索與實踐 [J].繼續教育研究,2016(10):100-102.

[10] 張天綱,玄萍,鞏誠.學術會議對提高研究生培養質量的作用 [J].教育教學論壇,2017(10):238-239.

[11] 魏生輝,鄭依華,南凱.基于云服務的會議服務平臺研究與實現 [J].計算機工程,2012,38(4):233-235+238.

[12] 林曉靜,楊瑾.建設互聯網+學術會議平臺 引領學會創新發展 [J].學會,2018(12):45-47.

[13] 張若愚.Python 科學計算:第2版 [M].北京:清華大學出版社,2016.

作者簡介:呂霞(1982—),女,漢族,湖北鄂州人,碩士,華中科技大學圖書館館員,主要研究方向:圖書館服務平臺建設和管理、智慧圖書館;蔡婷婷(1989—),女,漢族,湖北隨州人,碩士,華中科技大學圖書館助理館員,主要研究方向:智慧圖書館,信息組織;肖芳(1982—),男,漢族,湖南漣源人,碩士,華中科技大學圖書館副研究館員,主要研究方向:智慧圖書館,信息化建設。

猜你喜歡
數據分析
我校如何利用體育大課間活動解決男生引體向上這個薄弱環節
體育時空(2016年8期)2016-10-25 18:02:39
Excel電子表格在財務日常工作中的應用
淺析大數據時代背景下的市場營銷策略
新常態下集團公司內部審計工作研究
中國市場(2016年36期)2016-10-19 04:31:23
淺析大數據時代對企業營銷模式的影響
基于讀者到館行為數據分析的高校圖書館服務優化建議
科技視界(2016年22期)2016-10-18 14:37:36
主站蜘蛛池模板: 久久精品aⅴ无码中文字幕| 五月婷婷伊人网| 久久久成年黄色视频| 欧美特级AAAAAA视频免费观看| 手机精品福利在线观看| 欧美日韩中文国产| 亚洲国产天堂久久综合| 中文国产成人精品久久| 国产乱人乱偷精品视频a人人澡| 亚洲天堂2014| 在线观看免费人成视频色快速| 国产91透明丝袜美腿在线| 毛片免费试看| 久久人午夜亚洲精品无码区| 99热最新网址| 99er这里只有精品| 日韩天堂在线观看| 蜜桃视频一区| 亚洲色欲色欲www在线观看| 亚洲热线99精品视频| 国产在线视频导航| 欧美一级片在线| 九九九九热精品视频| 欧类av怡春院| 少妇露出福利视频| 丁香五月激情图片| 99热这里只有精品久久免费| 无码高潮喷水专区久久| 欧洲日本亚洲中文字幕| 亚欧成人无码AV在线播放| 丝袜久久剧情精品国产| 91国语视频| 欧美亚洲一区二区三区导航| 亚洲日本中文字幕天堂网| 激情六月丁香婷婷四房播| 国产精品自在在线午夜区app| 99精品免费在线| 欧美中文字幕无线码视频| 亚洲91在线精品| 国产精品爽爽va在线无码观看| 久久亚洲精少妇毛片午夜无码 | 国产一级毛片高清完整视频版| 狠狠躁天天躁夜夜躁婷婷| yjizz视频最新网站在线| 日韩欧美中文在线| 亚洲人成人伊人成综合网无码| 亚洲精品无码抽插日韩| 国产亚洲精品自在线| 麻豆精品在线播放| 亚洲综合18p| 免费看黄片一区二区三区| 92午夜福利影院一区二区三区| a亚洲天堂| 欧美无专区| 国产门事件在线| 国产午夜无码片在线观看网站| 国产毛片片精品天天看视频| 精品福利一区二区免费视频| 伊人激情久久综合中文字幕| 永久免费av网站可以直接看的 | 欧美www在线观看| 九九久久99精品| 久久精品一卡日本电影| 国产成人综合日韩精品无码不卡| 久久综合激情网| 国产精品妖精视频| 亚洲综合经典在线一区二区| 国产嫖妓91东北老熟女久久一| 一本大道无码高清| 精品综合久久久久久97| 日本a级免费| 欧美日本在线| 久久国产精品波多野结衣| 国内嫩模私拍精品视频| 国产香蕉在线视频| 日韩久久精品无码aV| 日日碰狠狠添天天爽| 欧美爱爱网| 视频在线观看一区二区| 麻豆a级片| 亚洲丝袜第一页| 无码乱人伦一区二区亚洲一|