李回歸 蔣杰 韋昌法



摘? 要:文章闡述了研究構建中醫藥院校國自然立項項目數據采集與分析系統的意義,設計并實現了項目數據采集模塊、項目數據展示與檢索模塊、項目數據統計分析及可視化模塊和后臺管理模塊,建立了中醫藥院校國自然立項項目信息數據庫,并進行數據統計分析和挖掘,可以為各個中醫藥院校的科研管理決策提供數據支持,為廣大中醫藥科研工作者的科研工作提供幫助。
關鍵詞:中醫藥院校;國家自然科學基金項目;數據采集;數據分析
中圖分類號:TP391? 文獻標識碼:A 文章編號:2096-4706(2021)05-0157-06
Construction of Data Acquisition and Analysis System for National Natural Science Foundation Project in Chinese Medicine Colleges
LI Huigui,JIANG Jie,WEI Changfa
(School of Information Science and Engineering,Hunan University of Chinese Medicine,Changsha? 410208,China)
Abstract:The significance of research and construction of the data acquisition and analysis system for the projects of Chinese medicine colleges approved by the national natural science foundation is elaborated. The project data acquisition module,project data display and retrieval module,project data analysis and visualization module,and background management module are designed and implemented,the information database of national natural science foundation projects in Chinese medicine colleges is established,and the data is statistically analyzed and mined,so as to provide data support for scientific research management decision-making of each Chinese medicine college,and provide assistance to the scientific research work of the vast number of Chinese medicine researchers.
Keywords:Chinese medicine college;national natural science foundation project;data acquisition;data analysis
0? 引? 言
國家自然科學基金是我國支持基礎研究的主要渠道之一,旨在推動我國自然科學基礎研究的發展,促進基礎學科建設,發現、培養優秀科技人才[1,2]。中醫藥院校是我國中醫藥科學研究的主力軍,全面分析研究中醫藥院校的國家自然科學基金項目(以下簡稱:國自然項目)立項情況,可以為各個中醫藥院校的科研管理工作提供決策支持,促進中醫藥事業的發展。因此,筆者研究構建了中醫藥院校國家自然科學基金立項項目(以下簡稱:國自然立項項目)數據采集與分析系統,建立中醫藥院校國自然立項項目信息數據庫,對立項項目數據進行分析挖掘,以幫助中醫藥科研工作者快速了解行業科研熱點和趨勢、高效開展科研工作。
1? 研究構建中醫藥院校國自然立項項目數據采集與分析系統的意義
為了推動我國科學技術進步、提高國家綜合競爭力,黨中央、國務院在1986年成立了國家自然科學基金委員會,設立了科學基金[1]。國家自然科學基金如今已經成為我國資助高水平基礎研究和應用基礎研究的主要渠道之一,它對人才培養、學科建設以及科研水平的提高都具有重要的促進作用[2]。一個地區或單位獲得國家自然科學基金資助的數量和級別是衡量其科技創新能力的重要指標之一。醫學類國自然項目立項數據已經成為衡量國內各大醫學科研院所科研實力的重要指標,分析這些數據有助于科研工作者了解當前的醫學科研熱點、預測未來的醫學科研發展趨勢[3]。
目前,已有一些研究者對中醫藥院校國自然項目申請和立項情況進行分析研究。例如,張盈對南京中醫藥大學“十二五”期間國自然項目獲資助情況進行了分析,探索該校基礎研究發展的上升空間,為科研管理規劃工作提供數據支持[4]。裴剛總結了2016年國家自然科學基金中醫方劑學方向的項目申請與資助情況,對申請項目進行了評述分析[5]。鄭紹勇對1986年至2016年間獲得立項的中醫舌診相關國自然項目進行了統計分析,為中醫舌診研究提供了參考依據[6]。朱正剛分析了2016年至2018年中醫學學科國自然項目獲資助情況,探討了該學科領域的國自然項目立項趨勢,為相關研究者開展選題和項目申報提供了參考依據[7]。
但是,上述研究只是對某個單位(或方向)的某一年度(或某些年度)的國自然項目立項情況進行分析,數據不全面、欠缺代表性,而且只是進行了簡單的統計分析。因此,本文研究構建中醫藥院校國自然立項項目數據采集與分析系統,建立中醫藥院校國自然立項項目信息數據庫,全面統計各個中醫藥院校歷年的國自然立項項目數據,并分析其走勢,通過數據來說明各個院校的中醫藥科學研究發展情況,揭示各個院校的優勢研究領域。對各個中醫藥院校國自然項目立項數據進行對比分析,揭示各個院校的科研水平差異,可以為各個院校的科研管理決策提供數據支持。對中醫藥院校國自然立項項目歷年的項目名稱等信息進行詞頻分析,發掘其中的高頻詞匯,揭示歷年中醫藥科學研究的熱點,并通過可視化技術將結果直觀展示,可以為廣大中醫藥科研工作者的科研工作提供支持。
2? 中醫藥院校國自然立項項目數據采集與分析系統的設計
中醫藥院校國自然立項項目數據采集與分析系統利用網絡數據采集技術對各個中醫藥院校歷年的國自然立項項目數據進行采集,存入項目信息數據庫,提供根據項目批準號、項目名稱、項目類別、項目負責人、依托單位、批準年度和項目申請代碼等條件對項目信息進行檢索的功能,對各個中醫藥院校歷年的立項項目數、獲資助金額、獲資助率和項目關鍵詞等數據進行統計分析和挖掘,并通過可視化技術將分析結果直觀地展示給用戶。
中醫藥院校國自然立項項目數據采集與分析系統可分為四個主要模塊:項目數據采集模塊、項目數據展示與檢索模塊、項目數據統計分析及可視化模塊和后臺管理模塊,系統功能模塊圖如圖1所示。
項目數據采集模塊負責利用網絡數據采集技術從國家自然科學基金網絡信息系統、國家自然科學基金共享服務網和LetPub國家自然科學基金項目查詢系統等平臺上采集各個中醫藥院校歷年的國自然立項項目數據,包括項目批準號、項目名稱、項目關鍵詞、項目類別、項目負責人、依托單位、批準金額、批準年度和項目起止時間等信息,將采集到的數據根據自定義字典格式存儲到數據庫中,建立中醫藥院校國自然立項項目信息數據庫。
項目數據展示與檢索模塊負責通過Django視圖層中的HTML網頁文件顯示各個中醫藥院校的國自然立項項目數據,支持用戶根據項目名稱、項目批準號、項目申請代碼、項目批準時間、項目類別、項目負責人和依托單位等條件對項目數據進行檢索。當用戶輸入檢索條件后,系統前端將數據提交給后端,根據輸入的檢索條件進行數據檢索。系統隨后將檢索結果返回給前端頁面,對結果進行分頁展示,用戶可以根據需要查看項目的詳情。
項目數據統計分析及可視化模塊負責對項目數據進行統計分析和可視化處理,并將分析結果直觀地展示給用戶。系統默認顯示所有中醫藥院校歷年的國自然立項項目數據統計分析結果,用戶可以對院校信息和年份信息進行選定,系統前端將用戶選定的信息傳給系統后端。系統后端將根據用戶所選定的不同信息對所有中醫藥院校某年份的項目數據、某所中醫藥院校歷年的項目數據、某所中醫藥院校某年份的項目數據進行統計分析,接著將分析結果封裝成JSON數據格式傳送到系統前端,并通過Echarts圖表向用戶進行可視化展示。
后臺管理模塊提供了一些系統配置信息管理功能,例如申請代碼管理和關鍵詞管理功能,以便為系統的項目數據檢索和統計分析等功能提供基礎數據支持。此外,后臺管理模塊還提供了用戶信息管理功能。
3? 中醫藥院校國自然立項項目數據采集與分析系統的實現
筆者根據上述系統設計方案,采用Python編程語言開發實現了中醫藥院校國自然立項項目數據采集與分析系統,成功采集了各個中醫藥院校的國自然立項項目數據,建立了中醫藥院校國自然立項項目信息數據庫。下面將對系統的項目數據采集模塊、項目數據展示與檢索模塊、項目數據統計分析及可視化模塊和后臺管理模塊的實現進行詳細介紹。
3.1? 項目數據采集模塊的實現
項目數據采集是本系統最基礎的功能,采集工作的基本流程是:訪問提供國家自然科學基金項目信息查詢功能的網站,獲取要采集的項目信息所在的URL地址并查看其變化規律,查看網頁數據結構、獲得對網頁進行解析時要獲取的數據的路徑,通過Request的get方法獲得網頁數據,然后通過BeautifulSoup從得到的數據中提取出文本數據并進行數據摘取,最后對數據進行字典封裝并存入數據庫中。
3.2? 項目數據展示與檢索模塊的實現
系統完成中醫藥院校國自然立項項目數據采集后,即可通過項目數據展示與檢索模塊將項目信息展示給用戶。用戶還可以根據自己的需求設置項目信息檢索條件進行項目檢索,圖2顯示了用戶檢索“申請代碼”為“H27(中醫學)”的項目信息后系統返回的檢索結果,用戶可以點擊項目標題超鏈接以進一步查看某個項目的詳情。
3.3? 項目數據統計分析及可視化模塊的實現
系統分別從各個中醫藥院校歷年的國自然項目立項情況、各個中醫藥院校某年份的國自然項目立項情況、某所中醫藥院校歷年的國自然項目立項情況和某所中醫藥院校某年份的國自然項目立項情況這四個方面進行了統計分析。
3.3.1? 各個中醫藥院校歷年的國自然項目立項數據分析
圖3顯示了各個中醫藥院校歷年的國自然項目立項數據統計結果,從圖中可以看出上海中醫藥大學、北京中醫藥大學、廣州中醫藥大學和南京中醫藥大學歷年獲得立項的國家自然項目數明顯高于其他中醫藥院校,這一情況印證了這4所院校的科研實力在各個中醫藥院校中名列前茅。此外,從圖3中還可以看出廣西中醫藥大學和江西中醫藥大學歷年獲得立項的國自然項目數也較多、且高于與它們同層次的中醫藥院校,這與廣西和江西可以申請地區科學基金項目有關。圖4顯示了各個中醫藥院校歷年的國自然立項項目關鍵詞詞云圖及數據視圖,從圖中可以看出各個中醫藥院校歷年在中醫藥作用機制研究、通路調控機制研究、干預機制研究等方面獲得立項的項目較多。
3.3.2? 各個中醫藥院校某年份的國自然項目立項數據分析
圖5顯示了各個中醫藥院校2018年的國自然項目立項數據統計結果,從圖中可以看出上海中醫藥大學當年的立項數為138項、居中醫藥院校之首,立項數超過70項的院校還有南京中醫藥大學、廣州中醫藥大學和北京中醫藥大學。圖6顯示了各個中醫藥院校2018年的國自然立項項目關鍵詞詞云圖及數據視圖,從圖中可以看出各個中醫藥院校當年在通路調控機制研究方面獲得立項的項目較多。
3.3.3? 某所中醫藥院校歷年的國自然項目立項數據分析
圖7顯示了湖南中醫藥大學歷年的國自然項目立項數據統計結果,從圖中可以看出湖南中醫藥大學自2012年起獲得的國自然立項項目數有大幅提升,這得益于該校加大了科研投入、完善了科研績效獎勵機制、大大提升了研究人員的科研積極性。圖8顯示了湖南中醫藥大學歷年的國自然立項項目關鍵詞詞云圖及數據視圖,從圖中可以看出湖南中醫藥大學在腦缺血、補陽還五湯等方面進行的研究較多。
3.3.4? 某所中醫藥院校某年份的國自然項目立項數據分析
圖9顯示了湖南中醫藥大學2018年國自然項目立項數據統計結果,從圖中可以看到該校當年獲得面上項目21項和青年科學基金項目12項。圖10顯示了湖南中醫藥大學2018年國自然立項項目關鍵詞詞云圖及數據視圖,從圖中可以看出湖南中醫藥大學當年在通路調控機制研究方面獲得立項的項目較多,與當年各個中醫藥院校獲得立項的項目特點一致。
3.4? 后臺管理模塊的實現
系統的后臺管理模塊提供了申請代碼管理、關鍵詞管理和用戶信息管理等功能。
申請代碼是國自然立項項目的重要信息,在對項目信息進行檢索時申請代碼是一個重要的檢索字段。為了便于用戶進行檢索,系統會將申請代碼的所有可選值初始化在項目檢索界面的申請代碼下拉列表框中。申請代碼管理功能主要用于將國家自然科學基金委員會規定的申請代碼導入到系統中并顯示于項目信息檢索界面,具體方案為:訪問國家自然科學基金管理信息系統項目檢索頁面,將申請代碼選擇框的文本數據復制到文本文件中,接著對數據進行規范化處理,再編寫代碼讀取申請代碼數據并按指定格式存入數據庫中,系統最終從數據庫中獲取申請代碼數據并顯示于系統前端。
關鍵詞也是國自然立項項目的重要信息,在對項目數據進行統計分析及可視化時需要使用關鍵詞數據。關鍵詞數據的來源主要有兩個,其一是前期通過數據采集技術獲得的國自然立項項目數據中的關鍵詞字段,其二是系統通過分詞技術從國自然立項項目名稱中抽取出來的關鍵詞。系統的關鍵詞管理功能負責對這些關鍵詞數據進行維護管理。
用戶信息管理功能主要實現對用戶信息進行增加、刪除、修改和查詢操作,系統可以基于用戶的學校等信息生成個性化的國自然立項項目數據列表并通過郵件推送給用戶,使用戶可以快速獲取其感興趣的國自然立項項目數據。
4? 結? 論
本文分析了研究構建中醫藥院校國自然立項項目數據采集與分析系統的意義,對該系統進行了設計與實現,建立了中醫藥院校國自然立項項目信息數據庫,對系統的項目數據采集模塊、項目數據展示與檢索模塊、項目數據統計分析及可視化模塊和后臺管理模塊進行了詳細介紹。通過對中醫藥院校國自然立項項目數據進行統計分析和挖掘,可以為各個中醫藥院校的科研管理工作提供決策依據,幫助中醫藥科研工作者快速了解行業科研熱點和趨勢、高效開展科研工作,促進中醫藥事業的發展。
參考文獻:
[1] 國家自然科學基金委.機構概況 [EB/OL].(2016-11-07).http://www.nsfc.gov.cn/publish/portal0/jgsz/01/.
[2] 李靜海.國家自然科學基金支持我國基礎研究的回顧與展望 [J].中國科學院院刊,2018,33(4):390-395.
[3] 宋芳,張淋坤,沈軍.某醫院國家自然科學基金申報情況及對策分析 [J].現代醫院管理,2018,16(1):60-62.
[4] 張盈.南京中醫藥大學“十二五”國家自然科學基金資助情況分析 [J].江蘇科技信息,2016(35):72-74.
[5] 裴剛,何偉明,黃鳳,等.2016年國家自然科學基金中醫方劑學項目申請、受理與資助情況評述 [J].湖南中醫藥大學學報,2017,37(1):79-82.
[6] 鄭紹勇,孫悅,丁成華.中醫舌診項目的國家自然科學基金資助情況分析 [J].中華中醫藥雜志,2018,33(7):3027-3030.
[7] 朱正剛,尹雨晴,潘曉彥,等.2016-2018年國家自然科學基金中醫學學科項目資助概況及熱點分析 [J].中國中醫藥信息雜志,2020,27(1):98-102.
作者簡介:李回歸(1997—),女,漢族,湖南益陽人,本科在讀,研究方向:中醫藥信息管理;蔣杰(1997—),男,漢族,湖南婁底人,本科在讀,研究方向:中醫藥信息管理;通訊作者:韋昌法(1982—),男,壯族,廣西巴馬人,副教授,博士研究生在讀,研究方向:中醫智能輔助診療。