寧黎苗 駱學春 賈軍



摘 要:本文利用大數據可視化分析方法和數據關聯挖掘方法,對近五年研究生參與學術交流活動情況及近五年研究生取得的學術成果數據做分析,以此挖掘出學術交流活動與研究生最終學術成果的產出的內在聯系。該研究結果證明,積極的有針對性的參與學術交流活動,對培養研究生創新能力,具有極大的促進作用;另一方面,本文的研究結果對高校開展有針對性的學術交流活動具有一定的理論意義和應用價值。
關鍵詞:研究生 學術交流 大數據分析
研究生教育是我國教育體制中的最高層次教育,肩負著為建設創新型國家和全面建設小康社會培養高層次、高素質、創新型人才的艱巨使命。 “創新是一個民族進步的靈魂,是一個國家興旺發達的不竭動力。”習近平總書記說,“我們必須把創新作為引領發展的第一動力,把人才作為支撐發展的第一資源,把創新擺在國家發展全局的核心位置”。研究生作為我國科研工作的生力軍,也是未來承擔建設創新型國家的重要力量。研究生創新能力的培養,是關系我國實施創新驅動戰略的重要問題之一。研究生學術交流活動是研究生培養的重要環節,是研究生創新能力培養的重要抓手。研究生學術交流對學生學術成果的實效,是一個重要的基礎性問題。
本文通過對我院近年來學生參加學術交流活動情況、學生學術成果情況,進行大數據分析,研究研究生學術交流活動與學術成果的相關性。包括各種學術交流活動的實際效果,各種學術成果與學術交流的關系等。研究結果有利于有針對性開展學術交流活動,提高學生的創新能力,對指導研究生開展學術交流活動,培養研究生創新能力,具有一定的理論意義和應用價值。
一、研究內容與方法
1.研究內容。我校研究生學術交流活動形式多樣,來源豐富。有學術講座、學術沙龍、學術會議、聯合培養等多種途徑,學術成果也包含發表高水平學術論文、申請發明專利和軟件著作權、成果獲獎等。本文通過統計近年來我院研究生學術交流的情況,學生取得學術成果的情況,主要研究兩個方面的內容:
(1)研究學術講座、學術沙龍、學術會議、聯合培養等多種方式對學生學術成果的促進效應。
(2)研究生發表高水平論文、申請發明專利和軟件著作權、成果獲獎等情況與學術交流的關系。
2.研究思路。通過數據分類整理,數據分析和結果解讀三個步驟進行研究工作。
(1)數據分類整理。對近五年研究生學術交流活動,包含參加學術講座記錄、參加學術沙龍記錄、參加學術會議記錄、出國聯合培養記錄進行歸類整理,整理出近五年研究生學術交流活動記錄表。同時,對近五年研究生取得學術成果,包含發表高水平學術論文、申請專利、申請軟件著作權及成果獲獎等情況進行歸類整理,整理出近五年研究生學術成果記錄表。
(2)數據分析。通過對步驟(1)中獲取的兩部分數據,采用大數據可視化分析及數據關聯挖掘等方法,可視化呈現各變量之間的定性規律,以及隱含在數據內部的關聯規則。
(3)討論。根據步驟(2)中的數據分析結果,得出研究生學術交流因素對研究生創新能力培養,研究生學術成果的取得所產生的積極意義。
3.研究方法。利用大數據可視化分析方法和數據關聯挖掘方法,對整理出來的數據做分析,最后對分析結果進行解讀。
(1)可視化分析是一種分析技術,主要應用于海量數據關聯分析,可輔助人工操作將數據進行關聯分析,并做出完整的分析圖表。主要應用于海量數據關聯分析,由于所涉及的信息比較分散、數據結構有可能不統一,而且通常以人工分析為主,加上分析過程的非結構性和不確定性,所以不易形成固定的分析流程或模式,很難將數據調入應用系統中進行分析挖掘。借助功能強大的可視化數據分析平臺,可輔助人工操作將數據進行關聯分析,并做出完整的分析圖表。圖表中包含所有事件的相關信息,也完整展示數據分析的過程和數據鏈走向。同時,這些分析圖表也可通過另存為其他格式,供相關人員調閱。
(2)關聯分析又稱關聯挖掘,就是在交易數據、關系數據或其他信息載體中,查找存在于項目集合或對象集合之間的頻繁模式、關聯、相關性或因果結構。關聯分析是一種簡單、實用的分析技術,就是發現存在于大量數據集中的關聯性或相關性,從而描述了一個事物中某些屬性同時出現的規律和模式。關聯分析是從大量數據中發現項集之間有趣的關聯和相關聯系。
二、實驗及結果
1.實驗數據。實驗數據來源四川大學計算機學院近五年研究生學術交流活動記錄,包含參加學術講座記錄、參加學術沙龍記錄、參加學術會議記錄、出國聯合培養記錄,以及研究生學術成果記錄,其中研一占比11%,研二占比38%,研三占比51%。
2.數據分析。
實驗數據如圖1所示:
其中2018年數據統計截止到9月,因此數據量較其他月份偏少。從圖中可以看出學生參與學術活動的次數逐年提高,并且產出的高水平學術成果也顯著提高。
在對學生參加學術講座、學術沙龍、學術會議、論文研討、實驗室組會和其他學術活動計算總和后,利用person相關性分析學術活動總次數與發表論文篇數呈現正相關,且能通過置信度<0.05的顯著性檢驗。見表1
比較奇怪的是,通過對參與實驗室組會次數與學術論文相關性分析,表明參加組會次數與發表論文數也呈現正相關。而在分析參與學院統一組織的學術講座和發表論文篇數的相關性分析時,兩者并未呈現正相關。見表2
三、總結與展望
本文利用大數據可視化分析方法和數據關聯挖掘方法,對近五年研究生參與學術交流活動情況及近五年研究生取得的學術成果數據做分析,實證學生參與學術活動的次數與高水平學術成果產出有正相關性,但在學生所有參與學術活動中,由課題組組織的每周形式的例會,對研究生科研產出最為重要,其重要性比學院范圍內的學術講座更為重要。本文通過數據挖掘,分析學術交流與研究生最終學術成果的產出的內在聯系,對高校開展有針對性的學術交流活動具有一定的理論意義和應用價值。
參考文獻
[1]習近平.在黨的十八屆五中全會第二次全體會議上的講話(節選)[J].求實,2016年1期
[2]周蘇,王文等.大數據可視化[M].北京:清華大學出版社,2016
[3]武松,潘發明等.SPSS統計分析大全[M].北京:清華大學出版社,2014