◆張辰枝
?
大數據環境下基于數據挖掘技術的高校科研管理系統的設計研究
◆張辰枝
(上海電子信息職業技術學院 上海 200032)
在大數據背景下,大數據技術被應用在各行各業中,借助數據庫中含有的關聯性信息,能有效提升科研水平和綜合實踐能力。因此,為了進一步優化高校科研管理系統的實際價值,要著重利用數據挖掘技術,提高高校科研管理水平。本文對數據挖掘技術的結構、使用工具等進行了簡要分析,并集中討論了高校科研管理系統應用數據挖掘技術的設計流程,以供參考。
大數據;高校科研管理系統;數據挖掘技術;設計
所謂數據挖掘技術,就是在海量數據中建立知識提取模式,從而有效使用動態信息,按照標準化分類標準對典型數據挖掘系統予以分析,其主要組成部分包括以下幾點:
第一,數據庫、數據/信息庫。
第二,數據庫服務器,能結合用戶的實際數據請求,提取有效的數據和信息,然后直接推送[1]。
第三,知識庫,會將相關聯的功能模塊結合在一起,保證指導搜索和評估結果分析的實效性,也能對用戶興趣度進行匯總。
第四,數據挖掘引擎,能對特征化、關聯化信息進行分類和聚合,并且深度研究數據之間的演變,建立系統性偏差分析機制。
第五,模式評價模塊。主要是借助相關技術對用戶的興趣度進行度量和分析,從而建構數據各個挖掘模塊之間的聯系,確保用戶交互工作和搜索項目的完整性。
第六,圖形管理,主要是對用戶和數據挖掘系統予以判定,并且整合各個部分之間存在的關聯度。
數據挖掘技術系統示意圖,如下圖1:

圖1 數據挖掘技術系統示意圖

在關聯規則中,要對項集、支持度和關聯規則進行系統化分析。

在高校科研項目不斷發展的背景下,要想有效對科研項目和相關數據容量體系予以分析,就要對其中含有的信息進行深度管控和整理,利用數據挖掘技術對高校科研發展結構展開全面的管理。在數據挖掘技術應用的過程中,要想保證設計體系的完整性,就要對設計依據予以標準化處理,從而建立相關關聯參數的設置體系,維護項目運維設計結構的基本質量。在設計項目開始前,要對以下幾點進行參數設置和匯總[3]。
第一,科研項目名稱,確定立項。第二,判定立項時間,并且對項目的起止時間進行有效確定。第三,確認經費,保證數據挖掘技術結構能在完整資金鏈支持下,有效發揮其實際價值,維護高校科研項目管理系統的運行水平。第四,關鍵詞,對于立項而言,關鍵詞尋找和確認十分關鍵,也是整個系統的根本參數。綜上所述,在標準化數據分析后,能有效建立科研數據收集和比對分析機制,確保整理信息和數據挖掘技術體系之間的聯動性符合高校科研管理項目數據管控技術的要求。
借助數據挖掘技術對高校科研管理系統進行整合,要保證功能模塊的完整性,從而提高整體數據處理和應用效果,也為后續建立更加系統化數據整合機制奠定堅實基礎,針對不同模塊的差異化功能,開展相應的技術管控活動[4]。
(1) 項目申報模塊。要對高校內要完成的科研項目進行申報處理,借助審核機制、評審措施以及立項管理功能等完成項目最終申報。
(2) 項目管理模塊。在申報結束后,就要對相關管理信息進行錄入和查詢,并且集中優化相關項目維護,能對項目出現的暫停、終止以及結題等予以處理,并且整合數據分析框架,確保最終的數據統計結構和項目科研經費管理結構的完整性。需要注意的是,在科研經費管理項目中,也要對科研經費的進賬數量、提取出量、支出數量和結轉數量等予以判定。
(3) 成果管理模塊。對于高校科研項目而言,最終的計量結果和數據分析結論十分關鍵,能借助數據直觀的體現出高校科研水平。因此,在成果管理模塊中,會對高校教職員工的著作、論文以及專利等項目展開深度判定。
(4) 學習交流模塊。主要是建立在學術交流基礎上,能對訪問考察、學術會議以及講學等內容進行集中匯總。
(5)系統管理模塊。主要是針對高校科研管理部門開設的相關模塊體系,要求相關部門對科研項目給予一定的支持,無論是科室管理人員還是部門管理人員,都要對系統運行結構和管控措施予以分析。另外,借助實時監控系統也能對具體問題進行及時記錄,保證系統相關參數、開關結構以及用戶權限設置的完整性。在用戶數據和系統日志方面也能發揮其維護和管理作用,確保集中審核具體問題后,積極建構完整的處理機制和控制體系[5]。
在數據挖掘算法選取的過程中,要結合高校實際要求對分析項目予以監督,并且結合NET技術服務項目和模式運行處理技術。在系統后臺建立科研和成果數據庫,采取數據設計和存儲工作機制,有效展開數據分析和整理,從而生成數據分析報告。應用關聯算法時,能建立單獨維度、單層結構以及布爾關聯體系,保證預測模型的完整性和對象值映射管理的完整性,全面完成推理和決策任務,維護數據關聯性處理和分析效果的完整性,整合深度挖掘機制,確保高校科研管理工作得以有效落實和發展。在利用關聯規則進行實務處理的過程中,也要結合支持度和置信度參數。
挖掘關聯規則中,不能對每個可能性的規則進行置信度測定,這就需要對閾值進行判定,針對有價值的信息和數據予以處理,減少浪費時間的計算過程,從根本上提高設計算法的針對性。一方面,要集中鎖定頻繁項集,并且結合項集對最下支持度閾值進行判定。另一方面,也要結合規則對發現的頻繁項集進行最下置信度閾值的提取,維護規則的完整性和實效性[6]。
總而言之,在高校科研管理系統設計過程中,要結合大數據背景,積極應用數據挖掘技術,維護關聯性應用價值和實際效果,從不同層面分析具體數據后,按照不同挖掘算法對科研數據予以系統化管理,整合后集中在固定的數據集合中,為高校日后科研項目的有序開展提供基礎數據資料和信息,保證分析數據管理的有效性,落實技術支撐價值和算法實踐管理,升級決策任務,也能集中解決信息孤島問題。
[1]朱慧爽.關聯規則在高校科研管理工作中的應用[J].濰坊學院學報,2015.
[2]劉占波,王立偉,王曉麗.大數據環境下基于數據挖掘技術的高校科研管理系統的設計[J].電子測試,2017.
[3]朱金龍.大數據環境下高校科研管理工作的思考[J].江蘇科技信息,2017.
[4]王貞,符天.基于互聯網的高校科研管理系統的構建[J]. 電腦編程技巧與維護,2016.
[5]史子靜.高校科研管理系統中計算機數據挖掘技術的運用研究[J].科技資訊,2017.
[6]楊麗莎.高校科研管理系統的設計與算法實現[D].湖南大學,2015.