肖鵬飛 謝英 劉秀蘭



摘要:利用歷史大數(shù)據(jù),通過數(shù)據(jù)挖掘技術(shù)發(fā)現(xiàn)教改課題與科研項目研究過程中的規(guī)律,在教改課題與科研項目管理中,應(yīng)用數(shù)據(jù)挖掘技術(shù)實現(xiàn)對歷史數(shù)據(jù)價值的提煉與分析,為教改課題與科研項目的申報條件設(shè)計提供參考,能實時掌握研究人員在每年度項目課題研究中的情況,與預(yù)期進行對比分析,及時捕捉到項目課題在研究過程中的異常,及時采取相關(guān)措施改善項目課題研究。通過前端圖形化的直觀展示,為教改課題與科研項目管理決策提供數(shù)據(jù)支持,多維度分析研究整體與個體情況,提供實時的數(shù)據(jù)支持服務(wù),實現(xiàn)服務(wù)型教改課題與科研項目研究管理的目標。
關(guān)鍵詞:數(shù)據(jù)挖掘;科研項目管理;教學改革
引言
醫(yī)學高等院校及附屬醫(yī)療機構(gòu)每年在教學改革課題管理與科研項目管理的過程中累積了海量的教改與科研項目的相關(guān)歷史數(shù)據(jù),在一定時間周期內(nèi)必須進行數(shù)據(jù)分割備份,以保證系統(tǒng)的運行效率,這些備份的數(shù)據(jù)僅提供簡單的查詢備份所用,各部門只能從一個個信息孤島中進行人工關(guān)聯(lián)提出有用信息,費時費力,計算也并不一定科學。數(shù)據(jù)挖掘技術(shù)更多是從實際的數(shù)據(jù)出發(fā),利用機器學習中頻繁模式、分類和聚類的技術(shù)來分析、挖掘、預(yù)測一些對實際有用的結(jié)果。近年來高校及附屬醫(yī)院及醫(yī)療機構(gòu)紛紛建設(shè)了各具特色的大數(shù)據(jù)平臺系統(tǒng),有效地利用這些數(shù)據(jù)也是教改的一個重要研究內(nèi)容,這些課題的數(shù)據(jù)通過數(shù)據(jù)挖掘技術(shù)和方法[1],能充分、快捷、準確地實現(xiàn)信息化的科研管理方式。
1. 教改課題管理系統(tǒng)的現(xiàn)狀
各高校及各大附屬醫(yī)療機構(gòu)的教改課題與科研項目管理單位一般由教務(wù)科與科研科進行共同管理,主要存在以下幾個問題[2]。
1.1 管理數(shù)據(jù)來源廣泛,審核過程冗繁
目前的教改課題與科研項目管理一般采用研究人員填報、各級部門和教務(wù)科研科聯(lián)合審核的方式進行,數(shù)據(jù)填報和審核量大,申報的需要審核的相關(guān)數(shù)據(jù)基本包含了申報團隊的基本信息、申報書、提供的評審材料、相關(guān)的財務(wù)支撐數(shù)據(jù)等,各部門審核過程相對冗長煩瑣。
1.2 容易形成數(shù)據(jù)孤島
高校及各大附屬醫(yī)療機構(gòu)的教改課題管理系統(tǒng)與各職能部門的信息系統(tǒng)相互獨立運行,相關(guān)數(shù)據(jù)無法集成,形成了大量的數(shù)據(jù)孤島。多年的教改與科研項目周期,積累了大量的教改課題與科研項目管理的歷史研究數(shù)據(jù),并沒有開展進一步的挖掘和分析,只是進行了簡單導(dǎo)出導(dǎo)入的再次分析功能,統(tǒng)計結(jié)構(gòu)簡單。對歷史數(shù)據(jù)的挖掘主要內(nèi)容是課題研究相關(guān)的頻次,如重點項目與課題的參與率、不同職稱和不同學歷的參與率、項目課題的延續(xù)性等,通過趨勢圖、分布圖來挖掘分析形成各類報表則很難實現(xiàn)。
1.3 重結(jié)題管理,輕研究服務(wù)指導(dǎo)
教改課題與科研項目管理由于技術(shù)與人力的短缺,主要是以結(jié)題管理為主,輕個性化的研究指導(dǎo)服務(wù)。相關(guān)研究人員除了關(guān)心本人的課題與項目申報及結(jié)題,更希望了解和學習教改課題申報書的撰寫方法和課題的研究方法,并能提供相關(guān)專業(yè)研究人員的專項培訓,從而提高教改課題與科研項目的申報和研究水平。
2. 數(shù)據(jù)挖掘技術(shù)的應(yīng)用
數(shù)據(jù)挖掘(data mining,DM)是一門新興的、匯聚多個學科的交叉性學科,這是一個很了不起的處理過程,即從龐大的數(shù)據(jù)中,將未知、隱含及具備潛在價值的信息進行提取的過程。數(shù)據(jù)挖掘?qū)⒏咝阅苡嬎恪C器學習、人工智能、模式識別、統(tǒng)計學、數(shù)據(jù)可視化、數(shù)據(jù)庫技術(shù)和專家系統(tǒng)等多個范疇的理論和技術(shù)融合在一起。數(shù)據(jù)挖掘技術(shù)在教改科研課題管理中的應(yīng)用研究,流程圖如圖1所示。
3. 數(shù)據(jù)挖掘技術(shù)在科研項目管理中的需求分析與設(shè)計
3.1 科研項目管理包括縱向課題、橫向課題、專項任務(wù)的管理
縱向課題的管理包括課題申報、課題立項、課題評審、課題變更、課題中檢、課題結(jié)題等內(nèi)容;橫向課題和專項任務(wù)包括合同評審、階段評審、驗收等內(nèi)容[3]。
科研成果包括論文成果、著作成果、專利成果、音像軟件的鑒定、申報以及推廣應(yīng)用;科研檔案管理包括電子檔案管理和紙質(zhì)檔案管理;科研經(jīng)費管理是科研管理中的重要工作,分為縱向經(jīng)費管理和橫向經(jīng)費管理,包括合同經(jīng)費、配套經(jīng)費、經(jīng)費預(yù)算、經(jīng)費到賬、經(jīng)費報銷等管理;科研設(shè)備管理部分主要分為設(shè)備采購、設(shè)備日常管理、計量設(shè)備管理、倉庫出入庫管理、涉密設(shè)備管理;網(wǎng)絡(luò)評審管理是基于局域網(wǎng)實現(xiàn)項目基本信息管理、網(wǎng)絡(luò)評審、網(wǎng)絡(luò)審批、網(wǎng)上公文傳遞等功能。
3.2 應(yīng)用大數(shù)據(jù)的挖掘技術(shù)
應(yīng)用大數(shù)據(jù)的挖掘技術(shù),可以實現(xiàn)對各類科研項目課題研究的歷史數(shù)據(jù)進行價值挖掘,通過前端圖形化展示使各類科研項目課題研究的特點更加直觀,通過多維的數(shù)據(jù)挖掘評價維度,展示項目承擔者的學術(shù)能力水平與發(fā)展?jié)摿Γ梢詮牟煌嵌确治霭ń谈恼n題研究在內(nèi)的整體與個體情況。充分利用歷史數(shù)據(jù)構(gòu)建數(shù)據(jù)倉庫,通過數(shù)據(jù)挖掘技術(shù)發(fā)現(xiàn)教改課題與科研項目研究過程中的規(guī)律,開展不同維度上的課題研究數(shù)據(jù)分析,實現(xiàn)對每個課題的深度分析,展現(xiàn)課題研究的趨勢信息和預(yù)警信息。利用大數(shù)據(jù)高性能計算的優(yōu)勢,展示課題研究的實時數(shù)據(jù),為有針對性的教改課題研究指導(dǎo)提供依據(jù),并且能夠及時發(fā)現(xiàn)教改課題研究在各項指標上的異常,通過趨勢圖、統(tǒng)計圖等,可以使教務(wù)科研管理部門及時捕捉到教學改革課題與科研項目研究過程中的異常,并及時采取相關(guān)改進措施。
3.2.1 成立信息技術(shù)與大數(shù)據(jù)數(shù)據(jù)處理團隊
根據(jù)需要,成立專門的信息技術(shù)與大數(shù)據(jù)數(shù)據(jù)分析專家團隊。歷史大數(shù)據(jù)倉庫的構(gòu)建受到軟硬件、專業(yè)技術(shù)人員能力等客觀因素的影響,成立專門的信息技術(shù)與大數(shù)據(jù)的數(shù)據(jù)分析專家團隊,保障歷史大數(shù)據(jù)的數(shù)據(jù)倉庫設(shè)計具有完整與正確可靠的設(shè)計,保障決策數(shù)據(jù)來源與數(shù)據(jù)倉庫模型的準確性。
3.2.2 大數(shù)據(jù)處理過程
歷史大數(shù)據(jù)倉庫的數(shù)據(jù)抽取、清洗與分析設(shè)計。大數(shù)據(jù)主要來源于教改課題與科研項目管理系統(tǒng)、人事管理系統(tǒng)、研究人員發(fā)展評價管理系統(tǒng)、財務(wù)系統(tǒng)等,數(shù)據(jù)在進入數(shù)據(jù)倉庫前需要進行抽取、清洗去除無效數(shù)據(jù),保證基礎(chǔ)數(shù)據(jù)準確進入數(shù)據(jù)倉庫,根據(jù)專家組、教務(wù)科研科、研究人員等角色的需求分析設(shè)計各類維度表與指標KPI的度量值,實現(xiàn)將數(shù)據(jù)轉(zhuǎn)化為知識,為決策服務(wù)的目的。
3.2.3 圖形化展示結(jié)果
研究數(shù)據(jù)結(jié)果的直觀圖形化展示。數(shù)據(jù)挖掘分析結(jié)果的前端圖形化展示,使教改課題與科研項目研究中的特點更加直觀,為管理決策提供直接的數(shù)據(jù)支持。通過趨勢圖、統(tǒng)計圖、直方圖、百分比圖等使管理者能及時捕捉到研究過程中的變化,及時采取相關(guān)應(yīng)對措施。
3.3 大數(shù)據(jù)挖掘的實現(xiàn)過程
系統(tǒng)在醫(yī)院內(nèi)部網(wǎng)絡(luò)環(huán)境下運行,技術(shù)路線圖如圖2所示。
4. 數(shù)據(jù)挖掘技術(shù)在教改科研課題管理中的應(yīng)用研究
(1)利用相關(guān)的教改與科研課題項目及相關(guān)財務(wù)、人事、研究人員發(fā)展評價系統(tǒng)等的歷史大數(shù)據(jù)構(gòu)建數(shù)據(jù)倉庫,確定管理數(shù)據(jù)倉庫的主題包括課題申報、課題評審、研究進度、研究成果等,進一步設(shè)計教改課題研究分析維度和粒度,建立數(shù)據(jù)倉庫的模型。通過數(shù)據(jù)挖掘技術(shù)發(fā)現(xiàn)課題與項目中研究過程的規(guī)律,完善教改課題的結(jié)題指標和相關(guān)立項政策的制定。
(2)進入數(shù)據(jù)倉庫的數(shù)據(jù)必須進行抽取、清洗與加載,去除無效的數(shù)據(jù),確保數(shù)據(jù)的完整性、正確性和可靠性。通過清洗的數(shù)據(jù)如指南方向、負責人、研究成果、參與人、年度等相關(guān)數(shù)據(jù)進入大數(shù)據(jù)中心,這些數(shù)據(jù)通過后續(xù)的數(shù)據(jù)挖掘可以得出每個課題的按期結(jié)題概率分析,經(jīng)費使用合理性分析,整體研究進展趨勢信息情況、整體經(jīng)費使用情況、研究成果推廣情況等的預(yù)警與指導(dǎo)。
(3)數(shù)據(jù)挖掘技術(shù)的設(shè)計主要采用神經(jīng)網(wǎng)絡(luò)與決策樹等相關(guān)人工智能算法。決策樹(decision tree,DT)分類算法是一種以決策樹形式表示的分類規(guī)則,能夠根據(jù)一定的規(guī)則將眾多的數(shù)據(jù)分類,從中挖掘出有價值的、潛在的信息,適合分類及處理預(yù)測模型的任務(wù),結(jié)論易于解釋和理解。神經(jīng)網(wǎng)絡(luò)系統(tǒng)具有高度的抗干擾能力,所以,在各個領(lǐng)域內(nèi)神經(jīng)網(wǎng)絡(luò)算法應(yīng)用廣泛,基于關(guān)聯(lián)規(guī)則分析的分類算法搜索頻繁模式與類標號之間的強關(guān)聯(lián),有效避免了決策樹歸納一次只考慮一個屬性的限制,使其比一些傳統(tǒng)的分類算法更為準確。通過對教改課題與科研項目數(shù)據(jù)進行分析,達到趨勢分析、預(yù)測偏差預(yù)警,來發(fā)現(xiàn)影響教改課題研究的因素和影響機制,實現(xiàn)將數(shù)據(jù)轉(zhuǎn)化為知識,為決策服務(wù)的目的[4]。
通過前面對系統(tǒng)業(yè)務(wù)流程的分析及功能模塊的描述說明,可將科研業(yè)務(wù)管理系統(tǒng)中實體對象如教師職工、課題、論文、校本教材等實體數(shù)據(jù)集開發(fā)系統(tǒng)整體的功能圖,如圖3所示。
5. 數(shù)據(jù)挖掘技術(shù)在教改科研課題中的研究應(yīng)用效果評價
(1)為教改科研項目課題申報管理提供依據(jù),通過數(shù)據(jù)挖掘技術(shù)掌握項目課題研究與教師職稱、專業(yè)、研究方向、研究成果之間的關(guān)聯(lián)關(guān)系,有針對性地為課題管理提供專業(yè)研究學習,同時為申報條件設(shè)計提供參考。
(2)為教改科研項目課題研究提供參考,研究人員可以實時掌握自身在年度課題研究中的位置,掌握本人相關(guān)評價指標在研究進度、研究成果等不同維度上與其他課題組比較存在的優(yōu)勢和不足,為研究人員改善課題研究情況提供依據(jù)。
(3)通過大數(shù)據(jù)的數(shù)據(jù)挖掘技術(shù)可以對教改科研課題研究的進展與預(yù)期進行對比分析,及時發(fā)現(xiàn)此研究在各項指標上的異常,通過趨勢圖、統(tǒng)計圖、百分比圖等使教務(wù)科研管理部門及時捕捉到教學改革課題與科研項目在研究過程中的異常,有利于及時采取相關(guān)應(yīng)對措施。
結(jié)語
在科研管理信息化中充分利用歷史數(shù)據(jù)構(gòu)建數(shù)據(jù)倉庫,通過數(shù)據(jù)挖掘技術(shù)發(fā)現(xiàn)教改課題與科研項目研究過程中的規(guī)律,開展不同維度上的課題研究數(shù)據(jù)分析,實現(xiàn)對每個課題的深度分析,展現(xiàn)課題研究的趨勢信息和預(yù)警信息利用大數(shù)據(jù)高性能計算的優(yōu)勢[5],展示課題研究的實時數(shù)據(jù),為有針對性的教改課題研究指導(dǎo)提供依據(jù),為科研項目課題的管理決策者提供數(shù)據(jù)支持,并及時采取相關(guān)改進措施。
參考文獻:
[1]戴麗娟.大數(shù)據(jù)技術(shù)在高校教育中的應(yīng)用探討[J].信息與電腦(理論版),2019, (15):39-240.
[2]吳學會,李佳恒,叢慧源,等.大數(shù)據(jù)技術(shù)在中醫(yī)高校教改課題管理中的應(yīng)用研究[J].中國中醫(yī)藥現(xiàn)代遠程教育,2019, 17(7):146-148.
[3]胡曉林,劉劼,葛宏,等.信息化在科研管理中的應(yīng)用及發(fā)展[J].技術(shù)與創(chuàng)新管理,2014,35(1):17-20.
[4]谷建英.基于.NET的科研管理系統(tǒng)的設(shè)計與實現(xiàn)[D].石家莊:河北科技大學,2013.
[5]彭靜,李秀瀅.數(shù)據(jù)挖掘技術(shù)在教務(wù)管理系統(tǒng)中的應(yīng)用[J].信息系統(tǒng)工程,2021,(4):44-46.
作者簡介:肖鵬飛,碩士研究生,高級工程師,研究方向:計算機應(yīng)用技術(shù)、智能大數(shù)據(jù)、圖形圖像處理。
基金項目:湖南中醫(yī)藥大學教學改革項目(編號:2019-JG056)。