
摘 要本文分析傳統科技項目評審專家遴選過程存在不足等問題,提出了利用數據挖掘技術的聚類、關聯、推薦等方法來輔助系統,實現科技項目評審的客觀、公正、公平、公開為目的。系統主要圍繞“政策-項目-專家-評估”全過程的模式,一方面提高了系統的科學性,另一方面降低了科技管理人員的工作難度。未來系統的模型研究將通過程序實現,應用到科技服務平臺系統。
【關鍵詞】遴選系統 數據挖掘 智能推薦
1 科技項目評審系統的研究背景及意義
1.1 研究背景
隨著科學技術的持續發展和社會的不斷進步, 各類科學技術研究項目的申報數量也越來越多,某省科技計劃項目的申報書從2007年的7344項,上升到2013年的13477項。 科技項目公平評審是科技計劃管理工作的重要環節之一,如何實現科技項目評審的客觀、公正、公平、公開,對于這些項目評審的主體——評審專家的遴選及其評審行為的科學性就顯得尤為重要。既要適應眾多科技申報項目又要保證公平評審是目前科技管理部門遇到的管理難點。
傳統的科技項目評審體系無法滿足當前科技評審的需求,主要表現在:項目評審體系制度陳舊、科技評審項目的數量多、時間短、專家遴選的不科學性、系統無法識別評審專家與評審項目之間的關系等現象。這些現象嚴重影響了政府管理科技工作的健康、可持續發展。
1.2 系統研究的意義
(1)大力促進政府管理科技工作的健康可持續發展;
(2)保障科技項目評審專家的遴選工作的客觀、公正、公平、公開;
(3)節省評審專家遴選環節的人力物力,為公平評審提供快速指引;
(4)以公平手段促使科技人員積極申報有價值的課題,為國家的政治、經濟、科技、社會發展提供更好的理論和技術支撐。
2 專家遴選系統的方案設計
2.1 平臺環境的總體情況
本項目的主要運行環境如下:
(1)操作系統:Windows Server 2012;
(2)編譯語言:Java7.0;
(3)Web服務器:Tomcat7.0;
(4)數據庫:MySQL5.5;
(5)數據挖掘工具:Mahout 開源工具。-
2.2 模型過程的描述
2.2.1 基礎數據
(1)科技項目基礎信息:包括科技項目的名稱、關鍵字、專項資金類別、申報單位、項目成員、內容摘要……等信息;
(2)專家基礎信息:姓名、職稱、職務、所屬領域、所在單位、身份證號碼、畢業學校、畢業專業、研究項目……等信息;
(3)項目評審全過程日志信息:評審開始時間、評審結束時間、子項評審時長
(4)項目評審得分明細表:子項評審開始時間、子項評審結束時間、子項得分情況
(5)科技項目政策權重信息:重點支持領域、支持區域、支持數量、支持資金、支持人員……等信息。
2.2.2 挖掘模型
(1)專家信息知識表示圖:提取專家的畢業專業、研究項目和從事領域,結合專業領域知識庫,通過聚類算法架構出專家信息知識表示圖。
(2)申報項目信息知識表示圖:提取項目申報名稱、關鍵字、內容摘要等信息,結合專業領域知識庫,通過知識發現算法架構出申報項目信息知識表示圖。
(3)項目-專家信息知識關聯圖:提取項目名稱、關鍵字、摘要結合專家的畢業專業、研究項目和從事領域等信息,通過關聯規則和相似度計算算法架構出政策權重圖。
(4)專家-申報人科技社交網絡圖:提取科技專家信息知識表示圖,對評審專家及申報項目成員進行關聯規則算法挖掘,深度構建專家-申報人科技社交網絡圖。
(5)項目評審全過程日志-得分評價圖:提取項目評審日志,結合得分明細表和專家-申報人科技社交網絡圖,通過異常評分補償修正算法得出評價模型。
2.2.3 管理過程
(1)獲取項目信息功能:從系統中獲取本次需要評審的項目,項目按照領域方向分類。
(2)智能推薦專家功能:基于專家信息知識表示圖、申報項目信息知識表示圖、專家-申報人科技社交網絡圖、項目-專家信息知識關聯圖,通過內容推薦算法和關聯規則算法,推薦相應的專業領域專家評審項目。
(3)專家評審質量評價庫功能:基于項目評審全過程日志-得分評價圖、專家信息知識表示圖、專家-申報人科技社交網絡圖,實時登記評審評價結果,把評價的結果存入數據庫,為以后的項目評審專家遴選提供數據參考。
2.3 模型總體設計圖
本項目在傳統的評審專家遴選系統基礎上,利用新興的數據挖掘算法關鍵技術,結合科技評審管理方法,提出了基于數據挖掘技術的科技項目評審專家遴選系統。它包括基礎數據、數據存儲、挖掘模型、管理過程四個階段,如圖1所示。形成了“政策—項目—專家—評估”全過程的智能化專家評審遴選體系。
3 總結
本文提出了數據挖掘技術在科技項目評審專家遴選系統中的應用模型,通過分析科技評審項目全過程的需求分析,融合了眾多數據挖掘的算法,提煉并整合出適合系統的算法模型。模型重點四個環節:基礎數據層搭建了數據的基本機構;數據存儲是基于HDFS的大數據云存儲;挖掘模型把專家、申報人、項目之間的關聯起來;管理過程最終給出智能處理的結果供系統管理參考。在今后的工作中,將算法模型通過程序實現出來,在實際項目中應用,多方位測試,保證項目符合管理者的要求。
參考文獻
[1]陳平華,陳傳瑜,洪英漢.一種結合關聯規則的協同過濾推薦算法[J].小型微型計算機系統,2016(02).
[2]黃敏.科技項目專家推薦系統研究[D].浙江:杭州電子科技大學,2012.
作者簡介
洪英漢(1984-),男,廣東省潮州市人。碩士研究生學歷。現供職于韓山師范學院。研究方向為云計算、因果關系發現、推薦系統。
作者單位
韓山師范學院 廣東省潮州市 521041