李悅+孫健+邱志祺



摘 要: 通過對目前我國信息化的發展現狀及問題進行詳細分析,找到基于關聯規則的數據挖掘技術與我國各單位信息管理中的契合點,提出了基于關聯規則的數據挖掘技術系統的設計方案。該方案有助于我國各單位優化資源配置,促進領導的決策合理性,進而對于提高我國各單位的綜合實力,推動全面發展具有很強的現實意義。
關鍵詞: 數據挖掘; 信息管理系統; 關聯規則; 分類挖掘
中圖分類號: TN911?34 文獻標識碼: A 文章編號: 1004?373X(2016)23?0121?03
Application and research on data mining technology based on association rules
LI Yue1, SUN Jian2, QIU Zhiqi3
(1. Modern Technology and Education Center, North China University of Science and Technology, Tangshan 063000, China;
2. Dean′s Office, North China University of Science and Technology, Tangshan 063000, China;
3. College of Information Engineering, North China University of Science and Technology, Tangshan 063000, China)
Abstract: The information development situation in our country and its problems are analyzed in detail. The integrating point of data mining technology based on association rules and information management in China′s each unit is found out. The design scheme of data mining technology system based on association rules is proposed. This scheme is helpful to optimize the resource allocation of all units in China, promote the decision?making rationality of the leader, and has great practical significance to improve the comprehensive strength of all units in China and promote the comprehensive development.
Keywords: data mining; information management system; association rule; classification mining
0 引 言
隨著信息技術在各單位信息管理中應用的逐漸普及,信息管理系統中積累了海量的數據,本文以我國高校為例,深刻研究了高校信息管理系統,在管理信息化的條件下,對這些長期積累的海量數據進行分析和挖掘,挖掘出其中隱藏的、未知的規則和信息,將分析結果用于高校管理的分析與決策上,輔助管理者的決策,還可以為我國高校優化資源配置提供可靠的數據,節約成本,為我國高校的發展發揮著重要的作用。
1 數據挖掘的定義及技術分析
1.1 數據挖掘的定義
數據挖掘技術是一門新興學科,集眾多學科交叉融合而成的工具和技術,其中包含了數據庫技術、統計學、人工智能、信息檢索、模式識別等多種技術。數據挖掘(Data Mining)是指從海量的數據或數據庫中分析和提取出人們感興趣的知識的過程。這些數據知識是隱含的、事先未知的,將數據挖掘技術應用到高校信息管理上是非常有益的,可以全面地分析課程設置,教學過程等各方面因素的內在聯系,是一種決策支持的過程。
1.2 關聯規則分析
數據挖掘的技術方法有很多種,其中關聯規則挖掘是目前使用頻率最多,應用范圍最廣的數據挖掘技術之一。關聯規則反應了事物與其他事物之間的相互依存性和關聯性,可以通過研究分析海量數據,捕捉其中的相互關聯和重要關系,反應數據的不同規律,預測時間的發展趨勢。關聯規則是易于理解和解釋的一種技術,應用分析廣泛,是許多其他數據挖掘方法的基礎。
其中,Apriori算法是關聯規則挖掘方面很有影響力的算法,通過項目集元素數目的不斷增長來逐步完成頻繁項目集的發現,是挖掘產生布爾關聯規則所需頻繁項集的基本算法。利用Apriori算法迭代識別所有的頻繁項目集,發現計算量最大的部分,從頻繁項目集中構造置信度不低于用戶設定的最小置信度的規則。具體算法流程如圖1所示。
2 數據挖掘技術在高校管理中的應用
數據挖掘技術應用到高校管理工作中,可以通過對信息系統中的海量數據的相互之間的關系進行分析,發現其中一些潛在的聯系和客觀規律,可以對高校管理的決策支持等工作提供極大的幫助,為改進高校管理提出了指導性的建議,使得高校管理系統在高校信息化的建設中發揮更大的作用。
2.1 數據挖掘技術在教學評估中的應用
高校員工的評價結果是日常工作情況的重要表現,是高校信息管理工作的一個重要組成部分,也是目前高校進行職稱評定,績效評定的有效標準。但是影響高校員工的評價因素有很多,包括員工年齡、工作時間、政治面貌、學歷、職稱等很多方面。如何通過這些現有數據判斷哪些或者哪個因素對于高校員工考評的影響最大,可以通過關聯規則數據挖掘的Apriori算法進行數據分析,對各方面的數據進行充分挖掘,得到有價值的信息作為高校員工考評的評價依據,以達到對高校員工管理的改進的有效支持,極大地提高了高校人事管理的效率,使高校實現科學化、正規化管理。
摘 要: 通過對目前我國信息化的發展現狀及問題進行詳細分析,找到基于關聯規則的數據挖掘技術與我國各單位信息管理中的契合點,提出了基于關聯規則的數據挖掘技術系統的設計方案。該方案有助于我國各單位優化資源配置,促進領導的決策合理性,進而對于提高我國各單位的綜合實力,推動全面發展具有很強的現實意義。
關鍵詞: 數據挖掘; 信息管理系統; 關聯規則; 分類挖掘
中圖分類號: TN911?34 文獻標識碼: A 文章編號: 1004?373X(2016)23?0121?03
Application and research on data mining technology based on association rules
LI Yue1, SUN Jian2, QIU Zhiqi3
(1. Modern Technology and Education Center, North China University of Science and Technology, Tangshan 063000, China;
2. Dean′s Office, North China University of Science and Technology, Tangshan 063000, China;
3. College of Information Engineering, North China University of Science and Technology, Tangshan 063000, China)
Abstract: The information development situation in our country and its problems are analyzed in detail. The integrating point of data mining technology based on association rules and information management in China′s each unit is found out. The design scheme of data mining technology system based on association rules is proposed. This scheme is helpful to optimize the resource allocation of all units in China, promote the decision?making rationality of the leader, and has great practical significance to improve the comprehensive strength of all units in China and promote the comprehensive development.
Keywords: data mining; information management system; association rule; classification mining
0 引 言
隨著信息技術在各單位信息管理中應用的逐漸普及,信息管理系統中積累了海量的數據,本文以我國高校為例,深刻研究了高校信息管理系統,在管理信息化的條件下,對這些長期積累的海量數據進行分析和挖掘,挖掘出其中隱藏的、未知的規則和信息,將分析結果用于高校管理的分析與決策上,輔助管理者的決策,還可以為我國高校優化資源配置提供可靠的數據,節約成本,為我國高校的發展發揮著重要的作用。
1 數據挖掘的定義及技術分析
1.1 數據挖掘的定義
數據挖掘技術是一門新興學科,集眾多學科交叉融合而成的工具和技術,其中包含了數據庫技術、統計學、人工智能、信息檢索、模式識別等多種技術。數據挖掘(Data Mining)是指從海量的數據或數據庫中分析和提取出人們感興趣的知識的過程。這些數據知識是隱含的、事先未知的,將數據挖掘技術應用到高校信息管理上是非常有益的,可以全面地分析課程設置,教學過程等各方面因素的內在聯系,是一種決策支持的過程。
1.2 關聯規則分析
數據挖掘的技術方法有很多種,其中關聯規則挖掘是目前使用頻率最多,應用范圍最廣的數據挖掘技術之一。關聯規則反應了事物與其他事物之間的相互依存性和關聯性,可以通過研究分析海量數據,捕捉其中的相互關聯和重要關系,反應數據的不同規律,預測時間的發展趨勢。關聯規則是易于理解和解釋的一種技術,應用分析廣泛,是許多其他數據挖掘方法的基礎。
其中,Apriori算法是關聯規則挖掘方面很有影響力的算法,通過項目集元素數目的不斷增長來逐步完成頻繁項目集的發現,是挖掘產生布爾關聯規則所需頻繁項集的基本算法。利用Apriori算法迭代識別所有的頻繁項目集,發現計算量最大的部分,從頻繁項目集中構造置信度不低于用戶設定的最小置信度的規則。具體算法流程如圖1所示。
2 數據挖掘技術在高校管理中的應用
數據挖掘技術應用到高校管理工作中,可以通過對信息系統中的海量數據的相互之間的關系進行分析,發現其中一些潛在的聯系和客觀規律,可以對高校管理的決策支持等工作提供極大的幫助,為改進高校管理提出了指導性的建議,使得高校管理系統在高校信息化的建設中發揮更大的作用。
2.1 數據挖掘技術在教學評估中的應用
高校員工的評價結果是日常工作情況的重要表現,是高校信息管理工作的一個重要組成部分,也是目前高校進行職稱評定,績效評定的有效標準。但是影響高校員工的評價因素有很多,包括員工年齡、工作時間、政治面貌、學歷、職稱等很多方面。如何通過這些現有數據判斷哪些或者哪個因素對于高校員工考評的影響最大,可以通過關聯規則數據挖掘的Apriori算法進行數據分析,對各方面的數據進行充分挖掘,得到有價值的信息作為高校員工考評的評價依據,以達到對高校員工管理的改進的有效支持,極大地提高了高校人事管理的效率,使高校實現科學化、正規化管理。
IF期末成績等級=B,AND平時成績等級=C,THEN是否優秀=N;
從上面的生成規則可以看出:期末考試成績等級為A,且平時成績等級為B以上者,成績為優秀。
(4) 生成分類規則
通過對學生成績進行數據挖掘,找出影響學生成績的主要因素以及之間的關系,為教學管理部門提供高校教學中學生的知識、技能、能力之間的關系,以明確今后學生學習的重點和難點。
2.3 數據挖掘技術在高校課程設置中的應用
目前,高校學生的課程安排是相互聯系的,是循序漸進的。在學習專業課前,要將先開設的課程學好,才能繼續下面課程的學習。如果先開設的課程沒有學好,就會影響后面課程的學習。另外,由于授課教師,班級學生的總體成績等因素,學生的成績有時會相差很大。教務管理人員和任課教師可以利用關聯規則對課程數據進行挖掘分析,發現數據中隱藏的前期課程和后期課程的相互關聯,為今后課程進程的開展提供重要的決策和理論支持。
可以通過查找存在于項目集合或者對象集合之間的頻繁模式,查到相關性或者因果結構,是當前數據挖掘研究的主要模式之一,確定數據中不同領域之間的聯系,利用關聯規則分析課程安排的不同順序與學生最終取得考試成績之間的關聯關系,從而得出教學計劃中的課程安排的順序與學生的考試成績之間的關系,得出教學計劃中課程之間的關系,進而合理設置專業課程。
3 結 語
如今,數據挖掘技術在高校信息管理領域中的應用日益廣泛,也已經取得了一定的成績。但是,還存在著一些不足,需要進一步的完善。主要包括以下方面的研究:首先,挖掘工具要更標準,使用更便捷。目前,挖掘工具都是針對某一具體的高校信息系統,而沒有統一規范化的適用于所有系統的工具。這種情況不便于使用者更好更快地掌握,給推廣挖掘工具的工作帶來了困難。其次,挖掘工具操作復雜,只有從事信息工作方面的人員才能使用自如,對于廣大普通管理者和從事信息管理的管理者來說掌握起來需要花費很長的時間。所以,研究一種簡單、友好、方便快捷,并且通用的挖掘工具是目前高校信息處理工作的研究重點。
參考文獻
[1] 朱鐵櫻,駱爽.數據挖掘技術在高校管理決策中的應用[J].計算機時代,2015(3):39?43.
[2] 朱麗麗.基于數據挖掘技術的高校教務管理的應用與研究[J].數字技術與應用,2014(31):239?240.
[3] 江敏,徐艷.數據挖掘技術在高校教學管理中的應用[J].電腦知識與技術,2012(24):541?545.
[4] 呂慎敏.基于數據挖掘的高校教學管理決策支持系統研究[D].濟南:山東師范大學,2012.
[5] 楊恩震.淺論計算機技術在教學管理中的運用[J].湖北函授大學學報,2012,25(2):28?29.
[6] 高曉佳.數據挖掘在教育信息化中的應用研究[J].電腦知識與技術,2012,8(5):1199?1200.
[7] 孫中祥,彭湘君,楊玉平,等.數據挖掘在教育教學中的應用綜述[J].智能計算機與應用,2012,2(1):78?81.
[8] 張海燕,李娟.B/S 架構的高校教學管理系統研究與開發[J].農業網絡信息,2012(1):109?111.