李松濤
摘 要:隨著高職生教育不斷地發展擴大,如何提高職學生能力發展定位已經成為社會的一個熱點話題。學生的能力定位和規劃決定著學生的未來和發展,但現如今學生能力分析不能很完全的提供有效信息,本文通過總結歸納數據挖掘的相關技術,探索數據挖掘技術如何應用于高職生能力發展定位與預測。
關鍵詞:數據挖掘 高職生 能力發展定位
中圖分類號:G641 文獻標識碼:A 文章編號:1672-3791(2014)02(c)-0183-01
1 數據挖掘的內涵
廣義上說的數據挖掘是從大量的、不完全的、有噪聲的、模糊的、隨機的原始數據中,提取隱含在其中的、人們事先不知道的、但又是潛在有用、可信新穎的信息和知識的過程。即數據挖掘從數據庫的相關數據集合中抽取有價值的知識、規則或深層次的信息。狹義上的數據挖掘是一個利用各種分析工具在海量數據中發現模型和數據之間關系的過程,是知識發現過程中的一個關鍵步驟。數據挖掘是一門廣義的交叉學科,它的發展和應用涉及到不同的領域,尤其是數據庫、人工智能、數理統計、可視化、并行計算等。數據挖掘的使用極大地提高了信息的利用率,使用有效信息更高效,為社會與人類的發展提供了方便的實用工具。
2 應用于學生能力信息的數據挖掘技術方法
根據不同的問題及數據類型,存在相對應的數據挖掘技術方法,方法如下。
第一,分類與預測:分類是根據問題情況事先分好類別,利用某個分類器一一劃分數據庫中的數據對象,并分配到相對應的類別中。分類方法在學習過程中提供了指導性作用。預測是為了預測未知類別的數據對象,通過之前學習歸納的方法模型預測未知數據對象。其中分類模型可應用于預測。
操作步驟為:(1)構造對數據進行分類的分類器。例如運動員體能數據庫中,根據學體能測試成績,將運動員的成績分類為:優、良、可、差四個等級。(2)精確分析分類規則,即是通過總結分析運動員成績數據,對成績分類等級做出更加具體的分類規則描述,如“體能測試科目總分高于85分的運動員分為等級優”。(3)最后是利用制定完備的分類規則來分析數據庫中的相應數據。
第二,聚類:聚類是將數據全部輸入數據庫中,然后對數據進行分析,其方法步驟正好與分類是相反的。其內容是根據數據的相似性,相似度高的劃分到同一組。聚類是一種無指導性的學習過程,也可以說聚類與分類是一個互逆的過程。
第三,決策樹:主要應用原理是利用概率論分析事例的概率數,在此基礎上劃分數據到不同的類別,并以樹的分支形式表示。根據數據的分類情況也可以預測數據的發展趨勢,這是這種方法的一個優點,優點還有數據表達直觀,并且應用便捷快速,易于理解,但是不適合于復雜量大的數據,由于分支太多會埋沒了優點,不利于使用。
第四,遺傳算法:這種方法適用于結算最優數據,其內容是利用概率計算,直接計算出最有數據結果的方法。遺傳算法模擬了自然界優勝劣汰、適者生存的自然進化規則,生成的用于數據選擇的隨機搜索算法。其優點是在對數據進行操作過程中,不需要制定規則,直接用于數據對象,直接快捷的得倒最優化搜索。缺點是應用比較單一化,可以配合其他方法使用。
3 數據挖掘技術應用于高職學生職業能力發展定位
如何開發優質課程,提高課程對就業和能力這兩個要素的針對性;如何提出以“提高學生能力”為教學本位的教育方案,是目前各大職業院校所面對的重要問題。要想歸納出教育教學方案中所必不可少的、課程中應該重點傳授的知識點和能力培養方向,就需要對學生們的招生信息、在校表現情況和就業信息等等的相關信息進行挖掘,從而獲得對校方來說了解學生的有用信息,并把這些信息同企業對學生需求的信息結合起來。
高校儲存著大量學生數據,包括教育信息和就業信息。教育信息同樣分為兩部分,一部分是教學直接相關的,如學業成績、學績點、獲獎情況等等;一另部分則是與非智力因素有關,包括學生的性別、身體狀況、心理健康情況等等。就業信息、顧名思義,可能包括學生就業所在的企業地域、企業性質、所處職位、行業、薪資待遇等。近年來,信息化應用與存儲規范化的推進使得高校的學生個人信息庫越來越豐富。但與信息高度豐富不同的是,這些數據和信息都沒有被充分利用。高校在制定學生們的培養計劃時很少注意到這類信息,這些寶貴并且具有指導性的信息被遺忘了。但培養計劃的制定者如果整合學生信息并從中總結出規律,那么這種規律能很好的啟發教育者應該重視培養學生的哪種方面素養。本課題就是從這個角度出發,總和并研究學生信息和最終就業的信息,挖掘出其中包含的規律,為培養計劃的制定和設計提供相關的理論支持。數年以來,高職院校在其教學和管理工作,積累了大量的學生信息數據,這些信息已具備了形成一個信息庫的基本條件。而目前需要做的,是將這些數據庫進行開發,通過對這些教學信息進行有針對性和關聯性的分析和挖掘,總結出課程的效果與其他因素的關聯,為培養計劃的決策者支持信息,以便教學工作能更有計劃和效果的進行,課程安排能更加合理的開展,教學質量進一步提高,學生相關能力也進一步提升。
4 結語
將學生的個人信息,包括教育信息和就業信息等挖掘出來,整合成對校方設計培養學生、了解學生的有用信息,并把這些信息用于在分析企業對學生能力的需求上,從而進一步歸納出課程設計和能力培養的側重點。把新興的數據挖掘技術應用到學生管理工作中,這在大力提倡科教興國的今天,對于提高教學質量,培養全方位人才無疑具有十分重大的現實意義。
參考文獻
[1] 安淑芝.數據倉庫與數據挖掘[M].清華大學出版社,2005.
[2] 于立紅,張建偉.基于數據挖掘的高職生成績分析與預測[J].鄭州輕工業學院學報:自然科學版,2006(3):77-79.
[3] 慕春棣,戴劍彬,葉俊,等.用于數據挖掘的貝葉斯網絡[J].軟件學報,2000(11):660-666.endprint