薛瑞峰,彭墩陸
(1.上海金融學院,上海 201209;2.上海理工大學,上海 200000)
隨著擴招政策的延伸,高校的畢業(yè)生每年都在大量增加,就業(yè)形勢也變得十分嚴峻,鑒于此種形勢,高校的畢業(yè)生職業(yè)指導工作引入了數(shù)據(jù)挖掘技術(shù),旨在對畢業(yè)生就業(yè)數(shù)據(jù)信息進行分析比對,構(gòu)建高校職業(yè)指導服務(wù)體系,指導學生盡快實現(xiàn)就業(yè)。
(1)數(shù)據(jù)挖掘技術(shù)概況。數(shù)據(jù)信息管理系統(tǒng)的應用,為用戶節(jié)省了大量的時間,提高了數(shù)據(jù)信息的管理效率。數(shù)據(jù)挖掘技術(shù)是基于數(shù)據(jù)信息管理系統(tǒng)產(chǎn)生的新式的數(shù)據(jù)管理方式,最早起源于早期數(shù)據(jù)信息管理系統(tǒng)中。目前我國的數(shù)據(jù)信息管理系統(tǒng)也進入了大范圍的使用階段,如何對數(shù)據(jù)實現(xiàn)有效利用成為了一個課題。當前高校的數(shù)據(jù)信息管理系統(tǒng)趨于完善,對信息實行了分類歸檔的作法,由此也產(chǎn)生了冗余信息。對于數(shù)據(jù)信息的高速膨脹,必須采取新方法進行管理。數(shù)據(jù)挖掘技術(shù)就是在這種形勢下誕生的。數(shù)據(jù)挖掘技術(shù)的優(yōu)勢在于能夠從數(shù)據(jù)信息管理系統(tǒng)的數(shù)據(jù)庫中抽取有價值信息,并將這些有規(guī)律的信息歸納整理,對原有的數(shù)據(jù)庫中的數(shù)據(jù)重新進行分析比對和挖掘,將有益的信息挖掘出來。數(shù)據(jù)挖掘技術(shù)屬于對數(shù)據(jù)信息的二次加工,滿足了用戶數(shù)據(jù)管理的需要,使數(shù)據(jù)庫中的冗余數(shù)據(jù)繼續(xù)發(fā)揮作用,實現(xiàn)對數(shù)據(jù)庫信息的全面利用。
(2)數(shù)據(jù)挖掘技術(shù)的概念。數(shù)據(jù)挖掘技術(shù)是基于數(shù)據(jù)庫的一種信息管理新技術(shù),是數(shù)據(jù)庫信息管理中開發(fā)的一個新方式。數(shù)據(jù)挖掘技術(shù)是一個綜合的技術(shù),采用了數(shù)據(jù)庫管理技術(shù)、數(shù)理統(tǒng)計技術(shù)、數(shù)學應用技術(shù)等等,是多個技術(shù)的融合和歸納。數(shù)據(jù)挖掘技術(shù)從發(fā)明以來,已經(jīng)在實際數(shù)據(jù)管理中運用了十幾年的時間。數(shù)據(jù)挖掘技術(shù)有效的吸取了相關(guān)學科的優(yōu)點,集多個學科的優(yōu)點于一身,逐漸形成了與眾不同的具有自己特色的數(shù)據(jù)管理方式。數(shù)據(jù)挖掘從定義上面分為廣義數(shù)據(jù)挖掘技術(shù)和狹義數(shù)據(jù)挖掘技術(shù),廣義數(shù)據(jù)挖掘主要是指從數(shù)據(jù)庫中獲取特定的、未知的知識,并且該知識對管理決策起決定作用。狹義數(shù)據(jù)挖掘主要是指從固定的數(shù)據(jù)體系中選擇有規(guī)律的知識的過程。不管數(shù)據(jù)挖掘如何定義,其優(yōu)勢作用正越來越被人們所重視,正逐漸應用在數(shù)據(jù)管理領(lǐng)域。
(1)目前高校職業(yè)指導體系概述。目前的高校職業(yè)指導體系,由于數(shù)據(jù)量越來越大,數(shù)據(jù)信息種類越來越多,依靠傳統(tǒng)的人工管理方法已經(jīng)不能適應形勢的需要,基于這種現(xiàn)狀,在高校職業(yè)指導體系中已經(jīng)大范圍的應用了數(shù)據(jù)管理系統(tǒng)。高校的職業(yè)指導體系的作用是對畢業(yè)生就業(yè)進行政策性指導,并將畢業(yè)生的所有信息錄入到高校數(shù)據(jù)庫中,供日后進行分析比對。雖然多數(shù)高校都實現(xiàn)了數(shù)據(jù)管理系統(tǒng),但是在對畢業(yè)生信息的利用上,目前的利用率還不高。數(shù)據(jù)發(fā)掘技術(shù)的出現(xiàn),有效的改變了高校職業(yè)指導體系對數(shù)據(jù)信息的利用模式,使高校職業(yè)指導體系中的冗余信息得到了發(fā)掘和運用,使畢業(yè)生的信息真正實現(xiàn)全方位、立體的綜合運用。
目前數(shù)據(jù)挖掘技術(shù)已經(jīng)開始在高校職業(yè)指導體系中大范圍運用,由于數(shù)據(jù)挖掘技術(shù)的特點,數(shù)據(jù)挖掘技術(shù)能夠整合數(shù)據(jù)庫資源,對高校畢業(yè)生數(shù)據(jù)庫內(nèi)的信息進行分類細分,將有用信息挖掘出來進行利用,將瑣碎信息予以剔除,保證了高校畢業(yè)生數(shù)據(jù)庫信息的完全利用。
(2)利用數(shù)據(jù)挖掘技術(shù)的算法選擇。目前高校職業(yè)指導體系的構(gòu)建,需要借助數(shù)據(jù)挖掘技術(shù)。運用數(shù)據(jù)挖掘技術(shù)首先就要確定算法。目前基于數(shù)據(jù)挖掘技術(shù)構(gòu)建的高校職業(yè)指導服務(wù)體系的首選算法為ID3算法,ID3算法是目前應用最廣泛的決策樹實現(xiàn)算法,最早出現(xiàn)在1977年。ID3算法的主導思想是用信息增益作為決策屬性分類判別能力的度量,進行決策節(jié)點屬性的選擇。ID3算法的重點在于選擇正確的決策節(jié)點,用以形成決策樹。選擇完決策節(jié)點之后,就要根據(jù)決策節(jié)點生成決策分支。一般我們會選取具有代表性質(zhì)樣本進行數(shù)據(jù)采集,用以分析樣本數(shù)據(jù)的分類特征。ID3算法的決策節(jié)點是依據(jù)信息論中的相關(guān)定義來選擇,具有一定的代表性,能夠體現(xiàn)數(shù)據(jù)挖掘的主要特征,把握好這個原則,就可以利用數(shù)據(jù)挖掘技術(shù)構(gòu)建出優(yōu)良的信息管理體系。因此,構(gòu)建高校職業(yè)指導服務(wù)體系,數(shù)據(jù)挖掘技術(shù)的算法選擇是關(guān)鍵。
(3)數(shù)據(jù)挖掘技術(shù)在高校職業(yè)指導服務(wù)體系中的運用。目前由于國家實行了高校擴招的招生政策,高校的畢業(yè)生的數(shù)量也出現(xiàn)了大幅度的增長。為了對畢業(yè)生的信息實行有效規(guī)范的管理,高校紛紛建立自己的數(shù)據(jù)信息管理系統(tǒng)。為了實現(xiàn)對畢業(yè)生的信息系統(tǒng)化、規(guī)范化的管理,高校開始采用數(shù)據(jù)挖掘技術(shù)來構(gòu)建自己的職業(yè)指導服務(wù)體系。由于高校的畢業(yè)生信息數(shù)據(jù)庫的信息量龐大,這就為數(shù)據(jù)挖掘技術(shù)的應用提供了有力條件。在高校畢業(yè)生數(shù)據(jù)庫中,數(shù)據(jù)挖掘技術(shù)運用了ID3算法,在畢業(yè)生的數(shù)據(jù)庫中挖掘出有價值的數(shù)據(jù)信息,并將這些信息進行分類,為指導學生就業(yè)提供有益的參考。這些有價值的數(shù)據(jù)信息包括:學生的各個科目的成績、是否在社團擔任職務(wù)、是否具有一定的特長、是否具備第二學位。是否具備國家考試的資格證件等等。數(shù)據(jù)挖掘技術(shù)實現(xiàn)了將畢業(yè)生基本信息、就業(yè)信息和成績信息有效的融合,并從中挖掘出有價值的信息和線索,指導畢業(yè)生就業(yè)。因此,數(shù)據(jù)挖掘技術(shù)在高校職業(yè)指導服務(wù)體系的構(gòu)建中,發(fā)揮了重要的作用。
構(gòu)建高校職業(yè)指導服務(wù)體系需要采用創(chuàng)新方法,數(shù)據(jù)挖掘技術(shù)本身具有的對數(shù)據(jù)分類分析和挖掘管理的優(yōu)勢,正符合構(gòu)建高校職業(yè)指導服務(wù)體系的要求。鑒于高校畢業(yè)生信息庫具有大量數(shù)據(jù)信息和數(shù)據(jù)挖掘技術(shù)的特點,數(shù)據(jù)挖掘技術(shù)被應用于高校畢業(yè)生職業(yè)指導工作中。數(shù)據(jù)挖掘技術(shù)的應用,促進了高校職業(yè)指導服務(wù)體系的發(fā)展,提高了高校職業(yè)指導的工作效率,使高校的就業(yè)指導工作能夠適應社會形勢的需要,能夠為廣大畢業(yè)生提供優(yōu)質(zhì)的就業(yè)指導服務(wù)。由于畢業(yè)生就業(yè)涉及的信息較多,應用數(shù)據(jù)挖掘技術(shù)可以為畢業(yè)生提供就業(yè)的關(guān)鍵信息,可以挖掘出有價值的就業(yè)線索。所以,在構(gòu)建高校的職業(yè)指導服務(wù)體系必須應用數(shù)據(jù)挖掘技術(shù)。
[1]毛國君,段立娟.數(shù)據(jù)挖掘原理與算法[M].北京:清華大學出版社,2005.
[2]武森,高學東,[德]M.巴斯蒂安.數(shù)據(jù)倉庫與數(shù)據(jù)挖掘[M].北京:冶金工業(yè)出版社,2003.