劉俊灼 柳炳祥 張軍
摘要:Apriori算法是關聯規則數據挖掘算法的一種,也是極具影響力的算法。Apriori 算法算法具有先驗性質,Apriori 算法的用處是挖掘頻繁項集的,頻繁項集粗俗的理解就是找出經常出現的組合,然后根據這些組合最終推出關聯規則。因此,將Apriori算法應用在高校就業分析中,能夠幫助相關人員分析出高校學生的就業方向。
關鍵詞:關聯規則;Apriori算法;高校學生;就業分析;應用
引言
高校畢業生就業管理和就業指導工作是高校培養人才過程中的最后一個階段,也是至關重要的一步,而就業分析是完成這一步的關鍵。在就業分析過程中,形成大量的、復雜的數據,統計和分析起來有很大的難度,而就業指導是影響畢業生就業走向的重要環節,如何從復雜的畢業生信息中挖掘出對就業指導有效的數據,是很多高校都在研究的問題。
使用數據挖掘技術做就業預測,可以為就業管理部門在畢業生就業指導過程中提供有效決策性數據依據,同時為畢業生在就業擇業時提供有效的引導。
一、關聯規則Apriori算法概述
(一)關聯規則
關聯規則挖掘則是數據挖掘中的一個很重要的課題,顧名思義,它是從數據背后發現事物之間可能存在的關聯或者聯系。例如對商場里買東西的顧客進行調查發現,百分之三十的顧客會同時購買枕套和枕巾,而百分之八十購買枕套的人會購買床單,這其中就隱藏面臨一條關聯:床單~枕巾,也就是說大部分人會一起購買床單和枕巾,因此商場可以將枕巾和床單放在一個購物區。
(二)Apriori算法
Apriori算法是一種挖掘關聯規則的頻繁項集算法,其核心思想是通過候選集生成和情節的向下封閉檢測兩個階段來挖掘頻繁項集。
Apriori算法是一種逐層搜索的迭代式算法,其中k 項集用于挖掘(k+1)項集,這是依靠他的先驗性質的:頻繁項集的所有非空子集一定是也是頻繁的。
通過這個性質可以對候選集進行剪枝。用k 項集如何生成(k+1)項集呢,這個是算法里面最難也是最核心的部分。
通過2 個步驟,第一個步驟是連接步,將頻繁項自己與自己進行連接運算;第二個步驟是剪枝步,去除候選集項中的不符合要求的候選項,不符合要求指的是這個候選項的子集并非都是頻繁項,要遵守上文提到的先驗性質。最后,通過一、二步驟還不夠,在后面還要根據支持度計數篩選掉不滿足最小支持度數的候選集。
二、關聯規則Apriori 算法在高校學生就業分析中的應用
(一)數據收集
數據挖掘要有明確的數據分析對象,所以,數據挖掘的第一步必須收集數據。在數據挖掘過程中,可以直接從高校數據庫中提取數據,也可以通過調查得到所需數據。文章選擇問卷調查的方式得到數據,問卷調查分為畢業生和在校生兩種,針對已畢業學生主要的調查信息包括專業課成績、對所學專業是否感興趣、影響工作的因素、是否參加實習、就業方向是否與專業對口、就業單位是否是原實習單位、就業的主要途徑等。針對在校學生的調查信息主要包括:專業課成績情況、對專業課是否感興趣、對就業前景的態度、希望學校提供的就業指導情況、預計在就業中遇到的問題等。
(二)Apriori算法優化
高校畢業生就業信息較為復雜,且不確定性較為突出,畢業生的專業成績、社會實踐情況、英語等級等因素在畢業生就業方向中存在重要影響,為了挖掘對畢業生有利的信息,文章采用基于劃分的Apriori優化算法應用在畢業生就業分析中。主要思路是:將畢業生就業信息數據庫中的事務,根據歷屆畢業生就業方向劃分成不重疊的部分,劃分后的每一部分均能夠一次性的讀入內存中。運用Apriori算法在每一部分的內部進行頻繁項集的掃描,得到局部頻繁項集,并計算每個頻繁項集在整個數據中的實際支持度。由這些頻繁項集構成整個數據庫的候選項集,從而確定出全局候選項集。
(三)數據關聯規則挖掘
使用學生就業數據挖掘出來的主要關聯規則對學生的就業情況進行預測。從規則中可知,大數據科學應用專業的學生,不論是對專業是否感興趣,還是專業是否優秀,百分之八十以上的人都愿意參加實習,尤其是男生,這說明,實習是加強專業技能有效手段,通過實習,學生擇業的范圍和機會都會增大。
總體來說,不論專業課成績好壞、是否參加過實習、實習崗位是否與所學專業對口,大部分學生都希望學校能夠安排實習,少數學生希望通過人才市場等方式實現就業。總的來說,大部分學生希望學校提供就業機會。
(四)建議
第一點,對在校生來說,實習是走上工作崗位的重要途徑,建議在有機會的情況下參加畢業實習工作,也希望學校可以為學生聯系較多的實習崗位;
第二點,學校應該加強對學生的管理,培養學生的興趣,提高學生的素質結構和操作技能,解決學生就業難的問題。
第三點,學校應主動采取措施,積極滿足學生的就業需求。同時,學生應該利用人才市場,網絡等多種渠道來解決就業難的問題。
三、結語
綜上所述,應用關聯規則Apriori算法對高校畢業生進行就業分析是可行的,高校應根據分析結果,為學生提供更多的實習機會,同時在校期間,要積極鼓勵學生自己找工作,不斷滿足學生的就業需求,解決就業難的問題,提升高校畢業生就業率,幫助學生找到適合自己的工作。
參考文獻:
[1] 覃永貞,顧平.Apriori算法在高校畢業生就業預測中的應用分析[J].輕工科技,2014,30(07):93-94+97.
[2]黃文靜.Apriori 算法在高校畢業生就業數據挖掘中的應用研究[J].電子技術與軟件工程,2015(04):207-208.