999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于Apriori算法的高職院校畢業(yè)生就業(yè)情況分析

2021-04-11 14:25:44羅明全
中阿科技論壇(中英文) 2021年3期
關(guān)鍵詞:數(shù)據(jù)挖掘關(guān)聯(lián)規(guī)則

羅明全

(瀘州職業(yè)技術(shù)學(xué)院,四川瀘州 646000)

1 引言

目前,隨著信息化建設(shè)的不斷深入,各高職院校存儲(chǔ)了大量、復(fù)雜的畢業(yè)生成績(jī)和就業(yè)信息數(shù)據(jù),如何從中挖掘出有價(jià)值的信息,成為高職院校的重要研究課題。本文對(duì)瀘州職業(yè)技術(shù)學(xué)院信息工程學(xué)院近5屆畢業(yè)生在校成績(jī)和就業(yè)相關(guān)數(shù)據(jù)進(jìn)行挖掘分析,獲得一批可以為人才培養(yǎng)方案修訂和就業(yè)指導(dǎo)工作開展提供決策依據(jù)的有價(jià)值信息。

2 數(shù)據(jù)挖掘及關(guān)聯(lián)規(guī)則的基本概念

從海量數(shù)據(jù)中挖掘出潛在、有用知識(shí)的過(guò)程被稱為知識(shí)發(fā)現(xiàn)(KDD),在這個(gè)過(guò)程中,數(shù)據(jù)挖掘(Data Mining)是至關(guān)重要的一環(huán)。數(shù)據(jù)挖掘是利用特定算法,自動(dòng)或半自動(dòng)地發(fā)現(xiàn)有意義的數(shù)據(jù)模式。

關(guān)聯(lián)規(guī)則(Association Rule)是數(shù)據(jù)挖掘的一個(gè)重要技術(shù),其目標(biāo)是發(fā)現(xiàn)數(shù)據(jù)項(xiàng)集之間的關(guān)聯(lián)關(guān)系或相關(guān)關(guān)系。關(guān)聯(lián)規(guī)則挖掘的一個(gè)典型例子是購(gòu)物籃分析,通過(guò)分析“購(gòu)物籃”哪些商品頻繁地被顧客同時(shí)購(gòu)買,發(fā)現(xiàn)不同商品之間的關(guān)聯(lián),得出顧客的購(gòu)物習(xí)慣,從而幫助零售商調(diào)整商品貨架布局以及開發(fā)更好的營(yíng)銷策略[1]。

關(guān)聯(lián)規(guī)則是形如X Y的蘊(yùn)涵式,其中X為關(guān)聯(lián)規(guī)則的先導(dǎo),Y為關(guān)聯(lián)規(guī)則的后繼,以下為關(guān)聯(lián)規(guī)則的幾個(gè)重要概念。

(1)事務(wù)

一個(gè)數(shù)據(jù)實(shí)例表視為一個(gè)數(shù)據(jù)集,每一條記錄為一個(gè)事務(wù),使用D表示數(shù)據(jù)集,|D|表示數(shù)據(jù)集中事務(wù)數(shù)。

(2)項(xiàng)集與頻繁項(xiàng)集

一個(gè)數(shù)據(jù)表中,每個(gè)屬性字段具有一個(gè)或多個(gè)不同的值,每個(gè)取值稱為項(xiàng),這些項(xiàng)的集合稱為項(xiàng)集,k-項(xiàng)集指包含k個(gè)項(xiàng)的項(xiàng)集,記為L(zhǎng)k。

(3)關(guān)聯(lián)規(guī)則支持度與置信度

(4)強(qiáng)關(guān)聯(lián)規(guī)則

在數(shù)據(jù)挖掘中,為衡量關(guān)聯(lián)規(guī)則在整個(gè)數(shù)據(jù)集中的統(tǒng)計(jì)重要性和關(guān)聯(lián)規(guī)則的可信程度,需要設(shè)置最小支持度閾值min_sup和最小置信度閾值min_conf。

3 Apriori算法實(shí)現(xiàn)

Apriori算法是一種常用于挖掘數(shù)據(jù)關(guān)聯(lián)規(guī)則的算法,使用該算法可篩選出滿足強(qiáng)關(guān)聯(lián)規(guī)則的頻繁項(xiàng)集,Apriori算法主要由兩個(gè)階段構(gòu)成:提取頻項(xiàng)集和產(chǎn)生強(qiáng)關(guān)聯(lián)規(guī)則。

(1)Apriori算法流程

以高職院校畢業(yè)生在校表現(xiàn)及就業(yè)信息數(shù)據(jù)挖掘?yàn)槔珹priori算法流程如下。

輸入:畢業(yè)生在校成績(jī)及就業(yè)信息數(shù)據(jù)集D、最小支持度min_sup、最小置信度min_conf。

輸出:畢業(yè)生在校成績(jī)與就業(yè)的關(guān)聯(lián)規(guī)則。

Step1:掃描數(shù)據(jù)集,統(tǒng)計(jì)k=1項(xiàng)集及其支持度support(X),比較support(X)與min_sup,若support(X)≥min_sup,則X為頻繁1-項(xiàng)集L1。

Step2:判斷頻繁k-項(xiàng)集Lk是否為空,為空則轉(zhuǎn)到Step6,否則轉(zhuǎn)到Step3。

Step3:將頻繁k-項(xiàng)集連接,產(chǎn)生候選(k+1)-項(xiàng)集Ck+1。

Step4:掃描原始數(shù)據(jù)集,計(jì)算出每個(gè)候選項(xiàng)集c的支持度support(c),若support(c)≥min_sup,則c屬于頻繁(k+1)-項(xiàng)集,否則為不滿足條件的候選項(xiàng)應(yīng)刪除,產(chǎn)生頻繁(k+1)-項(xiàng)集Lk+1。

Step5:k=k+1,返回Step2。

Step6:計(jì)算頻繁項(xiàng)集L=∪kLk。

Step7:比較頻繁項(xiàng)集L中的頻繁項(xiàng)與min_conf,得出畢業(yè)生在校表現(xiàn)與就業(yè)之間的強(qiáng)關(guān)聯(lián)規(guī)則。

(2)Apriori算法程序?qū)崿F(xiàn)

本文使用PHP作為程序開發(fā)語(yǔ)言,Apriori類成員如下:

4 基于Apriori算法的數(shù)據(jù)挖掘應(yīng)用

本文所使用的數(shù)據(jù)是瀘州職業(yè)技術(shù)學(xué)院信息工程學(xué)院近5屆畢業(yè)生在校期間課程成績(jī)和就業(yè)信息數(shù)據(jù),課程成績(jī)包括畢業(yè)生在校期間每學(xué)期各科目成績(jī)和綜合素質(zhì)測(cè)評(píng)成績(jī),就業(yè)信息數(shù)據(jù)包括畢業(yè)去向、單位性質(zhì)、工作職位類別等[2]。

4.1 數(shù)據(jù)預(yù)處理

在數(shù)據(jù)挖掘之前,對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,主要包括以下內(nèi)容。

(1)數(shù)據(jù)變換與集成:由于不同專業(yè)課程存在差別,通過(guò)屬性與屬性的連接構(gòu)造新屬性用于后續(xù)的數(shù)據(jù)挖掘計(jì)算,畢業(yè)生各學(xué)期英語(yǔ)、高數(shù)成績(jī)的算術(shù)平均值構(gòu)造為“文化課程”新屬性,專業(yè)課程成績(jī)的算術(shù)平均值構(gòu)造為“專業(yè)課程”新屬性,各學(xué)期的綜合素質(zhì)測(cè)評(píng)成績(jī)的算術(shù)平均值構(gòu)造為“綜合素質(zhì)”新屬性。以學(xué)號(hào)為唯一字段,將教務(wù)系統(tǒng)和就業(yè)管理系統(tǒng)的數(shù)據(jù)結(jié)合起來(lái)并統(tǒng)一存儲(chǔ)。

(2)冗余數(shù)據(jù)和缺失的處理:數(shù)據(jù)集成后,不避免出現(xiàn)冗余數(shù)據(jù),如學(xué)號(hào)、年級(jí)、性別等,所有冗余數(shù)據(jù)全部刪除,可節(jié)約內(nèi)存并提高運(yùn)算效率。個(gè)別畢業(yè)生畢業(yè)時(shí)未就業(yè)或未填報(bào)就業(yè)數(shù)據(jù),致使畢業(yè)去向、單位性質(zhì)、工作職位類別等數(shù)據(jù)項(xiàng)缺失,處理方式為一律舍棄。

(3)數(shù)值數(shù)據(jù)離散化處理:畢業(yè)生的成績(jī)數(shù)據(jù)均為數(shù)量屬性,我們將各成績(jī)屬性離散化處理,對(duì)文化課程、專業(yè)課程、綜合素質(zhì)成績(jī)采用統(tǒng)一的量化標(biāo)準(zhǔn),分為良好和一般兩個(gè)等級(jí),85分及以上為良好,值使用1表示,低于85分為一般,值使用0表示。

4.2 關(guān)聯(lián)規(guī)則挖掘

將經(jīng)數(shù)據(jù)預(yù)處理后的數(shù)據(jù)存入數(shù)據(jù)庫(kù)中,使用Apriori算法的挖掘程序,我們?cè)O(shè)置min_sup=5%,min_conf=60%,搜素?cái)?shù)據(jù)庫(kù),得到強(qiáng)關(guān)聯(lián)規(guī)則如下所示。

(1)專業(yè)成績(jī)(良好)→就業(yè)行業(yè)(信息傳輸、計(jì)算機(jī)服務(wù)和軟件業(yè)),support=41.2%,confidence=80.5%。

(2)專業(yè)成績(jī)(一般)∩綜合素質(zhì)(良好)→職位類別(商業(yè)和服務(wù)業(yè)),support=6.3%,confidence=71.4%。

(3)文化成績(jī)(良好)→就業(yè)方向(專升本),support=5.2%,confidence=63.1%,同時(shí)就業(yè)方向(專升本) →文化成績(jī)(良好),confidence=87.4%。

4.3 關(guān)聯(lián)規(guī)則分析

規(guī)則1表明,在校期間專業(yè)成績(jī)好的畢業(yè)生就業(yè)行業(yè)為IT行業(yè),一定程度上表明,現(xiàn)開設(shè)的專業(yè)課程較為合理。

規(guī)則2表明,專業(yè)成績(jī)一般但綜合素質(zhì)較強(qiáng)的畢業(yè)生偏好從事商業(yè)和服務(wù)業(yè)工作。

規(guī)則3表明,文化成績(jī)達(dá)到良好的畢業(yè)生偏好專升本,同時(shí),大多數(shù)專升本成功的畢業(yè)生在校期間文化成績(jī)達(dá)到良好水平。

5 結(jié)語(yǔ)

本文利用關(guān)聯(lián)規(guī)則及Apriori算法對(duì)畢業(yè)生在校期間各項(xiàng)成績(jī)和就業(yè)數(shù)據(jù)進(jìn)行了挖掘和分析,分析得出:高職學(xué)生的畢業(yè)去向與在校期間的學(xué)習(xí)和表現(xiàn)存在較大的關(guān)聯(lián)性。在就業(yè)指導(dǎo)中,根據(jù)學(xué)生在校表現(xiàn)情況,指導(dǎo)學(xué)生正確自我認(rèn)知,確定合適的就業(yè)目標(biāo),同時(shí)向招聘單位進(jìn)行精準(zhǔn)的人才推薦,進(jìn)一步提高就業(yè)率,促進(jìn)優(yōu)質(zhì)就業(yè)。

猜你喜歡
數(shù)據(jù)挖掘關(guān)聯(lián)規(guī)則
撐竿跳規(guī)則的制定
“苦”的關(guān)聯(lián)
數(shù)獨(dú)的規(guī)則和演變
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢(shì)
奇趣搭配
讓規(guī)則不規(guī)則
Coco薇(2017年11期)2018-01-03 20:59:57
基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
電力與能源(2017年6期)2017-05-14 06:19:37
智趣
讀者(2017年5期)2017-02-15 18:04:18
TPP反腐敗規(guī)則對(duì)我國(guó)的啟示
一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
主站蜘蛛池模板: 亚洲综合欧美在线一区在线播放| 国产欧美视频综合二区| 97se亚洲综合在线| 久久伊人色| A级毛片无码久久精品免费| 亚洲综合色吧| 亚洲高清日韩heyzo| 一级毛片免费观看不卡视频| 欧美亚洲另类在线观看| 亚洲色无码专线精品观看| 欧美中文一区| 精品视频91| 日韩在线影院| 国产成人喷潮在线观看| 996免费视频国产在线播放| 中文字幕乱码二三区免费| 大学生久久香蕉国产线观看 | 二级毛片免费观看全程| 精品夜恋影院亚洲欧洲| 亚洲手机在线| 欧美日韩另类在线| 国产91视频观看| 国产成人做受免费视频| 亚洲第一国产综合| 热九九精品| 91av国产在线| 一级毛片不卡片免费观看| 成人午夜视频网站| 好吊色国产欧美日韩免费观看| 综合网天天| 一级毛片在线播放| 免费一级毛片在线播放傲雪网| 直接黄91麻豆网站| 女同国产精品一区二区| 在线色综合| 无码网站免费观看| 狼友av永久网站免费观看| 114级毛片免费观看| 日韩视频免费| 最新国产精品第1页| 九九久久精品国产av片囯产区| 久久综合久久鬼| 99视频只有精品| 精品亚洲国产成人AV| 国产91线观看| 色综合成人| 日韩中文精品亚洲第三区| 国产最爽的乱婬视频国语对白| 午夜视频在线观看区二区| 天天综合网色| 亚洲精品国产综合99| 99视频有精品视频免费观看| 人妻精品久久久无码区色视| 免费在线色| 91娇喘视频| 日本高清有码人妻| 99久久精品免费视频| 青青青国产视频| 国产成人高清亚洲一区久久| 国产粉嫩粉嫩的18在线播放91| 亚洲第一精品福利| 中文字幕无线码一区| 亚洲欧美极品| 亚洲 欧美 偷自乱 图片| 无码国产伊人| 午夜精品久久久久久久无码软件 | 国产精品高清国产三级囯产AV| 57pao国产成视频免费播放| 69免费在线视频| 国产在线视频二区| 中文字幕在线欧美| 国产在线八区| 国产91色在线| 免费国产不卡午夜福在线观看| 亚洲第一中文字幕| 国内a级毛片| 一级看片免费视频| 亚洲欧洲天堂色AV| 久久永久精品免费视频| 男女性午夜福利网站| 强奷白丝美女在线观看| 欧美日韩高清在线|