鄧 凱,趙振勇,劉浩博
職業(yè)教育
基于大數(shù)據(jù)分析的高職院校專業(yè)評價(jià)神經(jīng)網(wǎng)絡(luò)模型研究
鄧凱,趙振勇,劉浩博
近十幾年來,隨著我國職業(yè)教育的快速發(fā)展,高職院校專業(yè)設(shè)置與結(jié)構(gòu)調(diào)整已成為高職教育領(lǐng)域非常關(guān)注的熱點(diǎn)問題。本文是基于大數(shù)據(jù)分析的高職院校專業(yè)評價(jià)神經(jīng)網(wǎng)絡(luò)模型研究,深入分析高職院校專業(yè)設(shè)置重要影響因素,通過對部分職教領(lǐng)域?qū)<?、教師及企業(yè)人員的詳細(xì)調(diào)查與咨詢,結(jié)合教育部有關(guān)專業(yè)設(shè)置相關(guān)管理文件的要求,構(gòu)建科學(xué)的專業(yè)設(shè)置與調(diào)整評價(jià)指標(biāo)體系,并根據(jù)指標(biāo)體系采集大批量專業(yè)樣本數(shù)據(jù)進(jìn)行仿真實(shí)驗(yàn)。結(jié)果表明,運(yùn)用BP神經(jīng)網(wǎng)絡(luò)模型對專業(yè)設(shè)置與調(diào)整進(jìn)行評價(jià),排除了對專業(yè)設(shè)置與調(diào)整的主觀因素影響,能夠獲得客觀滿意的評價(jià)結(jié)果,具有廣泛的適用性與科學(xué)性。
高職院校;BP神經(jīng)網(wǎng)絡(luò);專業(yè)設(shè)置與調(diào)整;評價(jià)指標(biāo)體系
隨著改革的不斷深化,更好適應(yīng)經(jīng)濟(jì)發(fā)展的新常態(tài)和技術(shù)技能人才成長成才需要,高職院校必須根據(jù)市場的導(dǎo)向和社會(huì)經(jīng)濟(jì)發(fā)展需求進(jìn)行人才培養(yǎng)。專業(yè)作為高校實(shí)現(xiàn)人才培養(yǎng)、科學(xué)研究和社會(huì)服務(wù)功能的載體,其重要性不言而喻。在我國,關(guān)于專業(yè)設(shè)置與調(diào)整集中研究起始于20世紀(jì)80年代以后,并且也是高等教育界關(guān)注的熱點(diǎn)問題之一。專業(yè)設(shè)置與調(diào)整的速度直接反映適應(yīng)社會(huì)需求的程度,起到橋梁紐帶作用;專業(yè)設(shè)置與調(diào)整更是直接影響人才培養(yǎng)質(zhì)量、辦學(xué)效益與就業(yè)質(zhì)量。筆者通過查閱大量與此相關(guān)文獻(xiàn)發(fā)現(xiàn),研究領(lǐng)域主要涉及專業(yè)設(shè)置與調(diào)整中存在的問題與解決辦法、影響專業(yè)設(shè)置的相關(guān)因素分析與策略以及專業(yè)設(shè)置與調(diào)整的機(jī)制研究等,多數(shù)從宏觀層面侃侃而談,結(jié)合經(jīng)濟(jì)發(fā)展做重要分析,從存在問題、設(shè)置原則以及優(yōu)化對策等方面提出一些建設(shè)性意見與建議。然而在大量的文獻(xiàn)著作等資料中,實(shí)證研究數(shù)量很少,采用量化或質(zhì)性方法來研究專業(yè)設(shè)置問題的個(gè)案材料始終沒有[1]。
2004年,教育部頒布了《普通高等學(xué)校高職高專教育指導(dǎo)性專業(yè)目錄》和《普通高等學(xué)校高職高專教育專業(yè)設(shè)置管理辦法》兩個(gè)重要文件,在專業(yè)管理方面具有重要的現(xiàn)實(shí)與指導(dǎo)意義,但由于審核和監(jiān)管等機(jī)制不夠健全,很多高職院校在專業(yè)設(shè)置與調(diào)整過程中隨意、盲目的現(xiàn)象,以及與區(qū)域經(jīng)濟(jì)發(fā)展脫節(jié)、專業(yè)結(jié)構(gòu)失衡、同質(zhì)化現(xiàn)象依然存在。影響專業(yè)設(shè)置與調(diào)整的因素有很多,現(xiàn)實(shí)中難以用線性的數(shù)學(xué)公式來表達(dá)或歸納,顯而易見,這是一個(gè)典型的非線性幾何問題。因此,找到一個(gè)科學(xué)、客觀的評價(jià)方法非常重要。本文提出一種基于大數(shù)據(jù)分析的高職院校專業(yè)評價(jià)神經(jīng)網(wǎng)絡(luò)模型,深入分析高職院校專業(yè)設(shè)置重要影響因素,通過對部分職教領(lǐng)域?qū)<?、教師及企業(yè)人員的詳細(xì)調(diào)查與咨詢,結(jié)合教育部有關(guān)專業(yè)設(shè)置相關(guān)管理文件的要求,構(gòu)建科學(xué)的專業(yè)設(shè)置與調(diào)整評價(jià)指標(biāo)體系,并根據(jù)指標(biāo)體系采集大批量專業(yè)樣本數(shù)據(jù)進(jìn)行仿真實(shí)驗(yàn)。結(jié)果表明,運(yùn)用BP(Back-Propagation Network)神經(jīng)網(wǎng)絡(luò)模型對專業(yè)設(shè)置與調(diào)整進(jìn)行評價(jià),排除了對專業(yè)設(shè)置與調(diào)整的主觀因素影響,能夠獲得客觀滿意的評價(jià)結(jié)果,具有廣泛的適用性與科學(xué)性。
(一)構(gòu)建高職院校專業(yè)設(shè)置評價(jià)指標(biāo)體系
筆者通過對影響高職院校專業(yè)設(shè)置與調(diào)整的相關(guān)重要因素進(jìn)行科學(xué)分析與總結(jié),對部分職教領(lǐng)域?qū)<摇⒂嘘P(guān)教師代表及企業(yè)相關(guān)人員的詳細(xì)調(diào)查與咨詢,對教育部有關(guān)專業(yè)設(shè)置等管理文件要求深入研究,并結(jié)合目前高職院校以“就業(yè)為導(dǎo)向”的辦學(xué)實(shí)際和社會(huì)實(shí)際需求,以努力避免粗放與盲目性為宗旨,確定了高職院校專業(yè)設(shè)置評價(jià)指標(biāo)體系為10個(gè)一級指標(biāo)。分別是:1.社會(huì)發(fā)展;2.校外專業(yè);3.校內(nèi)專業(yè)結(jié)構(gòu)與專業(yè)布局;4.相關(guān)專業(yè)辦學(xué)經(jīng)驗(yàn);5.專業(yè)設(shè)置硬件條件;6.師資隊(duì)伍條件;7.專業(yè)人才培養(yǎng)方案;8.專業(yè)人才需求調(diào)研論證;9.教學(xué)管理與教學(xué)研究;10.其他。在此一級指標(biāo)的基礎(chǔ)上,又分解出43個(gè)二級指標(biāo)、82個(gè)三級指標(biāo)和188個(gè)四級指標(biāo)。根據(jù)對一流權(quán)威的專家、相關(guān)專業(yè)教師、企業(yè)代表進(jìn)行詳細(xì)調(diào)查與咨詢,對各級指標(biāo)確定了相應(yīng)的權(quán)重,構(gòu)成專業(yè)設(shè)置評價(jià)指標(biāo)體系。
(二)構(gòu)建BP(Back-Propagation Network)神經(jīng)網(wǎng)絡(luò)模型
BP神經(jīng)網(wǎng)絡(luò),是一種多層前饋神經(jīng)網(wǎng)絡(luò),是由信息的前向傳遞與誤差反向傳播修正兩個(gè)過程組成,拓?fù)浣Y(jié)構(gòu)分為輸入層、隱含層和輸出層。在信息前向傳播時(shí),信號就會(huì)從輸入層經(jīng)過隱含層逐層計(jì)算處理后最終到達(dá)輸出層,輸出層輸出信息并處理結(jié)果,這樣就完成了一次學(xué)習(xí)的正向傳播處理過程。當(dāng)輸出層輸出的數(shù)值或結(jié)果得不到預(yù)定的目標(biāo)值時(shí),則啟動(dòng)誤差的反向傳播,即根據(jù)誤差值設(shè)定情況主動(dòng)調(diào)整網(wǎng)絡(luò)的權(quán)值和閾值,并反復(fù)訓(xùn)練修正,從而使BP神經(jīng)網(wǎng)絡(luò)的預(yù)測輸出值不斷逼近目標(biāo)值,最終達(dá)到預(yù)期的輸出目標(biāo),完成整體建模效果[2][3]。
能否構(gòu)建一個(gè)科學(xué)合適的神經(jīng)網(wǎng)絡(luò)模型,其結(jié)構(gòu)參數(shù)的設(shè)定非常重要。
1.輸入層神經(jīng)元個(gè)數(shù)的選取。通過構(gòu)建的評價(jià)指標(biāo)體系可知,文中輸入層神經(jīng)元個(gè)數(shù)設(shè)定為188(即為四級指標(biāo)的個(gè)數(shù))。
2.輸出層神經(jīng)元個(gè)數(shù)的選取。文中的評價(jià)結(jié)果即為網(wǎng)絡(luò)的輸出情況,為突出以“就業(yè)為導(dǎo)向”的宗旨以及學(xué)生和用人單位對學(xué)校辦學(xué)水平的評價(jià),文中選擇了各專業(yè)的招生人數(shù)和就業(yè)人數(shù)指標(biāo)為網(wǎng)絡(luò)的輸出,設(shè)定輸出層個(gè)數(shù)m=2。
3.神經(jīng)網(wǎng)絡(luò)層數(shù)的選取。實(shí)踐上表明,在神經(jīng)網(wǎng)絡(luò)訓(xùn)練和評價(jià)過程中,依靠單純地增加神經(jīng)層數(shù)未必都能達(dá)到降低誤差或提高精度的效果,并且還將網(wǎng)絡(luò)變得更加復(fù)雜,網(wǎng)絡(luò)訓(xùn)練時(shí)間以及需要的內(nèi)存空間都大大增加。然而很多實(shí)驗(yàn)表明,利用調(diào)節(jié)隱含層中間的神經(jīng)元節(jié)點(diǎn)數(shù)目的方式可以提高誤差精度,取得滿意的訓(xùn)練效果。因此,在實(shí)踐運(yùn)用中將采用相對簡單的三層BP網(wǎng)絡(luò)比較理想。
4.隱含層神經(jīng)元個(gè)數(shù)。在BP算法的神經(jīng)網(wǎng)絡(luò)中,各層神經(jīng)元節(jié)點(diǎn)數(shù)目的選擇對于網(wǎng)絡(luò)的性能影響比較大,實(shí)踐表明,當(dāng)輸入層神經(jīng)元個(gè)數(shù)多,樣本數(shù)據(jù)大,此時(shí)隱含層節(jié)點(diǎn)數(shù)過多,在一般的PC機(jī)上計(jì)算時(shí)則會(huì)產(chǎn)生內(nèi)存溢出,那么對網(wǎng)絡(luò)的概括推理能力將產(chǎn)生不利影響。另外,當(dāng)隱含層節(jié)點(diǎn)數(shù)目過少時(shí)不僅導(dǎo)致網(wǎng)絡(luò)學(xué)習(xí)會(huì)出現(xiàn)局部極小值現(xiàn)象,而且精度也會(huì)受到嚴(yán)重影響,查閱大量書籍和資料,對于隱含層神經(jīng)元節(jié)點(diǎn)數(shù)目選取的問題也有一些方法,但至今沒有統(tǒng)一起來,基本都是以經(jīng)驗(yàn)或?qū)嶒?yàn)為主。根據(jù)經(jīng)驗(yàn)公式,本文隱含層神經(jīng)元個(gè)數(shù)確定為10較為理想。
5.合理確定神經(jīng)元轉(zhuǎn)換函數(shù)。一般均采用S型函數(shù)作為BP神經(jīng)網(wǎng)絡(luò)神經(jīng)元轉(zhuǎn)換函數(shù),其具體函數(shù)形式為[2]
根據(jù)BP(Back-Propagation Network)神經(jīng)網(wǎng)絡(luò)模型原理,不難理解在網(wǎng)絡(luò)訓(xùn)練的過程中,要想達(dá)到一定的誤差精度和取得滿意的訓(xùn)練效果,對樣本數(shù)據(jù)的數(shù)量要求非常高,樣本數(shù)據(jù)越多,建模效果就越好,泛化能力就越強(qiáng),評價(jià)的結(jié)果就越準(zhǔn)確。因此,我們選了取76所某高職院校2012、2013年所開設(shè)的專業(yè)為代表,共1889個(gè)不同地區(qū)的不同或相同專業(yè)作為大樣本數(shù)據(jù)。
根據(jù)前面構(gòu)建的BP(Back-Propagation Network)神經(jīng)網(wǎng)絡(luò)模型及相關(guān)參數(shù)要求,本文建立一個(gè)三層的BP神經(jīng)網(wǎng)絡(luò),選用高性能的數(shù)值計(jì)算可視化軟件MATLAB作為仿真實(shí)現(xiàn)工具,輸入層神經(jīng)元個(gè)數(shù)為188,隱含層神經(jīng)元個(gè)數(shù)為10,輸出層神經(jīng)元個(gè)數(shù)為2,學(xué)習(xí)率1r=0.08,訓(xùn)練函數(shù)選擇為trainlm,訓(xùn)練目標(biāo)誤差err-goal=1e-7,誤差精度設(shè)為1e-10(誤差平方和),最大迭代次數(shù)max_epoch=2000。(如圖1,2所示)同時(shí)對1889組樣本數(shù)據(jù)做歸一化處理,首先選擇其中1859組樣本數(shù)據(jù)進(jìn)行學(xué)習(xí)訓(xùn)練,樣本數(shù)據(jù)經(jīng)過2000次反復(fù)迭代訓(xùn)練后,各專業(yè)招生的實(shí)際輸出人數(shù)與目標(biāo)人數(shù)非常接近,擬合度特別高(如圖3),誤差平方和SSE=0.0052,由綠色小圓圈構(gòu)成的連線都在0附近徘徊,各專業(yè)就業(yè)實(shí)際輸出人數(shù)與目標(biāo)人數(shù)也非常接近,擬合度特別高 (如圖4),誤差平方和為SSE=0.00000074,由綠色小圓圈構(gòu)成的連線都在0附近徘徊。

圖1 BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練模型
為證明所構(gòu)建的基于大數(shù)據(jù)分析的高職院校專業(yè)評價(jià)神經(jīng)網(wǎng)絡(luò)模型泛化能力和普適性強(qiáng),我們又選取了剩余的30組樣本數(shù)據(jù)進(jìn)行測試對比,結(jié)果如圖5、圖6所示,其中圖5誤差平方和SSE=0.00006,圖6誤差平方和SSE=0.000000006,都達(dá)到了預(yù)期的效果。顯然,表明此網(wǎng)絡(luò)模型的泛化能力強(qiáng),所構(gòu)建的專業(yè)評價(jià)神經(jīng)網(wǎng)絡(luò)模型是成功的,同時(shí)也印證了此模型在高職院校專業(yè)設(shè)置與調(diào)整評價(jià)指標(biāo)體系中應(yīng)用的普適性與科學(xué)性。

圖2 BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練過程

圖3 專業(yè)招生人數(shù)實(shí)際與預(yù)測樣本情況

圖4 專業(yè)就業(yè)人數(shù)實(shí)際與預(yù)測樣本情況

圖5 專業(yè)招生人數(shù)實(shí)際與預(yù)測樣本情況

圖6 專業(yè)就業(yè)人數(shù)實(shí)際與預(yù)測樣本情況
四、結(jié)論
筆者通過集合多方力量共同探討,保證了評價(jià)指標(biāo)體系的全面科學(xué)性;在采集樣本數(shù)據(jù)過程中,選擇了大批量專業(yè)數(shù)據(jù)作為保障,保證了數(shù)據(jù)的可靠、可行性;由于影響專業(yè)設(shè)置因素之間的聯(lián)系復(fù)雜且具有非線性特征,在定量分析方法選擇時(shí),利用神經(jīng)網(wǎng)絡(luò)模型保證了科學(xué)性。因此,通過仿真實(shí)驗(yàn),結(jié)果證明,運(yùn)用BP神經(jīng)網(wǎng)絡(luò)模型對專業(yè)設(shè)置與調(diào)整進(jìn)行評價(jià),真正排除了對專業(yè)設(shè)置與調(diào)整的主觀因素影響,并能夠獲得較為客觀滿意的評價(jià)結(jié)果,具有廣泛的適用性。
[1]杜才平.近十年國內(nèi)高校專業(yè)設(shè)置與結(jié)構(gòu)調(diào)整研究文獻(xiàn)綜述[J].內(nèi)蒙古師范大學(xué)學(xué)報(bào)(教育科學(xué)版),2011 (3).
[2]趙振勇,張平澤.基于BP神經(jīng)網(wǎng)絡(luò)的高職學(xué)生評價(jià)模型構(gòu)建與實(shí)現(xiàn)[J].湖北第二師范學(xué)院學(xué)報(bào),2013(8):75-76.
[3]從爽.面向Mauab工具箱的神經(jīng)網(wǎng)絡(luò)理論與應(yīng)用[M].安徽:中國科學(xué)技術(shù)大學(xué)出版社,1998.
責(zé)任編輯:賀春健
G642
A
1671-6531(2015)19-0122-03
鄧凱/常州紡織服裝職業(yè)技術(shù)學(xué)院教授,研究員級高級工程師(江蘇常州213164);趙振勇/常州紡織服裝職業(yè)技術(shù)學(xué)院副研究員,碩士(江蘇常州213164);劉浩博/常州紡織服裝職業(yè)技術(shù)學(xué)院講師(江蘇常州213164)。
長春教育學(xué)院學(xué)報(bào)2015年19期