楊國龍
(湛江幼兒師范專科學(xué)校,廣東 湛江 524084)
本研究為了拓展和深化專科類高校人才培養(yǎng)評估手段以及專科類高教人才培養(yǎng)方式的理論探討空間。將信息挖掘、文本信息分析等技術(shù)從網(wǎng)絡(luò)輿論管理等領(lǐng)域應(yīng)用到高校人才培養(yǎng)質(zhì)量評估,而且該技術(shù)應(yīng)用于大專院校人才培養(yǎng)質(zhì)量評估具有一定的創(chuàng)新性。其次,采用新的研究思路及工具方法對專科類院校的人才培養(yǎng)質(zhì)量進(jìn)行評估,通過編寫程序抓取互聯(lián)網(wǎng)海量的文本信息,再根據(jù)神經(jīng)網(wǎng)絡(luò)模型來判斷文本中的情感傾向和主體觀點,對專科類高校人才培養(yǎng)質(zhì)量進(jìn)行精準(zhǔn)評估,得以在科學(xué)決策的基礎(chǔ)上綜合評判大專院校人才培養(yǎng)方案,進(jìn)而保障大專院校人才培養(yǎng)質(zhì)量及持續(xù)改進(jìn)[1]。最后,本文旨在于對大專院校人才培養(yǎng)質(zhì)量評估方法進(jìn)行研究,進(jìn)一步完善和改進(jìn)高職院校人才培養(yǎng)質(zhì)量評估體系,對大專院校人才培養(yǎng)體系結(jié)構(gòu)進(jìn)行宏觀調(diào)整及監(jiān)督,有助于保證專科類高校人才培養(yǎng)體系處于較高水平,借助信息挖掘和信息分析技術(shù),通過社會輿論等反饋對人才培養(yǎng)質(zhì)量評估體系進(jìn)行優(yōu)化,可為高職類的院校制定人才培養(yǎng)方案提供決策支持。
隨著我國經(jīng)濟(jì)的快速發(fā)展,各行各業(yè)人才市場的需求也不斷加大。國家實施高職擴招戰(zhàn)略可進(jìn)一步促進(jìn)職業(yè)教育模式改革。因此,構(gòu)建與高職擴招相適應(yīng)的人才培養(yǎng)質(zhì)量保障機制作為職業(yè)教育改革的重要內(nèi)容,通過探索多元化人才培養(yǎng)體系的關(guān)鍵因素具有一定促進(jìn)意義。
當(dāng)前的教育數(shù)據(jù)分析離不開大數(shù)據(jù)技術(shù),通過對教育數(shù)據(jù)挖掘,可及時獲得教育領(lǐng)域相關(guān)信息,進(jìn)一步挖掘教育數(shù)據(jù)的深層價值,為人才培養(yǎng)質(zhì)量方案制定提供數(shù)據(jù)參考。除此之外,利用大數(shù)據(jù)可以完成大量教育數(shù)據(jù)的收集、處理和分析,為制定教學(xué)指導(dǎo)措施提供決策支持。在此基礎(chǔ)上,因大數(shù)據(jù)、深度學(xué)習(xí)等技術(shù)的不斷發(fā)展,產(chǎn)生了另外一種數(shù)據(jù)挖掘技術(shù),即是文本分析技術(shù),該技術(shù)也可應(yīng)用于語義理解、機器翻譯、問答系統(tǒng)和信息檢索等多個領(lǐng)域[2],因此,數(shù)據(jù)挖掘技術(shù)的國內(nèi)外發(fā)展現(xiàn)狀與趨勢如圖1所示。

圖1 國內(nèi)外發(fā)展現(xiàn)狀與趨勢
在20 世紀(jì)50 年代,國外學(xué)者H.P.Luhn提出詞頻的概念,進(jìn)而開始研究了文本分類技術(shù)。隨后,IBM公司將詞頻引入到文本分類技術(shù),促進(jìn)文本分類領(lǐng)域發(fā)展。除此之外,學(xué)者M(jìn)aron等人利用關(guān)鍵詞實現(xiàn)了文本的自動分類。
隨著數(shù)據(jù)特點的越來越復(fù)雜,當(dāng)時文本分析領(lǐng)域的研究方向主要是機器學(xué)習(xí)的文本分類方法。學(xué)者Kim等人研究了深度學(xué)習(xí)模型并應(yīng)用到文本分類中,而且在句子建模中采用了卷積神經(jīng)網(wǎng)絡(luò),實驗結(jié)果表明,在多個數(shù)據(jù)集上處理效果較好。學(xué)者M(jìn)ikolov 等人對神經(jīng)網(wǎng)絡(luò)語言模型進(jìn)行研究,提出利用RNN進(jìn)行語言建模進(jìn)而增強語言模型的表征能力。學(xué)者Komninos等人研究了詞嵌入在深層網(wǎng)絡(luò)中影響,并得出了采用上下文的詞嵌入方法在實現(xiàn)分類上效果明顯。而國內(nèi)學(xué)者曾誰飛等人結(jié)合了雙向長短期記憶網(wǎng)絡(luò)與雙詞嵌入可以較好完成文本特征提取[3]。
在2003 年,自從國外學(xué)者Nasukawa提出了情感分析含義,相關(guān)專業(yè)的研究者在此基礎(chǔ)上進(jìn)行深入研究。比如,根據(jù)情感詞典的研究方法,學(xué)者Kim 等人利用情感詞典來制定情感得分的計算方法,為了提高準(zhǔn)確性,通過對文本中情感詞的情感得分進(jìn)行求和計算得出整個文本情感極性。在分析文本情感傾向性分類時,因部分文本的特征準(zhǔn)確性不足,針對該問題,國內(nèi)學(xué)者魏廣順等人為了提高情感分類準(zhǔn)確性,從而設(shè)計出一種文本特征加權(quán)方法,該方法利用TF-IDF算法實現(xiàn)特征加權(quán),最后,設(shè)計分類器對傾向性進(jìn)行分類判斷。學(xué)者張志華對卷積神經(jīng)網(wǎng)絡(luò)模型等內(nèi)容進(jìn)行了研究,分別提出了三種不同的情感詞向量學(xué)習(xí)模型,利用預(yù)測情感強度值,建立一種基于有監(jiān)督的排序模型,得出的實驗效果較好[4]。
本研究對社會評價的大專院校人才培養(yǎng)質(zhì)量評估方法及內(nèi)容分三步進(jìn)行分析,首先對高職類院校人才培養(yǎng)質(zhì)量評價的數(shù)據(jù)進(jìn)行收集及預(yù)處理,然后,根據(jù)獲取的相關(guān)數(shù)據(jù),利用改進(jìn)情感詞典的文本情感強度計算方法及神經(jīng)網(wǎng)絡(luò)文本分類來建立分析模型,最后,基于建立的分析模型對大專院校進(jìn)行人才培養(yǎng)質(zhì)量進(jìn)行評估,如圖2所示。

圖2 人才培養(yǎng)質(zhì)量評估分析步驟
為了提高人才培養(yǎng)質(zhì)量評估準(zhǔn)確性對相關(guān)數(shù)據(jù)進(jìn)行收集,由于互聯(lián)網(wǎng)數(shù)據(jù)不斷更新及結(jié)構(gòu)不同,采用不同數(shù)據(jù)收集方法,利用網(wǎng)絡(luò)爬蟲的策略,完成實驗數(shù)據(jù)集獲取,將采集的原始數(shù)據(jù)通過篩選及標(biāo)注等處理后,基于篩選的數(shù)據(jù)結(jié)合高職院校人才培養(yǎng)質(zhì)量評價指標(biāo)體系,比如評價指標(biāo)包括課程建設(shè)、教學(xué)能力與人才培養(yǎng)模式改革等內(nèi)容,進(jìn)而完成人才培養(yǎng)質(zhì)量評價數(shù)據(jù)集構(gòu)建,為大專類院校人才培養(yǎng)質(zhì)量分析及改進(jìn)提供數(shù)據(jù)支撐[5]。
基于獲取人才培養(yǎng)質(zhì)量相關(guān)數(shù)據(jù),分析數(shù)據(jù)集計算情感強度,在網(wǎng)絡(luò)評價中,參考口語化及網(wǎng)絡(luò)用語等詞匯,組成了社交網(wǎng)絡(luò)詞典。然后將社交網(wǎng)絡(luò)詞典等加入到基本情感詞典,借鑒基于改進(jìn)情感詞典的文本情感強度計算的方法,建立了分析模型[6]。在分類模型中,利用循環(huán)神經(jīng)網(wǎng)絡(luò)的循環(huán)結(jié)構(gòu),結(jié)合注意力模型與循環(huán)神經(jīng)網(wǎng)絡(luò)的循環(huán)結(jié)構(gòu),形成文本分類模型,并對人才培養(yǎng)評價數(shù)據(jù)中更重要的關(guān)鍵詞分配相對較高權(quán)重,在指標(biāo)分類準(zhǔn)確度上,保證該建立模型的效果。
基于建立的人才培養(yǎng)質(zhì)量分析模型進(jìn)行評價,利用該模型具體分析大專類院校人才培養(yǎng)質(zhì)量存在問題,采用的文本分析是借鑒TF-IDF算法實現(xiàn)特征加權(quán),利用分類器進(jìn)行分類判斷。此外,可通過社會網(wǎng)絡(luò)數(shù)據(jù)為人才培養(yǎng)質(zhì)量監(jiān)督提供反饋,得以在科學(xué)決策的基礎(chǔ)上綜合評判大專高校人才培養(yǎng)方案及其效果的優(yōu)劣程度,為改善大專高校人才培養(yǎng)質(zhì)量提供研究方向[7]。
本文利用文本分析對大專院校人才培養(yǎng)質(zhì)量評估方法進(jìn)行介紹,分別對文獻(xiàn)調(diào)研、文本分析法和質(zhì)化計量進(jìn)行分析,利用人才培養(yǎng)質(zhì)量評估為后續(xù)制定大專院校的人才培養(yǎng)計劃提供參考方向,如圖3所示。

圖3 人才培養(yǎng)質(zhì)量評估方法介紹
通過文獻(xiàn)調(diào)研可廣泛收集國內(nèi)外有關(guān)高職院校的人才培養(yǎng)數(shù)據(jù)和人才培養(yǎng)質(zhì)量評估的相關(guān)文獻(xiàn),結(jié)合高職類院校人才培養(yǎng)的最新研究動態(tài),采用科學(xué)知識圖譜等工具,對國內(nèi)外高職院校人才培養(yǎng)及其質(zhì)量評估的研究方向、引文關(guān)系及發(fā)展趨勢與熱點進(jìn)行分析,為全面把握該領(lǐng)域內(nèi)的發(fā)展態(tài)勢及進(jìn)展,從理論和方法上全面系統(tǒng)地研究人才培養(yǎng)質(zhì)量的相關(guān)問題,利用網(wǎng)絡(luò)工具軟件對高職院校的人才培養(yǎng)質(zhì)量進(jìn)行評估分析[8]。
根據(jù)大專院校人才培養(yǎng)質(zhì)量分析數(shù)據(jù),對相關(guān)文本數(shù)據(jù)進(jìn)行有效整理,將獲取的無結(jié)構(gòu)原始文本轉(zhuǎn)化為結(jié)構(gòu)化且計算機可識別及處理的信息,將文本進(jìn)行科學(xué)抽象。在此過程中,采用文本分析法是利用分詞算法和詞頻統(tǒng)計方法而得到的特征項來表示文本向量中的指定維度,用以描述和代替文本,最后使用可視化的工具將其展示,得到的相關(guān)數(shù)據(jù)用于高職院校人才培養(yǎng)質(zhì)量評估更方便。
質(zhì)化計量是基于扎根理論,立足媒體平臺和社交平臺,通過編寫程序抓取挖掘的大專院校人才培養(yǎng)相關(guān)的文本信息,利用得到的相關(guān)數(shù)據(jù)信息,可采用面板回歸、工具變量法、PSM-DID和RDD等多種計量實證方法進(jìn)行分析,研判質(zhì)化計量人才培養(yǎng)質(zhì)量的綜合評價因素,以及大專高校人才培養(yǎng)體系的建設(shè)重點和發(fā)展方向,給予制定高職院校的人才培養(yǎng)計劃提供參考[9]。
本文介紹了通過采用Python語言完成了在百度知道、新浪微博和百度貼吧等平臺上實現(xiàn)精確的關(guān)鍵詞檢索和文本挖掘算法編寫工作,以及對廣東省高水平高職院校的評價指標(biāo)進(jìn)行分析和網(wǎng)絡(luò)神經(jīng)情感判斷進(jìn)行高強度訓(xùn)練,進(jìn)而完成AI訓(xùn)練工作,人才培養(yǎng)質(zhì)量評估技術(shù)分析如圖4所示。

圖4 人才培養(yǎng)質(zhì)量評估技術(shù)分析
在數(shù)據(jù)獲取過程中,為了獲取方式的高效性,從而保障文本數(shù)據(jù)源的完整及客觀性。在抓取媒體平臺和社交平臺關(guān)于高校人才培養(yǎng)質(zhì)量反饋的文本信息過程中,確保獲取數(shù)據(jù)信息較全面而且無偏差,依托關(guān)鍵詞進(jìn)行全平臺抓取,以保證數(shù)據(jù)源的完整及可靠,另外為了應(yīng)對該平臺中數(shù)據(jù)信息抓取的反制措施,可通過使用模擬瀏覽器的方式繞過障礙。因社會上對高校的人才培養(yǎng)質(zhì)量評價所能產(chǎn)生的文本不僅存在于傳統(tǒng)媒體和自媒體,更多是在社交網(wǎng)絡(luò)平臺,鑒于平臺上的反爬蟲措施和抓取難度,本文利用文本抓取工具的選取與運用,采用Python語言編寫高效率的程序,模擬瀏覽器登錄的方式抓取指定文本信息[10]。依托現(xiàn)有的情感詞典,再組織社交詞典和領(lǐng)域詞典改進(jìn)文本的算法,另外可采用神經(jīng)網(wǎng)絡(luò)模型處理文本中的高頻詞和情感關(guān)鍵詞兩者間關(guān)聯(lián)問題,結(jié)合注意力模型對關(guān)鍵詞給予分配更高的權(quán)重。最后,根據(jù)文本分析的結(jié)果,借鑒網(wǎng)絡(luò)提供參考數(shù)據(jù)從而完善大專院校人才培養(yǎng)質(zhì)量評價體系[11]。
本文根據(jù)“漏斗法”邏輯結(jié)構(gòu),對人才培養(yǎng)質(zhì)量評估得到的社會文本進(jìn)行預(yù)處理、結(jié)合多種詞典和模型數(shù)據(jù)進(jìn)行分析,將數(shù)據(jù)實現(xiàn)可視化展示,深入挖掘大專院校人才培養(yǎng)體系與網(wǎng)絡(luò)文本信息反饋之間的規(guī)律及意義。利用網(wǎng)絡(luò)信息挖掘技術(shù)和大數(shù)據(jù)分析技術(shù),可以精準(zhǔn)分析人才培養(yǎng)質(zhì)量存在問題,也可通過個案調(diào)查、訪談和相關(guān)資料進(jìn)行分析及驗證,實現(xiàn)高職類高校人才培養(yǎng)質(zhì)量評估[12],研究路徑如圖5所示。

圖5 人才培養(yǎng)質(zhì)量評估過程
通過互聯(lián)網(wǎng)產(chǎn)生的海量大數(shù)據(jù),在媒體平臺和社交平臺上獲取有關(guān)于高等學(xué)校人才培養(yǎng)質(zhì)量的信息,有效解決傳統(tǒng)人才培養(yǎng)質(zhì)量評估研究中數(shù)據(jù)難以獲取,數(shù)據(jù)不夠客觀的問題,為高校人才培養(yǎng)建設(shè)工作提供精準(zhǔn)社會信息及數(shù)據(jù)反饋,以便于科學(xué)決策與方案改進(jìn)。
研究理論是為實踐服務(wù),對于高校人才培養(yǎng)體系的建構(gòu),是為了學(xué)生在社會實踐質(zhì)量服務(wù),也反饋在社會網(wǎng)絡(luò)文本上;同時,人才培養(yǎng)體系的運作情況可以用來驗證質(zhì)量評估體系的客觀科學(xué)性。由此,本文對高校人才培養(yǎng)質(zhì)量體系研究可供大專院校的人才培養(yǎng)制定參考借鑒。
本研究對大專類高校人才培養(yǎng)質(zhì)量評估研究中采用新的研究思路及方法,介紹了編寫程序抓取互聯(lián)網(wǎng)海量的文本信息的方法,介紹神經(jīng)網(wǎng)絡(luò)模型來判斷文本中的情感傾向和主體觀點,對專科類高校人才培養(yǎng)質(zhì)量進(jìn)行精準(zhǔn)評估,得以在科學(xué)決策的基礎(chǔ)上綜合評判大專院校人才培養(yǎng)活動及其效果的優(yōu)劣程度,從而保障大專院校人才培養(yǎng)質(zhì)量的持續(xù)改進(jìn)。也可借助信息挖掘和信息分析技術(shù),循環(huán)使用評估體系、利用社會輿論反饋提高人才培養(yǎng)質(zhì)量。