



1 前言
本研究以黃炎培職業教育思想中的“謀個性之發展”為指導思想,通過將學生的社交信息融入推薦系統的個性化識別為技術手段。從學生之間交互度、學生性格、專業相似度、構建專業課程池等方面對學校課程推薦和評價體系進行研究,提出了一個兼顧個性和社會化信息的學生特征模型,并利用相似性,計算課程與專業間的相似性,構建專業課程池,實現滿足黃炎培職業教育思想的個性化培養的課程推薦方法。
當前高職院校學生選課面臨的主要問題是學校選課、排課形式單一,而學生的知識背景、學習能力卻千差萬別,致使黃炎培職業教育思想的個性化培養貫徹成為難題。本研究全面剖析了當前職業教育人才培養方案中的課程選擇和排課方式中存在的模式統一的問題,以學生個性化識別為出發點,從學生性格分析和學生社會化信息識別兩個維度,以實現學生課程的個性化推薦為基本目標,創新性地提出了構建專業課程池的方法,緊緊圍繞學生個性刻畫和課程推薦展開研究,探索提高學生成功選課的方法及選課后的評價標準研究。
1.1 個性化識別建模
黃炎培職業教育思想強調個性化教育,職業教育應該根據每個學生的獨特特點和需求來進行。課題組通過廣泛深入地調查學生學習方式,并研究了信任推薦領域內的最新商業研究動態,從應用調研情況和當前研究現狀分析發現,現有的學校排課模式統一,學生沒有自主選擇權。針對這個問題,課題組提出學生個性化識別模型,該模型旨在利用學生的個性化特征,為他們提供定制的教育體驗。學生個性化識別模型能較全面地識別和刻畫學生的個性,充分反映學生特征,為下一步課程推薦的合理性和推薦的成功率提供基本保障。學生個性化識別模型與黃炎培職業教育思想的理念相符,可以為教育領域提供更好的工具和方法,以滿足學生的個性需求,培養全面發展的人才。
1.2 構建專業課程池
與黃炎培職業教育思想相結合,學校擴大課程選擇范圍,以滿足學生的多樣化興趣和需求。針對當前學生可選的課程非常有限的問題,我們對專業特征和課程特征進行了分類和整合,通過建立課程特征向量和專業類特征向量,然后認真分析學校所開課程的特點,對開設的課程和各系部開設專業的特征,以計算向量余弦值的方式計算課程與專業的相似值,將余弦值大的課程歸入到專業課程池內,構建出相關專業的課程池。
1.3 生成推薦列表
根據黃炎培職業教育思想“謀個性之發展”的理念,本課題設計了一個個性化的培養方案,以學生個性化識別和專業課程池的構建技術為支撐,課題組使用預估評分的辦法計算被預測的學生對所有沒被評價過的課程的預估分值,將分值進行排序,給出N門課程的排序序列,將這個排序序列推薦給學生選擇。
1.4 社會化推薦課程評價標準
黃炎培職業教育思想的“謀個性之發展”課程推薦評價標準的制定是一個復雜而重要的過程,需要考慮多個因素,以確保評價標準的專業性和全面性。課題組首先根據準確性、個性化、時效性、解釋性、學生滿意度等方面設定評價目標,根據學生的選課成功率進行評價,以課程覆蓋率和準確率的平均絕對誤差為評價工具,對結果進行分析,比較不同學生、不同課程的評價結果。
2 研究工作的內容詳述
2.1 問題描述
將課程推薦與黃炎培職業教育思想相結合的課程分類可以有助于更好地實施黃炎培教育理念。將學校課程重新進行定義和劃分,如下:核心價值觀教育類課程、人文科學與社會科學類課程、健康與體育教育類課程、創新與創業教育類課程、實踐與實習類課程、職業發展與就業指導類課程。以上專業和課程假設為L個專業大類、M門課程、N個學生,學生集合U={u1,u2,u3,…, un},專業課程池集合Z={z1,z2,z3,…,zl},課程集合C={c1,c2,c3,…,cm}。學生之間的信任關系記為tu,v,tu,v為[0,1]之間的小數,學生信任關系矩陣記為:T。學生的性格記為pi,pi為[0.5,1]之間的小數,越內向的取值越靠近0.5,越外向的取值越靠近1。課程和專業之間的相似值記為Xc,z,Xc,z這里為0~1之間的一位小數,所有的相似值組成相似矩陣,記為:X=[Xc,z]M×L。新學期新開設的課程ci第一次排入選課系統中,計算新開設課程與系統內所有專業的相似值xi,j,將新加入的課程歸類相似值最大的課程池zk中。選課學生u對新加入的課程c的評分記為rui,cj,設定rui,cj為[1,5]之間的整數,如果第一次選課的學生對某一課程沒有評分,這一項在矩陣中用0表示,評分矩陣記為:R=[Ru,c]M×N。
2.2 學生的社會化個性識別模型
黃炎培職業教育思想下學生的社會化個性識別是一個復雜而重要的問題。要有效地識別學生的社會化個性,課題組采取了以下方法:學生調查和問卷調查。進行定期的學生調查,以了解他們在校園和社會環境中的互動和行為。教師觀察。教師在日常教學中可以觀察學生的行為和互動方式,這有助于了解他們的社會化特征。家長和同學反饋。與家長和同學交流,以獲取他們的觀點和看法。社會技能評估。進行社會技能評估,以了解學生的溝通、合作和解決沖突的能力。通過以上方法,對學生進行社交個性分類,將學生分為內向型和外向型。內向型學生更喜歡獨立思考,外向型學生更愿意和他人互動和合作。根據“信任即相似”的假設,利用網絡交互信息,計算學生之間的信任度。
信任的定義:若有學生u和學生v,v的選課是參考u的選課結果而做出的選擇,則認為v信任u。計算出學生的信任度再用其個性進行修改,得到學生v對u的信任值。公式1給出了計算個性化的學生之間的信任度。
t(v,u)=pv·(1)
表1是表示學生之間信任的關系矩陣,表格中有u1、 u2、u3、u4、u5五個學生,表格中0~1之間的數值表示學生之間的信任關系,假設學生之間是互相信任,比如u3和學生u1、u2、u4、u5有信任關系,那么u1、u2、u4、u5也都和u3有相同的信任關系。
表2表示學生對課程評分構成的矩陣,表格中包含有5個學生對5門課程的評分值,學生對課程的評分是矩陣中的一個值,數值在[0,5]之間。在表格中課程c2和c4的已有評分是學生u2給出的,數值都是3。沒有被這5個學生選過的課程,在矩陣中的值都是0。0值越多,沒被學生選過的課程越多。
表3是專業—課程的X矩陣,表格中列出5個專業和5門課程的相互關系,以[0,1]的小數表示課程與專業之間的相似性。例如,課程c2和專業z1、z2、z3、z4、z5之間的相似值都是非0值,z1的相似值最大。從而課程c2歸入到z1的專業課程池中。專業—課程相似的矩陣數據比較充足。
本課題研究學生和課程之間的關系,假設學生u和課程c,其中u∈U,c∈C,而學生對課程的評分ru,c未知。課程c在第一次被選課之前,要計算課程的特征向量,根據課程向量和專業類向量之間的相似值,加入相似值最大的專業課程池中,我們再去預估學生u對課程c的評分值。
2.3 建立以相似值和信任值為基礎的課程池算法。
(1)課程與其專業的余弦相似值計算
構建專業矩陣Qa×b,其中a為學校的專業數量,b為專業關鍵特性的數量。將專業關鍵特征數量看作是多維空間上的向量,利用cos計算課程與專業類的相似值公式2如下。
(2)
其中,ci是表示目標課程的向量,zj是所將歸屬的專業類的向量,輸出課程與其專業的cos矩陣XM×L,其中,M表示學校內全部課程的總量,如管理學基礎、個人與團隊管理、教育學等全校課程的總數量;L表示全校設置所有專業的總量,如法學、公共事業管理、土木工程等的總數量。
(2)構建專業課程池
由余弦相似來計算相似值,根據相似值來建立專業課程池,由公式2計算每一門課程與所有專業類的相似值,把課程歸入相似值最大的專業課程池中。
計算全部課程與所有專業的相似值和建立課程池的算法如下。
算法1 建立課程池的偽代碼
輸入:全部課程的集合C,全部專業的集合L,課程—專業相似值的矩陣S=[Sc,z]M×L
輸出:專業課程池矩陣
1:for i from 1 to m do
2:for j from 1 to l do
3:利用公式2計算每一門課程ci與專業zj的余弦相似值
4:記錄相似值矩陣Mm×n
5:ci歸入相似值最高的zj
6:endfor
7:endfor
未選課的學生u,對新課程c的預估評分,可由公式3(學生對課程的預估評分)得到。
公式3學生對課程的預估評分
以學生之間信任關系為基礎的課程推薦評分預測算法。
算法2 預測評分的偽代碼
輸入:學生對已選課的評分矩陣R,學生的信任關系集合T
輸出:生成新的評分矩陣R
1:if (ci in 課程池)
2:for i from 1 to m do
3:計算學生u對已選課程的評分平均值
4:ruc= rcache
5:else
6:通過公式(1)計算學生之間的相互關系值,選取值最大的學生v
7:if (rvc>0)
8:利用公式(3)計算ruc
9:else
10:計算學生v對課程c所在課程池的已評課程的rcache
(3)算法的后續討論
以計算專業相似性的方法,劃分專業課程池的算法,利用了學校排課中的課程與專業相關的特性,進行余弦相似值計算,根據相似值的大小,將新加入的課程歸入相似值大的專業課程池內,這防止了課程進入選課系統的冷啟動的出現。同樣地,新生第一次進入系統選課,通過學生歸屬在班級或系科里,解決了學生的冷啟動問題。
通過學生對課程的預測評分計算出新生對所有還沒選擇課程的預測評分,將預測值排序,從列表中選擇最大的N門課程進行推薦。
例如,判斷新生李華對人力資源管理課的預測評分。先搜索人力資源管理課所在會計專業池內李華已經選修課程的課程評分,將所有課程的均值返給,如果會計專業課程池內沒有李華選修的課程,則選取李華信任最大的王山作為游走目標,若王山對《人力資源管理》有評分rv,c,則=tu,v·rv,c,否則,計算王山在會計專業池內已選修課程的評分均值rv,c,如果李華與王山的信任值為tu,v,則李華對《人力資源管理》的預測評分為:=tu,v·rv,c。在選課系統中,基于信任關系的隨機游走算法,可以百分百實現選課預測,但是根據路徑的長度,準確性也相應地變化。
2.4 課程推薦的評價
黃炎培職業教育思想的課程推薦評價步驟與一般的課程推薦評價類似,但可以根據黃炎培職業教育思想的特點進行定制。首先收集和預處理數據,收集與黃炎培職業教育思想相關的用戶行為數據和課程信息。這些數據可能包括學生的學習歷史、瀏覽記錄、學習興趣等行為,以及課程的內容、難度等特征信息,再劃分訓練集和測試集,將數據集劃分為訓練集和測試集,以確保評估結果的準確性和可靠性,可以使用交叉驗證或其他合適的劃分方法。
(1)課程推薦評價標準
①準確性。評價目標應該確保推薦算法能夠準確地根據學生的需求和興趣推薦適合的選課信息。這可以通過計算推薦結果與用戶實際選擇的課程之間的匹配度來進行評估。
②個性化。評價目標應該關注推薦算法的個性化程度,即推薦結果是否能夠符合不同用戶的特定需求和興趣,這可以通過計算推薦結果的多樣性和覆蓋率等指標來進行評估。
③時效性。評價目標應該考慮推薦算法的時效性,即推薦結果是否能夠及時地反映最新的選課信息和用戶需求變化,這可以通過計算推薦結果的更新頻率和響應速度等指標來進行評估。
④解釋性。評價目標應該關注推薦算法的解釋性,即推薦結果是否能夠清晰地向用戶解釋為什么會得到這樣的推薦結果,以增加用戶對推薦結果的理解和信任,這可以通過計算推薦結果的解釋性指標來進行評估。
⑤用戶滿意度。評價目標應該關注用戶對推薦結果的滿意度,即推薦算法是否能夠真正地滿足用戶的需求和期望。這可以通過用戶調查、反饋和評分等方式來進行評估。
通過設定以上評價標準,并合理選擇相應的評估指標和評估方法,可以有效地評估課程推薦系統的性能和可靠性,為進一步改進和優化提供參考依據。
(2)課程數據測評
我們選取與黃炎培職業教育培養“謀個性之發展”目標相吻合的覆蓋率和準確率兩個評價指標對推薦系統進行實驗和分析比較。在課題實驗的時候,嚴格掌控數據的來源、格式。刪除含有缺失項的記錄,用默認值或使用其他相關變量的信息填充缺失值進行插補等。識別并處理與其它觀測值明顯不同的值,再對學生之間的交互關系進行模擬,信任度設置在[0,1]之間,通過將學生以班級、系部進行信任關系歸類,生成學生的信任關系表。
①以選課和行為記錄為數據集。訓練集1是采用了學校最近3年的48個專業、1290門課程的150276課次的選課記錄。訓練2是學生在3年的學習過程中產生的546987份學生行為記錄,將它分成信任值在[0,1]之間的信任關系。測試集是2023年秋季的6個專業、187門課程、1902個學生的選課數據和這些學生的行為記錄作為信任關系集。
②算法的評價指標
在建立各類專業課程池的時候,課程的覆蓋率是重要的評價指標,表示課程歸入到課程池的完全程度。在學校課程的分類過程中,課程分類一直不徹底。比如大數據分析課程,既與計算機應用專業相類似,也和大數據與會計相類似,這種模棱兩可的課程,就無法被推薦給學生。課程覆蓋率的高低、課程推薦的準確性也就有了相應的變化。覆蓋率的計算公式如下。
Coverage= (4)
其中,是指課程池內包含的課程的總量,是指全校課程的總量。
準確度是課程推薦的另一個評價指標,是在信任的基礎上加入隨機游走策略后,成功將課程推薦給學生的比率,用平均絕對誤差來表示。平均絕對誤差的大小與推薦是否成功緊密相關,平均絕對誤差越小越好。設學生對課程的預測評分集合為={,,…,}而實際學生選課后的真實評分集合為R={,,…},那么推薦成功的準確度的計算公式如下。
(5)
(3)結果分析
將48個專業、1290門課程進行實驗,將對課程進行分類的詞語分別設定為3、5、7、9、11、13、15個,在對課題研究的算法進行實驗過程中,驗證了對課程進行分類的關鍵詞的選擇決定算法的成敗。選擇專業術語作為“專業類關鍵詞”,兩個評價指標都很低。設定專業性不強的“非專業關鍵詞”,兩個評價指標都非常高,但是也有同一門課程分到了不同的專業池里的情況。分布圖如表4和表5所示。
由上表所示,課程進行分類的過程中,是否是專業的關鍵詞對課程的成功分類起到關鍵的作用。在本課題研究中,選用黃炎培職業教育方向相關的課程作為訓練集和測試集,所以測試結果完全在預期中。
本研究的課程分類和推薦算法是在經典的隨機游走算法的基礎上改進的,所以將本文算法和隨機游走算法用平均絕對誤差值進行比較,結果如下圖所示。
從圖中可以看出,本研究采用的先建立專業課程池再基于信任的隨機游走雙層結構算法與傳統的TidalTrust算法與比較,課程推薦成功的可能性更大。在學校選課系統內,已經構建了各個專業的課程池,所以課程查找范圍進一步縮小,在基于學生互相信任基礎上的隨機游走算法,進一步提高了課程推薦成功的可能性。
3 總結
黃炎培作為中國職業教育領域的杰出思想家,他的思想對中國的職業教育產生了深遠的影響。為深入研究和傳承黃炎培的職業教育思想的“謀個性之發展”的理念融入學校課程中,本課題研究提出的以個性為基礎的新的學校課程設置算法,先根據課程與專業的相似值大小,將課程歸入專業課程池,再在專業課程池中,將學生之間的信任關系融入游走算法中,將預測學生評分高的課程推薦給學生進行選擇。在這種情況下,解決了系部增加的學期新課的冷啟動問題,加入信任的隨機游走算法后,也將黃炎培職業教育思想中的“個性化”考慮在內,解決了新生剛進入學校的選課冷啟動問題。研究最后的實驗驗證了,基于信任的隨機游走算法能夠提高學校課程的推薦成功率,也減少了學生選課的盲目性。
(作者單位:1.煙臺職業學院;2.煙臺開放大學)