劉振棟 羅群

摘要:文章采用教學視頻標簽化標注視頻知識點、類別等信息,職業教育知識圖譜以視頻知識點為中心,基于在線教育平臺大數據構建畫像模型勾畫目標推薦用戶,分析在線教育領域推薦場景,研究基于視頻關聯網絡以“數據驅動+知識驅動”為理念的視頻推薦模式和算法。
關鍵詞:在線職業教育;知識圖譜;學生畫像;個性化視頻推薦
中圖分類號:TP273? ? ? ? 文獻標識碼:A
文章編號:1009-3044(2022)34-0104-03
1 概述
當今,隨著云計算技術迅速發展,移動設備、智能終端的普及,教育信息化應用更加廣泛。在線開放課程就是教育現代化的要求,依靠信息技術、智能終端和云平臺技術而進行的具有科學性、多樣性、開放性和創新性的一種教學方式[1]。在線開放課程學習方式靈活多樣,同時可滿足不同層次、不同年齡、不同興趣等廣大學習者的需求。2019年以來,線上教學方式趨于常態化,在線課程資源的建設顯得尤為重要。
隨著硬件計算能力的快速提升和數據量呈爆炸式增長,深度學習成為研究焦點。在推薦系統領域,相關的推薦算法也相應增多[2]。目前,推薦算法包括基于圖文、用戶以及協同過濾、混合推薦等推薦算法。在線個性化教學視頻推薦,是從學生的角度出發,以基于用戶的協同過濾式算法將在線學習用戶作為分析對象,在學習用戶之間找到相似用戶,這樣就可以面向目標用戶、相似用戶和集中感興趣用戶結合知識結構邏輯推薦沒有接觸過的視頻內容,形成推薦[3]。在眾多推薦算法中,AutoRec算法是基于自動編碼器(AutoEncoder) 的推薦算法,在視頻推薦過程中,該算法可根據輸入用戶訪問視頻信息數據矩陣來重構新的矩陣,然后根據用戶訪問數據從大到小進行推薦。2016年,Google發布了Wide & Deep算法,該算法將寬度模型與深度神經網絡進行聯合訓練,結合Wide & Deep算法優勢,形成與AutoRec算法的有益補充,可解決推薦系統等大規模的帶有稀疏輸入的回歸或分類問題。
此外,有文獻提出了一種通用框架,即可以表示和擴展矩陣因子分解算法,并且能夠與深度神經網絡相結合。基于深度神經網絡的推薦算法可以學習出在線學習用戶和視頻之間的非線性關系,而不像矩陣因子分解算法只能學習在線學習用戶和視頻潛在特征的點乘關系。然而,基于深度神經網絡的推薦算法網絡架構難以改變,也就難以結合其他的信息改進推薦效果[4]。因此,矩陣因子分解算法仍是推薦系統的一把利器。近年來,與深度學習相關的推薦算法正逐年增多,同時華中科技大學根據收集到的用戶歷史行為信息,建立一個基于標簽的視頻流行度預測模型。通過這種方式可以為目標用戶預分配一些流行度高的視頻資源,這不僅能夠提高用戶的體驗效果,而且也能有效地解決新用戶的冷啟動問題[5]。基于以上眾多研究成果和日益成熟的推薦算法,加上神經網絡、深度學習等算法的自學習屬性,使得在復雜場景自學習的智能視頻分發機制的研究上也有了充分的科學意義。
2 智能視頻分發機理分析
視頻作為承載信息量最豐富的數據傳輸形式,無疑是學生學習知識的重要途徑。面對海量教學視頻資源和未來線上教育發展、學生學習途徑網絡信息化的大勢所趨,研究目標是通過智能視頻分發機理,完善學生學習的個性化路徑,輔助分析并幫助學生直達適當的學習視頻資源,實質上為各類學生、各類需求量身打造個性化視頻推薦系統。從學生個人角度來看,提高學生學習的主動性、積極性以及學習效率,幫助學生一步一步學習掌握知識技能;從建設智慧教育的角度來看,使教育搭載上科技發展智能化的動力系統,進一步完善“智慧教育”這個大課題,提高優質教學視頻資源的利用率;從社會經濟發展的宏觀角度來看,能夠推動社會基礎建設的教育工作,幫助完善社會發展和社會人才教育培養體系。目標通過為學生提供更完善好的學習服務,逐漸擴大來完善智慧教育的建設和人才培養體系,最終助力社會現代經濟和智能科技的蓬勃發展。
隨著社會互聯網等科技的快速發展和國家對于智能科技深入教育行業的支持,學生對于獲取各類知識和自學方式發生了很大的變化,關于建設智慧教育的建設成果不斷涌現,出現了很多優質在線教育平臺,例如科大訊飛的博思智慧學習平臺。針對在爆炸式增長的教學視頻資源和一般推薦機理在大規模的視頻信息和數據基礎上開展視頻推薦業務表現不足的現狀,結合學生各類實際學習場景的需求,發現對學習教育這一復雜應用場景的教育視頻分發機理研究的必要性和實用性,進一步調研挖掘從技術角度驗證了這一研究的可行性。目前在線教育的發展處在快速發展階段,關于智慧教育的建設工作還沒有很完善,隨著技術的不斷進步,將催生越來越多的基于人工智能和大數據的教育業務。
對智能視頻分發機理在教育復雜場景下的應用設想是一個全新的發現,同時也是一個全新的挑戰。相信依托發展教育培養人才的重要性和有關人工智能、大數據等科學技術的基礎積累,攻克這一難題將只是時間問題。
3 智能視頻分發因素分析
筆者針對在線教育復雜場景下教學視頻資源,根據不同學生的專業學習路徑、認知能力、興趣偏好和自學行為路徑等,分析設計各類學習視頻推薦場景,充分挖掘大數據相關技術處理海量視頻數據,全方位開展復雜場景自學習的智能視頻分發機理的研究。
通過前期的教育類復雜場景設計和技術調研工作,發現關于教育場景自學習的智能視頻分發機理與普通的智能視頻分發機理有很大不同,主要從原理、方法和規律上進行論述。
從原理上,教育視頻推薦算法原理明顯由純數據驅動轉向“數據驅動+知識驅動”,原因主要體現在視頻數據、用戶畫像和推薦場景的巨大差異上。
視頻數據方面,對一般視頻來說,其本身巨大的信息量被濃縮成幾個標簽,例如“生活類”“體育類”“舞蹈類”等。而教學視頻的屬性標簽分析將會復雜得多。與普通視頻相比,教學視頻本身所承載的知識點的關系錯綜復雜,受眾層次和知識深度差異大,視頻分類要求嚴格等。
用戶畫像方面,現有的互聯網相關視頻產業的視頻推薦中,用戶畫像是清晰易構建的;而教育場景下要構建較高完整度的學生畫像,需要分析大量的學生個人數據、專業路徑和學習行為等,最終系統表現的優劣與構建學生畫像的質量成正比。
推薦場景方面,教學視頻的推薦場景除了常見的包括進入平臺后啟動、觀看完視頻后等場景外,還有例如平臺上答錯題目啟動,學習完某知識點和課程后和完成某學習任務后等諸多較為復雜的場景,為了完善系統的專業性,需要充分考慮并設計相關復雜場景。
從方法上,由于教育類學習資源的特殊性,需要整合基于知識圖譜的學習資源,包括制定職業教育領域知識圖譜標準、建立統一的知識點圖譜,積極填充教學資源和建立知識圖譜與課程的對應等。另外由于學生畫像和推薦場景的復雜程度,不同于普通的視頻推薦,需要額外分析學生的認知能力和學習行為以及交互模式等。在一些通用的視頻推薦系統中主要考慮的目標是:準確度、新穎度、多樣性。而在教育視頻推薦系統中,還需要考慮很大難度的匹配性。
從規律上,教學視頻的屬性與普通視頻差異大,所以在一些普遍推薦的規律,例如加大同類型視頻、同作者視頻等權重外,還需要重點考慮視頻中知識點的關系以及視頻的分類,例如是否同屬于一門課程,知識點是否重疊,是否跨專業等因素。教學視頻的特殊性,使得視頻之間也比一般視頻具有更多的關系和規律,都將在系統中被挖掘分析。
4 智能視頻分發總體設計
總體設計步驟如圖1所示,第一步:視頻標簽預測;第二步:復雜場景分析;第三步:構建學生畫像;第四步:構建基于知識圖譜的視頻關聯網絡;第五步:實現視頻推薦模式及算法。
其中,視頻標簽預測主要包括構建知識點標簽、難度標簽。復雜場景分析包括以題推題場景、以視頻推視頻場景、搜索場景等。用戶畫像包括:基礎數據、行為數據構建數據標簽,基于學生作業構建學生能力及用心程度標簽(進行學生作業相似評價,生成用心程度標簽),學生職業素養、崗位能力標簽等。基于知識圖譜的視頻關聯網絡包括構建知識點圖譜(包括通識課程知識點、專業基礎知識點、專業方向知識點等)與視頻集之間的關聯關系。視頻推薦模式及算法包括自適應學習算法、適應性學習算法,自適應學習包括錯題推題、錯題推薄弱知識點、學習路徑規劃等,適應性學習是指根據學生興趣愛好和習慣來進行推薦,貫穿學習過程當中。
5 智能視頻分發實施路徑
實現智能化視頻推薦,需要解決以下兩個問題:一是如何構建基于職業教育領域知識圖譜的教學視頻關聯網絡;二是如何依據視頻關聯網絡進行個性化視頻推薦。為了解決第一個問題,首先引入教學視頻標簽化研究,解決如何給視頻進行標注知識點、類別等信息,然后引入職業教育知識圖譜將以視頻為中心的資源關聯起來,同時闡述各個視頻知識點的關系。為了解決第二個問題,首先引入項目組已完成的學生畫像研究工作,基于在線教育平臺大數據構建畫像模型勾畫目標推薦用戶,然后分析在線教育領域推薦場景,接著研究基于視頻關聯網絡以“數據驅動+知識驅動”為理念的視頻推薦機制,包括推薦模式和算法。
1) 職業教育領域教學視頻標簽化
分析描述教學視頻的屬性,比如所屬學科、視頻類型、教學老師、視頻知識點等。教學視頻的特殊性,知識點是否重疊,是否跨專業等因素使得視頻之間也比一般視頻具有更多的關系和規律,都需要被挖掘分析,并進行標簽化。
2) 基于知識圖譜構建視頻關聯網絡
職業教育知識應具備體系性、全面性。本研究以博思智慧學習平臺提供的豐富自學課程數據為基礎,包括課程頁任務、視頻任務、試題任務、知識圖譜、錯題集等。其中通過視頻任務,學生可直觀地了解到老師需要講授的知識點,是最有效的自學途徑之一,因此需要所有資源以視頻為中心進行關聯,研究如何利用知識點圖譜模型的方式對視頻進行表示關聯,圖譜上的點代表闡述該知識點的視頻,同時需要闡述各個知識點的關系。
3) 引入基于平臺大數據構建學生畫像
在線學習平臺實現課堂全過程常態化應用,并將產生大量的數據構成了包括教師、學生、管理者在內,涵蓋課前、課中、課后教學全過程多個環節的多維教育大數據[6]。
基于上述數據,將已經研究的學生畫像成果引入,包括圍繞學生的三個層面(事實層、模型預測層、認知模型預測層)標簽,目的是引入平臺教與學的行為和活動過程狀況和學生偏好、認知能力等標簽。
4) 分析在線教育復雜推薦場景
學習是由人參與其中的社會活動,而具有生命和智能特征的系統都是復雜系統。在研究教育領域時候,教育系統內部學生、老師、知識的關系非線性,因此,要充分考慮學習的復雜性問題。同時在線學習系統應具有引導性,發現在學習時需要哪些場景觸發推薦算法。例如平臺上答錯題目時,學習完某知識點和課程后,或者完成某學習任務后等諸多較為復雜的場景。
5) 智能視頻推薦算法研究
結合視頻關聯網絡,針對不同學校不同層次的學生,研究如何智能引導學生學習視頻學習資源,建立知識體系,培養學習習慣,幫助學生一步一步學習掌握知識技能。
6 結論
通過在線教育這一復雜場景下自適應智能視頻分發機理研究,提出用 “數據驅動+知識驅動”的特色視頻分發機理,采用視頻關聯網絡構建與智能視頻分發方法,解決將合適的教學視頻資源分發給需要的學生的問題,在整個智慧教育個性化推薦的建設中具有相當的創新性,也給智能驅動學習方式變革賦予積極的意義。
參考文獻:
[1] 陳亮,戴孝林,文斌.在線開放課程的微項目化探究[J].紡織服裝教育,2021,36(6):583-585.
[2] 周瑞環.基于視頻流行度及視頻分類標簽的Top-N推薦[D].成都:西南交通大學,2018.
[3] 展淵,王宇.基于用戶行為分析的視頻推薦算法研究[J].電子測量技術,2017,40(4):39-42.
[4] 周瑞環,趙宏宇.結合物品流行度的列表級矩陣因子分解算法[J].計算機應用,2018,38(7):1877-1881.
[5] 柯偉兵.基于標簽的視頻流行度預測和推薦算法研究[D].武漢:華中科技大學,2016.
[6] 劉邦奇,李鑫.智慧課堂數據挖掘分析與應用實證研究[J].電化教育研究,2018,39(6):41-47.
【通聯編輯:唐一東】