羅利能,吳秋蓉,石瑩禹,徐浩霖,李鄉儒,肖江平,彭婉芬
(1.華南師范大學 數學科學學院,廣東 廣州 510631;2.華南師范大學 計算機學院,廣東 廣州 510631;3.廣州犀靈信息科技有限責任公司,廣東 廣州 511458)
近年,隨著人工智能(AI)在計算機網絡、智能機器人、電力和綜合能源系統等眾多領域中的成功應用與突破[1-3],AI技術不僅成為眾多企業確保競爭力的關鍵,也成為國家戰略的重點內容。2018年4月,人民日報海外版報道了AI近年的快速發展與相關專業人才的巨大缺口。另外,據人工智能人才白皮書[4]顯示,2017年前10個月內AI人才需求量已經大約達到了2016年的2倍,2015年的5.3倍。因此,以機器學習、深度學習、數據挖掘和大數據分析等為代表的AI技術受到了廣泛關注,并導致了社會對相關技術崗位需求的急劇增加和嚴重的AI人才緊缺。
2019年教育部確定AI為新增重點支持領域,納入“國家關鍵領域急需高層次人才培養專項招生計劃”,希望高校能為國家關鍵核心技術領域儲備戰略人才。因此,國內各大高校紛紛開設與AI相關的專業、學院。特別是,隨著“互聯網+”的普及、教育信息化的深入推進,人工智能類人才的培養方式經歷了許多變革。例如,在學習環境的開放性方面[5],許多高校老師都會結合在線教育平臺教授AI課程。但是,目前已有在線教育平臺存在許多不完善的地方[6],例如,教師無法及時獲悉學生對知識點的理解程度,難于恰當安排課程講解重點;AI知識體系過于龐大[7],學生無從下手;與AI相關的課程作業往往沒有標準答案,教師批改作業有一定困難;學生并不了解自己對于課程知識點的掌握程度。這些不足之處可能導致在線學習AI相關知識和技能的相關環節變得更加困難與復雜。因此,急需一個適合AI人才培養的在線平臺。
針對以上問題,著力于開發并不斷完善一個智能教育平臺——智能化數據挖掘學習平臺(DM_Edu)。這是一個高校數據挖掘類課程的輔助教學平臺,同時具備大數據分析和智能化的功能[8]。本研究瞄準了AI人才的市場需求,針對國內高校的數據挖掘技術的教育教學,致力于運用智能化的系統功能升級傳統的課堂教學[9]。具體創新如下:
(1)學生在線根據課件預習、復習時,可以做難點標注,教師可據此相應地調整課堂教學;
(2)通過收集學生的在線學習數據,系統智能地向學生推薦適合的課外學習內容,構建知識圖譜,學生不僅可以更好地學習重點和難點,也有利于掌握AI體系的某一分支,促進個性化戰略人才的培養;
(3)根據數據挖掘類作業的特點,開發了算法訓練案例及其自動測評功能,使得教師批改作業的負擔得以減輕,從而擁有更多時間對不同同學進行個性化指導;
(4)通過收集學生的在線學習數據,可視化學生學習情況,讓學生更為直觀清晰地了解自己對課程的掌握程度。
DM_Edu平臺結合大數據分析與推薦算法,不僅實現了傳統教育平臺的功能,還為使用者提供智能化的教學服務。DM_Edu平臺的系統架構分為以下三層:資源層、管理層、智能層。
資源層主要用于存儲平臺上的各種資源,包括教師的教學資源、學生的學習資源以及用戶數據等。教學資源,如教師根據課程特色和教學特點設計出的教學視頻和教學課件;學習資源,如學生分享的優秀作業代碼或者在交流區分享的學習經驗等;用戶數據,包括用戶基本數據和行為數據。其中,用戶行為數據是為智能層分析提供數據支撐。通過資源層,平臺可以有效存儲教學資源,使資源得到最大化利用。
平臺數字資源都存儲在數據庫當中,采用的數據庫運行管理系統是Sqlite3[10]。這是一款開源的小型嵌入式數據庫,目前已被幾乎所有的高級程序開發語言所支持。它與Access相比更小、更快、容量更大、并發更高,是更適合平臺使用的中小型站點。
管理層主要是對DM_Edu平臺不同應用的管理,包括用戶管理、資源管理、安全管理等。平臺將用戶劃分為教師用戶、學生用戶和管理員,并對三類不同用戶的訪問做相應的授權[11]。資源管理是指平臺對系統的實驗環境和教學資源等進行管理,實現資源的高效使用。安全管理主要考慮實驗環境安全、用戶信息安全等,為平臺的安全運行提供保障。
管理層是進行平臺管理的樞紐,它對系統資源的調度情況進行分析和處理,并將結果展示至前端;同時也擔負著維護平臺安全的職責。
智能層是為了實現個性化教育而設計的,是平臺智能化和個性化的引擎。平臺通過記錄用戶使用DM_Edu平臺的數據,構建用戶行為追蹤和分析的基礎信息。據此,使用人工智能方法繪制用戶畫像并預測其學習情況。進而,平臺為學生個性化地推薦相應的學習資料,達到引導學生學習的目的。智能層可分為兩大板塊:用戶追蹤和智能分析。用戶追蹤板塊收集的數據通過智能分析板塊的算法為用戶提供智能化服務。
用戶追蹤板塊實現的功能是追蹤學生在DM_Edu平臺中的學習行為。所謂學生的學習行為,就是學生在DM_Edu平臺所進行的操作,比如瀏覽頁面內容,觀看教學視頻或課件,在討論區進行提問、解答、點贊、評論、探討等等。本平臺的追蹤流程為:在Web端使用js采集頁面信息,向日志服務器發出http請求,以將采集到的數據作為參數傳遞保存至頁面瀏覽類日志。通過服務端采集日志,再匯總發送給下游鏈路消息隊列。通過js腳本將追蹤代碼嵌入到每一個頁面里,減少對網站工作代碼的侵入并保障頁面追蹤的全覆蓋。因此,用戶追蹤板塊記錄了同學們使用DM_Edu平臺進行學習、交流的信息。
智能分析板塊則是對學生的在線學習、交流數據進行行為特征的分析,并對行為發展的趨勢做出預測。DM_Edu平臺基于學生的行為數據和作業情況等學習行為數據,利用文本挖掘等算法,構建用戶畫像[12],探究用戶的學習行為偏好和興趣,構建了個性化智能教學系統。
基于上述系統架構,將DM_Edu平臺的核心功能劃分為教學模塊、學習模塊、管理模塊以及智能化輔助學習模塊。DM_Edu平臺的功能模塊設計如圖1所示。

圖1 DM_Edu平臺的功能設計
教學模塊是為高校數據挖掘類課程教學的使用而設計的,包括教學資源和在線實驗環境等。一方面,教師可利用平臺上已有資源或者自行上傳教學資源,靈活安排課程和教學內容。另一方面,基于平臺的在線實驗環境,教師不僅可以進行課堂演示,還可以為學生布置作業,并利用系統對作業進行自動評分。此外,師生均可在討論交流區提問,或瀏覽、回答學生提出的問題,這有助于教師及時了解學生的學習情況、難點,有助于同學們及時釋疑和朋輩學習。
因此,DM_Edu平臺可減輕教師的教學負擔,使得教師能將更多的精力放在教學設計上,大幅度提高教學質量;另外,平臺為學生提供難點標注,并能以可視化方式展現學生的學習情況,教師據此可以更好、更及時地調整優化教學安排。
學習模塊主要是提供給學生自主學習數據挖掘領域的相關技術。借助該模塊,選課學生既可以根據教師提供的教學資源進行自主學習,也可以利用平臺的在線實驗環境完成教師布置的作業。此外,平臺還開發了討論交流區。
討論交流區是用戶進行問答、分享的區域(如圖2所示)。在討論區中,學生可以提問,也可以在線編輯學習筆記、心得體會、個人博客,或分享看過的優質資源;同時還能瀏覽或回答他人問題,拓展自己對學習內容的認識[13]。與傳統的MOOC平臺討論區無人問津的情況不同,DM_Edu平臺作為一個高校數據挖掘類課程的輔助教學平臺,采用了積分獎勵機制,與課程最終成績相掛鉤,激勵學生積極參與討論。

圖2 討論交流區截圖
為了便于運營維護團隊對平臺資源進行分配及安全管理,該模塊開發了用戶管理、資源管理和安全管理等三大管理功能,實現對平臺的高效管理。
用戶管理子模塊通過將用戶分為不同組,并賦予其不同的權限,以便于對用戶進行管理以及資源權限調度。
DM_Edu平臺主要的兩大資源是在線實驗環境和教學資源。實驗環境是系統在線實驗功能的基本保障;而教學資源庫包含了大量的教學視頻、課件和示例代碼。資源管理通過對這兩大資源進行管理,實現資源的高效使用。
安全管理包括實驗環境安全和用戶信息安全。實驗環境安全方面目前通過限制用戶可編寫代碼片段的長度及其運行時間上限降低對內存、硬盤的潛在風險;研發團隊計劃將來添加代碼自動預檢查功能和代碼運行中行為檢測功能,進一步降低用戶程序對內存信息的潛在威脅的檢測、硬盤空間和信息安全的檢測等。在用戶信息安全方面,實現了用戶密碼的加密、通過郵箱的密碼重置功能;將來擬添加基于手機短信和安全問題回答等措施的密碼找回方案,進一步提升用戶信息的安全性。
大數據分析模塊通過對用戶在平臺的行為數據進行收集,利用文本挖掘、聚類分析等算法進行行為建模,以構建用戶畫像,幫助用戶自我評估、了解和提升。該模塊包括用戶追蹤,用戶畫像和可視化學習過程等三個功能。
用戶追蹤是為平臺實現智能化提供數據支撐而設計的。將用戶的行為分為參與、堅持、專注、交互、學術挑戰、學習的自我監控等六種類型。該平臺以此分類作為用戶在線學習行為的主要分析維度。用戶追蹤模塊記錄了用戶的平臺登陸次數,對教師回帖次數以及觀看視頻時長等數據,詳見表1。

表1 在線學習行為分析框架
用戶畫像是基于對用戶在線學習行為數據的聚類分析、預測等形成的用戶概要描述。用戶畫像反映了用戶的興趣愛好、知識掌握情況等(如圖3所示),可用于對其實踐能力進行評估,幫助用戶自我認識。目前,該功能的具體實現仍在探索、優化中。
可視化學習過程。平臺會對用戶在系統中的學習行為數據進行收集,例如,在平臺上的點擊、瀏覽等基本行為數據。并對這些數據進行統計分析和可視化展示。這些信息的收集和可視化展示有助于學生直觀地掌握自己的學習情況(如圖4、圖5所示)。借此,學生不僅能及時查缺補漏,進而提高學習質量;也更容易自醒和優化調整自己的學習行為。

圖3 用戶畫像構建原理

圖4 某同學的作業成績動態(成績為10分制)

圖5 某同學的課件瀏覽時長
為了提高用戶的學習效率并提供更好的體驗,該平臺為數據挖掘的學習者開發了以下智能化功能:
學習者可對知識難點進行標注。在用戶瀏覽課件時,可對課件進行難點標注,并將結果呈現到教師端,使得教師能更好地了解學生對課程知識點的理解程度,從而能在課堂中進行難點講解,促進學生的理解。在難點標注中,系統以課件的“頁”作為知識點度量的基本單位。另外,為了能更準確地反映學生對知識的理解程度,避免學生由于懶惰而不對知識點進行難點標注,平臺擬開發更為智能的功能,即基于學生瀏覽某頁課件的時長,來評定該頁知識點對學生的理解難度。
基于上述難點標注信息,DM_Edu平臺可個性化地為學習者提供精準推薦(如圖6所示)。基于收集的難點標注和教師預先的知識點標注信息,平臺會為學習者推薦個性化的學習資源,實現因材施教[14]。若對每一教學資源都進行知識點標注,必然會增添教師的負擔,因此,平臺后期擬結合半監督學習等方法[15-16],對教學資源進行自動或半自動標記,減輕教師負擔。

圖6 精準推薦實例
給予學習者智能化的測評。在用戶使用過程中,平臺的實驗環境免費開放,用戶可進行程序填空題的在線實踐演練,平臺對演練結果自動測評[17],并根據用戶的解答給出恰當的評價。在接下來的計劃中,準備進一步實現如下功能:當用戶作業有所錯漏時,平臺將在互聯網中檢索出相應的解決方法以及對應知識點,給出其鏈接;對解答錯誤類型進一步細分,以供系統做出更具體的智能診斷和個性化學習建議與修改提示。據此,系統可有效地提升用戶的學習效率,讓用戶能在短時間內發現自己的不足并快速修改,進而提高用戶尤其是新手的學習興趣以及實踐能力。
為學習者構建知識圖譜。AI知識體系極為龐大,容易令人無從下手,特別是初學者。因此,計劃在平臺上實時記錄每位用戶在線學習的知識點,分析每位用戶所學內容。系統據此為用戶構建知識圖譜[18],并作為個性化推薦算法中的一些輔助信息,從而增強推薦算法的挖掘能力,更好地為用戶提供個性化的學習內容及學習方案[19]。目前,知識圖譜構建功能的具體實現還在探究、優化中。
DM_Edu平臺正在華南師范大學數學科學學院的數據挖掘類課程中進行第三個學期的教學試用。通過數據挖掘類課程與DM_Edu平臺的結合,實現了翻轉課堂模式和多元互動混合型教學模式。
借助平臺,教師實現了以學生為主體的主動式個性化學習的翻轉課堂模式[20]。通過線上的教學資源、討論交流區,學生課前可以更容易地提前了解將要學習的知識,而針對學生在課件上所標注的難點,教師相應地優化課堂講解的重點。借助DM_Edu平臺,教師將傳統的先教后學模式轉換為先有線上輔助的自學、后有課堂教授模式,提高了教學效率和效果。
結合平臺,實現了“課堂教學+網絡輔助教學+個性化自主學習”相結合的數據挖掘類課程多元互動混合式教學模式[21]。利用平臺豐富的教學資源,實現了教學內容多元化,例如,由教師或高年級學生制作的教學內容,依據學生學習內容而產生的個性化推薦資源與平臺外資源鏈接等。此外,平臺能夠實現多種元素的互動,包括但不限于通過討論交流區實現的師生互動、生生互動,以及根據學生的難點標注,平臺優化調整推薦的學習內容而實現的人機互動。因此,相比于傳統的“課堂講授型”教學模式,平臺以多元化的方式豐富了學生的學習內容,改變了學生的學習方式,提高了學生的學習積極性和效果。
該研究設計并不斷完善了基于Django框架[22]的DM_Edu平臺。該平臺結合深度學習、數據挖掘等技術,將“互聯網+”、AI和數據挖掘等人工智能與人才的培養相融合,使得用戶可借助在線的個性化、智能化學習,提升學習效率和效果。對于學生,平臺會結合其個人的學習情況和學習偏好,在頁面一側推薦資源,可視化學習情況數據,以便于學生更好地掌握知識,提升自我;對于教師,通過作業自動批改功能、線上互動和多學習階段與多方位的智能反饋,任課教師的教學負擔得以減輕、教學設計更有針對性,能夠將更多的精力投入課程準備中。通過對討論交流區中學生提出的問題以及學生對課件的難點標注,教師能更精準地把握學生的學習情況,及時查缺補漏,進而提高教學質量。對于課程教學,結合DM_Edu平臺,可以改革課程,為學生構建出個性化協作式的學習環境,促進形成新型的學習方式,使得學生可以更好地掌握AI技術。
隨著DM_Edu平臺的使用人數與在線課程越來越多,平臺接下來將進一步結合半監督學習等方法完善難點標注與智能化測評功能。此外,計劃實時記錄每位用戶在線學習的知識點,結合多元信息,構建用戶的知識圖譜,以更好地為用戶提供個性化的學習內容以及學習方案,滿足用戶學習數據挖掘類課程的需求。