劉燕
常州鐵道高等職業技術學校,江蘇,常州,213011
從20世紀90年代末開始,隨著互聯網的發展,在線教育逐漸興起。經過20多年的發展,在線教育已經滲透到各種教育類型中,被大眾普遍接受。2019年7月,教育部、中央網信辦等六部門出臺了《教育部等六部門關于規范校外線上培訓的實施意見》,這是國家第一次對校外的線上培訓提出規范要求[1]。2020年初受新冠肺炎疫情影響,為了配合新冠肺炎疫情防控工作,教育部提出“停課不停教、停課不停學”,從中小學到各級高校紛紛響應此號召,將線下教學改為線上教學。在這個特殊的歷史時機下,線上教育進入快速發展期。然而,從教師和學生對線上教育教學的反饋效果來看,線上教育教學并沒有設想的那么好。一方面教師還是按照之前的教學方式采用直播或錄播教學,無法顧及每一位學生的學習需求,互動性也不夠;另一方面學生的學習自律性不夠,特別對于文字類或長時間教師授課視頻出現了“偷工減料式”聽課。如何提高學生的學習積極性,幫助學生找到適合的學習方式是在線教育教學發展急需解決的問題。大數據等新興技術的應用,使得學習分析、個性化推薦,甚至個性化輔導成為可能。為了高效高質地從海量網絡學習資源中篩選出符合學生學習要求的教學資源,很多網絡企業采用大數據技術進行網絡教學資源的數據分析與篩選,大幅提高了個性化在線教育的效率和質量。本文利用大數據技術設計了個性化在線教育系統的結構和模塊,來滿足不同學生的個性化在線教育需求。
在線教育系統功能要齊全,包含考勤、直播、互動、討論、提問、作業評測、學習過程分析、成績導出、學習資源推薦、練習推薦等。根據這些功能需求確定數據層的各個模塊,并通過劃分不同的用戶類型提供相應的功能。
如圖1所示,繪制了基于大數據技術的個性化在線教育系統結構,主要包括5個部分,分別是數據層、處理層、功能層、客戶端、對象層。

圖1 個性化在線教育系統整體結構
數據層主要包括學生信息庫、課程信息庫、學習資源庫、考試習題庫。其中,學生信息庫包括學生的學號、姓名、專業、班級等基本信息,學生的測試和作業成績,學生對相關知識點的掌握程度,學生課程學習過程中的行為習慣等信息。課程信息庫中主要存放了課程的名稱、內容、課時等信息。學習資源庫包含課程及相關知識點的各種資源,例如文字、PPT、視頻等類型。考試習題庫包含對應知識點的作業、練習以及綜合考試的題庫。
處理層主要包括數據清洗、數據轉換、數據收集、數據維護等功能。數據清洗負責將數據層中無效、冗余或無意義的數據刪除、合并。數據轉換負責將數據層的數據轉換為系統能夠處理識別的形式。數據整合負責將不同數據庫的信息按照一定的設置方式整合到一起。數據提取是根據指令提取數據層中的數據以供處理。數據維護負責對數據進行備份、管理,保證數據層的安全。
功能層主要借用處理層的數據半成品針對不同的對象提供特定的大數據功能。包括學生考勤、作業自動測評、成績導出、學習資源推薦等。學生考勤主要是通過學生對學習資源完成度來判斷。作業自動測評就是自動閱卷功能。成績導出是指學生的練習完成后教師可以導出成績進行分析。學習資源推薦是個性化的體現,利用大數據分析學生的弱點來推薦適合學生的學習資源。
客戶端是利用大數據技術、計算機和電子設備終端創建用于學生、教師和管理者與系統進行交互的界面。
對象層主要包括學生、教師、管理者。學生學習、教師授課、管理者又分為系統管理者和教務教學管理者。系統管理者負責系統技術、數據的維護管理,教務教學管理者負責監督教師授課情況、管理課程并及時發現學生在線學習產生的問題。
在實際的在線教育教學中發現,學生對于同一知識點的掌握程度是不一樣的,這種現象在教學中是正常的,在線下的教學中也會出現。但是線上教學與線下教學相比更加缺乏互動性,這主要是線上教學缺乏面對面的情感交流、缺乏歸屬感。沒有足夠的面對面互動,教師就不能全面地了解學生對知識點掌握的情況。當前,需要重新審視在線教育的價值,充分發揮在線教育的優勢,彌補在線教育的缺陷,以此提升在線教育的質量[2]。
基于大數據技術的在線教育系統可以對網絡教學視頻和課件等數據信息進行分類,來實現學生的個性化學習需求,提高學生學習興趣,并延長學生在線教育學習時長,提高在線教育系統用戶黏性;并通過分析學生完成的作業以及練習的情況,判斷學生的對知識點的掌握程度、學習弱點,根據分析結果為學生推薦適合的練習和學習資料,達到幫助學生學習的目的。
在線教育中的個性化推薦必須由系統中的歷史數據作基礎,然而在系統建好的初期是沒有可供分析的數據的,除了學生的基本個人信息以外,學習記錄都不存在,系統就無法為他提供準確的學習內容。
數據采集模塊主要功能是跟蹤、記錄學生在線學習的過程,并將學習過程量化,將量化后的數據存儲于數據庫中,根據數據進行個性化推薦。數據采集模塊為個性化推薦功能提供數據支持,收集的數據包括學生信息、課程信息、學生學習行為反饋信息。學生信息和課程信息是由系統提前導入的,學生學習行為反饋信息是需要跟蹤、記錄的。主要是對所學課程的學習資料,包括文本資料和視頻資料的學習時長的記錄;學生與教師在論壇的提問及發言時長;在線練習和作業的結果。數據采集流程如圖2所示。

圖2 數據采集模塊流程
數據分析模塊負責將數據采集模塊采集并存入數據庫的數據進行計算處理,呈現出可視化的學生在線學習行為的分析。根據教學反饋與個性化推薦需求,將學生在線學習某課程的整體情況和具體情況按照需求進行呈現。
從數據庫中提取學生就某課程在線學習的數據,例如文本資料學習時長、視頻資料學習時長、學生與教師互動發言次數、學生與教師互動時長、相關知識點在線練習的成績等等。而文本資料學習時長中包括開始、結束時間和持續時間,依此類推,經過分析我們可以獲得學生的學習時間曲線,學生對于不同類型學習資源的喜好,學生對于知識點的掌握程度、薄弱點在何處。這些數據分析有利于教師全面具體地掌握學生的學習情況,及時調整教學的內容以及進度。
基于大數據技術的在線教育系統可以對網絡教學視頻和課件等數據信息進行分類,來實現學生的個性化學習需求,提高學生學習興趣,并延長學生在線教育學習時長,提高在線教育系統用戶黏性。在線教育系統能夠給學生不同的學習資源,可以滿足其不同的學習需求,系統會根據學生的興趣和需求基于PageRank 算法來從數據庫中篩選學生感興趣和符合學生學習需求的網絡教學視頻并推薦給學生,從而實現個性化課程推薦功能。
在線教育系統的開發環境因功能和設計語言的不同而不同,本文采用具有谷歌搜索引擎功能的Java SDK進行開發設計,該在線教育系統的開發設計步驟如下。
(1)下載jdk,利用jdk來改善開發環境,進行資源優化配置。安裝完jdk之后,在cmd.exe中輸入指令來檢查jdk是否順利安裝。(2)下載Eclpse并解壓運行。(3)安裝谷歌軟件,創建App Engine項目。本設計所應用的大數據技術是根據GAE標準進行系統設計的。
首先要登錄系統界面。利用谷歌SDK搜索引擎來快速登錄用戶賬號,用戶不需要復雜的注冊步驟,只需要一個手機號就可以注冊賬號登錄在線教育系統,管理員對手機號進行查驗,授予用戶登錄資格,用戶選定教師或學生身份在系統中進行教學或學習。
其次是在線教育。此模塊是在線教育系統的核心,管理員對教師上傳的網絡教學視頻進行檢查與存儲,并根據網絡教學視頻的內容進行分門別類,創建檢索連接,能夠讓用戶能夠快速檢索想要的網絡教學視頻。管理員和教師都具有上傳數據信息的權力,以此來完善在線教育系統的網絡教學視頻質量和教學內容。教師上傳的數據信息需要管理員查驗,而管理員上傳的數據信息不需要查驗。管理員會將上傳的數據信息存儲到數據庫中,以便于學生和教師檢索和瀏覽。
最后是資源管理。管理員對上傳的數據信息進行檢查,并將數據信息存儲到數據庫中,讓學生和教師來瀏覽。學生在注冊賬號后利用三級聯動列表對數據庫中的教學視頻進行檢索,就可以找到符合自己學習興趣和需求的教學資源。
通過使用本次設計的在線教育系統,發現該系統具有良好的可靠性,教師、學生和管理員在登錄該系統后能夠獨立進行自己的模塊和界面,各個用戶之間的數據傳輸相互獨立,保證了系統各個模塊、各個功能的正常使用。
隨著大數據技術的不斷發展以及互聯網的普及,人們逐漸發現互聯網的價值,并使用互聯網來生活和工作,而對于學生而言,也更傾向于在線學習這種新穎和有趣的學習模式。加上近兩年傳統教育行業受新冠肺炎疫情影響,為了貫徹自我隔離號召,線下教育不斷被中斷和叫停,使得線上教育成為時代潮流,因此創建符合學生學習需求的個性化在線教育系統是大勢所趨。在大數據技術的加持下在線教育系統能夠對學生學習行為模式進行深度挖掘,篩選符合學生需求的學習資源,滿足學生的高效高質學習需求。本文設計的在線教育系統就是利用大數據技術,深挖個性化教育的核心內容,總結歸納學生學習風格和規律,根據學生興趣和學習需求自動篩選相應的教學資源和相關練習并自動推送給學生,避免了學生因為在線學習缺乏足夠的互動而產生學習滯后的現象,大大提高了在線教育的便捷性和高效性。而且學生、教師和管理者三大對象層的模塊設計和功能設計彼此獨立、互相促進,能夠確保個性化在線教育系統的正常運行,為學生和教師提供良好的學習和教學環境。
大數據技術推動了在線教育的發展,疫情又加快了在線教育的發展。在線教育與傳統教育互相影響與改變,希望隨著在線教育的進一步發展,能和傳統教育互相補充,彌補彼此的缺陷。目前對于大數據應用的探究才剛剛開始,本文為在線教育發展的研究提供了一些建議,對于推薦算法的詳細實現還有待進一步的研究。