
【摘 要】本文分析基于大數據分析的在線教育平臺的應用價值,闡述從物理層、數據層和應用層構建基于大數據分析的在線教育平臺交互模型,論述基于大數據分析的在線教育平臺實現技術,針對在線教育平臺應用中數據標準不統一、數據采集覆蓋面窄、教育模型構建專業性不足、數據共享機制尚未形成等問題,提出政府統一數據規范、智慧教室設置人臉識別與學習狀態捕抓傳感器、加強大數據相關專業人員素質培養、建立有效的資源共享機制等對策。
【關鍵詞】大數據 ?在線教育平臺 ?大數據分析技術 ?云計算
【中圖分類號】G ?【文獻標識碼】A
【文章編號】0450-9889(2020)06C-0190-03
隨著信息科技的不斷發展、教育改革的不斷深入,很多學校都構建了網絡教學平臺,利用網絡信息技術作為教學輔助手段。然而要進一步提升網絡教學平臺的教育教學效果,使其真正具備“智慧”,就要在網絡技術中融入大數據技術,利用大數據分析技術采集用戶的學習行為,改變傳統的學習方法,以學生為中心,為不同的學生提供個性化的教育服務,從而實現教育領域的革命性變革。
大數據分析技術是數據分析的前沿技術,是把大量、種類多樣、有商業價值并能迅速對數據進行分析從而把數據轉為信息資產的技術。構建具有良好的交互水平的在線教育平臺,是發展基于大數據技術的在線教育的基礎。目前,基于大數據分析的在線教育平臺主要分為兩類:學習行為管理驅動平臺和教學教育資源驅動平臺。我國各開放大學如廣播電視大學等高校和國外比較熱門的Blackboard、Moodle等在線教育平臺大部分都是屬于學習行為管理驅動平臺,而目前的慕課、微課和翻轉課堂等屬于教學教育資源驅動平臺。
一、基于大數據分析的在線教育平臺的應用價值
基于大數據分析的在線教育平臺,是一種基于“互聯網+”的學習行為,通過云端采集用戶數據,再利用大數據對數據進行分析、清洗,最后通過針對個人用戶的特定算法對數據進一步的迭代,從而獲得一個適合學習者自身的學習方法與用戶數據。基于大數據分析的在線教育平臺具有以下應用價值:
第一,實現隨時隨地學習。基于大數據分析的在線教育平臺,教師與學生可以不受時間與空間的限制,進行雙向學習交互與信息資源的高度共享。通過云端的資源共享,學習者可以非常便利地獲取需要的學習資源,當中包括常用的學習視頻、在線答疑、分析測試和交流互動等內容,從而進一步提升自己的學習能力與水平。尤其對于職場上的在職人士來說,他們已經脫離了全日制學習,只能利用碎片式的時間學習,而且他們相比全日制學生更難掌握學習的方法,但是利用基于大數據分析的在線教育平臺,就能通過移動便攜設備或者PC端掌握適合自己學習習慣的科學學習方法。
第二,促進個性化教育。傳統的教育對教師的依賴程度較高,教師的個人能力與工作量對整個教育質量影響較大。如今在大數據的基礎上開發先進的教育應用,可使教學更加靈活。數據是個性化教育的重要指標,基于大數據的個性化教育,可以采集更多更完整的數據,比如學生在課堂的表現情況,包括課堂練習情況、作業情況、參與課堂的表現、課堂教學舉手提問次數及回答問題的時長和準確率、師生互動頻率和課堂的專注程度等數據。通過大數據分析,可以如實勾勒出課堂的實景和學生對本次課堂教育的接受程度,從而根據學生的個體差異實施個性化教育。個性化的教學服務和獨立自主的教學方式,使得學生能夠根據自身個體差異制訂學習計劃,把傳統的教育方式轉變為學生主導、老師輔導的教育方式。
第三,促進學生自主學習。由于教育資源有信息化技術支撐,可以實現遠程的信息同步與共享,未來的教育將在一個開放的教育平臺下,為學生提供寬闊的學習空間,學生可以根據自身的條件自主創新學習方法和習慣,從而增強學習的獨立自主性。在線教育平臺通過采集學生學習的時間、對各個知識點的理解程度和教學工具的使用等數據,將各類數據擴展為大數據教育信息數據庫,實現把海量數據轉化為有規律的信息,規律的信息匯聚成為知識,知識指導著教育,不斷層層細化,從而達到學生自主學習、教師因材施教的目的,有效地提高教育質量。
二、基于大數據分析的在線教育平臺交互模型的建立
基于大數據分析技術的在線教育平臺應該以用戶的使用體驗感為核心,針對學習者的需求,為學習者量身定做一套關于學習的個性化服務。從平臺的架構來看,建立基于大數據分析的在線教育平臺交互模型應該包含三層:物理層、數據層和應用層。如圖1所示。
(一)物理層
在物理層中,通過虛擬化和云計算技術對物理設備進行集約化管理,實現資源共享,提供物理基礎。物理層采用虛擬化技術在提高硬件性能的同時,降低硬件的能耗,大大提高了設備系統的可靠性和安全性,為大數據平臺提供了可靠的硬件基礎。
(二)數據層
運用大數據分析技術,在數據層中,通過統一身份訪問技術對實時采集的數據進行預處理,再將初始數據進行清洗,對數據挖掘進行處理,最后把有價值的數據保存到數據中心,并使用數據容災等技術備份數據,進一步提高平臺系統的可靠性。
(三)應用層
基于大數據分析的在線教育平臺可以使用人臉識別的方法來認證用戶的訪問權限,不同權限的用戶可以登錄到不同的系統界面獲取相應權限的服務。對于學生而言,登錄到平臺進行在線學習的同時,也為數據平臺提供學習的形態數據,可以通過不斷的數據采集調整自身學習的方法,為自身學習定制出一套合理的學習方案,從而提高學習的效率,實現“以人為本,以學為中心”的學習理念。教師通過平臺采集教師的教態,通過大數據分析評估教育方案,一方面可以改進教師的教育教學方法;另一方面教師作為教育者同時也是學習者,基于大數據分析的結果能夠促進教學相長,真正意義上實現以學促教。
三、基于大數據分析的在線教育平臺的實現技術
在當前人工智能發展迅速的背景下,基于大數據分析的在線教育平臺的建設前提是要把握教育發展的趨勢與規律,利用大數據與云計算技術,重點要開展對教育數據的挖掘,使得教育平臺具有人的智能性,能夠不斷地通過數據采集進行自我動態升級,從而能夠站在用戶的立場上切實地、精準地為用戶提供個性化交互的教育教學服務。
(一)數據收集
所有的數據系統都需要進行數據采集,隨著大數據技術的應用越來越廣泛,數據的采集問題也隨之變得重要。大數據采集可以分為離線采集、實時采集和互聯網采集。離線采集,在數據倉庫的語境下,ETL基本上就是數據采集的代表,包括數據的提取(Extract)、轉換(Transform)和加載(Load)。在數據的轉換的過程中,需要針對教育場景對數據進行治理,對數據進行監測與過濾、格式轉換與數據規范化、數據替換、保證數據完整性等。實時采集,可以利用Kafka流處理平臺進行采集實時數據,利用智能設備、移動終端和數據源提供的API或者采用爬蟲工具采集外部數據,實時采集主要考慮教育過程中的流業務場景,在流處理場景時,數據采集會成為Kafka的消費者,就像一個水壩一般將上游源源不斷的數據攔截住,然后根據業務場景進行對應的處理(例如去重、去噪、中間計算等),之后再寫入對應的數據存儲中。互聯網采集,利用垂直搜索引擎技術的網絡蜘蛛或者網絡機器人自動獲取其他教育網站信息,如Scribe日志收集系統可以從不同數據源、不同設備上收集日志,完成在互聯網上關于教育數據的采集。
(二)數據存儲
在數據存儲階段,分析不同數據存儲方案的優缺點,大致分為下面三種。
第一,基于MPP架構的新型數據庫群集,采用Shared Nothing框架,主要針對行業大數據的存儲,大數據教育平臺可以通過大數據列存儲、塊級粗粒度索引等處理技術,結合MPP架構的云計算技術來完成對教育應用的分析。基于這樣技術的存儲平臺架構,具有高速、高可靠性和高擴展性等特點,除了應用在大數據教育平臺外,也廣泛地應用在其他分析類的領域。
第二,基于Hadoop的擴展和封裝技術,充分地利用Hadoop的開源優勢,針對大數據的非結構化和半結構化的數據存儲,把基于Hadoop的擴展和封裝技術應用到互聯網的大數據存儲、支撐大數據分析技術中。Hadoop平臺對于大數據復雜的數據類型、ETL操作、數據挖掘和云計算技術的處理是非常擅長的。
第三,大數據教育一體機,這是硬件集合了存儲設備、終端與服務器,軟件集合了操作系統、數據庫管理系統和預分析處理軟件等,是一個軟件和硬件相結合的產品。它為大數據教育應用的處理數據、分析以及信息采集提供了支撐,具有良好的縱向擴展性和穩定性。
(三)數據處理和分析
在數據處理階段,根據不同的教育應用領域,可采用MapReduce、Spark、Storm等計算框架對數據進行流式處理與批處理等預處理。在數據分析階段,采用Mahout、Spark MLlib等數據建模工具來實現分類、聚類、過濾、推薦、頻繁子項挖掘等大數據智能分析功能,采用HiveQL查詢語句,能夠提高大數據的數據抽取、數據轉換和數據加載的效率。
四、基于大數據分析的在線教育平臺的問題與建議
根據有關基于大數據的在線教育平臺的調研報告統計,285位學生中有61.5%的學生認為,現有的教育平臺在界面布局設計、文字色彩、特效動畫、響應速度、操作流程復雜等方面存在不足;有47%的學生認為,現有的教育平臺在共享資源、及時性、個性化和互動性方面還存在很多問題,需進一步改進、優化。
(一)針對數據標準不統一問題,政府應統一數據規范
大數據分析的數據基本來自多種類型和多個信息源的集合,面臨的問題就是數據字典的統一問題,數據的匯聚需要規范和建立一個統一的標準。基于大數據的教學環境與教學過程方面的數據尚未發展起來,雖然近年在線教育發展比較成熟,但是數據的標準也沒有得到統一,成為大數據技術在教育領域有效應用的瓶頸。建議在政府層面上推動大數據平臺的發展并制定相關大數據教育平臺的政策,從頂層上定義數據字典,統一數據規范。
(二)針對數據采集覆蓋面窄的問題,智慧教室應設置人臉識別與學習狀態捕抓傳感器
我國已基本建立關于教育方面的公共服務平臺,在教育教學和管理方面的數據也基本成熟,但是在個性化教育教學方面,尤其是個性化教育教學過程中的數據采集方面,尚存不足。在現有的遠程在線教育平臺開發中,只是單純地利用網絡把教學方式從傳統的面授改為遠程教學,沒有考慮關于用戶方面的數據分析,對教與學的數據采集不夠完善,從而影響教育數據的分析。經調查研究發現,目前很多的智慧校園建設,也沒有統一對教與學的數據進行采集研究分析,對大數據的應用缺乏整體設計,給未來基于大數據的教育發展帶來困難。建議在智慧校園建設中除了相關的智慧平臺外,還應該加入智慧教室,設置人臉識別與學習狀態捕抓傳感器,學生進入教室,就被自動記錄相關學習數據信息。
(三)針對教育模型構建專業性不足的問題,應加強大數據相關專業人員素質培養
數據模型的構建是基于大數據的在線教育平臺進行有效預測、監管、評價與診斷等功能的總體框架。基于大數據的在線教育平臺從應用到決策,都要通過嚴謹的數據模型來支撐。由于目前遠程教育平臺都是單獨開發和構建的數據模型,沒有真正地利用大數據,沒有做到“全民來建”,所以專業化水平不高。由于前沿教育數據分析技術不足,未能有效利用大數據技術,導致教育專家知識領域的應用與教育科研成果沒有得到充分合理地相結合,影響了未來的教育發展。未來的教育應加大關于大數據相關專業的人員培養,提高教育的數據分析、系統建模、數據挖掘等技術水平,充分調動各行業的積極性和主動性,推動未來教育之路的發展。
(四)針對數據共享機制尚未形成的問題,應建立有效的資源共享機制
基于大數據的在線教育平臺的核心價值是數據,海量數據的收集需要全面大規模的采集,那么就需要合理而規范地進行數據共享與開放。目前,由于商業利益、個人隱私等因素,還沒有建立有效的數據共享與開放機制,因此,還需要通過國家政策建立有效的資源共享機制,通過多種途徑匯聚教學,研究和管理數據,擴大數據的規模,形成基于大數據分析的教育平臺的獨特優勢。
我國的教育正在走向大數據時代,誰能夠掌握數據,誰就能夠贏得未來的生存;誰能夠運用數據,誰就能夠贏得未來的發展。目前大數據、云計算、物聯網快速發展,教育數據的形式和應用越來越多元化、多樣化,誰能快速發現和整合數據,并能解決如何利用數據挖掘其背后的價值這一問題,將會有效增強其在未來的競爭力。在“互聯網+”的時代,為了更好地應對教育大數據所面臨的一系列挑戰,基于大數據的在線教育平臺的發展需要將大數據技術與教育領域進行深度融合。
【參考文獻】
[1]曹良亮.在線學習中的交互設計——以交互結構為核心的交互設計方法[J].中國遠程教育,2010(1).
[2]徐海波.淺析面向在線教育的大數據應用[J].數字技術與應用,2015(12).
[3]李瑞霞,鄭睿,張領.大數據環境下個人隱私存在的安全問題研究[J].電腦知識與技術,2015(12).
[4]宋秋蓮.基于云計算和大數據的在線交互平臺應用模型的構建研究[J].智能城市,2016(10).
[5]琳昕.基于云計算的大數據挖掘平臺構建研究[J].山東工業技術,2015(17).
[6]楊美沂,林勇.大數據背景下基于云計算的政府統計平臺構建[J].統計與決策,2016(4).
[7]李巍巍.基于云計算的大數據統一分析平臺設計與應用[J].自動化與儀器儀表,2016(8).
【基金項目】2016年度廣西壯族自治區中青年基礎能力提升項目“基于大數據的教育技術信息平臺的應用研究”(KY2016YB899)
【作者簡介】李超宇(1982— ),男,廣西梧州人,工學碩士,梧州職業學院講師,網絡工程師,研究方向:云計算、大數據與計算機網絡方面的研究。
(責編 王 一)