達泓宇, 田少卿, 杜美玲, 王聰
(哈爾濱商業大學 計算機與信息工程學院, 黑龍江 哈爾濱 150028)
基于大數據時代互聯網行業快速發展,用戶的學習方式發生了極大的改變,通過黑板及書籍的學習形式逐步發展成為網絡在線學習,通過便捷、貼心的在線學習,使學習能力顯著提高。同時在線教育發展前景廣闊, 已成功躍進大數據應用的最前端。然而,隨著科技的不斷進步,網絡環境不斷更新換代,用戶需求不斷增多,光靠提高學習服務質量很難得到大眾認可,用戶很難持續響應系統規定的教學任務。因此,網絡在線教育應通過對大數據的分析來積極響應不同用戶在不同時間段的學習訴求,開發人員通過每日獲取的數據對用戶的學習行為進行分析,對不同的用戶提供個性化定制服務。本系統部分模塊采用高性能的非關系型數據庫 MongoDB對大量數據進行存儲,使其在安全性、可靠性、擴展性和資源重復利用率上更勝一籌,為往后大數據研究與應用打下良好基礎。
據iiMedia Research公布的《2018中國在線教育行業白皮書》數據預測,中國在線教育用戶將在2020年達到2.96億。到時中國有望成為世界上參與在線教育行業人數最多的國家之一。據調查顯示,有84.9%的被調查者認可O2O教育模式。近些年,移動互聯網、VR、人工智能和大數據等技術得到了迅猛發展,線上教育具有資源習得性、豐富性、靈活性等優勢,這些優勢已逐漸補充了線下傳統教育模式的缺陷。據有關人士預測,在2020年中國在線教育市場將達到4 330億規模。“互聯網+”教育市場正迎來新一輪的風口。
在美國,在線教育所開設的學歷、學位課程數已達到4.8萬個,基本上涵蓋了美國高等學校的所有學科和專業。近百萬的學生通過在線教育學習來獲取學歷。美國的在線教育以技術創新為基礎,正以較快的速度在規模、層次和水平上不斷向前發展。通過對國外在線教育現狀的研究,美國民眾已經逐步認可在線教育的戰略地位,并將此融入到美國高等教育中。無論是教學質量、發展速度、規模還是普及率方面,在線教育已經成為高等教育系統重要的一部分。
在國內,由于了解在線教育行業的人不多且信息采集渠道不夠規范,大量的優質教育資源沒有信息產業化,因此數據量并不大,還不能形成大數據分析基礎。并且,國內在線教育的內容以及形式不夠標準且普遍缺乏對教育資源的統一管理。人們受傳統觀念的影響,導致該類平臺的推廣并不順暢。除此之外,已有的信息化教育資源無法相對集中,用戶常常不能獲取切實所需的資源,不利于自身的學習和分享。
本系統角色主要分為兩類:用戶和管理人員。不同角色具有不同的職責,相互依存,協調配合,共同維持在線教育平臺的信息化管理。
用戶在初次注冊該系統學習時,系統會對用戶進行職業興趣測試,分析出最適合用戶從事的職業,并以此進行課程推薦。用戶在購買學習資料后,可以隨時查看訂單號、訂單名稱和訂單類別。在學習過程當中,用戶可以隨時查看學習進度,并對學習中碰到的疑難問題進行討論。其功能用例圖,如圖1所示。

圖1 用戶用例
系統管理員擁有較多的管理權限,其功能需求包括賬號審核、用戶信息查看、用戶信息修改、篩選用戶上傳資料、管理第三方支付、數據統計分析和信息公告等。其功能用例圖,如圖2所示。

圖2 管理員用例
該系統的設計圍繞以下幾項基本原則。
(1) 經濟性和實用性原則
開發人員應盡最大可能節省投資成本,設計出高性能、價格合理且具有較好性能價格比的在線教育平臺。同時,設計時應該充分結合實際,注重實效,并堅持實用、經濟的原則,通過對現有設備和信息渠道的充分利用,幫助用戶節省資源。
(2) 先進性和資源共享性原則
我們必須利用先進的技術水平設計出合理的、符合國際發展趨勢的在線教育平臺。該系統的設計方案主要是通過網絡教育信息資源的整合、傳輸和共享來實現。
(3) 安全性和可靠性原則
技術人員應提供多種檢查和處理手段來保證系統數據的安全性及準確性。針對主機、數據庫、網絡和應用等各層次制定相應的安全策略,保障系統的安全性和可靠性。
(4) 用戶操作方便的原則
系統功能全面,為每個用戶群,包括客戶提供一個高效、統一且易于交互的操作界面。
(5) 可擴展性和易維護性的原則
在設計系統時應具有一定的前沿性,在充分考慮系統更新換代、擴容維護的基礎上,針對不同的操作系統提供多語言的代碼設計。
本平臺將采用B/S結構(瀏覽器/服務器模式,Browser/Server)為用戶進行服務,用戶通過互聯網進入系統,享受相應的功能服務。并采用C/S結構來對Web服務器和數據庫服務器進行維護修改。形成“內外有別”“查改有別”模式,提高服務器的安全性,防止數據被破壞,如圖3所示。

圖3 系統體系結構示意圖
在技術架構方面,它采用了在功能上可擴展且接口相對來說更加安全開放的松耦合架構,以此來確保系統可以適用于各種不同的應用環境,且能在不同的應用環境中穩步運行。本系統運用基于三層架構以及MVC(模型、視圖、控制)的一種模式,這種模式將數據、業務和展現三者進行了非常有效的分離。它們分工明確,JSP用于實現用戶界面層(View);Servlet用于實現控制層(Control);JavaBean實現業務邏輯層(Model)。各層之間實現解耦的過程體現了系統設計的開閉原則,即通過依賴注入達到目標。該系統架構,如圖4所示。

圖4 系統架構示意圖
平臺網頁前端應用HTML、CSS、JavaScript、PHP等網頁開發技術。
后端應用服務器端HTML嵌入式腳本語言PHP開發技術,用以處理用戶與服務器之間的操作命令。數據庫以MySQL為主,部分模塊采用MongoDB。用以存儲、處理相應數據,數據庫服務器只能由數據庫管理員進行操作,庫內數據需滿足以下規則。
(1) 實體完整性規則;
(2) 參照完整性規則。
系統是在目前主流在線教育平臺的基礎上,開發的一套功能齊全的軟件。通過每日獲取的數據(用戶連續學習時長、單次學習時間、每日學習次數等)對用戶的學習行為進行分析,通過算法分析測試結果,向用戶推薦更加合理的課程,并以此進行針對性的規劃。該系統學習資源采用高性能的非關系型數據庫MongoDB存儲,高效率執行多用戶并發訪問,結合專業知識創建索引,提高查詢準確度。信息管理模塊包括系統信息和異常信息,系統每天都會產生大量的日志信息,為了對海量日志數據能夠進行高效分析和存儲,利用Mapreduce來發掘隱藏在日志數據中的用戶訪問規律和模式,如圖5所示。

圖5 數據獲取
(1) 學習資源在線查詢模塊設計
用戶可以通過知識庫學習進行知識積累與管理,但面對大量的知識數據,如何對信息進行準確定位與檢索變得尤為重要。本系統采用Lucene.Net全文檢索開發包,它提供了完整的查詢引擎和索引引擎,可以快速查詢用戶所需內容。底層采用MongoDB數據庫,用來存儲圖片、音頻、視頻等大文件數據。在多用戶并發查詢時,能夠高效、快速地返回結果,部分代碼如下。
$conn = mysqli_connect('localhost','root','123456','root') or die("數據庫連接失敗!".mysqli_error());//用戶連接相應數據庫
mysqli_query($conn,"set names utf8");
?>
$insearch = $_POST["insearch"];//接受查詢請求
$sqlstr = "select * from teach where username like '".$insearch."' or teachid like '".$insearch."' Or teachname like '".$insearch."' or kind like '".$insearch."'";//對所需信息進行模糊查詢
$result = mysqli_query($conn,$sqlstr); //并返回相應結果
(2) 用戶資源共享模塊
用戶可隨時上傳各領域學習資料并能對該部分資料設置相應的權限,如可閱覽用戶、可讀、可下載和查閱期限等權限,用以保護該類資料的知識產權。同時,上傳資料的用戶會得到一定量的學習積分,用來瀏覽其他學習資料。使各類學習資料在共享中將其優勢最大化。
(3) 個人職業測試模塊
本項目借鑒霍蘭德職業測試原理,在用戶注冊完成之后,首先使用霍蘭德職業測試對用戶性格等方面進行測試,分析出用戶未來更適合從事的職業,從而推建更適合用戶學習的課程。職業測試模塊圖,如圖6所示。

圖6 測試模塊
(4) 用戶管理中心
用戶可以在個人主頁查看和修改個人基本資料,個人主頁記錄了用戶的全部學習記錄以及網頁通知等消息,部分代碼如下。
if (!($id and $name and $age and $sex)){
echo "";
}else {
$sqlstr = "update users set name = '".$name."', age= '".$age."', sex = '".$sex."', where id = '".$id."'";
$result = mysqli_query($conn,$sqlstr);
if ($result){
echo "";
}else {
echo $sqlstr;
}
}
本平臺在灰度測試期間,在本院隨機選取計算機院150人進行試用,為時半年(2019.03-2019.09)。在試用的過程中,通過分析3月和9月的相關數據,發現平臺曝光量和點擊率顯著提高,用戶上傳數據量不斷提升,使用戶的學習資源得到相應的補充,極大的豐富了用戶的學習生活。同時,通過一些用戶訪談和調查問卷,約有78%的用戶對該平臺比較滿意,除此之外,我們還另外抽取120位受眾,其中約有96%用戶平時有自主學習的習慣,這與平臺設計初衷相符。平臺相關指標,如圖7所示。

圖7 平臺相關指標
通過大數據,可以更深入地了解大量數據的本質,可以對傳統的教學方式加以改善,也可以實現個性化學習。但與此同時,在線教育也面臨著挑戰—如何保證學習的質量及效果成了首要問題。首先,大數據具有海量性的特點,處理數據的方式會與傳統方式不同,怎樣改善處理數據的方式是一個問題。其次,雖然大數據技術在教育領域有著良好的發展前景,但是如何與各個跨學科領域的技術成果相結合仍然是大數據在線教育領域研究的重中之重。此外,我們還應該將數據安全以及所有權的問題作為我們關注的重點,嚴防數據安全隱患的同時保護用戶的隱私。