黃援生
(廈門大學圖書館 福建 廈門 361005)
近年來,大數據技術在創新領域的關注度不斷攀升,已成為許多行業應用的焦點,這其中就包括學習領域。數字化正在逐漸改變我們的日常生活及社會的各個層面。通過訪問互聯網,可以隨時隨地獲取信息?;ヂ摼W用戶根據自己的需求進行導航,在這里點擊、評論、購買、收藏和學習,由于許多可追蹤的小行為帶來了大數據的宇宙,在這個時代,所有的東西都可以測量。建模。貨幣化。可操作和預測。大數據的應用范圍很廣,從營銷到科學,再到可持續發展和健康領域,以及本文關注的學習分析領域[1]。學習環境離不大數據,而學習平臺產生的數據仍未得到充分利用。隨著物聯網的迅速興起,“教育大數據”的時代已然到來。
大數據學習在世界范圍內正在成為一種新興趨勢,尤其是在高等教育中。通過使用智能手機、WIFI連接、教育內容管理平臺、數字通信服務、協作工作工具和社交媒體,許多學習過程會產生可收集和分析的數字痕跡。這些痕跡可能來自:提供數據(學生的背景,結果,需求和偏好)的教學管理系統;指示使用時間和持續時間;測試結果以及所查詢內容列表的電子學習環境;多個設備提供的地理位置數據;外部服務和工具,例如云存儲應用程序、閱讀數字教科書和模擬;使用設備的識別和連接速度的技術信息;社交網絡等。為了給每個學生提供最好的資源,以適應他們的學習模式,許多高等教育機構都在使用分析來改善他們的學習過程。通常,大學和機構通過注冊。、考試、數字學習環境或圖書館借閱系統收集有關其學生(學習者)的大量信息,這些系統會自動生成數據。因此,隨著教育技術的出現,數字化在教育中的普遍使用可以捕獲、存儲、研究、共享、分析和可視化。海量數據或大數據必須將基于技術、數據分析和計算機功能的新方法整合到學習過程中,以滿足學生的需求,尤其是在個性化、參與性和學習動機方面的需求,滿足教師更好地理解每個學生的個性化方面的需求。大數據技術的興起和數字工具的廣泛應用,使得有可能根據學生的行為建立大量的數據?,F在可以測量、收集、分析和處理這些數據,以便更好地了解學生的需求,然后優化學習[2]。例如,我們可以對學生單擊學習平臺上的按鈕的次數、在該平臺上花費的時間、MOOC(大規模開放式在線課程)的動機以及對課程的保留程度等進行關注,改善學習過程的大數據分析種類繁多。而教師能夠更好地評估學習過程,對使用這些學習信息源進行大量的研究,目的是充分利用學生留下的數字痕跡,以更好地了解他們的行為并優化學習過程[3]。
互聯網已經滲透到我們社會的各個方面。IT工具的出現導致數據爆炸,數字時代已經改變了學習過程的各個階段:從電子學習到社會學習,再到MOOC等形式的出現。大數據技術是學習機構日益追求的一種方法。這是一個值得關注的策略問題:他們要面向什么樣的學生?他們提供什么類型的學習?答案來自基于數據分析的學習工具,該工具反映了大數據的全球術語。這些學習工具的設計依據來自于學生使用反饋產生的大數據。通過對學生行為軌跡的數據收集和分析,學習機構可以確定哪些學生可以針對性地進行教學干預。預測算法可以通過提供行為信息來激發學生的個性化干預措施,以確保更好地訓練和技能。只要學生在一個平臺上連接,便會立即收集數據。這些工具有助于更好地了解該學生,并為他提供個性化的推薦。為此,大數據使用機器學習算法來處理產生的所有數據。隨著大數據的出現而開展的研究工作,導致了許多技術和算法的發展,主要包括以下四方面。
在試圖從數據中提取和獲取有用的知識之前,理解、發現新知識的整體方法和過程很重要。數據挖掘與大數據相關聯。大數據是指由于規模大而不能手動管理的數據,必須使用計算機方法進行數據處理和分析。數據挖掘被認為數據庫中的知識發現過程的子步驟,通過從數據挖掘算法中發現知識來改進教學方法,因此,隨著教育數據挖掘的發展過程,出版物的數量呈指數級增長[4]。該過程定義了一系列步驟(最終反饋),應遵循這些步驟來發現數據中的知識。為了成功推進每個步驟,我們必須應用有效地數據收集、描述、分析和解釋。通常通過可用的軟件工具來實現每個步驟。數據挖掘技術是探索大量數據的基礎。算法的發展可能起源于學習分析和教育數據挖掘學科的興起。這是根據學生的行為預測學生的具體知識和技能。在學生的知識不斷發展的過程中,這種方法與通常的心理測量模型有很大的不同,因為它具有交互性的特征。
預測分析是使用從相似的過去數據構建的模型來預測以前看不見的數據中存在的未來事件和行為。它在金融、教育、醫療保健和法律等不同領域具有廣泛的應用。這種機制完全適用于學習環境。主要方法是基于內容的推薦和項目之間鏈接的協同過濾。
預測方法也可以應用于社會學習。社交推薦機制類似于內容推薦,但依賴于圍繞社交網絡圖組織的特定數據。圖形是代表網絡中不同對象之間的連接的數據結構:成員、內容、討論、社交活動等。這些方法可用于確定要提交給網絡成員的相關對象:要關注的其他成員、相關討論、共享內容等[5]。
對社交網絡的活動及其動態的深入理解可以更好地推動學習過程。社交學習分析依賴于對社會網絡的分析。識別網絡中的內聚子集;調查這些網絡的密度。由網絡管理并圍繞圖表組織的數據的特殊性質定義了新的適應措施。
隨著諸如微信、微博、抖音之類的社交網絡的出現,使用了幾種定義和統計工具。這些概念局部地描述了社交網絡,并確定了它們的重要元素,例如影響者和中介。
檢測社交網絡上的社區或群體的主要技術基于計算之前的連接。這項措施的重要意義在于,這種聯系將兩個不同的社區聯系在一起。通過對網絡連接之關的值,施加一個閾值,我們獲得了網絡在社區中的分割[6]。
對社交網絡成員的貢獻的自動分析需要一種基于自然語言處理技術特定的方法。在這種情況下實現的具體技術可以是主題分類和自動“標簽”;可能是該領域中最流行的應用之一,它允許將每個貢獻關聯到一個或多個標簽,這些標簽是由集中分類法或由學習者提出的。這種豐富的數據可以稍后用于改善內容搜索或社交推薦模塊[7]。
大數據技術革新了教育機構分析和評估學習經歷的方式。對學生來說,這種方法可以支持他的學習過程,對教師來說,大數據讓教師更多地定位為學生的向導。
學生將是基于大數據的學習方法的第一受益者。數據驅動方法將提供的新用途,使學生能夠遵循適合其需求的高度個性化的培訓設備,并從大規模的“量身定制”方法中受益。了解可檢測承諾不足的系統,以及誰能夠適應這些狀態以使學生重返學習環境中。
這些好處對學生而言具有相同的目標。它可以在整個過程中優化知識的獲取和保留,并最終改善其運營績效。
大數據將為學生的學習提供前所未有的個性化服務。這將使教師更加確定每個學生的設施、努力、進度或遇到的困難:誰有困難?在哪些課程中?在哪些練習上?因此,由于不斷收集數據,大數據技術可以進行干預,并立即采取行動,以解決所發現的問題。教育也需要不斷保持警惕,以找出任何差距并盡快予以糾正。這些實時監控機制為實驗和測量新教學方法的有效性提供了理想的環境。
面對數字化在專業領域帶來的挑戰,高等教育在學習過程中合理整合數字化元素。其目的是應對所需技能的快速發展。大數據分析可以幫助提高教學支持并增強學習分析過程。有許多類型的數據需要交叉和分析:那些與數字使用和教育學生活動有關的數據,更好地識別他們的學習狀況,創新教學和科學研究數據。使用教育工具(技術)產生的數據還可以為教育團隊提供指標。這些指標使它們能夠更好地評估學生,優化學生的知識獲取并發展他們的技能。