羅惠元 渤海大學教育科學學院
當前,人們對大數據技術的理解主要集中在數據規模、數據復雜性、應用價值和技術實現四個方面。從數據規模的角度來看,大數據技術是以海量數據為基礎而開展的技術;從數據復雜性程度來看,大數據技術內含多種多樣的數據形式,具有豐富的數據來源,并且有著動態復雜的數據體系;從數據應用價值的角度來看,大數據技術的應用有著巨大的價值潛力;從技術實現的角度來看,大數據是一種通過數據挖掘與交換、數據處理與深度分析,從海量數據集中獲得巨大應用價值的新型技術體系。
(1)數據海量性
隨著信息技術的高速發展,數據開始爆發性增長,社交網絡、移動網絡、各種智能工具等都成為數據的來源。教育大數據是在完整的教育活動過程中所產生的以及根據教育需要收集到的一切用于教育發展并可創造巨大潛在價值的數據集合,其數據來源及信息類型豐富多樣。教學性信息與非教學性信息綜合在一起,就會形成巨大的數據海洋,基于大數據技術,可實現對海量數據的科學分析。
(2)數據完整性
數據的完整性是使大數據技術分析出的結果具有可靠性和準確性的保障。大數據技術的數據完整性原則可參考數據庫的通用準則,將其歸納為ALCOA+CCEA原則。其中ALCOA原則是指教育大數據來源可追溯、數據記錄清晰可見并與各項操作同步生成、數據是第一手精確數據。CCEA原則指數據完整無遺漏、數據與實際操作相一致、原始數據可長久保存、數據在審核時可見不被隱藏。
(3)潛在邏輯性
大數據分析的意義體現在它所分析的數據具有潛在邏輯性。另外,“潛在”二字又代表了使用大數據技術要分析尋找的邏輯關系通常是隱含的不能被直觀得出,分析出的結果甚至可能是出人意料的。
大數據這一概念最早用于描述數據規模,其含義是指數據的量十分龐大。如今,大數據的內涵主要體現在以下兩個方面:①大數據是一種新型技術手段。信息技術的高速發展促進了大數據的誕生,而人們對記錄真實世界的渴望激發了大數據技術的不斷演變和發展。近幾年隨著移動互聯網、云計算、物聯網等技術不斷孕育走向成熟,人們處理信息的能力也有了極大提高,不僅能夠在一段時間內完成海量數據采集,還能挖掘、存儲、分析這些數據,從中提取有用信息,實現特定目標,并對現實進行引導。由此可知,大數據是把一切事物數據化的技術,且它的速度遠遠超過了傳統的數據存儲和運算。大數據技術是一項復雜、多層面的技術,可以從多角度、多方面對事物進行全面分析,這對于提高人類的認知水平、預測與決策能力起到重大作用。②大數據是一種思維方式。大數據兼具宏觀與微觀雙重功能,它既能宏觀地判斷某些模糊的事物,又能準確地觀察到個人,從而有效擴大了人們的認識范圍和深度。一方面,大數據技術以“更多”“更雜”“更好”的思想為基礎,開創了一種樣本即整體的全數據模式,打破了傳統局部分析和樣本分析的局限,可以從巨量的數據資料中得到更完整、全面、準確的總體情況,并預測其未來發展,以此輔助決策。另一方面,大數據還具有微觀的功能,可對不同個體進行量化處理,并將相關數據進行存儲和記錄,通過特定的處理方法,可以發現數據背后潛藏的規律,對未來發展趨勢進行預測,以輔助決策。
建立教育數據庫需要將教育信息分類,其中包含教師信息和學生信息。首先,根據學生學習的不同階段(上課—作業—考試),同時考慮到家庭教育和課外活動對學習成績的影響,最終將學生信息分為以下六大類:①學生基本情況。包括學生姓名、性別、愛好以及曾就讀的學校和主要經歷等。②學生課堂表現。包括學生記筆記的頻率、回答問題的頻率、小組討論和展示的情況等。③學生的作業反饋。主要包括學生課下作業完成情況,是否將規定內容全部完成,包括表達是否通順、信息是否完整、是否切題、正確率與準確率等。④學生的考試成績。將考試題目分為基礎題、能力題、難度題,詳細記錄學生完成以上三類題目的得分情況,同時記錄錯題原因。⑤學生的課外活動情況。包括課外閱讀、購物、運動、游戲等一系列的課外活動信息。⑥學生的家校互動情況。包括家訪情況、家長會表現情況、家長與教師溝通的信息等。其次,教師的信息也可根據“上課—作業—考試”來劃分。上課信息包括教師課堂講授情況、重難點設計及授課詳略安排;課件、課堂板書以及補充材料內容;課堂提問和解答的情況等。作業信息包含知識點分布、作業量、批注以及作業講解情況等。考試信息則包括題型新穎度、知識點分布、學生的正確率等。在教學過程中,教與學是密不可分的,因此學生的表現信息也應作為體現教師教學效果的一種結果信息,計入教師信息中。
要篩選出有效的、與教育教學活動具有較強關聯性的信息,首先要進行數據清洗。數據清洗是指在數據集中找出并糾正明顯謬誤的最后一道工序,通常是由計算機完成,其目的是去重、糾正明顯錯誤,并提供數據一致性。數據清洗的對象主要包含殘缺數據、錯誤數據、重復數據三類。殘缺數據是指缺失必要信息的數據。錯誤數據是指亂碼數據、不符合格式的數據以及從外觀上就可以直接判斷為無效的數據。重復數據是指沒有任何差別的完全相同的數據。經過數據清洗之后的數據基本可稱為有效樣本,下一步就是使數據與教育教學產生強關聯性。雖然在教育教學中應用大數據技術的最終目的是提升教學質量,優化教學效果,但在篩選數據時,不應只圍繞教學活動而舍棄非教學性數據。因此,數據收集和篩選應從反映分析對象性格特點和心理特征的數據入手,從源頭分析教師與學生的主要特點。明確了這一目標,許多非教學性信息就與教學產生了關聯。
根據信息庫中的數據,找出其中潛在的邏輯關系和規律指導教學實踐。①分析學生的信息,如結合作業和考試的相關信息推斷出學生的強項和弱項,教師在教學時能夠有所側重,使教學更有針對性;通過學生課外活動的信息分析學生興趣點,教師可在教學過程中結合學生感興趣的信息進行講解,采用舉例或引用等方式引起學生興趣,以達到更好的教學效果;通過家校互動信息教師可知道家長在學生學習過程中的參與度,并由此判斷是否應加強家校聯系、如何互動才能幫助學生更好地學習。②分析教師信息多維度地評價教師的教學水平。例如,分析教師準備的課件或教案,總結教師的教學方法和教學思路;根據上課提問和回答總結的情況反映該教師是否喜歡或擅長課堂互動;布置作業時知識點的分布是否均勻,難度如何,由此可得出教師布置作業的合理性和有效性。基于教師信息的分析結果,幫助教師明確自身教學的優勢和缺陷,平衡自己的教學能力,提升教學水平。
(1)幫助教師拓展和豐富專業知識與技能
在教學中,很多中小學教師都是根據教學大綱、教材和教案來安排教學內容。如果教師能夠利用大數據技術收集自己所在學科最前沿、最熱門的研究,并將它們融入課堂教學,那么這樣既可使自己的教學更加嚴謹,又可拓展學生知識面,提高學生學習興趣,教學效果也能得到增強。
(2)幫助分析學生特征和激發學生學習興趣
大數據技術收集記錄的學生信息是多領域、多維度、多方面的,通過這些信息能夠分析出學生的性格特征和個人興趣。教師根據對學生個性與興趣的分析結果調整教學內容和教學方式,使自己的課堂講授更貼近學生喜好,更能激發學生的學習興趣。
(3)幫助教師根據學生即時信息反饋進行教學調整
學生的課堂表現、作業反饋和考試情況是對教師教學能力、教學有效性的直觀反饋。運用大數據技術可以自動記錄每一位學生的課堂表現、作業情況和考試情況,幫助教師更好地觀察學生,并將這些信息作為教學的反饋信息,方便進行教學調整。
(1)幫助教師掌握學生課外學習情況和進度
教師結合課堂表現、作業反饋情況以及考試結果等信息,分析學生對知識的理解和掌握程度,個性化布置相關學習任務,使學習任務更有針對性,更有利于學生的自我提高。大數據技術可以記錄學生的自主學習情況,有效跟蹤學生的學習進展和學習效果。
(2)幫助學生更有效地尋找學習資源
大數據技術基于海量教育信息建立龐大的教育信息數據庫,學生在查找學習資料時,可以根據自己的專業特點或其他需求獲取相應的資源。另外,大數據技術可收集海量學生的學習評價,并通過他們的學習表現以及學習后產生的變化,幫助評價該資料的優劣,輔助學生選擇更有效的學習材料。
(3)幫助學生自我評價和自我完善
學生的自我評價通過對學生學習情況的橫向對比和縱向對比來生成。橫向對比指的是將該學生與其他學習能力相似的學生進行對比,比較其學習進度和學習效果,以此來判斷該學生的學習進度、學習效果是否符合平均水平。縱向對比指的是將學生個人的數據收集起來,比較不同時期的數據。大數據技術詳細記錄了學生在教學過程中的完整表現,并保留了歷史數據。通過這些數據可生成學生的學習成長曲線,學生能夠清晰地看到自己學習能力和學業水平的變化,有助于學生進行自我評價及自我完善。
(1)收集在線學習平臺的海量數據
大數據時代的在線學習平臺能夠收集到最多的數據,線上學習樣本量采集得越多,分析出的結果就越可靠,師生在教學判斷與評價方面所獲得的支持就越完備。大數據技術可以通過學生的瀏覽次數、是否倍速、暫停的次數以及參與互動的情況等分析出大部分學生對該課程的真實感受,判斷出該課程的難易程度,以形成更加客觀、有效的課程評價。
(2)快速收集在線學習平臺數據
大數據技術使在線學習平臺收集數據更加便捷,利用大數據技術,可快速分析學生的解題思路和回答情況,收集多種解題方法,還可以根據作業和考試情況向學生及時推薦更有針對性的課程,生成個性化定制的學習方案。在在線學習的場景中,無論是收集數據還是生成結果,都比面對面教學更加快速、便捷、高效。
(3)促進新概念與新技術的誕生
在大數據技術的基礎上,人們發展出智慧教育、智慧校園,又衍生出了數字化學習的概念。此外,與其他技術相融合,大數據技術也可發揮更大的作用,如在VR教學中應用大數據技術、在元宇宙空間應用大數據技術等。在在線學習的場景中,多種技術相融合成為可能,從而促進了教育技術的發展,發揮出在線學習更大的優勢。
大數據技術的應用開啟了教育教學實踐發展的新時代,推動了教育領域的諸多變革。但是隨著應用的深入,仍然會出現許多值得討論和思考的問題:①如何實現跨領域教育數據庫的共享與整合,是當前亟待解決的教育實踐問題之一。基于海量數據來源,大數據技術應用應建立包含多種不同種類信息的數據庫,單純使用教育相關的數據庫是不夠的,并不能充分反映出與教育分析對象相關的各種信息。②教育大數據從業者必須具有一定的數據素養,才能有效地進行大數據分析。首先,能夠獲取各種優質教學資源,并對其進行有效的管理與儲存;其次,應具備良好的數據分析能力,具備一定的數據統計和分析能力;最后,可對數據信息進行解釋,并運用模型分析對數據進行深度挖掘。盡管目前仍存在許多問題有待解決,但是以教育大數據為導向的教育決策,已經成為現代教育教學改革的重要基礎保障,成為一種無法改變的教育信息化發展趨勢。