楊智寧,祁敬偉
(1.北京大學數學科學學院,北京 100871;2.哈爾濱市香坊區教師進修學校,黑龍江 哈爾濱 150036)
數據挖掘技術以其先進的智能化手段,從大量的數據中提取出有用的信息和知識,不斷被銀行、保險、交通、零售等商業領域所采用。隨著中小學信息技術的普及和教育信息化進程的推進,數據挖掘技術開始逐漸向教育領域滲透。如何將數據挖掘技術有效地應用于教育活動,從大量的教育數據中發現隱藏的、有用的知識來指導教育、發展教育,成為一項具有重要實踐價值的研究課題。近年來,學者們在教育領域中已經做出很多此類嘗試,并在教學評價[1]、課程設置[2]、選課指導[3]等方面取得了初步的成效。
盡管如此,將數據挖掘技術應用于教師團隊研修領域尚屬空白。本文以數據挖掘技術為依托,以哈爾濱市香坊區小學語文“青青子衿”教師專業社群主題研修活動案例為背景,探討基于數據挖掘技術的教師團隊研修模式的實施目的、程序和成效。
哈爾濱市香坊區小學語文“青青子衿”教師專業社群成立于2009年,該社群由祁敬偉名師工作室、優秀青年教師精英團隊、各學年協作組三個層次組成,旨在通過問題研究、實踐反思、同伴互助、自我研修等方式,建立區域間多維立體的教師網絡研究共同體,促進各個層次的教師專業化發展。多年來,“青青子衿”教師專業社群立足小課題研究,取得了一定的成績,但也遇到了不少亟待破解的難題。
1.主觀性。以教研員為引領的教師研修團隊,優勢在于教研員能根據教師專業發展的需要,在教師的觀念和行動上給予專業支持。然而,由于研修的主題是教研員確定的,活動的內容、形式、目標,都存在很大程度的壟斷性和專制性,無法真正滿足教師個體的研修需求,在一定程度上降低了團隊研修活動的實效性。
2.盲目性。由于缺乏科學的調研、統計和分析,團隊研修無法摸清一線教師的實際需求,因此,研修內容設計存在著一定的盲目性。在很多情況下,團隊研修要么將網絡、報刊上的時髦話題作為主要內容,要么是把教研員聽課過程中發現的個別問題確定為團隊研修的內容。這樣的研修內容設計常會導致多方面問題,例如:研修內容跨度和隨意性很大,教師無所適從;內容陳舊無趣,費時低效。
3.虛假性。現有的教師團隊研修活動,常常呈現異彩紛呈、熱鬧非凡的態勢。課堂教學問題的呈現、教師觀念的交流與碰撞,使研修現場十分活躍。如果僅僅看到這些現象,多數人都會認為這樣的研修活動方式好、內容新、參與廣、實效佳。然而,冷靜思索一下不難發現,活躍的僅僅是現場的少數人,而多數參與者仍然處于被動、沉默的狀態,究其原因,主要是他們的興趣、問題等并沒有被充分關注,因而只能在團隊研修活動中充當看客或疲于應付。
上述這些弊端的存在集中說明了一點:教師團隊研修要想取得實效,不僅需要準確地把握教師們的研修需求,而且還需要選擇非常務實的研修方式。那么,如何才能科學地確定教師們的研修需求?究竟怎樣選擇有效的研修方式?這些都是難以解答的問題。僅就第一個問題來看,正確把握教師研修需求是一個非常復雜的過程,因為不僅每個教師的研修需求不只一種,而且群體教師的研修需求更是呈現多樣化的特點。因此,對于教師團隊研修的組織者來說,有必要在研修過程中對教師的研修需求進行充分調研,并且運用某種適當的技術手段對調研所獲得的數據進行科學分析,進而從紛繁復雜的信息與數據中識別教師研修的核心需求。數據挖掘技術就是解決這個問題的最好技術手段。
數據挖掘就是從海量的數據中采用自動或半自動的建模算法,尋找隱藏在數據中的、人們事先不知道的,但又是潛在有用的信息和知識的過程。數據挖掘技術的功能與特點可以用趨勢(Trend)、模式(Pattern)及相關性(Relationship)等幾個關鍵詞來形容。可以說,數據挖掘技術也是一種決策支持的手段。
1.分類分析。分類是找出數據庫中的一組數據對象的共同特點并按照分類模式將其劃分為不同的類。其目的是通過分類模型,將數據庫中的數據項映射到某個給定的類別中。如果將這種分類分析的方法用于教師團隊研修的活動中,那么它會使培訓調研中所獲得的包羅萬象、雜亂無章的需求信息變得有序和結構化,便于培訓者把教師的研修需求歸納為幾個大類,進而從宏觀上把握教師的研修需求究竟有哪些方面。
2.回歸分析。回歸分析可以反映數據庫中數據屬性值的特性,通過使用函數表達數據映射的關系來發現屬性值之間的依賴關系。在指導團隊研修活動中,它可以被應用到對數據序列的預測及相關關系的研究中去。
3.聚類分析。聚類類似于分類,但與分類的目的不同,是針對數據的相似性和差異性將一組數據分為幾個類別。在處理團隊研修多樣化需求的數據的過程中,運用聚類分析的方法,就會便于我們發現屬于同一類別的數據間較大的相似性,也便于我們發現不同類別數據間很小的相似性,還便于我們發現跨類的數據間很低的關聯性。
4.關聯分析。關聯分析是隱藏在數據項之間的關聯或相互關系,即可以根據一個數據項的出現推導出其他數據項的出現。團隊研修關聯分析過程主要包括兩個階段:第一階段為從海量原始數據中找出所有的高頻項目組;第二階段為從這些高頻項目組中提取出關聯規則。
將上述方法用于教師團隊研修過程中,實際上就是通過精細化、科學化的分析技術,使得研修組織者在面對大量的教師研修需求信息時保持理性,最終一步一步地逼近教師團隊研修的核心需求,并確定有針對性的研修內容和方式,從而大大提升教師團隊研修的效果。
2015年1月,哈爾濱市香坊區小學語文“青青子衿”教師專業社群準備開展一次小課題研修活動,即“群文閱讀教學實踐與策略研究”。怎樣確定這次的小課題研修的具體內容和方式?這是我們在研修開始前一直在思考的問題。
為了破解以往小學教師專業社群在小課題研修過程中存在的主觀性、盲目性和虛假性等難題,更好地發揮小課題研究工作的針對性和實效性,我們在研修開始之前對所有參與研修的教師進行了需求調研,隨后運用了數據挖掘技術對調研所獲取的信息進行了處理和分析,最終形成本次小課題研修的具體內容和方式,從而摸索出一種新穎、有效的團隊研修模式,下文將對我們的做法進行介紹。
我們的研修模式是一種基于自主研習的教師研修模式。因此,在將數據挖掘技術引入我們的研修模式之后,研修計劃的生成比以前有了很大的改進,其操作程序如下:
1.自我研習。在研修開展的準備階段,我們首先帶領并號召教師采取各種方式進行自我研習,以便讓每一位教師充分思考“群文閱讀教學”方面的問題,發現自己的興趣點和研修需求。
2.問卷調查。問卷調查在哈爾濱市香坊區小學語文教師中進行,共收到10組397份調查問卷,目的是了解教師對“群文閱讀教學”的基本認識、教師個人的讀寫素養、教師在閱讀教學過程中的習慣、能力、水平,以及教師目前的學習方式等。
3.數據挖掘。為了分析教師素養、教學行為和學習方式三者之間潛在的相關性,我們用關聯規則對問卷中的數據進行挖掘。關聯分析的常用算法被稱作Apriori算法[4],其操作流程參見圖1所示。根據這個算法,我們對相關數據進行分析,分別找出一、二、三、四項的頻繁項集,從而挖掘出在團隊研修活動中最重要的四個相關項目,以確定研修的主題及形式。

圖1 以Apriori算法進行數據挖掘的過程
通過數據挖掘,我們在12個項目中發現了兩組四項頻繁項集,也就是說,在促進教師專業發展的活動或因素中,這兩組中每組的四個項目相關性最大。如果在團隊研修過程中,充分將它們加以融合,必然能夠提高研修的針對性和有效性。為此,基于上述數據挖掘的結果,我們制訂了此次研修計劃。
4.形成判斷。在運用數據挖掘技術對10組原始調研統計數據進行處理后,我們就會得到如圖2所示的結果。
從總體上來看,以上研修計劃將提高教師專業能力最相關的兩組四個渠道進行充分融合,從而力使教師團隊研修發揮最大的功效,真正解決教師們在群文閱讀教學方面遇到的困惑和問題,全面改進小學語文群文閱讀教學,同時也大大促進了團隊研修模式的創新。在這個過程中,數據挖掘技術的運用甚為關鍵。

圖2 “小學語文群文閱讀教學調查問卷統計表”數據挖掘的過程及結果
由上可見,在數據挖掘基礎上制訂的研修計劃更加具有針對性和相關性。但是,這僅僅是確保高效研修的必要條件而非充分條件。進一步值得探索的問題是:教師如何對每一個研修內容進行深入研究?也就是說,教師在研修過程中如何做才是研修成功的關鍵所在。以往的研修中,教師們存在著盲目、忙亂、淺嘗輒止等問題,對所研修的問題要么因抓不住核心而面面俱到、淺嘗輒止,要么略談一二、以偏概全,從而無法達到對所研修問題的深入、全面理解。為了解決這些問題,我們在教師研修過程中也引入了數據挖掘技術,下面以“群文閱讀要‘讀’出什么”團隊主題研修為例,來具體地談一下基于數據挖掘技術的團隊研修活動的開展情況。
第一步:研修活動的準備
1.注重對學生水平的了解
(1)調研測試。研修者對一個教學班54名學生閱讀情況進行測試,了解學生的閱讀水平。
(2)數據挖掘。為了了解學生特征,我們用聚類分析的常用方法K—均值法[5](參見圖3)對54名學生進行聚類分析。其流程是:先抽取4名學生的數據,分別作為聚類的起點;然后通過計算距離,指派與他們數值相近的學生構成4個簇;最后通過比較各簇的特點得出結論。
(3)得出結論。將聚類信息進行分析,我們可以得出班級中四組學生的特征,從而判斷出他們在閱讀學習上的優勢與不足,為更好地設計教學活動提供了方向。
2.注重學生的需要,使教學設計有針對性
根據數據挖掘的學生情況,我們在設計該班群文閱讀教學《奇妙的巨人童話》時,確定了以下教學目標:
(1)找出文中的重點語句畫情節圖。
(2)默讀群文里的四篇關于巨人的文章,體會讀巨人童話的學習方法。
(3)自己設計情節圖,運用不同的表達方式來創編一篇巨人童話。
(4)通過本堂課巨人童話的群文閱讀,拓展延伸,激發學生課外閱讀童話的興趣并愿意和同學交流閱讀的感受。
數據挖掘技術下教學目標的確定,使教師能夠更加科學地站在學生能力、水平的起點上設計教學。它遵循了群文閱讀教學通過文本學語言運用的規律,使學生在文本學習的過程中了解了巨人童話的特點,夯實了基礎,強化了記憶,并在“比較——發現——運用”的學習活動中,鍛煉了分析能力和想象能力。
3.注重信息的發布,使教師做好研修準備
團隊研修活動前一周發布本次研修的信息,將研修目的、主題、內容、形式、教學設計及作業等提前讓教師知曉,促使教師帶著信息、帶著理念、帶著思索、帶著期待、帶著困惑,參與學習。
第二步:研修活動的進行
1.注重現場觀測,獲取真實數據。課堂教學現場,每一個情境都是團隊研修的例子。教學活動中教師的狀態、學生的表現是我們評價一節課的重要依據。為此,我們制訂了觀測量表,其中教師四個方面、學生六方面,每個方面的權重均為10。運用觀測量表,使聽課教師能夠細致觀測,從而有針對性地對課堂教學的現象進行分析。
依據全體教師的觀測統計情況(參見圖4),我們不難看出本節課在教學目標的達成、學生傾聽的習慣、積極互動的氛圍、愉快的情感狀態四方面得到了教師們的認可,而在教學過程、學生合作兩方面爭議最大。
2.實施有效交流,生成研修交往。針對教學過程的可行性,以及學生如何進行合作學習兩方面進行研討交流。
3.梳理研修成果,達成研修共識。將現場團隊研修和網上研討的要點整理出來,發布到QQ群里。

圖3 K—均值法進行數據挖掘的過程

圖4 群文閱讀《奇妙的巨人童話》課堂教學觀測統計圖
以上基于主題實踐的團隊研修活動,通過“數據挖掘——了解學生——確立教學目標”,再通過“觀測課堂——統計觀測數據——確定研討話題”,最后通過“研討碰撞——總結成果——發布成果”達成研修成果的資源共享。
實踐表明,相比較于常規教研而言,基于數據挖掘技術的教師團隊研修模式具有很多優勢。既往的團隊研修模式,無論是同課異構,還是問題辯論,抑或是經驗分享式等,在科學性、針對性和實效性等方面都無法與基于數據挖掘技術的教師團隊研修模式相媲美。
將數據挖掘技術應用到教師團隊研修中,從中發現隱藏的、模糊的、有價值的信息,不僅能夠給研修團隊提供教育中值得研究的問題,跟蹤、挖掘、預測出學生、教師的水平和關注點,而且能夠在研修過程中不斷通過新生成的數據,使研修教師把握研究的狀態,更加科學、多元地進行研修活動,從而提高團隊研修的效益和教師的專業化水平。關于將數據挖掘技術引入團隊研修活動,有以下幾點體會值得分享。
1.團隊研修活動前期的充分調研,是獲得數據挖掘信息判斷的重要依據。
2.將數據挖掘技術運用于團隊研修的不同階段,所采用的方法和起到的作用是不同的。數據挖掘技術中的回歸分析使教師團隊研修活動中的各種行動和方式達到最優化。數據挖掘技術中的決策樹技術,能夠幫助我們減少教學的盲目性,防止學習過程中出現不必要的困難與波折,因而大大地提升了研修的效率。
3.數據挖掘不同于簡單的數據統計,它是計算機專業知識在實際應用中的輔助作用。數據挖掘技術越專業,方法越實用,挖掘出來的信息越有價值。
然而,將數據挖掘技術應用于改進教師團隊研修只是一個初步的探索,我們也遇到了一些困惑和問題:
1.關聯分析和聚類分析屬于計算機等領域的常用方法,將他學科的理論與方法引入教育領域要考慮是否合適的問題。相對計算機學科來說,教育是一個多元的、復雜的、模糊的行為,因此,如何讓關聯分析和聚類分析更加細化、分支更加全面、操作更加簡潔等需要進一步研究。
2.數據挖掘技術由于其專業性較強,目前只有少數專業人員能夠進行操作。如何開發出便于教師、教研人員操作和理解的工具和方法,形成穩定的、常態的研修模式,這是值得我們以及所有致力于改進教師團隊研修的同仁們繼續努力的方向。▲