肖年志,郭 儉
(蘇州市園區教師發展中心,江蘇 蘇州 215000;蘇州百智通信息技術有限公司,江蘇 蘇州215000)
隨著基礎教育信息化的推進,基礎教育資源平臺面臨著從簡單的資源集成平臺向自適應學習系統的轉變。蘇州園區教育局于2016年建成的易加互動學習平臺通過近一年的推廣使用,集結了“17000+”原創微課。隨著課件、題目資源建設的進一步到位,平臺的資源集成功能已經實現。但是,面對數量日益增加的海量資源,基于師生對平臺的使用數據,構建更加智能化的自適應學習平臺,成為下一步建設的重點。
自適應學習系統,意味著系統可以根據學習者個性和學習行為特征,提供個性化的學習路徑和適宜的學習資源。從其實現的路徑來看,實現資源的個性化推送是關鍵環節。以往基于資源的推送研究往往基于孤立的簡單算法,例如基于內容的推送、基于關聯規則的推送等。但是,由于學習資源有其自身的特點,例如知識的關聯性,學習的場景化、資源類型多等,因此,實現自適應的學習資源推送,必須建立相應的資源特征庫,以便系統通過對相關資源特征的提取,進行快速有效的推送。
本文旨在研究通過使用大數據分析的方法,對平臺上各種與資源有關的用戶行為進行分析與理論研究,挖掘出其中蘊涵的對資源價值的評價傾向性,找到資源間隱含的關聯關系,建立相應的資源特征庫,以助平臺進一步向智能化方向進化。
面向基礎教育的教學平臺,其學習資源的組織與學校教學高度關聯,因此,在資源的組織上表現出鮮明的特點。首先,其教學內容表現出高度組織化。通常與教材的章節保持著高度的一致性,反映了基于學科邏輯和學生學習邏輯綜合考慮的知識結構化的需求。章節的設置,充分考慮了知識的邏輯關系和學習者的認知規律。在具體的內容組織上,既有強調上下位關系的層次結構,又有強調并列組合關系的組合結構。其次,同樣的知識內容,基于不同的學習目標達成,就可能有不同的資源形式。基本目標(知識、理解、應用)和高層次目標(分析、評價、創造)對學習資源有著不同的承載要求。此外,從學習資源具體應用來看,基礎教育領域學生的學習,通常需要按照學校教學進度,與課堂教學保持同步。例如,學生的個體學習主要發生在課前的自主預習和課后的作業練習。因此,自主學習的場景因素成為我們考慮學習資源特征時必須考慮的重要維度。
基于以上分析,我們認為,作為自適應學習最基本引擎的資源特征庫,可以考慮以下需求:
(1)資源依賴于教材章節
資源必須有明確的教材章節性質,即一個資源綁定一個或者多個教材章節。鑒于教材章節從數據結構上一般而言是樹結構的,故綁定的章節,需要盡可能是樹枝上的最終分叉節點。
(2)資源依賴于特定的場景
每一個資源,都是為了特定的場景而制作出來的,資源需要有明確的場景特性。在一個教材章節內部,有些資源是面向課前先學這一場景的,此時資源一般難度較低,主要用于滿足認知層級分類上的識記與理解。
(3)資源難易度適中
資源對學習者來說有點難而又不太難,是價值最高的,有點難是有挑戰性,不讓人掉以輕心;不是太難,是自己主觀能動努力一下就能有收獲,能夠享受到學習的樂趣。而學習者千差萬別,資源需要有復雜的難易等級,以滿足不同層次學生的需求。
(4)資源是優質的
優質的資源能使學習難度曲線降低,提升學生的學習樂趣與成就感,滿足快樂教與學的目的。
(5)資源間是關聯的
學習一般都是基于多個資源的學習,資源與資源之間有種種關聯,有時間先后關系的,有相似關系的,資源模型需要重點描述資源間的關聯關系。推薦引擎通過對關聯資源的引用,來計算出一個學生具體的學習路徑。
基于前述智慧學習推薦引擎的需求,我們認為需要從如下幾個方面來構建資源模型:
學習平臺支持的常見的教與學場景有課前預習、課堂互動、課后鞏固、單元加強、考前沖刺。雖然該五類場景有較為明顯的知識逐漸加深的因素,但是一個資源未必只用于其中的一個場景,還可以根據其他的因素考慮,被用于多個場景。比如:一道題目,可以用于課后鞏固,用于檢測學習效果;它也可以用于后續章節的課前預習檢測環節,達到檢測掌握是否牢固等目的。
作為一種屬性,資源的場景特性,可以是系統運營要求的,強制共享者在分享資源之前進行顯式的標注,不標注不能進行共享。此種方式依賴人力標注,一方面有可能標注得不夠全面,另一方面標注所耗費的人力巨大,故一般未必能夠形成常態化的操作。而通過資源在具體的課程使用情況的分析,可以得出具體的場景。如:
·課前任務單可以認為是課前預習環節,其所使用的資源均自動帶有課前預習場景特性;
·課堂任務單或者教師備課的課堂素材所包含的資源,可以歸類到課堂互動環節;
·課后任務單或者課后練習中所使用到的資源,可以歸并到課后鞏固環節;
·橫跨多個小章節的練習作業或者學習任務,可以認為是單元加強所需而產生的學習使用行為;
·從時間上判斷資源需所屬的章節有較大的跨度,并且資源難度相對較高,可以用于考前沖刺環節。
資源場景特性的自動識別與隱性標注,是在用戶無感知的情況下進行的,不會因此而受到教師用戶的阻撓,對平臺的推廣使用非常有益。
通過對資源在各種場景中的使用行為的分析,能夠得出一個資源的章節及場景使用屬性:
·教材章節編碼;
·場景編碼;
·以教材章節和場景為單位出現的次數;
·學生學習匯總情況,如微課資源的平均觀看時間、覆蓋度;題目資源的答題平均用時、正確率等信息。
隨后,在其他教師用戶使用時,平臺可以結合教師當前的具體場景,使用一定的算法,推薦最符合該場景的資源列表,或者資源的詳細信息里輔以上述分析得出的匯總及分析信息,幫助教師判斷,選用最合適的資源。
學生認知基礎不同、認知能力不同,使用同一份資源進行學習與測試往往效果會不同,分層式學習是最近幾年教學與信息化結合后出現的新做法,特點是學生分層,如分為提高、普通、薄弱,資源也分層,分別對應于學生的三個分層。典型的一個做法是一份測試題,教師進行了分層設置,除了一部分所有人都需要答的題之外,設定另外一部分題目,比如30%左右的題量,按照難中易三個層次布置,分發給學生作答。學習能力強的作答其中共通部分及較難的題目;學習能力一般的作答其中共通部分及一般難度的;學習能力較弱的,作答其中共通部分及簡單的題目。分層式教學對學習的促進作用已經得到廣泛驗證。分層教學,依賴的主要就是資源的難易度特性。
資源的難易度,可以是教師用戶或者資源供應商主動標注提供的;而在大數據時代,通過對各種數據進行分析匯總,來智能取得難度信息是比較可行的一種做法。
我們把難度分為5個等級,分別為極易、易、一般、難、極難。
資源的難易度,需要綜合如下幾個方面:
(1)資源使用場景所包含的難易度信息
根據布魯姆六層認知論,我們可以把平臺所支持的5種場景與前5層進行對應,并根據該流程分別設定難易度,即:

表1 資源使用場景難易度層次
如表1所示,考慮到課前課中課后會隨著課堂主題變化而不一樣,故我們針對一個場景設定了多個難易度值。資源在不同的場景里面出現,基于上表的規則把難易度設定到該資源的難易度等級列表里面去,并以二維數組的形式保存:
[場景編碼,難易度編碼],[場景編碼,難易度編碼]……
※保存場景編碼的目的是日后根據需要,進行算法精度的調校時,能夠基于此信息重新計算所對應的難易度信息。
(2)學生群體的認知能力信息
學生的學習能力有差別。一個班級作為一個群體,在每一個班級均會出現優良中差的等級;在一個學校,一般也可以把班級分為ABC(尖子班、普通班、薄弱班)三個等級;在一個區域,也可以將學校進行橫向的等級劃分,分為名校、普通校、薄弱校等。不同級別的群體,所需要的資源難易度不同;資源分配給各班級群體使用時該群體的等級比例也可以作為資源難易度判斷的數據來源。
我們一般將班級群體分為5個等級:優、優良、一般、較弱、薄弱,與資源的難易度正好一致。
(3)資源使用完畢后學生群體的反饋
如前所述,當一個普通班級在作答完畢一份練習后的統計數據表現出來平均分數過低,系統可以據此認為該練習的難易度等級較高。不同的群體,在資源學習或者題目檢測以后所反饋的信息(正確率等)也需要根據這個群體的認知等級進行二次處理。
基于上述分析,一個資源,可以通過使用學生群體的等級特性及使用后的反饋來進行難易度的補償修正。
(4)關聯使用時的難易度信息
在日常的教學過程中,教師一般會把難易度相等的多個資源組合以后形成任務單發放給學生學習或者作答。即一個資源和其他資源組合用于教學時,這個資源的難易度可以從這個組合內部其他資源的難易度來衡量。我們可以采用組合難易度的標準偏差來衡量,并對超出偏差閾值的資源進行難易度的修正。
以往,對資源的評價使用如排名、專家評審等方式進行,該類評價以主觀評價為主,較易受到人為因素的干擾。到了大數據時代,我們可以基于對資源的各種使用行為進行分析,挖掘其中所蘊涵的對資源評價的信息,形成資源的客觀評價。由于是基于數據的評價,數據量越大,受人為干擾的因素越小,客觀性也越有保障。
當前,在線學習平臺對資源的使用,主要會發生如下多種行為,行為及評價的方法簡單列舉如下:
(1)觀看:可以從觀看的覆蓋率、觀看次數、學校分散性、觀看熱度等方面進行評價;
(2)點贊:點贊數越高,評價越高;
(3)收藏:收藏數越高,評價越高;
(4)引用:實際的使用行為,引用數越高,評價越高;
(5)下載:同引用類似,下載數越高,評價越高;
(6)評論:可以通過文本情感分析技術進行分析,算出好感度來進行評價;
(7)投訴:一般是比較負面的評價;
(8)追蹤使用:前述都是對單個資源單獨的評價,追蹤使用是分析多個關聯性的資源,通過找到其共性,在共性內尋找差異,并形成客觀的評價;
(9)跨時段使用:通過追蹤分析每一個資源一段時間內的動作變化,來進行橫向的對比與評價;
基于上述9個方面,可以對資源做一個較為全面的評價,生成一個資源評價的七角雷達圖和綜合的評價指數。
基于用戶行為的資源評價模型,已經以微課資源為例,以獨立文章的形式進行了表述,在此不再贅述。
資源一般不是獨立使用的,而多以組合形式進行,最常見的場景是各類學習任務當中的“微課+題目”的形式,微課教授知識,題目檢測學習效果。本節和后續的兩小節是對資源與資源間關系的一種描述。
在資源庫中,在同一個細分的類目下還會有較多數量的資源,以易加互動學習平臺上的微課視頻為例,如圖1所示,同一個章節下有8個微課資源,實際教學時,8個資源的使用有先后限制,如需先學完《有趣的乘法計算(一)》才能學習《有趣的乘法計算(二)》。

圖1 學習平臺上的微課資源
當前的視頻是圍繞教材章節進行建設的,如圖1所示,在一個章節下面其實包含了多個課時的內容,教師選用某個章節的資源時,當前還不能直接選用,還需要再仔細看一下到底是第幾課時的微課,自己能不能直接選用。作為一個智能的推薦引擎,應該將這個過程也省掉,要實現貼心的推薦。
資源間先后順序的計算是基于場景的,即從業務角度考慮需要計算先后的場景,然后對實際的使用行為數據進行分析,找出其間的先后關系,并標以一個確信度,用于衡量先后關系的穩定性。在碰到相似的使用場景時,基于這些信息進行推薦優先度的排序。
我們舉幾個較為常見的場景:
(1)某學科章節的一個學習任務單,使用了一個“微課+一套練習題”。微課和這套練習題,將會默認形成一個先后關系。當其他用戶引用了微課后,系統應智能地提示是否把經常一起使用的、后續的那套練習題也引用進來。
(2)一個章節下面的微課,使用者是按照課時推進使用先后順序的。現在建設的微課資源已經形成規模,一個章節下面有5個以上微課的資源有很多;通過外購的題庫資源,平均每個章節均有超過100個題目的資源。實際使用時,有部分題目會在第一課時課前使用,有部分題目會在課后使用,有部分題目會在第二課時課前課后使用。這些題目的使用先后關系,系統都需要收集起來,經過計算以后記入資源前驅后置屬性當中去。
(3)學生做題目檢測時,系統發現有一個前置的知識點的掌握程度較低,系統需要從與當前章節關聯的前置微課列表中進行尋找。此時系統需要返回那些屬于前驅章節、又是在學習了本章節后使用的那些題目,此類題目優先展示給學生,可能是最滿足其期望的。
資源的前驅后置順序關系,在系統中保存為一個二維數組,每一項需要包含的信息包括前驅后置資源類型、前驅后置資源ID、前驅后置確信度。
當兩個資源的細分類都一致時,我們使用相似性代替其他屬性來進行描述。資源相似來源場景也有多種,舉例如下:
·基于資源關鍵字的比較計算所得,兩個資源擁有越多的關鍵字,則相似性越高;
·資源內容的比較,如多題經過對題目文本內容的語義分析,可以算出一個處于0~1的相似度指數;
章節知識點的相似性、地域的相似性等因素可以通過其他方式進行計算,可以不列入資源相似性的比較。
資源相似性通過相似資源這一屬性進行描述,包含的信息包括相似資源ID、相似確信度(確信度越大越相似)。
資源的相似性,是對同一類型的資源進行的相似度描述;而資源的聚簇性,則是對多種資源可以一起使用這一特征的描述。
一起使用的場景如:
·在多個學習任務單中被一起使用;
·多個題型的題目在同一份練習/試卷中被一起使用;
·在同一課程中被一起使用;
資源的聚簇特性,使用外鏈的聚簇因子 (唯一的ID)進行描述,包含的信息包括:
·聚簇資源ID。
·聚簇距離,該值為業務場景定義的距離,取決于具體的業務場景,如同一題在同一個課前學習任務單中被使用的距離要小于在同一課程中其他學習任務單中使用的距離,距離越小,聚簇性質越明顯。
·聚簇發生次數,次數越多,一起使用的傾向越大。
針對智慧教學,本文提出了適用于智慧教學智能化推薦場景的資源信息化系統的模型,并提供了一部分的實現思路。
基于行為數據分析的資源關聯與評價,能夠大大簡化費時費力的資源標注工作,且行為數據全部自動收集,用戶無感知,所計算出來的結果也能夠保證其客觀與公正,是學習平臺智能化的基石,也將是下一代學習平臺所必須具備的基礎性功能。
基于行為數據分析的資源關聯與評價,當前研究尚處于起始階段,模型場景、模型參數均會隨著研究與應用的深入得以進化。
[1]方海光,劉靜,黃榮懷,李玉順.基于學習對象化的移動學習資源自適應引擎的研究[J].中國電化教育,2009(7):51-55.
[2]劉俊.泛在學習中學習資源自適應環境系統設計[D].武漢:華中師范大學,2012.
[3]李曉,李浩君.基于片段式資源協作構建的自適應移動學習系統設計[J].中國教育信息化,2011(5):38-41.