李豫 張勇
(華中師范大學(xué) 武漢 430079)
近年來(lái),不少題庫(kù)管理系統(tǒng)在教學(xué)上減輕了教師的工作壓力,但在出卷策略、自動(dòng)化推薦以及個(gè)性化學(xué)習(xí)等方面上仍有改進(jìn)空間。大多數(shù)在線(xiàn)題庫(kù)平臺(tái)只涉及向?qū)诫S機(jī)組卷和手動(dòng)組卷,缺少智能化組卷策略和教學(xué)診斷機(jī)制。另外,MOOC教學(xué)考核模式已經(jīng)成為未來(lái)教育趨勢(shì),但其教學(xué)互動(dòng)環(huán)節(jié)仍有缺陷[1],例如一位老師在Coursera平臺(tái)上要教上萬(wàn)的學(xué)生,難以監(jiān)測(cè)學(xué)習(xí)者的學(xué)習(xí)狀況并及時(shí)提供幫助。與此同時(shí),網(wǎng)絡(luò)化教育和E-learning得到飛速的發(fā)展,知識(shí)載體也由書(shū)本逐漸轉(zhuǎn)變?yōu)槎喾N表達(dá)方式,而人類(lèi)對(duì)知識(shí)的理解又往往趨向于結(jié)構(gòu)化和聯(lián)想式[2]。針對(duì)以上現(xiàn)象,本研究小組利用知識(shí)圖譜開(kāi)發(fā)了一款多策略組卷系統(tǒng)。系統(tǒng)除傳統(tǒng)組卷方式外,還提出“基于知識(shí)圖譜的學(xué)習(xí)畫(huà)像和自動(dòng)化組卷”的更新方案,旨在根據(jù)學(xué)生訓(xùn)練情況自動(dòng)推薦組卷,學(xué)生通過(guò)接收試卷再次訓(xùn)練,此過(guò)程不斷迭代,直到學(xué)生對(duì)所要求的知識(shí)點(diǎn)基本都掌握。
知識(shí)圖譜是一種以圖的形式表達(dá)客觀世界中的概念、實(shí)體以及實(shí)體間關(guān)系的知識(shí)庫(kù),是語(yǔ)義搜索、智能問(wèn)答等服務(wù)的基礎(chǔ)技術(shù)之一[3],也用于對(duì)當(dāng)前領(lǐng)域熱點(diǎn)和發(fā)展趨勢(shì)進(jìn)行探索和研究[4]。目前谷歌、Facebook和IBM等都在以知識(shí)圖譜為基礎(chǔ)布局智能化發(fā)展戰(zhàn)略。在教育領(lǐng)域中建立學(xué)科知識(shí)圖譜能將書(shū)本里零散的知識(shí)點(diǎn)打通,先后形成脈絡(luò)化、模塊化、體系結(jié)構(gòu)化的知識(shí)網(wǎng)。知識(shí)圖譜與數(shù)字化教學(xué)的結(jié)合將有助于教師授課、督導(dǎo)學(xué)習(xí),同時(shí)又可以使學(xué)生對(duì)碎片化知識(shí)查漏補(bǔ)缺和檢索資源。
本平臺(tái)采用面向開(kāi)放域的抽取技術(shù),以百度百科作為知識(shí)來(lái)源進(jìn)行實(shí)體抽取、關(guān)系抽取和部分屬性抽取,使非結(jié)構(gòu)化的正文轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù)[5]。將專(zhuān)家推薦的知識(shí)作為百度百科的主題詞條,后經(jīng)計(jì)量分析選取同一頁(yè)面中高頻率鏈接詞條,通過(guò)知識(shí)可取性評(píng)估、實(shí)體對(duì)齊[6]、實(shí)體命名等工作,最終得到知識(shí)圖譜。本系統(tǒng)構(gòu)造出了含2160個(gè)知識(shí)點(diǎn)和3064組聯(lián)系的“計(jì)算機(jī)學(xué)科知識(shí)圖譜”,以及含1225個(gè)知識(shí)點(diǎn)和1722組聯(lián)系的“物理學(xué)科知識(shí)圖譜”。
知識(shí)圖譜(記為O)可表示為O={N,E,V},N代表知識(shí)點(diǎn)集;E代表關(guān)系集;V代表屬性集[7]。屬性集中,靜態(tài)屬性包括外觀屬性、摘要屬性、級(jí)別屬性、聚類(lèi)屬性;動(dòng)態(tài)屬性包括學(xué)情屬性、權(quán)重屬性。系統(tǒng)利用結(jié)構(gòu)化數(shù)據(jù)文件規(guī)定存儲(chǔ)單位為“實(shí)體1-關(guān)聯(lián)-實(shí)體2”三元組,以及實(shí)體與其相關(guān)屬性-值對(duì)。系統(tǒng)通過(guò)Web技術(shù)制作知識(shí)地圖并使用Louvain算法[8]進(jìn)行聚類(lèi)。
本研究小組利用改進(jìn)的黑板體系結(jié)構(gòu),構(gòu)造出知識(shí)圖譜可視化風(fēng)格。黑板體系結(jié)構(gòu)模型由知識(shí)源、黑板數(shù)據(jù)結(jié)構(gòu)和控制器三部分構(gòu)成[9]。依據(jù)黑板風(fēng)格制作的知識(shí)圖譜倉(cāng)庫(kù)由“算法庫(kù)”、“結(jié)構(gòu)化文件”、“資源庫(kù)”以及內(nèi)控制器組成,如圖1所示。算法庫(kù)包含知識(shí)源對(duì)應(yīng)的算法;結(jié)構(gòu)化文件是中央數(shù)據(jù)單元以及可視化的基礎(chǔ);資源庫(kù)存放數(shù)字化教學(xué)資源;內(nèi)控制器調(diào)用內(nèi)部業(yè)務(wù),當(dāng)信息狀態(tài)變化且符合能由知識(shí)圖譜直接解決的問(wèn)題時(shí),執(zhí)行結(jié)果會(huì)立即反饋給用戶(hù),當(dāng)需要調(diào)用題庫(kù)業(yè)務(wù)時(shí),內(nèi)控制器轉(zhuǎn)調(diào)外控制器,并依據(jù)B/S架構(gòu)處理。

圖1 知識(shí)圖譜可視化風(fēng)格設(shè)計(jì)圖
系統(tǒng)所針對(duì)的用戶(hù)是計(jì)算機(jī)專(zhuān)業(yè)的教師和學(xué)生。除了完備的題庫(kù)管理功能以及多種組卷方式外,本平臺(tái)還提供了其他輔助模塊。具體劃分如圖2所示。

圖2 系統(tǒng)樹(shù)狀邏輯結(jié)構(gòu)圖
策略模式實(shí)現(xiàn)了多種組卷方式的融合。手動(dòng)組卷依靠題庫(kù)檢索;向?qū)诫S機(jī)組卷在隨機(jī)概率下錄用試題;基于知識(shí)點(diǎn)的自動(dòng)化組卷策略先后通過(guò)知識(shí)圖譜和組卷業(yè)務(wù)進(jìn)行處理。
在真實(shí)的應(yīng)試訓(xùn)練中,成績(jī)的浮動(dòng)是反映近期學(xué)習(xí)狀況最直接的數(shù)據(jù),但在實(shí)際學(xué)習(xí)分析中,學(xué)生對(duì)知識(shí)點(diǎn)的掌握程度變化才是衡量學(xué)習(xí)能力提升與否的重要指標(biāo)[10]。即使采用知識(shí)圖譜的推薦策略也仍停留在知識(shí)本身,缺少對(duì)學(xué)生學(xué)習(xí)的觀察性。為此,本平臺(tái)增設(shè)學(xué)習(xí)畫(huà)像和自動(dòng)化組卷機(jī)制,使系統(tǒng)在學(xué)生答題訓(xùn)練后能自動(dòng)化推薦知識(shí)路徑并生成下一張?jiān)嚲怼D3是特定學(xué)生的學(xué)習(xí)畫(huà)像和知識(shí)推薦。
3.2.1 知識(shí)劃分
智能教學(xué)系統(tǒng)的一大優(yōu)勢(shì)在于系統(tǒng)設(shè)計(jì)之初,已經(jīng)對(duì)知識(shí)點(diǎn)做了比較詳細(xì)的規(guī)劃,各個(gè)題目會(huì)被事先標(biāo)記相應(yīng)的知識(shí)點(diǎn)集合用以知識(shí)跟蹤[11]。上述過(guò)程由對(duì)應(yīng)學(xué)科領(lǐng)域的專(zhuān)家進(jìn)行劃分。

圖3 學(xué)習(xí)畫(huà)像與知識(shí)推薦
3.2.2 重要節(jié)點(diǎn)的評(píng)估
為了針對(duì)特定的學(xué)生進(jìn)行個(gè)性化的知識(shí)點(diǎn)重要程度評(píng)估,本文綜合考慮了兩個(gè)因素,一是學(xué)生對(duì)知識(shí)點(diǎn)的掌握程度,另一個(gè)是知識(shí)點(diǎn)自身在學(xué)科中的重要性。為此,本文引入了PageRank算法[12]來(lái)進(jìn)行個(gè)性化的重要性評(píng)估。每個(gè)知識(shí)點(diǎn)包含有一個(gè)二元組屬性

3.2.3 關(guān)聯(lián)推薦
任何知識(shí)點(diǎn)都并非孤立而是彼此聯(lián)系的,往往某一知識(shí)的掌握程度會(huì)隨其他知識(shí)點(diǎn)的變化而改變。針對(duì)重要知識(shí)節(jié)點(diǎn)有如下策略。

表1 等級(jí)表
步驟1:劃分知識(shí)掌握等級(jí)(如表1),按對(duì)應(yīng)顏色點(diǎn)亮知識(shí)地圖中的知識(shí)點(diǎn)。
步驟2:對(duì)生疏的知識(shí)點(diǎn)推薦一階前驅(qū)節(jié)點(diǎn),對(duì)熟練的知識(shí)點(diǎn)適當(dāng)推薦一階后繼節(jié)點(diǎn)。
步驟3:教師可對(duì)推薦得到的知識(shí)點(diǎn)增設(shè)或更改權(quán)重,也可參考其他輔助方式設(shè)權(quán)。
步驟4:系統(tǒng)依據(jù)知識(shí)點(diǎn)權(quán)重自動(dòng)化出卷。
步驟5:學(xué)生訓(xùn)練,更新權(quán)重,返回步驟1。

圖4 兩點(diǎn)間共詞分析結(jié)果
當(dāng)面向龐大的知識(shí)網(wǎng)絡(luò)時(shí),人工定義它們的邏輯聯(lián)系是低效的做法,準(zhǔn)確性也難以保證。另外,在真實(shí)領(lǐng)域中存在大量關(guān)系模糊的知識(shí)點(diǎn)。共詞分析法是計(jì)量學(xué)的一種重要方法,也是內(nèi)容分析的方法之一[13]。系統(tǒng)以共詞分析方式來(lái)自動(dòng)探測(cè)任意兩個(gè)知識(shí)點(diǎn)的內(nèi)容關(guān)聯(lián),用來(lái)輔助出卷,如圖4所示。
本文介紹了一種針對(duì)出卷的知識(shí)圖譜應(yīng)用平臺(tái),系統(tǒng)具備多種組卷策略并將知識(shí)圖譜與特征學(xué)習(xí)相結(jié)合。未來(lái)教育將會(huì)出現(xiàn)教師明星化,內(nèi)容模塊化,輔導(dǎo)分級(jí)化的趨向[14]。因此,在線(xiàn)考核、模塊化學(xué)習(xí),以及師生互動(dòng)等教學(xué)需求將會(huì)不斷優(yōu)化。本文提出的學(xué)習(xí)畫(huà)像與自動(dòng)組卷機(jī)制在一定程度上將“基于知識(shí)點(diǎn)的教育知識(shí)圖譜”向“面向活動(dòng)的教育事理圖譜”進(jìn)行轉(zhuǎn)換,是教育大數(shù)據(jù)融入智能化處理[15]的一次研究嘗試。