基于教育大數據環境的擬人機器學習問題研究*

2020-11-30 09:06:36李小平張琳孫清亮姜麗萍陳建珍

中國教育信息化 2020年11期

李小平張琳孫清亮姜麗萍陳建珍

摘? ?要：教育大數據的出現無疑對教育人工智能機器學習是一個極大的推動，但是推動的核心在哪里、智能的條件和數據挖掘的條件是什么、智能有哪些步驟、如何完成機器學習下的教育智能化，一系列問題擺在智能教育推動者的面前。文章針對以上問題進行了實證分析研究，對教育數據進行了系列分析，找出了教育數據變化的規律和數據性質，給出了摸索數據與事件之間關系的方法——機器學習，并對主流機器學習進行了系統性分析，找出了一種適合于人類、適合于教育類型、在陌生環境下可學習、結果透明、可解釋的擬人機器學習系統。

關鍵詞：教育大數據;擬人學習;機器學習

中圖分類號：G434 文獻標志碼：A 文章編號：1673-8454（2020）21-0001-06

一、引言

教育教學的智能化是相對而言的，智能只能輔助教育發現問題、找出教學規律、輔助發現教學應力問題，有相當行業的數據問題呈現出的是非準確的、非感知的、非捕捉的、非規律的、非人類遇到的問題，這種無規律的現象只能通過擬人的方法解決，并通過人的干預和認識，找出潛在的事物規律。

而當今技術的發展徹底改變了我們尋找教育教學潛在規律的方法和概念，這些進步主要是基于數據的量、復雜度和來源的指數級別的增長。由于這些技術極大地影響了我們應對具有豐富數量環境的能力，輸入的數據是非線性的、非固定的、多模態/異構流的，混合了各種物理變量和信號以及圖像、視頻和文字，多源異構的大數據出現了。[1]教育大數據是大數據在教育領域的具體表現形式，它為新時代的教育教學創新提供了新的思路和方法，站在人的教育角度上相關研究如何從海量的教育大數據中提煉少量教學本質的信息、如何掌握其從大變小的過程、如何使人類教育帶上人的特征或具有人的思維，那就必須從分析教育大數據問題下手。

要讓教育具有人的思維和人的智力，先要完成對各種教育教學形態的辨識，只有在辨識的前提下才能夠對問題進行決策。如何認識事物和分清事物類型，就要對海量的教育數據進行機器訓練，形成模型方可實現智能控制和決策，教育智能化概要如圖1所示。

二、教學大數據特性研究

要研究人工智能，就要對數據來源和數據性質進行研究，找出數據事件的性質和類型，為下一步機器學習提取模型做準備。IT技術不斷發展，隨著教學辦公自動化的推進、教育技術的興起、教育技術地區差異化的普及應用，也產生了教學管理意志的不統一、數據化標準化建設程度不健全、教學政策變化過快導致政策不連續等情況，致使教育數據呈現出內涵和外延兩大特性，如表1所示。

1.教學大數據時間軸問題研究

教學大數據時間軸描述的是多個事件發生的過程中所產生事件之間的順序以及關系，它反映的是事件的特性。我們擬通過數據機器學習可以找出對應的教學策略和教學結果，還可以完成對事件的預測。[2]在時間軸上尋找事件之間的規律和關系是數據挖掘重要的研究方向，時間軸反映了事件的密度和數據的密度。

（1）事件密度：事件密度包括事件的慣性、事件的強弱、事件的稀疏、事件的疊加、事件影響力的持續、幾個數據源對一個事件反映的錯位以及突發事件的出現等。

（2）數據密度：數據密度與學習的慣性有關，例如學習者在業余時間上網集中等，這些都是教學慣性所反映的密度，屬于正常密度。而那些不是預期范圍的、突發的問題則是非正常密度，例如校園出現的突發沖突等。

2.教學大數據對象問題研究

教學大數據研究的對象是指那些在教學研究過程中起關鍵作用的、能被激活的數據。站在不同的教學者角度所關心的數據各不相同，因此需要在進行數據挖掘研究之前先確定所要研究的數據對象，其確定流程如圖2所示。這個過程是在經驗的基礎上實現的，依據教學經驗可以確定不同角色所關心的問題，由于關心的問題不同，需要獲取的數據就會不同，在此基礎之上展開大數據的處理。

3.教學大數據變化規律問題研究

教學過程是一個動態的過程，教學記錄數據會隨著教學過程的推進而不斷發生變化，并且呈現出明顯的特性，其中包括：

（1）慣性特性：教育一直延續著它的政策和慣性向前推進，這種推進是要符合教學規律的。教學數據同樣常年存在著穩定性，在沒有政策跳變的情況下，這些數據將維持著自己的變化規律，保持著一定的慣性特性。

（2）突發特性：教學過程中突發事件的產生將會導致教學數據的突變，這將對教學規律的挖掘產生一定的影響，但同時它也會從另一個角度反映出教學中存在的問題，對全面了解教學情況提供一定的依據。

（3）無規律特性：教學數據的變化雖然長期呈現一種變化的態勢，但針對某些具體類型的數據，尤其是一些主觀教學活動產生的數據，它的變化卻是無規律的，這就需要進一步對其分析來獲取這些數據變化的原因。

（4）疊加特性：影響教學過程數據的因素很多，這些因素有時候會單一地作用于教學數據，但絕大多數情況下會出現多因素共同作用于同一教學數據的情形，于是就會產生疊加效應。疊加效應的出現會加劇問題的復雜化，為數據的分析帶來很多困難，例如一個政策產生影響的過程中又出現另一個新的政策，就會產生相互疊加和相互影響的問題，往往會打破教學規律。

（5）因果規律特性：數據的因果關系反映了數據之間的聯系，通過對數據聯系的分析，就可以挖掘出教學現象的原因。數據的因果規律可以根據影響因素的多少分為單因素因果關系和多因素因果關系，根據影響的結果還可以分為線性因果關系和非線性因果關系兩種。

4.教學大數據衍生問題研究

教學中除了常規的內涵數據和外延數據之外，還存在很多衍生數據。通過衍生形成的新數據其本身的特性和作用點都將發生變化，衍生改變了數據的性質，對數據挖掘起到了輔助作用，它可以作為參考源，但不是挖掘的主流數據源。例如，在對學習者進行困難補助評選中，學習者在食堂的消費數據可以作為參考數據，但不能作為主要依據，它本身具有片面性，不能準確反映事實。[3]

5.教育大數據的分析結論研究

通過以上對教育數據的分析找出了教育數據的運行規律，找出了事件之間的、數據的對應規律，找出了事件和事件干擾所帶來的影響因子。由于歷史原因和管理因素的不系統性，造成主體數據和相關數據都不系統，整體數據結構混亂，雖然出現了多源異構，但是，邏輯規律非常不清晰，無法界定某一個事件集的數據是相對獨立或完整的。如果按照抽樣比對分析的方法，數據抽樣明顯，不具備有規律采集的條件。如果按照所有大數據進行訓練并進行相應的聚類分析等，明顯出現了數據的缺陷現象。如果按照單一事件去尋求教學教育的規律，明顯不符合當今教學形式。怎樣才能夠對教學教育的事件進行有針對性的捕捉，如何在龐雜無章的教育大數據中識別事物的真相，如何進行區分和判別分類，并通過規則完成對事件的定位分類、形成人工智能模型，這是當今研究的重大課題。

三、神經網絡機器學習方法的應用分析

在實施國家自然科學基金項目“考試作弊行為分析與研究”中，BP神經網絡學習對考場動作行為影響方面，筆者進行了研究：對作弊行為進行訓練，采集無限個樣本場景，對作弊圖像進行學習，試圖找到中間結果，試圖解釋出決策的原因，我們采用了神經網絡機器學習的BP神經網絡進行訓練分析。

本文共使用了135幅圖像195個人臉進行實驗，其中包括正臉80個、側臉65個、俯視姿態50個，實驗結果統計如表2所示。

在考試實際應用過程中，獲得的二維考試現場往往是不確定的，試卷圖像的大小、光線、角度、干擾、遮蓋程度都直接影響其學習效果，必須完成嚴格的圖像預處理，才可進行圖像對象定位、特征學習訓練。僅從訓練字母數字相似度問題分析，我們為了減少機器學習次數，采用了基于級聯分組網絡將每次分類任務簡單化的思想，將神經網絡的任務簡單化以提高其辨別能力。整個系統分成兩級，第一級進行粗分類，即將相似的字符分為同一類別;第二級再對每個類別進行細分類，即將相似的字符區分開來。這樣，每個子網絡分類的數目就會減少很多，特別是第二級子網，就是區分幾個類似的字符。整個框架如圖3所示。

在機器學習訓練輸入層、隱含層和輸出層節點數上，通常隱含層節點數越多越慢，但可達到更小的誤差值，特別是訓練樣本誤差，但超過一定的數目后，再增加則對降低誤差幾乎沒有幫助，卻陡然增加執行時間。[4]這主要是網絡變得更加復雜、收斂更慢。因此，隱含層節點數目應當通過試驗選取，是與其應用相吻合的個數。確定隱含層節點數的經驗公式是：

s=■+0.51

公式（1）

式（1）中，s為隱含層節點數，m為輸入層節點數，n為輸出層節點數，計算值需經四舍五入取整。經多個實例驗證，用公式（1）確定隱含層節點數比較可靠，一般能滿足訓練要求，有時也需略微調整。通常隱含層的層數為一層到兩層時有最好的收斂性質，太多層或太少層的收斂效果均比較差。為此，我們在算法上進行了改造，有效限定了中間層級，在BP算法性能上取得了一些進展。

但是，整體訓練量非常大，需要采集無限個樣本場景，對作弊圖像進行學習，幾乎對中間結果無可解釋，內部結構不清晰，無法清楚地解釋做出某些決策的原因，自身也不理解正在處理的問題;BP神經網絡能從圖像中提取高級抽象內容，但無法以人類可理解的分析方式與所處理的問題相關聯，沒有明確的內部模型、語義結構，其隱藏層數量和許多其它參數都是臨時確定的，無法在不確定的情境中工作。用結果對作弊進行實時捕捉，經常出現誤判、漏判等致命性錯誤。

四、擬人機器學習問題的研究

讓教育具有人的思維和人的智力，就要完成對各種教育教學形態的辨識，只有在辨識的前提下才能夠提出問題的決策。對于如何認識事物和分清事物類型，要對海量的教育數據進行機器訓練，而訓練是一個非常龐大的工作，訓練生成和處理的數據越多，計算就越復雜，耗時就越巨大，安全隱患就越大，風險就越高。由于教育大數據具有如此之多的不確定因素，如訓練樣本有限、數據不連續、數據呈現簡短特征、數據有變化趨勢、事件個性化特征明顯、事件作用相互疊加、干擾度過高等，如果采用傳統的深度學習，無法構成訓練環境及條件，訓練出來的決策如果缺乏透明度，其結果也無法進行解釋，呈現出中間運算“黑箱”狀態，人們很難斷定訓練結果是不是百分之百的可靠準確，如果按照傳統深度學習方法去訓練，并將其訓練結果直接用于汽車自動無人駕駛的項目，很難保證在駕駛中不出事故。[5]

1.擬人機器學習問題的研究

究竟什么樣的訓練方法能夠讓教育決策者知道訓練的中間結果的方向，所訓練出的結果是否可靠、科學合理，教育數據能否通過機器學習訓練完成智力思維的提升，且不帶來致命的災難，不會給人類帶來負面的決策、判斷性危險，這是未來教育人工智能解決問題的關鍵;針對傳統機器學習訓練種種不足的原因，各國都展開了這方面的基礎研究。美國國防部高級研究計劃局（DARPA）推出了擬人機器學習方法，即機器可以像人類那樣進行學習的方法。

擬人的機器學習訓練環境更加具有人的因素，需要訓練的結果更加接近人的意志，不給人帶來復雜的過多的工作量，在擬人的情感、擬人的視點、立體構造空間上進行自由思維;擬人可以找出問題，擬人可以對問題進行操控，擬人可以進行自我建構。擬人機器學習方法是最近引入的、基于深度規則系統進行的，從極小訓練數據開始逐步建立起模型，通過原型來描述或注釋學到的觀察結果，解釋系統為何做出決定以及學習一件事。我們將通過擬人的解決方法去處理數據教育問題，用擬人思維考慮人的智能參與度和教育自身的智能化。

擬人機器學習的方法非常適合訓練樣本有限、數據不連續、數據呈現簡短特征、數據有變化趨勢的行業，這種研究思路對非精準的、趨勢性的、允許有一定延遲的、允許有一定干擾的、允許一定影響因子出現的、與目標出現偏差的數據訓練更加有效，非常符合教育數據特性，人類學習與擬人學習比較問題如表3所示。

擬人化學習會使未來的教育智能機器和機器智能更好地為人類服務，也更與人類相像，同時大幅提高其處理量和自動化水平，更加準確透明，適應性強，自學習和計算效率高，更加增強了教育智能化的能力;擬人機器學習比起傳統的神經網絡學習更進一步地識別出未知情境，不僅可以識別此前已知的模式，還可以識別意外模式，能夠意識到自身局限，能在面對未知和不可預測的情況時，啟動安全程序，并從中自主學習，可高度自治，對人類友好、透明、符合人性。[6]擬人的機器學習方法非常適合教育智能研究方向，教育的數據特點與擬人的分類研究非常擬合。

2.主流機器學習和擬人學習的內容比較

目前計算機界推出了三種實現可解釋人工智能（XAI）的方法和模糊邏輯方法，試圖通過近似而非精確或量化的連續過程模仿人類思維，并在模糊規則系統（FRBS）上取得了進步，能夠生成更短也更少的條件（if? then）規則（與數量無關），保持系統獲得高清晰度和可解釋性的答案，與傳統FRBS形成鮮明的對比;這是本文重點要推出的方法——擬人機器學習方法，即機器可以像人類那樣進行學習。下面給出幾個主流機器學習和擬人學習的內容比較，如表4所示。

3.擬人機器學習在未來教育當中的應用研究

能識別未知情境，并從中學習、自主學習，最關鍵的是基于深度規則（DRB）系統的;DRB是一個自組織、自適應、高透明、收斂性好、并行化基于規則的架構和學習算法，一種通用的新的機器學習方法，可以進行簡單的修改。[7]用于圖像分類的DRB系統的結構示意圖，如圖4所示。

從圖4中可以看到，該分類器由以下組件組成。

（1）預處理塊。它涉及在計算機視覺領域中廣泛使用的預處理技術，包括歸一化、縮放、旋轉和分割。

（2）特征描述符。它將原始圖像投影到一個特征空間。使不同類別的圖像分離。I=>X。

（3）大規模并行模糊規則庫。它是一種復雜的非線性預測模型，充當系統的“學習引擎”。每個大規模并行模糊規則由從訓練集內特定類型的樣本中識別的大量原型組成。因此，對于包含c個不同類型的數據樣本，例如圖像的訓練集，if…or…or…then…識別出三個并行模糊規則（既一個類別一個規則）。

（4）決策器。一個類別帶有一個局部/子決策器，給出一個局部建議。根據這些大量并行的局部建議的置信度，來決定勝出的類別標簽。

基于識別出的原型RDB，從數據中自組織和自我演化一個完全透明且可由人類解釋的條件邏輯（if…then…），大規模并行FRB系統。每個大規模并行的模糊規則是圍繞大量原型確定的。這些原型從特定類型的訓練數據樣本中識別出來。RDB方法不是黑盒，它基于原型的特質提供內部結構的透明度和解釋性。大多數現有機器學習方法都需要大量訓練數據，而RDB系統甚至可以從單個例子中學習，也就是從零開始。即使是在完成訓練/部署之后，非迭代在線自主學習算法也能進一步使RDB系統終身不斷地學習新觀察到的樣本。因此它是不斷演化的，對普通的問題場景與特殊場景相結合的補充性學習非常有用。[8]

例如，使用擬人學習的訓練方法識別教育數據沖突事件時，發生于事件疊加的圖形如圖5 所示。

使用擬人的思想，不是識別一個二維圖形，而是以人的立體化思維學習和認識事物，如果識別的原型有錯誤，可以隨時替換正確的圖形，每一個問題都非常透明，每一步驟都有解釋;沒見過的場景可以隨時隨地添加，這對于面對問題出發的教育事件識別可操控性非常強，能有目標、無風險地進行智能判斷，為教學教育進一步智能化提供了有利的先決條件。

擬人的機器學習，可以邊實踐邊學習，如果給出的規則有錯誤，可以修改，如果碰見沒有見過的場景和問題，可以加到規則中，僅需要一兩個案例學習就可以進行人機互通的交互式學習。不像神經網絡對弈，物體要多角度、不同光線、不同場合進行采樣，況且對其訓練的結果還沒有把握。

五、結束語

教育人工智能是一個龐大的系統工程，能否對事件事物數據進行正確的定位、找出數據的特性將是教育智能的基礎，能否找到辨識事件和事物的關系和類型，及其學習的方法是提取有效模型的技術關鍵，能否進行透明的、可解釋的、可調控的、陌生場景的機器學習，是第五代移動通信下教育人工智能的技術標志。盲目的數據挖掘將會帶來勞命傷財的效果，科學的機器學習，按人的意志去提取教育所需要的東西，才是教育智能化的本質。脫離人的意志的人工智能是盲目的、無前途的。

參考文獻：

[1]P.P.Angelov，X.GU，and J.Principe.“A Generalized Methodology for Data Analysis”IEEE Trans，Cybernetics，2017;doi：10 1109 TCYB.2017.2753880.

[2]C.M.Bishop.Pattern Recognition and Machine Learning，Springer，2006.

[3]A.Nguyen，J.Yosinski and J.Clune.“Deep neural networks are easily fooled： High confidence predictions for unrecognizable images，”2015 IEEE Conference on Computer Vision and Pattern Recognition （CVPR），Boston，MA，2015：427-436.

[4]Y.LeCun，Y.Bengio，and G.Hinton.“Deep Learning”Nature Methods， 2015，13（1）：35.

[5]Plamen Angelov.Autonomous Learning Systems：From Data Streams to Knowledge in Real-time[J].2012.

[6]P.P.Angelov and X.Gu.“Deep Rule Base Classifier with Human-Level Performance and Characteristics，”Information Sciences，vol.263-464，208，pp.196-213.

[7]Angelov，Plamen & Gu，Xiaowei.Deep Rule-Based Classifier with Human-level Performance and Characteristics. Information Sciences，2018：463-464.10.1016/j.ins.2018.06.048.

[8]Gu，Xiaowei & Angelov，Plamen.Semi-supervised Deep Rule-based Approach for Image Classification. Applied Soft Computing，2018：68. 10.1016/j.asoc.2018.03.032.

（編輯：王天鵬）