楊現(xiàn)民 江蘇師范大學智慧教育學院副院長,教育部教育信息化專家,中央電教館培訓專家,江蘇省教育信息化工程技術研究中心副主任,教授、博士。
一、何為“大數(shù)據(jù)”
提起大數(shù)據(jù)時代,我們不得不提近年來一個非常了不起的“發(fā)明”——“雙十一”。據(jù)統(tǒng)計,2017年“雙十一”當天的交易額大概是1682億元,這是一個巨量的數(shù)字,相當于新加坡超過一個月的GDP,南蘇丹好幾年的GDP。這個例子直觀地反映出,中國已經(jīng)進入了一個新的時代——大數(shù)據(jù)時代。在這個時代,全數(shù)字化、移動互聯(lián)式的生活、工作、學習逐漸普及。那么,何為“大數(shù)據(jù)”?
在眾多的學術化概念中,筆者認為最權威、最有助于理解的“大數(shù)據(jù)”定義,是國務院在2015年發(fā)布的我國首個有關“大數(shù)據(jù)戰(zhàn)略”的文件——《促進大數(shù)據(jù)發(fā)展行動綱要》中所提出的:大數(shù)據(jù)是以容量大、類型多、存取速度快、應用價值高為主要特征的數(shù)據(jù)集合。筆者對該文件做了一個高頻詞分析,發(fā)現(xiàn)其中出現(xiàn)最多的兩個詞為:共享(59次)和開放(36次)。這足以說明,我國所走的大數(shù)據(jù)路線一定是開放、共享的路線,突出跨區(qū)域、跨部門、跨行業(yè)“三跨”數(shù)據(jù)的融合,最終用數(shù)據(jù)構建數(shù)據(jù)強國,推動大數(shù)據(jù)治國。
習近平總書記在2017年新一屆中央政治局第二次集體學習中,將“大數(shù)據(jù)戰(zhàn)略”作為一個專題進行學習。他指出,大數(shù)據(jù)是信息化發(fā)展的新階段。隨著信息技術和人類生產(chǎn)生活交匯融合,互聯(lián)網(wǎng)快速普及,全球數(shù)據(jù)呈現(xiàn)爆發(fā)增長、海量集聚的特點,對經(jīng)濟發(fā)展、社會治理、國家管理、人民生活都產(chǎn)生了重大影響。在這樣一個新的階段,習近平總書記對領導干部提出了新的要求。他指出,善于獲取數(shù)據(jù)、分析數(shù)據(jù)、運用數(shù)據(jù),是領導干部做好工作的基本功。各級領導干部要加強學習,懂得大數(shù)據(jù),用好大數(shù)據(jù),增強利用數(shù)據(jù)推進各項工作的本領,不斷提高對大數(shù)據(jù)發(fā)展規(guī)律的把握能力,使大數(shù)據(jù)在各項工作中發(fā)揮更大作用。
在這個大數(shù)據(jù)時代,對我們教育工作者來說,無論是學校校長、普通教師,還是企業(yè)研發(fā)者,如果沒有很好的數(shù)據(jù)意識、數(shù)據(jù)思維和數(shù)據(jù)能力,那么一定做不好工作。
二、大數(shù)據(jù)的核心思想
在研究過程中,筆者將大數(shù)據(jù)的核心思想概括為以下五點。
1.大數(shù)據(jù)強調(diào)數(shù)據(jù)本身的價值遠勝過算法技術。當然,互聯(lián)網(wǎng)界的大咖們各有不同的觀點。馬云說過,他有大數(shù)據(jù),數(shù)據(jù)為王。李彥宏認為,算法為王。馬化騰則認為,場景最重要。但是不管怎樣,在這個大數(shù)據(jù)時代,數(shù)據(jù)的價值已經(jīng)被越來越多的人認可。
2.大數(shù)據(jù)承認數(shù)據(jù)本身的混雜性和多元性。數(shù)據(jù)不是單一的,例如我們刻畫一個學生,如果僅僅通過成績?nèi)タ坍嫞且欢ㄊ遣徽鎸崱⒉蝗妗⒉豢陀^的,我們必須通過學生生活、學習等多方面的數(shù)據(jù),才能夠描繪出一個真實的學生。
3.大數(shù)據(jù)強調(diào)要從因果關系轉(zhuǎn)向相關關系,從“抽樣”走向“全樣本”。以前我們做調(diào)查研究,經(jīng)常是發(fā)出50份調(diào)查問卷,收回后進行統(tǒng)計。從統(tǒng)計學來說,抽樣統(tǒng)計出的數(shù)據(jù)確實可以在一定程度上推演出全樣本,但樣本畢竟只是樣本。在大數(shù)據(jù)時代,我們擁有更多更好的技術之后,很多的研究、管理就將走向全樣本的研究和管理。
4.大數(shù)據(jù)強調(diào)突出跨領域數(shù)據(jù)的交叉融合和流動生長。數(shù)據(jù)的交叉融合強調(diào)數(shù)據(jù)的多元化。數(shù)據(jù)的流動生長強調(diào)數(shù)據(jù)的價值,因為數(shù)據(jù)是有時間性的,是隨著時間的推移遞減、衰減的。例如,我們在淘寶上買東西,淘寶給我們推薦東西時所用的數(shù)據(jù)一定不是一年前的數(shù)據(jù),而是更有價值的近期數(shù)據(jù)。這個最典型的例子說明,數(shù)據(jù)本身的價值是隨著時間的推移而逐漸衰減的。因此我們要特別強調(diào)數(shù)據(jù)的流動性,也就是數(shù)據(jù)的更新、生長。
5.大數(shù)據(jù)強化了即時分析和利用數(shù)據(jù)預測未來的能力。這一核心思想是我們在小數(shù)據(jù)時代無法實現(xiàn)的。
三、教育大數(shù)據(jù)的特征
筆者認為,教育大數(shù)據(jù)不等同于普通的大數(shù)據(jù),它的初心和本源是服務于我們教育教學的發(fā)展。在這樣的初心和本源下,教育大數(shù)據(jù)呈現(xiàn)出以下三個典型特征。
首先,從教育數(shù)據(jù)采集角度看,教育大數(shù)據(jù)的復雜性遠遠超過普通的大數(shù)據(jù)。教育的業(yè)務場景是多元化、復雜化的,很多數(shù)據(jù)的采集難度很大。例如,課堂上教師用平板可以采集到很多數(shù)據(jù),但學生回家之后在紙上寫作業(yè)的相關數(shù)據(jù)卻無法采集;學生在課堂中的成績、舉手次數(shù)、提問次數(shù)都可以采集到,但學生情緒卻是一個復雜化、多樣化、個性化的數(shù)據(jù)……這些都是數(shù)據(jù)采集的難點。
其次,教育大數(shù)據(jù)的應用模式更具挑戰(zhàn)性。數(shù)據(jù)挖掘中最典型的案例叫“啤酒和尿布”,“啤酒”和“尿布”兩個看上去沒有關系的商品擺放在一起進行銷售,并獲得了很好的收益,這種現(xiàn)象就是賣場中商品之間的關聯(lián)性。而教育大數(shù)據(jù)則沒有這么簡單。教育是一項育人的工程,我們要從管理的維度、教學的維度、生活服務的維度、教研的維度等多個方面,去促進學生的成長。教育數(shù)據(jù)有很多應用的場景,其本身是很復雜的,不是簡單地放在一起就可以見效的。
最后,教育大數(shù)據(jù)要更加注重因果關系。我們通過復雜的數(shù)據(jù)確實可以發(fā)現(xiàn)其相關性,但還要在相關的基礎上,進一步去挖掘、分析、探究因果。因果反映的是一種規(guī)律,把握了規(guī)律之后,我們才能科學地去做事。
四、教育大數(shù)據(jù)采集技術體系
教育大數(shù)據(jù)采集的技術體系包括四大類十三種常見數(shù)據(jù)采集技術。
第一類叫物聯(lián)感知技術,包括物聯(lián)網(wǎng)感知技術、可穿戴設備技術、校園一卡通技術。其中最典型的例子就是校園一卡通,它重點采集了學生在學校里的生活數(shù)據(jù)以及學生日常管理的數(shù)據(jù)。
第二類叫視頻錄制技術,包括視頻監(jiān)控技術、智能錄播技術、情感識別技術。在智能錄播過程中,采集的是課堂教學數(shù)據(jù)、校園安全數(shù)據(jù)。智能錄播目前正邁入3.0時代,嵌入了數(shù)據(jù)分析和診斷評價功能,可以把教師的上課過程錄下來,并自動分析出報告,反饋出該節(jié)課是以學生為中心的課堂,還是以教師為中心的課堂,提問的有效性怎樣。
第三類叫圖像識別技術,包括網(wǎng)評網(wǎng)閱技術、點陣數(shù)碼筆技術、拍照搜題技術。
第四類叫平臺采集技術,包括日志搜索分析技術、在線學習與管理平臺技術、移動App技術、網(wǎng)絡爬蟲采集技術。
此外,隨著科技的日新月異,人臉識別技術也越來越成熟,這種技術也會改變我們的教育教學。當學生進入校園、課堂簽到時,有了計算機視覺技術之后,很多的管理模式都將改變。
五、教育大數(shù)據(jù)分析與應用
首先,教育數(shù)據(jù)可以分為四層。基礎層,存儲國家教育基礎數(shù)據(jù);狀態(tài)層,存儲教育裝備環(huán)境與業(yè)務的運營狀態(tài)數(shù)據(jù);行為層,存儲教育用戶的行為數(shù)據(jù);資源層,存儲各種形態(tài)教育資源。
其次,筆者在2016年出版的《互聯(lián)網(wǎng)+教育:中國基礎教育大數(shù)據(jù)》中,提出了七個數(shù)據(jù)分析模型,對應七個數(shù)據(jù)應用的場景,即決策支持模型、校情監(jiān)測模型、適應性學習模型、學業(yè)評價模型、學習預警模型、深度學習行為診斷模型、學生畫像模型。
最后,教育大數(shù)據(jù)有五大應用模式,即驅(qū)動教育政策科學化、驅(qū)動教育評價體系重構、推動區(qū)域教育均衡發(fā)展、助推學校教育質(zhì)量提升、促進師生個性化發(fā)展。
六、教育大數(shù)據(jù)六大發(fā)展趨勢
筆者參與編寫的《中國基礎教育大數(shù)據(jù)發(fā)展2016—2017:走向數(shù)據(jù)驅(qū)動的精準教學》于今年4月出版,書中總結了教育大數(shù)據(jù)的六大發(fā)展趨勢。(如下圖)