文/本刊記者 王左利
大數據:離中心越來越近
文/本刊記者 王左利
“一切都被記錄,一切都被數字化?!痹谠S多領域,大數據正在大放異彩。所以有句話說,未來的時代將不是IT時代,而是DT的時代。DT就是Data Technology(數據科技)。
而在教育信息化領域,真正的大數據應用還在路上。重要原因之一是分析工具的缺乏。就像當汽車時代來臨,我們當然無法按照駕駛船只的方式去駕駛汽車。所以,最開始,大家用Excel的方法分析了很多結構化非結構化數據,非常辛苦但收效也甚微。如果沒有合適的分析技術,要揭開龐大的數據背后的故事是極其困難的事情。
還有一個原因是教育教學是一個非常復雜的系統,受施教者、學習者、學習內容、學習目標、學習環境等因素的影響,使得大數據應用的切入不那么單純。
那么,從學校的管理層面上來說,大數據到底可以干哪些事?北京大學計算中心主任張蓓教授認為,很難在互聯網上發現大數據在教育領域的深入應用,目前來看缺乏精彩案例,但是,仍然可以說,大數據與教育的結合有很多潛力可挖。
比如,在教學管理中,通過大數據的分析為傳統課堂教學提供質量監控和評價。在科學研究中,通過對科研文獻挖掘,快速準確識別新型分子,加快科研進度。
而在傳統課堂領域,通過對數據的積累、挖掘、對比、分析,可以幫助學校了解:哪些課程最受歡迎;哪些課程需要改進,如何改進;哪些教師應該獲得幫助,需要哪些幫助等等。對于教師來說,對數據的分析和使用則可以幫助他們改善教學效果。通過這些數據的積累、挖掘、對比、分析,可以幫助老師了解自己的課堂是什么樣子;如何可以做得更好。
在高校,學生和教師畫像是最近一兩年比較流行的做法。多維度、全方位的刻畫主要用來分析學生學業狀況,預測掛科、排名突降,動態評估經濟水平,精準資助困難學生,預測學生畢業去向,提供針對性引導。
而對教師的數據服務主要表現在:基于教師學習經歷、導師、海外交流、所屬團隊、職位晉升等信息,構建教師成長軌跡,分析教師發展的影響因素,為教師個性化發展指引方向。

做MOOC幾年之后,清華大學副教授于歆杰認為,現在獲取的數據比原來更大量、精細。他認為,在獲得的基于真實課堂教育大數據的基礎上,2017-2018年,理念中的因材施教有望實現。總之,這幾年大數據在高校教學、管理的邊緣一直兜兜轉轉,不過似乎離中心越來越近了。
有步子邁得更大的,上海交通大學2015年開始“開放數據”,讓現有存量數據發揮價值是開放數據的初衷。
開放數據倡導者,上海交通大學教授金耀輝不僅倡導高校的數據開放,更倡導全民的數據開放,他說,很多人不明白為什么要做開放數據,實際上就是讓廣大吃瓜群眾也參與到反作弊、數據安全、隱私保護、預測分析等等數據科學研究中來。
在上海交通大學的案例中,他們從2015年開放了WiFi網絡、一卡通、氣象三個數據集?!耙皇て鹎永恕保?016年間,開放的數據得到諸多應用,還催生了多個學生創業團隊。
值得關注的是,在大數據時代,數據的來源是多種多樣的,無論是結構化數據還是非結構化數據。個性化的數據大部分來源于師生們發表的論文,包括微博,微信,論壇等等一系列信息。當然,問題隨之而來,數據得到更多開放的同時,我們更需要關注如何保護隱私,并在保證隱私和提供精準服務之間,找到合理合法的平衡點。