999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

“互聯網+”時代數據驅動的教育評價體系構架與實踐進展*

2019-08-31 08:25:38楊現民顧佳妮邢蓓蓓
關鍵詞:評價教育學生

楊現民, 顧佳妮, 邢蓓蓓

(1.江蘇師范大學 智慧教育學院,江蘇 徐州 221116;2.江蘇師范大學 化學與材料科學學院,江蘇 徐州 221116)

引 言

2015年,李克強總理首次在《政府工作報告》中提出“互聯網+”行動計劃,正式揭開了“互聯網+”時代的序幕。“互聯網+”理念正深刻影響和重塑傳統產業格局。同其他產業一樣,教育的面貌也在不斷改變,“互聯網+教育評價”是“互聯網+教育”的內容創新,教育事業的改革與發展離不開教育評價體系的支撐,合理的教育評價實踐有利于保障國家教育方針的順利實施。傳統教育評價存在一些缺陷,如評價標準和內容過于片面、缺乏真實性和動態性評價、對數據挖掘和利用不充分、難以開展持續性和終身性評價等,一定程度上阻礙了教育信息化和現代化的進程。

習近平總書記在全國教育大會上提出:要深化教育體制改革,健全立德樹人落實機制,特別強調要扭轉不科學的教育評價導向,從根本上解決教育評價指揮棒問題。[1]得益于大數據、云計算、物聯網等新一代信息技術的快速發展,大規模數據急速產生并流通,數據已成為當今時代重要的戰略資源。[2]隨著數據密集型科學范式的出現,“量化一切”“讓數據發聲”等口號成為新時代的重要標志,以數據驅動為導向的研究方式為教育評價的研究提供了新思路,推動教育評價走向數字化、科學化、智能化和專業化。[3]

一、教育評價的發展階段

教育評價是人類對教育過程的一種價值判斷活動。它起源于中國古代的教育考試制度,孕育于西方的教育測量批判思潮,形成于美國20世紀30年代的“八年研究”改革運動。縱觀教育評價發展的歷史和教育評價的重點差異,可以將教育評價的發展劃分為五個時期,分別為教育評價的啟蒙時期、開創時期、批判時期、專業化時期和精準化時期(見圖1)。隨著時代的發展和教育評價體系的不斷完善,評價手段與評測技術的融合性和評價結果的客觀性逐漸增強,評價主體、評價形式和評價方法也愈來愈多元化。

圖1 教育評價的發展階段

(一)教育評價的啟蒙時期(19世紀末至20世紀30年代)

1864年,英國格林尼治醫學校教師George Fisher公布了習字、拼字、數學、圣經和其他科目的標準對照表和實例,并規定了五分制評分的標準。1897年,萊斯(Joseph Rice)發表了對20個學校16 000名學生所做的拼字測驗結果,大大推動了對教育測量的研究。英國的差異心理學創始人高爾登(Francis Galton)是最早應用統計方法處理心理學研究資料的學者,他認為人的所有物質都可以定量敘述。高爾登的理論為教育評價工作的量化技術提供了重要基礎。1904年,美國教育心理學家桑代克(Edward Lee Thorndike)出版了《心理與社會測量導論》,該書介紹了心理統計方法和編制測量的基本原理,為教育測量的客觀化、標準化奠定了理論基礎。1905年,法國人比納(A.Binet)與其助手西蒙(T.Simon)編制了測量智力的“比納-西蒙量表”。1923年,美國發布了第一個標準化成績測驗——斯坦福成績測驗,標志著教育測量的編制和運用已十分成熟。這一時期教育測量方法被廣泛運用,但其仍存在一定弊端。首先,教育測量的研究對象有限,如學習興趣、學習動機等人格因素就難以全面量化;其次,教育測量只關注學生學習結果的測量,而無法對學習過程做全面測驗。為此,研究者和實踐者不斷探索更加科學的測量方法,于是教育評價應運而生。

(二)教育評價的開創時期(20世紀30年代至50年代初)

為了解決1929—1933年經濟危機后出現的學生需要與學校課程間的尖銳沖突,泰勒(Ralph W.Tyler)受進步主義協會邀請,主持了為期八年的課程與評價研究,以幫助教師形成有效的評價方法去了解學生參與新課程之后的變化。[4]泰勒認為學生學業成績測驗存在片面性,因此他提出了區別于“測量”的新概念——教育評價(Educational Evaluation)。泰勒的評價是以目標為導向,把評價內容分成具體可見、可操作的學生行為目標,根據預期的目標有計劃地收集資料,去判斷實際活動是否達到預期目標或者達到了何種程度,其中收集資料的手段有多種(筆試、觀察記錄、問卷、訪談等),但任何一種手段都需要遵循客觀性、信度和效度準則,否則評價都將無效。泰勒的評價實證化特點非常明顯,他的工作也取得了巨大成就。這一時期基本可以稱為“泰勒時期”,泰勒以目標為中心的評價極大提高了評價的實用性,[5]但同時它也有其自身難以克服的局限。首先,并不是所有目標都可以轉化成行為目標,如道德意識層面的目標就難以評價;其次,泰勒的評價過分關注如何實現預期目標,而忽略了對行為目標本身的評價。

(三)教育評價的批判時期(20世紀50年代至20世紀70年代)

這一時期,教育評價方法的實證化仍占主要地位,但隨著評價需求的快速增長,泰勒評價模式受到了嚴峻挑戰,一些學者紛紛對其提出了質疑和批判,克隆巴赫(Lee J.Cronbach)在一篇題為《通過評價改進課程》的論文中強調評價應發生在教育過程中,而不是教育過程結束之后,它不僅要關注預期教育目標的實現,更應關注針對評價信息的教育決策。斯塔弗賓(Stufflebean)同樣認為教育評價就是為決策者提供服務的過程,為此,他提出了以決策為中心的CIPP評價模式,幫助決策者改進教學和管理。除此之外,斯克里文(Michael Scriven)也認為教育評價不僅要對教育目標的預期效果進行評價,一些非預期的效果也需要在評價中有所體現,因此,他提出了目標游離的評價模式,主張評價活動與教育目標分離,評價者應在不知道預期目標的情況下全面搜集評價信息,保證評價結果的真實性。

總之,這一階段的評價都是評價者根據一定的標準去判斷所得結果是否達到預期目標,從而作出價值判斷。該時期的不足體現在過分強調科學實證主義的方法,忽視了定性方法的使用,嚴格、固定的評價流程使得評價活動缺乏靈活性和彈性。

(四)教育評價的專業化時期(20世紀70年代至21世紀初期)

這一時期,大量教育評價刊物、書籍被出版,各種研究機構、評價組織紛紛涌現,評價專業化活動也迅速興起,教育評價進入了專業化深入發展時期。[6]教育評價方法的人文化傾向得以強化,出現了一些新的評價模式,如斯塔克(Stake)等人的應答評價模型,庫巴(E.Cuba)和林肯(Lincoln)的自然主義評價模式等。這些評價模式不過分追求評價的客觀性,更多關注評價參與者對評價對象的主觀性認識。該時期的評價堅持“價值多元化”理念,因而評價結果是在評價過程中,以磋商的形式,不斷消除分歧,最后形成一致的、公認的觀點。在主張個人發展的質性分析的同時,實證化特征也同樣得到了進一步發展,泰勒的目標導向評價模式在經過波帕姆(W. James Popham)和布魯姆(B. S. Bloom)的改進后,仍在教學領域廣泛應用。[7]

總的來說,教育評價的價值取向從對學生的甄別選拔轉變為關注個性化發展;評價方法從標準化測驗轉變為定性分析和定量分析相結合;評價方式從終結性評價轉變為形成性評價、過程性評價和終結性評價相結合,教育評價體系正在逐步完善,也得到越來越多教育工作者的運用。教育評價走向客觀是一種趨勢,然而在大數據時代到來前,受限于數據采集技術,教育評價依賴于小樣本數據,評價結果雖然能在一定程度上描述客觀事實,但是仍然不夠全面、精準。[8]隨著大數據的發展,小樣本數據變為全樣本的大數據,基于數據驅動的精準評價時代到來。

(五)教育評價的精準化時期(2010年至今)

新一代信息技術(云計算、大數據、物聯網、移動互聯網、人工智能)與教育的深度融合促進了智慧教育的發展,催生出海量教育大數據,綜合應用多種采集技術(物聯感知、視頻錄制、圖像識別、平臺采集)對教育數據進行全面、自然、動態、持續采集,[9]通過數據挖掘、內容分析、聚類、預測等技術方法透視數據背后隱藏的價值規律,精準分析評價對象的發展情況,針對現存問題進行及時有效的干預,并對其未來趨勢做客觀且科學的預測。總而言之,基于數據驅動的教育評價就是利用技術手段與方法,更加系統、科學、全面地收集、處理和分析教育信息和數據,對教育活動做出智慧判斷的過程。相較傳統的教育評價,數據驅動的教育評價從經驗主義轉向數據主義,從模糊走向精準,在評價功能、評價對象、評價內容、評價方法、評價過程、評價結果等方面存在較大轉變(見表1),它具有如下特征:

表1 傳統教育評價和數據驅動的教育評價對比分析

1.增值性:倡導以“改進”為主的評價目的

當前我國的教育評價以選拔為主,評價標準過于單一,評價內容仍停留在成績的評定上,這在很大程度上阻礙了教育價值取向的創新發展。教育最大的價值在于發現個體興趣,幫助其不斷發展,最后創造出社會價值。大數據通過相關教育信息的關聯挖掘、分析,能精準確定不同個體的認知起點,根據數據分析結果預測其未來發展趨勢,幫助個體制定個性化的發展目標,且便于評價者實時監測個體的目標完成情況,及時提供針對性的改進建議。數據驅動的教育評價關注個體在一段時間內是否存在進步,以及具體的進步量是多少,例如通過當前學生質量與初始學生質量的增值幫助評價者快速洞察學習者在一段時間內的進步情況,同時進步量的差異也反映了不同干預措施的有效性。大數據“放大”了個體的細微變化,生動展示了教育“增值”的過程,同時也能為不同個體提供最適合的干預措施。

2.多元性:強調評價主體的多樣化

管辦評三位一體的教育管理格局使得教育評價的主體通常是政府和教育行政部門。這種評價主體相對單一的管理存在很多弊端,如長期以管理者主導評價容易導致教育評價行政化色彩濃重,美國評價學者派特(M.Q.Patton)早在1978年就提出了“多元主體參與”的概念。[10]他認為使用評價信息的相關人員都應參與到評價過程中,但受限于技術環境,難以實現全員參與評價。新一代信息技術的發展為教師、學生、家長、管理者等不同主體提供了足夠的空間和平臺參與評價,不同評價主體根據評價需要有選擇地處理數據,從而形成適合不同主體的評價報告。該種方式既拓寬了評價的視角,又增強了不同主體間的互動,還可以建立共同參與、相互影響的教育評價制度。

3.綜合性:注重評價范圍的全面性

過去,教育信息大多是“隱形”的,難以搜集、匯聚、分析和公開,然而大數據技術的出現促使教育信息變得可量化。新一代信息技術的廣泛應用為教育提供了海量的數據,使得教育評價的范圍逐漸擴大到“一切教育和教育的一切”,[11]它不僅涉及課堂教學質量評價、教師評價、學生評價、學校評價等微觀、中觀層面,還涉及區域教育發展水平評價、學科發展的國際比較評價、國家教育競爭力評價等宏觀層面,任何教育發展和改革實踐中存在的新問題、新進展都將納入到教育評價的范圍中。

4.實時性:注重評價過程的及時性

在傳統教育評價中,評價者通常采用事后分析,導致評價結果具有一定的延時性。如果學習者在學習過程中無法及時獲得關于自身的評價反饋,那么事后評價結果的作用也將大打折扣,因此教育評價要注意一定的時效性。大數據技術支持下的伴隨式采集能實時獲取學習者學習的過程數據和結果數據,形成評價數據源,根據評價指標建立數據分析體系,評價者在實時監測學習者學習效率時能將數據精準應用于其學習場景中,實現數據與學習者學習效率的融合轉化,讓學習者在學習過程中通過獲得持續不斷的評價結果反饋和精準干預而提高學習質量。

5.精準性:強調評價結果的有效性

以往學生學習的興趣點、難點等都是憑借教師經驗得以確定,但利用大數據技術能相對全面地記錄學生的學習過程,如線上線下的學習表現、作業完成情況、師生互動情況、學習興趣、學習態度、學習動機等,綜合運用人工智能、圖像分析、語音識別等方法分析學生學習和教師教學的過程,實現過程數據的智能化處理,利用決策樹、機器學習、神經網絡等技術掌握數據集中所隱藏的關系和價值,[12]精準有效地指導學生反思學習過程,引導學生主動發現學習問題,并將教學過程中存在的問題準確反饋給師生,為促進學生的深度學習和教師的精準教學提供個性化指導。

6.公平性:注重評價程序的公開透明

原來的教育評價實施過程是一個“黑箱”,部分委托項目中,政府仍占據著評價程序的推進權和決策權,[13]專家或第三方評估機構往往會因為種種利益關系而影響評價行為,因此很難保證評價程序的公正性。“互聯網+”開啟了一個高度透明、具有更強公信力的時代,評價主體或評價利益相關體能看到教育評價過程中發生的一切(采集了哪些數據、如何聚合信息、怎樣數據分析、做出什么決策)。伴隨著對教育評價過程的公開,保障民眾與教育相關部門的信息對等,從而建立彼此的信任,民眾通過可信的信息和數據支持能做到有“據”可依,不盲從評價者的決策和干預。

二、數據驅動的教育評價體系構架

教育評價活動的實施大體都包含前期的準備工作、評價實施和評價決策三個階段,每個階段都由相互關聯的若干程序組成。互聯網+、大數據技術、人工智能技術的發展改善了傳統的教育評價體系,數據驅動的教育評價體系構架(如下頁圖2所示)使得評價流程更具科學性、客觀性和精準性。

(一)評價的準備階段

在評價的準備階段,首先要明確評價目的,即評價活動想要實現的結果,是鑒定、分等,還是監控與激勵;然后確定評價對象,也就是評誰?評什么?新技術的使用擴大了評價的范圍,無論是微觀層面的教學效果評價、學生綜合素質評價、課程質量評價,還是宏觀層面的區域教育質量水平分析、國家教育競爭力對比等,都能根據評價目的確定相應的評價對象。評價目標、評價指標體系、評價標準的確立是教育評價的關鍵環節,評價指標體系要盡可能全面且可操作,評價標準需緊扣目標。另外,教學平臺、評價系統的成熟運用為教育評價提供了全新的評價工具。

(二)評價的實施階段

評價的實施階段主要包括數據采集、數據處理以及數據分析三個階段。首先需要采集與評價對象、評價內容、評價目標相關的信息數據,全過程數據的采集是數據驅動教育評價的重要環節,不完整的數據采集會影響教育評價的實施和評價結果的準確性。教育數據來源十分多元,根據教育數據來源和范圍的不同,評價數據大體分為國家教育大數據、區域教育大數據、學校教育大數據、班級教育大數據、課程教育大數據和個體教育大數據。目前,物聯感知技術、平臺采集技術、視頻錄制技術和圖像識別技術可對多元化數據進行全自動、全過程、全樣本、全類型的采集。全自動體現在評價數據通常是學生、教師、管理者和家長等評價主體在運用各種教育裝備中自動產生,而非根據特定的評價目標選擇性采集;全過程體現在充分借助先進技術平臺,持續記錄評價對象的學習軌跡,動態監測評價對象學習的全過程,在保證數據有效的基礎上,細化數據粒度;全樣本體現在數據分析所基于的樣本量不是純微觀抽樣,而是全樣本的總體數據,這也是大數據時代所強調的整體性思維;全類型體現在評價數據的類型除了結構化數據,還有非結構化數據和半結構化數據。

圖2 數據驅動的教育評價體系構架

高質量的數據經過處理分析才能得到高質量的結果,因此需將采集的數據進行預處理,去掉低質量、不合要求的數據,然后將其余規范、合理的數據進行整合,集中存放在數據庫中。數據存儲需要根據數據類型和特點,對大規模數據進行結構化存儲,存儲的方式和特點將直接決定數據利用的效率。很多學習系統或社區都有各自成型的數據管理策略,學習者在不同的學習系統或社區中注冊并留下學習軌跡,如果系統之間缺乏有效數據鏈接,那么獲得學習者完整的學習數據將十分困難。這就需要將不同來源的多樣性數據加以整合,并將這些多來源的數據導入到同一個分析框架中,實現大規模數據的語義存儲。

對于評價數據的分析既要綜合運用傳統的數據分析方法與工具,又要合理采用專門針對大數據處理的新方法與新工具。傳統方法主要包括聚類、預測、關系挖掘、社會網絡分析、文本挖掘、Web數據分析等,新方法主要包括深度神經網絡分析、智能代理、機器學習、計算智能方法、圖像分析、語音識別等,綜合運用數據分析方法,對評價數據進行智能化處理,[12]科學指導教育決策。大數據的使用一方面保留了教育評價的數量特征,保證了評價的客觀性,同時使人文社會科學方法在評價中的應用有所創新,比如應答評價模式中評價者與評價對象之間的應答過程,教學平臺提供了網絡空間讓評價對象及評價的相關人員針對某一問題各抒己見,網絡空間可以容納大范圍、大規模的相關人員參與討論,然后通過聚類、內容分析等技術快速統整意見,提煉核心觀點。當發表意見的人數足夠多時,就會削弱該種方法帶來的主觀性影響,在響應人文主義思想的同時,也保證了評價結果的準確性。

(三)評價的決策階段

在評價的決策階段,將教育評價結果以可視化的形式反饋給不同評價主體,以服務國家、區域、學校等進行教育決策。分析報告中呈現的內容主要包括診斷性評價結果、過程性評價結果、總結性評價結果、發展性評價結果、風險預測和發展趨勢。診斷性評價結果是為了幫助決策者確認評價對象的初始發展水平;總結性評價結果是為了感知評價對象的整體發展情況;過程性評價結果是為了從細節處把握評價結果的精準性,通過了解評價對象發展的動態過程,以評價對象教育過程中發生的變化為事實依據,分析判斷并給予評價對象實時反饋;[14]發展性評價則是為了展示評價對象自身發展變化的軌跡,以初始發展水平為參考,呈現當前表現與過去表現之間的差距,便于決策者尋找影響評價對象發展的因素和促進其發展的策略。總結性評價結果、過程性評價結果、發展性評價結果等從整體到局部全方位挖掘評價對象在教育過程中的發展情況,精準了解當前的教育問題及潛在風險,及時進行預警并采取措施以有效規避風險。

數據驅動的教育評價應用具有多角度、全方位、多層次的特點。在內容上,既包括學業評價,也包括對學習態度和運用知識能力的評價,以及適當的價值觀評價;在過程上,既包括課程評價,也包括教學及其結果評價;在層次上,涵蓋微觀、中觀和宏觀評價,從學生、教師評價到學校管理、地方教育的行政評價以及在國家層面上教育政策、投入和教育改革等方面的評價等。

國家層面上,評價結果主要用于教育決策、教育資源配置和教育體制改革。在教育決策方面,通過對關鍵年齡段學生大規模抽樣測試結果進行分析與數據挖掘,及時發現潛在的教育質量問題,并以高度可視化的方式呈現給決策者,以便決策部門調整教育政策,控制教育行為,從而穩定提高國家教育質量;在教育資源配置方面,教育管理者實時收集區域教育經費、學校分布、人口流動等數據,經過科學分析全面掌握不同區域的教育資源配置情況,管理者針對不同區域特點合理配置資源,促進教育資源均衡發展以及教育公平;在教育體制改革方面,教育管理者根據評價結果反映的問題重新審視當前的教育體制,及時修正教育體制中不合理的成分,通過了解教育供給中學習者的需要,為學生個性化學習提供精準支持,深化教育供給側改革。

與國家層面評價相比,區域層面上由于教育發展差距較小,影響因素較少,獲得的評價結果相對更為準確,可以為教育行政與業務部門采取相應的教育改革措施提供更準確的施政指標與證據,逐漸實現教育均衡、現代化以及提高教育質量等目標。評價應涵蓋區域范圍內的相關教育問題,包括學生參與性和進步程度、學生成就和素養、教育機構的組織和管理、教育機構的課程和發展趨勢、機構的財政情況和人力資源等。

學校層面上,數據驅動的教育評價應用包括:(1)對學生的評價。針對學習者相關數據的分析結果,評估其學習效果和學習狀態,讓教師更好地了解學生的知識掌握情況,預測學習者可能出現的學習風險,幫助學生查漏補缺,尋找相應的解決對策。(2)對教師的評價。針對教師與學習者相關數據的分析結果,可以對教師的教學效果、教學策略的有效性、教學指導的滿意度以及教學風格的接受度等進行評價,教師可以據此調整自己的教學方法與教學策略,促進教師的專業發展。(3)對課程和管理績效的評價。針對相關數據分析結果,為教育管理者提供更為深入的教學分析,并作為決策依據以改善現有的學校管理考核方式、課程設置等。

由于各種評價方式在具體實施中存有一定偏差和失誤,為了保證教育評價的正確導向,需要對教育評價進行多元化處理,對既定的評價活動做出必要的鑒定和監控,使其更加合理、完善。大數據技術的介入使評價過程更加公開、透明、開放與靈活,通過審查、跟蹤教育評價活動的每一個流程,及時調整優化評價程序,使評價結果有源可查。

三、數據驅動的教育評價實踐進展

如何更好地采集和分析教育數據,并將分析評價結果應用于教學實踐,教育工作者在國家、區域與學校各個層面進行了積極探索,并已取得了一些成果。

(一)國家層面

在國家層面,基于大數據的教育評價主要用于質量認證、教育問責和學校改進,從宏觀上評估教育體系的結構、效益等各要素之間的一致性,為制定國家教育政策提供一定的數據支撐和方向指引。

經濟合作與發展組織(Organization for Economic Co-operation and Development)認為荷蘭是教育體系最為發達的國家之一,主要得益于荷蘭堅持以數據為基礎開展科學化測評。荷蘭的基礎教育評價主體由學校、政府(教育部及其委派機構、省市兩級)和非政府(第三方評價機構和國際組織)組成,包含學生評估、教師鑒定、學校評價和體制評價四個維度。[15]

學生評估是教育評價的第一步,受學校的委托,第三方評價機構采集初等教育離校考試成績數據、中等教育國家和校本考試成績數據以及中小學生監測系統中的數據,對學生的學業成就進行客觀、專業的評估,并為后續教師評價和學校評價提供數據支持。值得注意的是,荷蘭的第三方評價機構——國家教育測量研究院在評估領域占據主導地位,它覆蓋了85%的小學考評工作。荷蘭的教師鑒定完全依賴于學校董事會的內部評價,外部評價的缺乏使得教師鑒定結果缺少一定的真實性和可靠性。學校評價主要途徑有學校自評和學校督導,學校自評沒有統一的標準,學校自行選擇評價形式和評價方法,評價結果為學校督導提供依據,從而助推學校的改進。體制評價是對國家教育體制的整體情況進行價值判斷,其中國內評價依賴于學生評價和學校評價中積累的各項數據,通過數據分析精準反映國內教育質量,同時參與一些權威的國際評估項目(如PISA、TIMSS)進行教育質量認證,根據國際間的比較尋找差距,明確發展方向,教育督導局會將各評價報告、核心數據、發展趨勢等內容公開在國家信息平臺上,保證公眾的知情權。其中學生評估、學校評價和體制評價都有第三方教育評價機構的介入,第三方評價的結果用于支持政府的外部問責。與荷蘭不同,芬蘭的國家教育評價機構——芬蘭教育評價中心得出的評價結果主要用于幫助評價對象自我改進,[16]它并不扮演督察員的角色。芬蘭、荷蘭開展評價的目的都是為了促進評價對象持續不斷的改進,且愈加重視內部評價與外部評價相結合的方式,注重發揮各方面的作用。

(二)區域層面

為落實黨在十九大報告中提出的“發展公平而有質量的教育”,包頭市于2017年正式啟動了普通高中的增值評價工作,通過學生的進步程度和學校的努力程度評價學校的教育質量,每輪評價周期為三年。2018年2月,包頭市根據基線測試數據已經完成了教育發展質量起點報告。目前包頭市仍在穩步推進增值評價工作。

增值評價最關鍵的部分在于采集學生一段時間內的基線數據和最終成績數據,基線測試數據包括學業成績數據和學生態度數據兩部分。就學業成績來說,至少要包含數學或閱讀成績等核心課程科目,而包頭市選取的科目涵蓋語文、數學、英語等九門課程的中考成績,因此學業數據的獲取是較為理想的。在態度數據方面,全市對起點對象進行了在線問卷的調查,問卷涉及學生16個方面,如學習適應、師生關系、同伴關系等,這些數據能幫助教師了解學生在非智力因素上的差異,但是無法掌握學生的態度問題,因此最好用經典的態度問卷對起點對象進行調查,三年后可進一步計算態度增值分數。通過對基線數據的深入分析,形成起點報告、增值分析報告以及各市間的差異分析報告,教育管理者、教師等通過解讀分析報告精準診斷當前的教育現狀及相關問題,并有針對性地給出可行性建議和解決對策,為了保證評價質量,包頭市針對不同人員組織了各類培訓會,幫助各校的教師、管理者充分挖掘起點報告價值。計算增值主要依靠兩個數據,一個是基點的中考成績,一個是終點的高考成績,通過多水平模型、多元回歸等統計方法精準估算學生的殘差分數,以此了解學生的相對進步。由于未到2020年高考,因而尚未采集終點數據,當前的增值評價工作的重點主要是嘗試剖析起點報告中存在的問題,并為其他地區開展增值評價提供借鑒依據。

不少人在閱讀包頭市教育發展質量起點報告時會產生一些“誤解”,如增值是終點成績與基點成績的差,教師、學生、校長的背景調查數據對分析學生的進步作用不大等。由此可見,在大數據時代,要想利用評價結果數據驅動教育質量的提升,教育管理者和廣大教師必須不斷提高數據應用意識和數據解讀能力,善于挖掘數據背后的價值,以更好地服務于學校改革、區域改進以及科學決策。

(三)學校層面

在學校層面,互聯網技術的迅猛發展變革了教育評價的手段,使其更加電子化、智能化,同時在評價內容方面也愈加注重對學生的綜合評價。

電子答題器是衡水中學用來進行課堂測驗的神器,教師只需在系統中完成試卷的編制,學生即可利用答題器進行答題,系統會及時反饋試題答案,幫助教師第一時間掌握學生的答題情況,這有效提高了教師批改作業的效率,同時也節省了學校用紙的費用。對教師而言,隨著學生答題的結束,電子白板上會出現每位學生答題的時間和答題的準確率,根據學生的答題情況有針對性地去調整教學內容,將重點、難點內容著重講解。對學生而言,提交作業或測驗后,能快速查看參考答案,通過與自己作業的對比,便于自我改進和自我提高。電子答題器為學生的診斷性評價提供了極大的便利,但也存在一些問題,如系統只能批改客觀題,對于主觀題,衡水中學采用學生互評的形式完成,這對考試、作業不斷的學生來說無疑增加了負擔;對于隨堂答題的功能,光靠答題總時間和答題率不一定能準確反映學生對知識的掌握情況,考慮到一些偶然性或學生對某一知識點理解模棱兩可的情況,該系統最好能提供學生完成每道測試題所用的時間,幫助教師進行精準判斷與科學指導。

不同于傳統基于單一學科成績的評價,廣東省佛山市鹽步中心小學嘗試采用“學生綜合發展在線評價系統”,該評價系統的應用大大提高了評價結果的服務能力。這一系統包括品德發展水平、學業發展水平、身心發展水平、興趣特長養成和學習負擔狀況5個一級指標,與《教育部關于推進中小學教育質量綜合評價改革的意見》中指標完全一致,參考20項關鍵指標,鹽步中心小學根據培養要求、地方特色等因素設置了19個二級指標,67個三級指標,并將三級指標細化為229個具體可觀測的點,教師和家長根據229個觀測點及時記錄學生的表現,形成全方位的學生發展性評價,學生綜合素質發展成長報告書將進一步服務教師、學生、家長決策。

大數據有能力讓教育教學變得更科學、精準,利用智能化的評價手段、測評系統能夠幫助教師厘清每位學生的問題和需要,從而提供個性化的教學策略。但由于技術的限制,當前智能工具的功能與智能程度有待進一步提高,隨著對此類工具探索的越來越多,基于大數據的智能測評系統會越來越完善。

四、數據驅動的教育評價實施建議

數據驅動的教育評價為學生自我發展、教師教學反思、學校質量提升等提供基于數據分析的實證支持。大數據支持的教育評價在國內外教育實踐中取得了一定成效,但依然面臨著諸多挑戰。為此,結合教育改革需求,本研究提出四條實施建議。

(一)開展數據素養專項培訓,提升評價者基于數據的評價能力

大數據時代,數據素養是一名合格的評價者所必須具備的技能。首先,建議政府部門組織各院校進行數據素養的網絡課程學習,學習結束后需通過一定考核才能授予結業證書,考核主要涉及數據的基礎知識、常用的數據分析工具以及數據處理的一般流程等理論知識;其次,第三方教育評價機構要積極提供個性化的培訓服務,運用大數據分析技術了解不同評價人員的培訓需求以及在運用數據驅動評價過程中存在的問題,有針對性地提供數據收集、數據處理、數據分析、數據驅動決策等專題培訓;最后,各教育相關部門可以設計一些真實的“數據驅動決策”項目,類似美國一個非營利機構TERC的“使用數據”項目和荷蘭的“數據團隊”項目,[17]由不同的評價人員組成學習共同體,在具體的實踐情境中提升數據素養。

(二)注重教育評價數據的開放與共享,確保教育評價的公正與精準

大數據帶來的價值愈加凸顯,開放和共享是實現數據增值的有效途徑。首先,建議政府部門建立數據開放平臺,平臺提供一定的數據檢索和數據導航服務,[18]幫助公眾快速獲取科學數據。為了便于公眾進一步處理數據,也可對部分數據(不涉及隱私、機密)提供下載權限。政府在開放數據建設過程中要確保評價主體及評價相關人員參與其中,大眾與政府統一步調有助于政府更便捷地進行教育治理,同時監督政府決策的透明公正。因此,政府應積極利用網絡平臺收集公眾對開放數據的需求以及教育決策的建議。其次,國家可以發起“數據共享計劃”,各院校、區域根據已有的教育評價數據制定整體的數據使用規劃,包括具體的評價數據指標、詳細的數據目錄,針對不同評價目標提供選用數據、數據維護的方法等,公眾依據數據規劃能更有計劃地重用數據并進行精準評價。

(三)建立大數據智能測評分析系統,促進教育評價效率的提升

海量數據是機器智能的核心要素,[19]人工智能技術的發展使得教育服務的智能化程度不斷提高。一方面,大數據智能測評分析系統能與第三方錄播系統深度對接,全面采集結構化數據和非結構化數據,對評價主體的發展過程進行全方位分析;另一方面,該系統集多類型評測管理于一體,如學生綜合素質評價、教師增值評價、學校效能評價等,將不同的評價指標進行分類管理,系統根據不同的評價標準靈活組合評價指標,不同主體使用該系統時只要完成評價信息的填寫,系統就會自動生成可視化評測報告,評測報告不僅包含基本的描述性統計,還有對評價主體的質性分析、預測和關聯分析,系統根據評價結果會智能提供個性化的服務,如根據學習者的學習情況提供知識圖譜,根據教師的增值數據提供專業發展路徑規劃等。

(四)倡導增值性評價,完善數據驅動教育評價體系

增值性評價是一種相對更客觀、公平的評價模式,也是新時期教育評價中重要的方式。首先,教育局應聯合外包公司開發增值性評價分析系統,該系統能準確測量每個學生的基礎認知能力,同時監測學生在教育過程中的“增值”情況,系統基于基線數據分析和增值數據分析形成測評分析報告并將其反饋給學生、教師、學校、政府等不同主體,通過建立科學的增值數據應用體系,確保增值數據得到切實有效的應用,如學生根據進步情況反思自身的學習過程,學校根據全體學生的整體進步情況評估教育質量,政府則按照增值指標進行學校的問責等;其次,增值性評價分析的數據來源于多次有效的測驗,[20]各地區在進行增值性評價時建議與高校、研究所、教育機構等開展合作,通過專業機構完成測驗的設計、后期的數據分析處理,以保障評價的規范性和合理性,當各地區具備獨立實施增值性評價的能力時,則可逐步脫離專業機構的幫助;最后,建議學校和有關教育部門在實施教育評價時參考美國俄亥俄州的評價方式,將增值性評價指標納入已有的學生評價或學校評價體系中,注重考察學生的進步程度、學校的努力程度以及家長的教育投入度等。[21]

猜你喜歡
評價教育學生
國外教育奇趣
華人時刊(2022年13期)2022-10-27 08:55:52
題解教育『三問』
當代陜西(2022年4期)2022-04-19 12:08:52
SBR改性瀝青的穩定性評價
石油瀝青(2021年4期)2021-10-14 08:50:44
教育有道——關于閩派教育的一點思考
趕不走的學生
辦好人民滿意的首都教育
學生寫話
學生寫的話
基于Moodle的學習評價
保加利亞轉軌20年評價
主站蜘蛛池模板: 女同国产精品一区二区| 久久综合九九亚洲一区| 无码在线激情片| 亚洲国产看片基地久久1024| 精品一区二区三区无码视频无码| 国产成人精品三级| 精品国产美女福到在线不卡f| 精品一区二区三区水蜜桃| 凹凸国产分类在线观看| 日韩欧美中文| 97在线碰| 亚洲中文字幕久久无码精品A| 99爱视频精品免视看| 久久精品无码一区二区日韩免费| 国产黄色爱视频| 无码免费试看| 91精品啪在线观看国产| 亚洲日韩国产精品无码专区| 91免费国产高清观看| 亚洲美女AV免费一区| 日韩无码白| 91精品国产自产在线老师啪l| 日日拍夜夜操| 欧美日韩91| 国产无遮挡猛进猛出免费软件| 国产一区在线观看无码| 自慰高潮喷白浆在线观看| 99久久婷婷国产综合精| 亚洲有无码中文网| 一本大道无码日韩精品影视| 天堂av高清一区二区三区| 国产精品私拍99pans大尺度| 丝袜国产一区| 欧美成人午夜影院| 草逼视频国产| 欧美第一页在线| 欧美高清三区| 亚洲精品欧美重口| 黄色三级网站免费| 欧美成a人片在线观看| 国产精品专区第1页| 成人欧美日韩| 亚洲无码电影| 国产chinese男男gay视频网| 国产第四页| 99久久精品免费看国产免费软件| 日韩高清一区 | 久久视精品| 9999在线视频| 啪啪免费视频一区二区| 久精品色妇丰满人妻| 99热国产这里只有精品9九| 国产v精品成人免费视频71pao| 欧美日韩国产综合视频在线观看 | 日韩免费毛片视频| 久久久久88色偷偷| 一本大道香蕉久中文在线播放| 国产免费羞羞视频| 青青青国产视频手机| 青青草一区| 在线亚洲天堂| 欧美精品一二三区| 亚洲精品波多野结衣| 欧美区一区二区三| 一区二区三区国产| 国产极品粉嫩小泬免费看| 四虎影院国产| 国产精品手机在线观看你懂的| 91成人在线免费观看| 日韩午夜福利在线观看| 亚洲国语自产一区第二页| 成AV人片一区二区三区久久| 国产精品视频猛进猛出| 色老头综合网| 欧美黄色a| 911亚洲精品| 91久久青青草原精品国产| 国产精品嫩草影院视频| 久久黄色免费电影| 欧美视频在线播放观看免费福利资源| AV色爱天堂网| 欧美日本在线观看|