朱德全 吳慮
摘要:按照圖靈獎獲得者吉姆·格雷的劃分,科學研究可分為四種范式,將理論、實驗和計算仿真統一起來的數據密集型科學范式(eScience),即為第四范式,其強調通過數據來發現并理解世界,為人類認知和科學研究提供了新方法和新視角,該范式與教育評價的結合必然會開創“數據密集型評價”,并將教育評價推向智能化階段。第四范式將從本體論、認識論、價值論和方法論層面引發教育評價變革:豐富教育評價本體論,將教育評價視為嵌入式評價和多元化評價,打破單一類型評價觀;重塑教育評價認識論,通過促進教育評價主體多元化,支持教育評價對象主體化,助推評價主體與評價對象形成“聯結機制”,走向平等協商共同參與,消解單主體權威評價觀;深化教育評價價值論,堅守“問題”導向的底線價值,凸顯“目標”導向的中線價值,強調“效能”導向的頂線價值,超越傳統評價的甄別和選拔導向;變革教育評價方法論,形成“全樣本數據+復雜模型+歸納分析+可視化反饋”的評價路徑,擴大教育評價主體的有限理性,從而使教育評價不斷走向智慧化和專業化。
關鍵詞:教育評價;大數據;專業化;第四范式
中圖分類號:G434? ?文獻標識碼:A? ? 文章編號:1009-5195(2019)06-0014-08? doi10.3969/j.issn.1009-5195.2019.06.002
教育評價是我國深化教育體制改革,推進教育現代化的關鍵環節,其重要性不言而喻。但囿于科學性和技術性不足,我國教育評價名目繁雜浮華,實質評價缺失,評價功用貧困,公信力大打折扣(葉賦桂,2019)。如何優化教育評價深受政府和學界關注,黨的十八大以來,國家出臺了系列招生考試、人才項目評價改革文件,2018年全國教育大會更是明確強調,要堅決破除“五唯”頑瘴痼疾,從根本上解決教育評價指揮棒問題。當前,教育信息化的持續推進使得大數據正在進入教育的方方面面(維克托·邁爾-舍恩伯格等,2015),其作為“數據、技術、思維三足鼎立的產物”(維克托·邁爾-舍恩伯格等,2013),能為教育評價帶來海量時間尺度密集、空間尺度多樣、價值尺度多元的教育大數據(王戰軍等,2015),同時提供挖掘教育數據潛在價值的技術手段和思維方式(趙伶俐,2014)。為此,國務院在《促進大數據發展行動綱要》中專門提及教育文化大數據工程,要求推動教育基礎數據的伴隨式收集和全國互通共享;《國家教育事業發展“十三五”規劃》也明確提出,“鼓勵學校利用大數據技術開展對教育教學活動和學生行為數據的收集、分析和反饋,為推動個性化學習和針對性教學提供支持”。誠然,大數據的價值日趨凸顯,已成為教育評價變革與創新的重要驅動力量。
一、第四范式教育評價分析框架
大數據時代的到來,將事物的可量化程度和范圍空前推進,催生出數據密集型的知識發現,驅動著科學研究范式轉換。按照圖靈獎獲得者吉姆·格雷的劃分,科學研究可分為四種范式:用于描述自然現象的實驗科學范式(Empirical Science),利用模型和歸納法的理論科學范式(Theoretical Science),對復雜現象進行計算機仿真的計算科學范式(Computational Science),將理論、實驗和計算仿真統一起來的數據密集型科學范式(eScience),也稱之為第四范式。第四范式是通過儀器收集數據或通過模擬方法產生數據,然后用軟件進行處理,再將形成的信息和知識可視化呈現(Hey et al.,2012)。這使得人們不需要再借助“望遠鏡”或“顯微鏡”來觀察世界,而只需通過數據來發現并理解世界。毫無疑問,大數據的誕生為人類認知和科學研究提供了新方法和新視角,其與教育評價的結合必然會開創“數據密集型評價”新范式,并將教育評價推向智能化階段,即基于全樣本、全過程、全景式的元教育大數據進行數據挖掘和學習分析,使教育評價專業化成為可能。
“范式”是貫穿于庫恩科學哲學思想的一個核心概念和理論體系。庫恩在1962年出版的著作《科學革命的結構》中對“范式”作出了系統性闡釋,但由于將概念從認識論范疇上的共有范例擴展為科學共同體共有的信念、基本觀點、價值標準、具體操作規范等認識世界和理解世界的工具、精神定向工具的綜合體(陳俊,2007),導致“范式”富有“過分的塑造性”,“幾乎可以滿足任何人的任何需要”(托馬斯·庫恩,2004),從而引發了諸多誤解和爭議。針對庫恩提及的21種“范式”概念,英國學者瑪格麗特·瑪斯特曼從三個層次進行了概括:一是哲學層面的形而上學范式,即科學共同體所共識的信念;二是社會學范式,即科學共同體普遍認可的學術傳統和學術研究的理論框架,主要包含概念系統、基石范疇和核心理論;三是構造范式或人工范式,即解決問題的工具與方法,這三類范式相互聯系成為一個有機體(Masterman,1970)。庫恩認為范式間具有不可通約性,這是導致范式更迭或轉換的根本原因。當舊范式的基本理論和方法在解釋或解決某一問題時出現反常,就意味著原有范式已經面臨危機,而范式的世界觀功能及其作為“認知工具”的本質性意義,決定了只有轉變世界觀,基于新的立場和認知視角才能包容反常(托馬斯·庫恩,2012)。一旦立場和認知視角發生轉變,科學共同體對研究目標和價值標準的設定以及研究方法和操作模式的選擇必然也會受到相應影響,這可歸結為范式的價值論和方法論功能(楊懷中等,2008)。據此,第四范式即“數據密集型評價”的出現,將會從本體論、認識論、價值論和方法論層面引發教育評價變革。因此,筆者以本體論、認識論、價值論和方法論四個方面作為分析框架,深入探討第四范式如何促進教育評價走向智慧化和專業化。
二、豐富本體論:第四范式拓展教育評價意涵
如何理解教育評價、解釋教育評價,是現代教育評價基本理論的首要問題,直接關系著教育評價活動的立場和認知視角。得益于大數據技術,第四范式教育評價在教育活動監測上實現了時間維的連續性、空間維的全域性和價值維的多元性,相應地,對教育大數據的識別和采集也突破了時空和類型限制,海量實時性強、真實度高、顆粒度細和內容廣泛的教育評價依據全面匯聚,利于打破單一評價類型,使教育評價更加科學多元。
1.第四范式教育評價是貫穿于教育活動始終的嵌入式評價
教育是一個反饋調控的過程,教育質量的高低在一定程度上取決于其是否能成為一個自我調控和自我完善的系統(裴娣娜,2005)。教育系統要實現自我調控和完善,就必須依賴教育評價對教育活動進行實時監控并提供持續性信息反饋,即實現教學評一體化。回溯教育評價發展歷程,現代教育評價自發端以來經歷了測量、描述、判斷和建構四個時代,依次形成了工具導向、目標導向、決策導向和價值導向的教育評價理念,評價方法實現了由簡單到多元的擴展,評價類型也從強調終結性評價轉向形成性評價。但從評價時間和空間來看,這四代教育評價與教學和學習活動仍然是相分離的,尚未真正實現教學評一體化,教育評價的智能化水平不高。具體而言,教育評價與教學的“共時性”被阻斷,教育評價通常在教學之后,是教學的終點;“共域性”被隔斷,教育評價和教學不在同一個情境或空間之中(于開蓮,2016)。這導致教育評價相對滯后,評價無法實時獲取過程性教育數據,更不可能為教學活動改進及時反饋最有效的信息。大數據時代,泛在網絡、移動通信、傳感器、云計算等信息技術飛速發展,教育數據爆炸式增長,同時大數據技術能夠對教育活動中實時產生的海量數據進行動態捕捉和深度挖掘,這使得第四范式教育評價成為一個智能化的動態信息反饋系統。具體而言,大數據支持下的教育評價能夠對教育活動進行動態監測和控制,持續搜集和處理與教學相關的信息,并及時將評價結果反饋給利益相關主體,使其不斷調整和變革教學和學習行為,實現教育系統的動態平衡和教育質量的持續改進。可以說,大數據時代的教育評價并非單向度的結果性評價,而是貫穿于整個教育過程的伴隨式評價,教育評價與教育教學活動不再是線性關系,而是構成一個反復迭代的循環回路,其能促使教育成為一個“自我糾正系統”,真正實現以評促改、以評促教、以評促學、教學評合一。
2.第四范式教育評價是一種多元化評價
“五唯”頑疾在我國教育評價中根深蒂固,評價學生“唯分數”,評價學校“唯升學”,評價教師“唯論文”,引進人才“唯文憑”“唯帽子”,這種“一刀切”的評價方式已經嚴重困擾我國教育質量的提升和教育現代化的推進。作為評價改革的“牛鼻子”,考試招生制度首當其中。受“學而優則仕”傳統觀念的影響,“唯分數”和“唯升學”的評價觀在當前教育質量評價中大行其道,政府和教育行政部門將學生學業成績和升學率視為統一的評價標準,過度關注非自然狀態下學生的單維認知能力發展結果,對其他能力的評價則被遮蔽,嚴重影響了學生的全面發展。事實上,“唯分數”和“唯升學”的教育評價屬于抹殺學生特質和個性發展的終結性評價,其對教育發展起到的只是監測作用而不是反饋和促進作用。隨著知識經濟時代的到來,社會對復合型人才和創新型人才的需求日趨迫切,單一的評價內容已經無法適應需要,市場更看重學生解決問題的能力、探究精神、創新能力、溝通合作能力、社會責任感和良好的心理素質等,這就意味著教育評價要實現范疇和內容上的擴展,重視德智體美勞綜合評價。大數據時代,教育評價能夠依托生物信息技術、虛擬現實、情境感知技術等,嵌入式采集學習者在真實狀態下展現出的復雜能力數據,并通過建模繪制出學生綜合能力發展輪廓圖,從而大大增強教育評價結果的可用性。可見,從評價內容或范疇而言,第四范式教育評價以“落實立德樹人根本任務”為統領,將評價擴展到“一切教育和教育的一切”(朱德全等,2013),使評價真正能夠促進學生全面發展和教育質量的提升。從評價目的而言,第四范式教育評價涵蓋了診斷性評價、形成性評價和終結性評價。大數據技術能對不同階段的教育活動進行監測評估,即對一個完整的教育過程實施前饋控制、實時控制和后饋控制,每個階段都依賴于從教育信息流中提取數據、分析處理并進行反饋,這種基于數據又超越數據的反饋能夠更好地服務于教育管理和決策。從評價范圍而言,第四范式教育評價既關注對群體的評價,又重視對個體的評價。大數據技術不僅能夠對整個教育活動進行“全面性”質量監測、“全員性”主體關照、“全方位性”數據搜集、“全域性”監督跟蹤(朱成晨,2018),而且能夠對評價對象個體進行“個性化”“適應性”考量,這使得教育評價既能從整體上促進教育的改進和發展,又能關注到個體發展的特殊需求,真正成為評價對象發展的“腳手架”。從評價方法而言,大數據技術能夠綜合處理結構化、半結構化和非結構化數據,將定量評價和定性評價進行統整,有效避免單一量化評價導致的絕對性,從而增強評價結論的科學性。
三、重塑認識論:第四范式催生教育評價共識
認識論的核心是認識主體與認識對象的關系,而技術手段會極大地影響兩者間的關系(呂乃基,2014)。大數據時代,“數據驅動”激發了越來越多的教育利益相關者參與教育評價,且增進了評價主體之間、評價主體和評價客體之間的交流,這在一定程度上消除了評價過程中的“信息孤島”和“數據壁壘”,克服了教育評價認知有限性和模糊性,使教育評價更加全面精準。
1.大數據驅動教育評價主體多元化
教育評價作為一項具有極強復雜性和豐富性的實踐活動,其生命力源于多元主體共同參與和協商(陸啟越等,2018)。追溯教育評價發展史,“多元主體參與”最早由美國教育評價學專家派特(Patton,M.Q.)于1978年在《使用定向評價》一書中提出,主張只有將需要使用評價信息的各方人士邀請到教育評價中,并讓其基于各自立場對教育評價提出要求和建議,才能使教育評價結果更好地滿足不同使用者的需求(蔡敏,2003)。隨后,第四代教育評價加以繼承發展,進一步明確提出多元主體“全面參與”“協商對話”“共同建構”以及“價值多元化”評價理念。可見,理想的教育評價應該是相關利益主體共同參與并表達多元價值訴求,進而通過平等協商的方式在評價標準和評價關鍵點上達成共識。但長期以來,我國教育評價主體較為單一,政府和教育行政部門是最主要的評價主體,學校、學生、家長和社會等教育利益相關者則處于邊緣被動地位,評價過程缺乏對不同利益主體內在發展價值訴求的協調,評價標準過于統一和剛性,忽略了不同主體間的差異性,嚴重制約了教育評價結果的客觀性和有效性。大數據時代,教育信息化的不斷推進既讓多元利益主體能借助網絡平臺獲取所需教育信息,同時又為其提供了信息交流和信息共享渠道,使各個利益主體能夠及時表達自身發展需求和價值訴求,并實現交流協商,從而共同制定出一個科學合理的評價標準,使教育評價更具有針對性。
2.大數據支持教育評價對象主體化
從應然層面看,教育評價對象主體化是教育評價必須遵循的邏輯,這是由教育評價自身本質所決定的(熊楊敬,2018)。教育評價主體要對評價客體作出價值判斷,不只是需要認識評價客體本身是什么和有什么的事實,而是要結合評價主體的主觀意圖,即基于評價主體需要什么以及能夠接受什么來認識評價客體的事實。教育評價主體的主觀意圖和評價客體的客觀事實兩者有機結合才構成“教育價值判斷”的前提。換言之,“評價客體能夠或已經給評價主體提供了什么”“評價主體能夠或已經從評價客體那里獲取了什么”,即教育供給方供給了什么,以及其對教育需求方的滿足程度才是教育評價所要認識的對象,這又稱之為“價值事實是主體性的事實”(李德順,1987)。在傳統教育評價中,客體對主體的滿足程度無法準確量化,只能依據評價主體的經驗和主觀感受作出大致判斷,這導致教育評價結果存在模糊性,無法為教育改進提供精準反饋。而大數據的出現和發展將教育活動的可量化程度空前推進,依靠大數據技術能夠動態捕捉海量的教育過程性數據,尤其能夠在真實情境中采集教育利益相關者的行為數據并進行深度挖掘和對比分析,準確找出供需差距,進而對教育評價客體作出精準的價值判斷,增強評價信度。
3.大數據助推教育評價主體與評價對象的關系由主客體轉向主體間性
一般而言,教育評價主體與評價對象是彼此交融相互滲透的一體,當教育評價對象是人時,兩者還可以相互轉換,這意味著任何科學的教育評價中都不能將兩者視為簡單的主客體關系。但在傳統教育評價中,以管理者為主的單一評價主體往往被視為“裁判員”,處于絕對的主體地位,決定著教育評價內容和評價標準,評價對象只能被動、無條件地接受。這種強調單一評價主體相對于評價對象的主導地位,過分夸大了行政主體或權威主體對教育評價對象的支配作用,容易導致教育評價流于形式和脫離實際,從而制約教育評價效果。大數據時代,多元主體參與教育評價重塑了評價主體與評價對象的關系,即由主客體關系轉為主體間性關系,被評者以主體身份積極參與到教育評價中,由被動接受評價轉為主動合作,同其他主體一起通過平等協商參與教育評價,在評價中進行自我反思和自我學習。總之,第四范式教育評價能促使評價主體與評價對象之間的關系發生交互,形成一種“聯結機制”,使兩者彼此信任,相互合作,從而消解傳統教育評價中的單主體權威評價觀,建立起平等對話模式,為達成“教育評價共識”提供可能。
四、深化價值論:第四范式回歸教育評價本真
根據范式的價值論功能,其不僅能為科學共同體確立研究目標,也能引導共同體的研究和決策走向細微化、專業化(楊懷中等,2008)。就教育評價而言,價值論可以通過評價的導向體現出來。不同于傳統教育評價的甄別、選拔導向,第四范式教育評價的價值論主要體現為精準改進、達成目標和促進發展。
1.第四范式教育評價堅守“問題”導向的底線價值
這主要體現為教育評價能精準診斷問題和預測問題,為即將進行的或正在進行的教育活動提供信息反饋,進而調整和改進教育方案、教育計劃、教育活動或教育過程中存在的問題,以達到提升教育質量的目的。對教育活動問題的診斷和預測主要體現在教學領域,即學情分析和對前一階段學習情況的評價。在傳統教育評價中,往往以標準化測試和常模測試產生的結構化數據作為依據,局限于對學習者群體特征的關注,忽略了個體發展差異,對問題的診斷和預測也缺乏精準性和針對性。而在大數據時代,教育評價能基于數據挖掘算法、機器學習、回歸分析等學習分析技術,多維度多層次收集學生學習行為相關數據,如原有知識基礎、學習態度、學習動機、學習興趣等認知和非認知數據,并借助復雜算法挖掘數據背后的潛在價值,精準診斷當前學習存在的問題,或是通過相關關系法則精準預測學習者未來的學習趨勢(孫洪濤等,2016),從而及時調整教學設計和教學策略,干預和消除教學和學習中的不確定性因素(楊現民等,2016)。如加拿大著名的教育服務公司Desire2Learn利用“學生成功系統” (Student Success System), 結合已有的學習數據預測學生是否適合某門新課程,以及在未來課程學習中可能面臨的問題,這既有助于客觀評估學生的學習能力,又能引導教師適時提供科學的教學介入以確保教學和學習的有效性(楊現民等,2015)。總之,第四范式教育評價能夠基于數據精準地診斷和預測教育活動中的短板,并及時作出改進。
2.第四范式教育評價凸顯“目標”導向的中線價值
“目標”導向的價值是指教育評價要充分發揮鑒定和導向功能。從應然層面看,要以教育目標為基準,一方面鑒定教育組織、教育方案、教師或學生等評價對象是否達到了教育目標,以及達成教育目標的程度,并對比兩者找到“最近發展區”;另一方面,要通過開展科學的教育評價活動,引導評價對象達成教育目標。可以說,教育評價的目標導向價值實質上是要促使評價對象的行為產生某些期望的變化(Tyler,1949),這意味著評價要更加關注個體,以及個體學習行為發生的過程和程度,即重視過程性評價。在傳統評價中,由于數據采集和處理技術較為粗糙,無法對自然狀態下評價對象的真實學習行為軌跡進行監控,導致無法鑒定其學習狀態與預期目標之間的差距,也就不可能實現基于證據的個性化教學和適應性教學。可以說,傳統教育評價更多是以終結性評價的方式對群體水平進行鑒定,沒有針對個體發揮精準的導向功能。與之不同,第四范式教育評價更加關注個體,重視通過數據生發個性化學習決策。具體而言,其能借助Experience API(xAPI)技術、Wiki技術對真實或虛擬學習中個體的學習行為特征數據進行精細化記錄和無損采集,并能存儲和檢索可擴展的學習記錄,如學習交互、學習進度、學習時間和頻率、學習軌跡、情感表現、任務用時等復合化數據(吳慮,2019)。然后,從這些海量數據中了解個體的學習特征、學習進程和進一步學習需求,并在此基礎上進行教育教學決策,即結合個體需求定制個性化學習資源和學習路徑,不斷縮小個體的“最近發展區”,在最大程度上達成教育目標。例如,MOOCs和翻轉課堂在大數據技術支持下,能夠對學生的學習行為進行實時監控和評價,為教師精準判斷不同學生的學習偏好、學習風格、知識缺陷等反饋可靠依據,并引導教師有針對性地實施個性化教學,從而促成教學目標。總之,第四范式教育評價以大數據為支撐,以計算和建模為手段,能實現針對個體的精準數字畫像,洞察個體“最近發展區”,這在很大程度上提升了教育評價的科學性和有效性。
3.第四范式教育評價強調“效能”導向的頂線價值
正如第四代教育評估理論創立者埃貢·G·古貝所言,“評價的意義在于促進發展”(埃貢·G·古貝等,2008)。增進效能意味著發展,包括教育教學的發展和人的發展。其一,就促進教育發展而言,要求教育評價必須是一種增值性評價。增值評價是基于“學校能增加‘價值到學生學習成就中”這一假設提出的(薩麗·托馬斯等,2005),強調通過收集學生在不同時間節點上的標準化測驗成績,同時將不受學校和教師控制但又會影響學生學業成績的因素(如學生原有認知水平、人口學變量、家庭背景情況、生源地經濟發展水平等)剝離開來,考察學生在某段時間內的“學習增益”,估算出學校和教師對學生學業發展的“凈效應”,并進一步計算學校各個因素對學校和學生發展的影響程度,找出制約學校教育質量提升的關鍵因素,從而有針對性地提升學校發展效能(辛濤等,2009)。長期以來,對學校和教師的評價通常依據學生的平均成績或升學率,指標較為單一,且無法控制影響學習成績的非學校因素,這導致評價結果的信效度受到質疑。大數據時代,依托超時空的信息采集和先進的分析技術,第四范式教育評價能夠超越簡單的分數統計,引入多元線性回歸模型和多水平分析模型,嚴格控制變量,準確計算出學校和教師的效能,并檢視教育發展中存在的問題及其影響因素,同時不斷加以改進實現教育的增值。其二,就促進學生發展而言,我國的教育評價必須堅持“把立德樹人作為根本任務”,指向學生的生命成長。傳統教育評價過于追求功利價值,學生的發展被條分縷析的評價指標體系與統一的評價標準所控制,這導致學生的個性特征逐漸迷失,精神追求逐漸衰微,生命活力被遮蔽(楊鴻等,2018)。第四范式教育評價依托大數據技術能夠實現對個體教育數據的超時空、持續性采集和匹配推送,實現對學生生命成長的精準服務,不再將學生視為工具人、單向度的人,而是作為一個獨特的、完整的個體,在評價中實現對個體發展差異的關照;同時大數據支持對個體成長的縱向追蹤,這利于建構學生的生命成長軌跡,同時喚醒和激發學生的主體精神,促進學生的生命成長。
五、變革方法論:第四范式增強教育評價智慧
審視我國傳統教育評價,囿于教育數據稀缺和分析技術滯后,評價的方法論主要體現為基于假設或評價目的有針對性的小規模抽樣實證,或是依托教師的經驗總結和理論推導,這導致教育評價結果過于同質化、經驗化和抽象化,嚴重制約了教育評價質量提升。隨著大數據的深入驅動,智能化技術開始追求全樣本,接受數據的混雜性和非精確性,關注數據隱含的相關關系(維克托·邁爾-舍恩伯格等,2013),這改變了傳統以抽樣數據為主的評價方法,促使教育評價各環節即信息采集、價值判斷和結果反饋都始終貫穿于整個教育數據流中,依靠數據發聲,從而推進教育評價精準智慧運行,提升教育評價信效度。
1.全時空場域數據無損采集提供可靠性依據
信息論奠基者香農認為,信息是對事物運動狀態或存在方式的描述,獲得信息就可以消除認識主體對于事物運動狀態和方式的不確定性。要使一個系統從無序變為有序,必須從外界獲取信息(唐世偉等,2008)。教育評價正是通過教育信息來認識教育活動并作出價值判斷,教育信息的多寡、真實與否直接關乎價值判斷的可靠程度。換言之,要增強教育評價信度,就必須提升教育信息的數量和質量。當前,大數據、人工智能和物聯網等新興技術與教育的融合重塑著教育秩序和教育生態,日趨開放智慧的教育系統在開展教學、管理、科研和服務等活動中正在生成海量的教學數據、學生數據、管理數據和教育輿情數據等,這些源于國家、區域、學校、課程和個體層面的教育大數據匯聚成立體化數據網絡(楊現民等,2015)。不同于傳統評價,大數據支持下的教育評價信息采集不再是取決于評價目標的小規模抽樣,也不只局限于非自然狀態下產生的時段性斷層數據,而是通過物聯網感知技術、視頻錄制技術、圖像識別技術和平臺采集技術,對教育過程中實時生成的多源、異構、多模態、不連貫語義的大數據進行持續性采集。這種采集方法在數量上強調全域性、全樣本和細顆粒;類型上關注表象性結構化數據,重視價值隱喻的半結構和非結構化數據;質量上凸顯真實性和客觀性,縱深采集教育活動中產生的情境化和過程性數據。可見,教育評價第四范式的數據采集方法有助于極大增強教育評價依據的可靠性,為專業化教育評價提供強解釋力證據。
2.多元方法的數據融合分析驅動精準化判斷
價值判斷是教育評價中最為核心的環節,其直接關系到教育評價的信效度。傳統教育評價主要利用“小數據”定量評估方法,以及基于因果關系思維進行邏輯推理,以驗證相關假設或佐證專家判斷。由于整個教育評價過程依賴于專家,所以評價專業性取決于專家經驗和知識的權威程度,評價的科學性則由票決、回避和公開等程序性規定來保證(王戰軍等,2015)。這種經驗主義取向的教育評價主觀隨意性強,評價結果的可信度和權威性面臨挑戰。當前,大數據技術的崛起顛覆了傳統數據分析方法,能更快速、精確、有效地從海量細顆粒教育大數據中挖掘出有價值的信息。與傳統評價對結構化數據的簡單統計不同,大數據技術能對海量繁雜的教育數據進行清理、脫敏和轉換,以控制數據冗余與缺失引起的不確定性,駕馭數據高速增長與交叉互聯引發的涌現性(徐宗本等,2014);并利用學習分析和數據挖掘技術進行多元回歸分析、分類聚類算法、語義分析、系統建模和決策樹分析等,進而從隱喻、模糊、毫無關聯的教育大數據背后洞見本體共生的表征價值、交互產生的關聯價值以及多方協同創生的決策價值(劉桐等,2018),最大限度地實現數據分析的科學化和理性化。
同時,大數據驅動教育評價走向專業化和精準化,還在于大數據能結合所挖掘信息作出具有更高解釋力和預測力的價值判斷,這是由大數據思維引發的方法論變革所決定的。大數據思維強調由“始于假設”的“小數據”評估轉為“基于證據”的“大數據”實證研究,由強調因果關系轉為探究事物間的相關關系或某種規律性,這使得評價方法論由“假設-演繹邏輯”轉向“數據-歸納邏輯”。具體而言,深受波普爾證偽主義影響,傳統教育評價的價值判斷環節主要遵循“定性-定量-定性”的分析方法(李金昌,2014),首次定性是提出評價假設,為定量分析提供教育數據采集方向和范圍;而定量分析是對有限數據進行統計推斷,并結合概率由樣本推斷整體,即從“小數據”中演繹出盡可能多的信息量;再次定性則是以定量結果回應專家判斷或是檢驗評價假設。由于傳統教育評價各環節都依賴于相關理論體系或評價主體的知識經驗,這容易導致評價結果存在“路徑依賴”和“個性依賴”傾向(劉濤雄等,2017),一旦某個環節出現問題,那整個教育評價將毫無意義,甚至會阻礙教育決策與管理。大數據的出現,催生了“數據驅動”的教育評價范式,使得教育評價結論的獲取由演繹法轉向“數據+模型+分析”基礎上的歸納法。這意味著教育評價活動不再受預設的限制,也不局限于因果關系探究,而是借助特定算法對“大數據”進行分析,從而歸納出教育數據背后隱含的關聯性和規律性。此外,大數據通過對復雜教育系統中動態變化的相關關系進行分析,還能實現對教育活動的預測和干預。總之,大數據不僅為教育評價提供了高速、客觀、準確的數據分析方法,也為教育價值判斷革新了方法論,這在一定程度上消除了教育評價中的主觀性和不確定性,擴大了教育評價主體的有限理性。
3.直觀可視化結果及時反饋增強評價有效性
有效的教育評價離不開教育信息的“深入淺出”,這表明既要能對教育信息進行深入挖掘,更要及時將評價結果清晰準確、直觀簡潔地反饋給評價對象和相關利益主體。可以說,教育評價是否有效,在很大程度上取決于教育評價結果的反饋質量。傳統教育評價在結果反饋過程中,時常面臨信息不對稱和信息超負荷雙重矛盾(王戰軍等,2015):一方面,人們試圖從教育評價結果中掌握盡可能多的信息,但結果反饋往往是幾組缺乏深層次解讀的數據,或籠統模糊的文字描述,可讀性不強;另一方面,卷帙浩繁的反饋信息超出了個體的信息接受和處理閾值,造成認知負荷,從而制約評價效用的發揮。大數據時代,第四范式成為助推教育評價走向現代化和智能化的革命性力量,其通過變革反饋形式、反饋周期和反饋范圍,不斷促進評價結果的高效交付,進而增強教育評價效能。具體而言,在反饋形式上,大數據技術借助數據可視化工具將教育評價結果以直觀明了的圖形、圖像信息呈現出來,增強了評價結果的可讀性,使評價結果能夠清晰有效地傳達給相關利益主體。在反饋周期上,大數據技術通過對教育活動的即時動態監測,能從實時生成的教育大數據中挖掘出有價值的信息,并及時反饋,使得“評價-反饋-改進-評價……”反復迭代,以實現對教育活動的持續性改進。在反饋范圍上,一是由教育決策者擴大到教育利益相關者,讓多元利益主體能夠基于不同立場全面客觀地了解教育發展概況和把握教育發展趨勢,進而引發“循證性”教育決策;二是由面向群體反饋發展為面向群體和個體的反饋,尤其強調進行有針對性的個性化反饋,這使得教育評價專業化水平不斷提高。
參考文獻:
[1][美]埃貢·G·古貝,伊馮娜·S·林肯(2008). 第四代評估[M]. 秦霖,蔣燕玲. 北京:中國人民大學出版社:29.
[2][美]托馬斯·庫恩(2004). 必要的張力——科學的傳統和變革論文選[M]. 范岱年,紀樹立等. 北京:北京大學出版社:287.
[3][美]托馬斯·庫恩(2012). 科學革命的結構(第四版)[M]. 金吾倫,胡新和. 北京:北京大學出版社:79-113,114.
[4][英]維克托·邁爾-舍恩伯格, 肯尼斯·庫克耶(2013). 大數據時代:生活、工作與思維[M]. 盛楊燕,周濤. 杭州:浙江人民出版社:160,29.
[5][英]維克托·邁爾-舍恩伯格, 肯尼斯·庫克耶(2015). 與大數據同行——學習和教育的未來[M]. 趙中建,張燕南. 上海:華東師范大學出版社:1,121.
[6]Hey, T., Tansley, S., & Tolle, K. (2012). 第四范式:數據密集型科學發現[M]. 潘教峰,張曉林等. 北京:科學出版社:10.
[7]蔡敏(2003). 論教育評價的主體多元化[J]. 教育研究與實驗,(1):21-25.
[8]陳俊(2007). 庫恩“范式”的本質及認識論意蘊[J]. 自然辯證法研究,(11):104-108.
[9]李德順(1987). 評價論[M]. 北京:中國人民大學出版社:25.
[10]李金昌(2014). 大數據與統計新思維[J]. 統計研究,(1):11-16.
[11]劉濤雄,尹德才(2017). 大數據時代與社會科學研究范式變革[J]. 理論探索,(6):27-32.
[12]劉桐,沈書生(2018). 從表征到決策:教育大數據的價值透視[J]. 電化教育研究,(6):54-60.
[13]陸啟越,余小波(2018). 高校德育評價范式及其轉變[J]. 湖南師范大學教育科學學報,(2):103-108.
[14]呂乃基(2014). 大數據與認識論[J]. 中國軟科學,(9):34-45.
[15]裴娣娜(2005). 現代教學論[M]. 北京:人民教育出版社:325.
[16]薩麗·托馬斯, 彭文蓉(2005). 運用“增值”評量指標評估學校表現[J]. 教育研究,(9):31-35.
[17]孫洪濤,鄭勤華(2016). 教育大數據的核心技術、應用現狀與發展趨勢[J]. 遠程教育雜志,(3):41-49.
[18]唐世偉,劉賢梅(2008). 信息論[M]. 哈爾濱:哈爾濱工程大學出版社:4.
[19]王戰軍,喬偉峰,李江波(2015). 數據密集型評估:高等教育監測評估的內涵、方法與展望[J]. 教育研究,(4):29-37.
[20]吳慮(2019). 大數據支持下學習評價的價值邏輯[J]. 清華大學教育研究,(1):15-18.
[21]辛濤,張文靜,李雪燕(2009). 增值性評價的回顧與前瞻[J]. 中國教育學刊,(4):40-43.
[22]熊楊敬(2018). 教育評價多元主體的共同建構——基于對話哲學的視域[J]. 教育研究與實驗,(5):74-78.
[23]徐宗本,馮芷艷,郭迅華等(2014). 大數據驅動的管理與決策前沿課題[J]. 管理世界,(11):158-163.
[24]楊鴻,朱德全,宋乃慶等(2018). 大數據時代學生綜合素質評價:方法論、價值與實踐導向[J]. 中國電化教育,(1):27-34.
[25]楊懷中,邱海英(2008). 庫恩范式理論的三大功能及其人文意義[J]. 湖北社會科學,(6):101-104.
[26]楊現民,唐斯斯,李冀紅(2016). 發展教育大數據:內涵、價值和挑戰[J]. 現代遠程教育研究,(1):50-61.
[27]楊現民,王榴卉,唐斯斯(2015). 教育大數據的應用模式與政策建議[J]. 電化教育研究,(9):54-61.
[28]葉賦桂(2019). 教育評價的浮華與貧困[J]. 清華大學教育研究,(7):18-21.
[29]于開蓮(2016). 評價與教學:從分離走向融合[J]. 教育理論與實踐,(4):53-56.
[30]趙伶俐(2014). 量化世界觀與方法論——《大數據時代》點贊與批判[J]. 理論與改革,(6):108-112.
[31]朱成晨,閆廣芬(2018). 現代化與專業化:大數據時代教育評價的新技術推進邏輯[J]. 清華大學教育研究,(5):75-80.
[32]朱德全,宋乃慶(2013). 教育統計與測評技術[M]. 重慶:西南師范大學出版社:230.
[33]Masterman, M. (1970). The Nature of a Paradigm[C]// Criticism and the Growth of Knowledge. Cambridge: Cambridge University Press:59-90.
[34]Tyler, R. W. (1949). Basic Principles of Curriculum and Instruction[M]. Chicago: The University of Chicago Press:105-106.
收稿日期 2019-06-30 責任編輯 田黨瑞