999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

教育評價改革的算法追問*

2022-01-01 08:34:54楊欣
關鍵詞:評價教育

楊欣

(1.西南大學 基礎教育研究中心,重慶 400715;2.中國基礎教育質量監測協同創新中心西南大學分中心,重慶 400715)

引言

2020 年10 月,中共中央、國務院印發的《深化新時代教育評價改革總體方案》(以下簡稱《方案》)已然開啟了全國范圍關于教育評價的大討論和大學習。《方案》在主要原則中明確提出“充分利用信息技術,提高教育評價的科學性、專業性、客觀性”。這預示著,信息技術將會在教育評價改革中發揮更大的效用。不過,與部分學者對信息技術之于教育評價的推崇相比(宋乃慶等,2021;張琪,王丹,2021;張生等,2021;張志禎,齊文鑫,2021;柯林斯,哈爾弗森,2013,第114 頁),也有教育學者擔憂信息技術暗含的量化局限及其弊端(高江勇,2019;原祖杰,2020;孟照海,劉貴華,2020;周川,2021)。

鑒于此,筆者嘗試以算法作為切入點,追問評價改革的機遇、風險與突破。理由在于:信息時代的教育評價除了可以擁有(生產)前所未有的大數據,也將獲得(設計)不同以往的人工智能,以及連接(控制)大數據和人工智能的算法。同時,從信息技術的本質來看,“如果說數據是土壤的話,人工智能就是成熟的作物,而算法則是種子”(多明戈斯,2017,第10 頁)。由此出發,教育評價改革的算法追問既是從信息技術的本質對教育評價進行批判反思,也是在厘清機遇和風險的基礎上把脈教育評價改革的突破方向。

一、教育評價改革的算法機遇

“算法”一詞源自波斯數學家、代數與算術的創立人、被譽為“代數之父”的穆罕穆德·伊本·穆薩·花剌子米(公元780—850)的名字(李,2020,第202 頁)。最初,算法意味著使用數字的加、減、乘和除法,此后,算法指的是執行書面初等算術的具體分步方法(Miyazaki,2012)。現如今,算法已然成了現代信息技術的核心概念,且擁有種類繁多的表現形式及其對應的稱謂,如模式識別、統計建模、數據挖掘、知識發現、預測分析、數據科學、適應系統和自組織系統等(多明戈斯,2017,第11 頁)。近年來,隨著一批社會學者開始批判性地探索算法的思想本質,它除了可以視作數學模型,也開始具有了知識和權力層面的內涵(Lash,2007;Kushner,2013)。為此,結合《方案》的主要原則來看,教育評價改革的算法機遇在于以下三點。

(一)糾偏教育觀念,提升評價的科學性

本次教育評價改革最受世人關注的議題就是《方案》提出的,“扭轉不科學的教育評價導向,堅決克服唯分數、唯升學、唯文憑、唯論文、唯帽子的頑瘴痼疾”。科學是日本學者西周時懋1874 年翻譯法文science 時生造的詞,它最初形態是古希臘科學強調確定性、內在(邏輯)、非功利的知識(吳國盛,2019,第303 頁)。以此觀之,“五唯”的非科學本質在于:其一,模糊。畢竟多數人不重視教育評價的確切結果,也不知道確切的教育評價意味著什么,更看不懂教育評價的確切結果,于是大家能接受、也喜歡用“分數、升學、文憑、論文和帽子”這些模糊的觀念評價學生、學者或學校。其二,非邏輯。“知識和能力”?“分數、升學、文憑、論文和帽子”就無法成立,而它的逆命題“分數、升學、文憑、論文和帽子”?“知識和能力”更是無從談起。所以,僅就命題而言,“五唯”就是典型的邏輯錯誤。其三,功利。分數、升學、文憑、論文和帽子是最符合學生、教師、學校以及其他利益相關者現實訴求的功利性評價。也正鑒于此,未來教育評價改革若要提升評價的科學性,亟須借助算法糾偏教育觀念,使之從模糊、非邏輯、功利走向精確化、邏輯化和非功利。

第一,藉由算法思想蘊養教育評價的精確觀念。歷史而言,笛卡爾、斯賓諾莎、萊布尼茨與霍布斯都曾試圖給自己的理論提供一種數學結構,以便建立發現和闡述真理的新科學(柏林,2019,第56 頁)。對如今的科學而言,如果某個理論無法用算法表示,那么它也不能稱之為嚴謹(多明戈斯,2017,第6 頁)。從上述算法與科學的思想淵源而言,藉由算法思想蘊養教育評價的精確觀念就是要用類似數學的語言對教育問題進行精確描述,助人厘清那些雜亂無章、互相矛盾且又難以理解的教育經驗,以期消弭語焉不詳的推論、模糊不清的觀念以及蠱惑人心的偏見(楊欣,2021a;楊欣2021b)。

第二,借助多元算法豐富教育評價的邏輯體系。從算法的基本原理來看(佩奇,2019,第11 頁),借助算法實現教育問題邏輯化的關鍵在于:一是簡化問題,剝離不必要的細節,以及抽象掉若干現實世界中的因素;二是對問題給出形式化的精確定義;三是從上述兩個特點而言,任何算法必然是片面的。以此觀之,教育評價科學化既意味著借助算法實現教育問題的邏輯化,更意味著借助多元算法豐富教育評價的邏輯體系。相應地,為了讓教育評價的實踐更具科學性,教育者要習慣使用(建構)多元算法對改革中的教育問題進行解釋和預測。

第三,通過算法批判警惕教育評價的功利偏好。教育評價的功利邏輯在于,一旦教育算法因為其精確性和邏輯化而被眾人接受,師生便會根據算法的標準來優化自己的行為,而不在意那些真實卻無法衡量的教育目標(羅素,2020,第110 頁)。而這其中的謬誤就像哈耶克在《知識的僭妄》中所言,“完全有可能存在這樣一種‘科學’證據,它們更有助于支持一種錯誤的理論,而無益于佐證一種有效的解釋。換言之,這種錯誤理論之所以被接受,實在是因為更加‘科學’,而一種有效的解釋之所以被否棄,則是因為我們沒有足夠的量化基據來支持它”(哈耶克,2014,第192 頁)。同理,未來教育評價改革若要超越功利偏好背后的謬誤,研究者首先應清醒地意識到任何教育算法都必然有其局限性,也沒有什么算法可以至高無上、免受檢驗,任何教育算法必須在邏輯上經得起推演、在現實中經得起考驗;然后,在教育評價算法上考慮兩個重要問題“我能知道什么”和“我如何得知”,進而開展必要而又謙遜的先驗批判;再者,基于觀察、實踐以及實驗得出的事實去檢驗教育評價算法,而不是按照人們預設或想象的樣子去理解它;最后,通過必要標準來檢驗教育評價算法的假設、條件與尺度,進而對其進行糾正、優化和推演。

(二)生產教育知識,提升評價的專業性

400 多年前,“知識就是力量”的提出者弗朗西斯·培根在《新工具》一書中寫道,“在知識的問題上,以人們的認可為根據是最糟糕的選擇”(培根,2008,第40 頁)。所以,在培根看來,知識的力量決不能簡單歸結于人類的直觀認識,而是知識能否經得起理性推導和實驗檢驗,且是否蘊含解釋現實的能力(鄭永年,2018,第59—64 頁)。70 年前,圖靈在《計算與智能》的開篇寫道,“‘機器能思考’這一問題必須從機器和思考這兩個詞的定義開始。并且它們定義不能通過日常使用或者蓋洛普名義調查的方式。不然,這就會顯得很荒唐”(Turing,1950)。正因此,圖靈為了準確地表達自己心中智能機器的內涵,他在該文提出了著名的“圖靈測試”。從上述知識觀點來看,過去教育評價之所以陷入“五唯”的惡性循環,一方面是為了獲得多數人的認可,它必須與“分數、升學、文憑、論文和帽子”這些已經獲得人們認可的事物產生關聯;另一方面由于教育評價與“五唯”的深度綁定,使得已有教育知識顯得荒謬且模糊,以至于無法解釋新時代教育發展的需求和使命。換言之,“五唯”在知識層面非但經不起理性檢驗,且缺乏深刻的解釋力,更難以實現“多數人認可”與“明確定義”的有機統一,以至于不斷重復“按下葫蘆又起瓢”的窘境。而這也是本次教育評價改革不易覺察卻又亟待突破的隱藏目標。

與之不同,算法可以在明確定義的基礎上,實現對教育現象(問題)的數字化界定,同時結合嚴謹的概念和數學邏輯關系,最終提升教育評價在“交流、解釋、判斷、設計、預測、探索和實施層面的專業性”(佩奇,2019,第25—39 頁)。進一步而言,借助算法生產教育知識主要基于以下邏輯。盡管人們常說,“數據無法替代人類直覺”。反過來講,“人類直覺也替代不了數據。”原因在于,從算法的角度來看,所有知識,無論是過去的、現在的還是未來的,都有可能通過單個通用學習算法來從數據中獲得(多明戈斯,2017,第33 頁)。這也意味著,用算法生產教育知識首先需要做的就是搜集足夠的數據,然后通過適當的算法發現相應的知識:給它考試成績,它就可以“判斷”應試教育的優劣;給它課堂教學頻流,它就可以“看出”教學的特色與問題;給它教育實驗的結果,它就可以“發現”教育的規律;給它教師工作生活的所有數據,它就可以“解析”教師專業發展的結構。其次,用算法打破教育知識的門戶之見。正如波動方程、擴散方程、泊松方程表明的那樣:一旦研究者在某個領域發現它們,也很快能在其他領域發現它們;一旦研究者在某個領域懂得解開它們,也能在所有領域將它們解開(多明戈斯,2017,第39 頁)。以此作為啟發,各行、各業、各學科的專家完全可以藉由科學與人文之間的四座橋梁“認知神經科學、人類行為遺傳學、進化生物學、環境科學”(威爾遜,2016,第269 頁),建構跨學科的評價算法對教育知識進行交叉驗證和迭代升級,并據此塑造有理有據、令人信服、知識融合的專業評價,從而告別“五唯”式的籠統、閉塞與錯亂。最后,用算法彰顯主觀知識的重要性。算法的最大價值并不在于算法本身可以從數據中學到什么,而是透過這些算法,人類學會了什么(多明戈斯,2017,第358 頁)。同理,借助算法生產教育知識的更高追求應是驅使人們明白教育需要很多算法之外的主觀知識,即沒有人類體驗就無法理解的東西。而這也正是“人”在教育評價中專業性的最好體現—通過算法低成本完成的量化評價越多,評價就更需要源自人類主觀知識的專業判斷。

(三)優化教育治理,彰顯評價的客觀性

《方案》提出第一個目標是“經過5 至10 年努力,各級黨委和政府科學履行職責水平明顯提高”,第一條重點任務則是“改革黨委和政府教育工作評價,推進科學履行職責”。由此可見,教育治理極有可能構成未來教育評價改革的難點。更深層原因在于,面對教育領域日益復雜且不斷加速的大數據趨勢,各級黨委和政府藉由教育評價進行治理時不得不面臨以下難題:一方面為了應對日益復雜的教育問題,國家權力往往需要改造自身以體現教育治理的客觀性。否則,教育治理難免為了體現“不摻雜個人主觀意識”的客觀性,而再次陷入“以數字大小論英雄”的“五唯”困境之中。另一方面,國家面臨著以有限的教育資源推動教育高質量發展的潛在壓力。所以,如果缺乏其他堅實的算法依據,與“五唯”類似的算法仍有可能成為教育資源分配的“客觀標準”。也正是鑒于上述難題,各級黨委和政府確有必要借助算法優化現有教育治理,以便促進國家權力對復雜教育需求作出準確的回應和分配,同時在教育領域彰顯客觀公正的國家形象。

參考國家治理的相關經驗(宋鍇業,2021),教育評價改革可以借助算法從以下三個方面優化教育治理。一是推動教育治理的結構化。這就要求研究者(技術官員)在教育評價中先將非結構化教育問題轉化成結構性數據;然后,把教育問題表述成可以進行數據處理的有效形式;同時,在數據清洗、合并、轉化和重組的基礎上,依據算法構建非結構性數據的相關關系并挖掘其中的價值,把分散的教育數據整合起來,使之成為有內在關聯的大數據;最終,借助算法的數據迭代和知識分類使那些難以處理的非結構化教育問題邏輯化、概念化、條件化和綱領化,從而降低教育治理的主觀性和不確定性,以期為國家權力大規模、長時間地塑造教育秩序提供超越個人情感和利益的客觀算法支撐。二是重塑教育治理的流程。隨著機器學習這一算法的成熟和普及,基于教育評價的教育治理流程有機會被重塑為“從數據輸入到算法輸出”。首先,必須通過教育評價收集足夠的數據作為算法的輸入。隨后,可用的數據被用做機器學習的訓練材料。然后以此為據,構造出適合這些數據的最佳決策算法。完成后,該算法可用于輔助教育治理的決策。需要說明的是,就上述流程而言,借助算法重塑而成的教育治理關注的是客觀概率(相關),而非確定性(因果)。所以,基于機器學習的教育治理流程關鍵在于把教育評價轉變為數據輸入和算法輸出,并以此揭示、解釋和顯示教育活動中時間、人物、地點和事件的傾向性和規律性,進而為教育治理中的資源分配提供可供借鑒的“客觀標準”。三是加強教育治理的決策統一性。算法作為治理機制,不僅可以視作行使國家權力的工具,也能推動國家治理在決策層面的統一性(宋鍇業,2021)。加之考慮到霍布斯在《利維坦》中所言,“多人的智慧勝于一人這句話不假,但是除非最終有一個決策者,否則多個人往往都從各自的利益出發看同一個問題。那些別有所圖的人,盡管四處查看,但最終目標只會是鎖定到自己的利益上”(霍布斯,2008,第124 頁)。我們或許可以作出以下設想,藉由算法優化教育治理的本質目的應鎖定在幫助國家通過收集、整理和計算教育中的各種數據,進而通過適切算法把數據轉換成加強國家統一決策的客觀依據。

二、教育評價改革的算法風險

承前所述,在教育評價享受算法帶來的科學性、專業性和客觀性時,如果追問根植于算法背后的認知,人們就會窺見教育評價改革中的算法風險。

(一)偏見強化

盡管算法有助于彰顯教育評價的科學性、專業性和客觀性。不過在此之前,我們需要追問的是,這樣的教育評價是否有益于消除已有的教育偏見。畢竟,人類已有算法的背后總會伴隨著偏見強化的身影—“它往往由隨機的數據采集和假性相關所驅動,被制度不公平加以強化,又被實證性偏見加以進一步惡化”(奧尼爾,2018,第12 頁)。對此,我們只需要深究“五唯”中的分數算法本質,就能明晰這種偏見所在。舉例而言,當一個學生因為學習開始階段的分數高低而被分為“好學生”和“壞學生”之后,“好學生”不僅擁有更友好的學習環境,而且他還會收獲到更多正面的積極反饋,所以他的成績越來越好,從而構成良性循環;而“壞學生”也會更有可能與其類似的人待在一起,同時他也更容易接收到消極反饋,所以他未來的學習成績也可能面臨更大風險,從而陷入惡性循環。更糟的是,一方面“好學生”的良性循環和“差學生”的惡性循環都能驗證基于考試分數的教育評價合理性。另一方面,也正是基于考試分數的教育評價導致了某些學生陷入惡性循環,甚至進一步固定了這些學生的惡劣環境。究其實質,分數算法帶來的偏見強化,源于它的不透明、不接受質疑和解釋不通,并且它只是對學生(教師、學校)進行定位、篩選或者優化,而非真正關注與人類、社會、國家、歷史、現實、未來有關的真實教育質量。也正因此,當人們在認知教育時把考試分數和教育實際相混淆時,分數算法只會導致偏見的進一步強化而非問題解決。

進一步而言,如果我們將考試分數換為教育評價算法(如核心素養、綜合素質),上述偏見強化就會自動消弭嗎?答案顯然不在于算法的內容設計,而在于算法背后的隱性利益。回到分數算法而言,管理部門和學校之所以根據成績衡量教育質量,而忽略教師的“傳道授業解惑”,以及學生的情感體驗、潛力激發與創新發展等事關真實質量的因素,實則是因為分數評價不僅簡單可見,而且易操作、易理解,更有文化上的慣習、輿論上的“多數人”以及政策上的默許作為支持。所以,他們可以為了追求效率而犧牲教育評價的精確性和洞察力,從而把“分數”作為評價學校質量和教師績效的有效工具。更令人無奈的是,從筆者參與教育評價的實踐經驗來看,即便參與者都知道了分數算法暗含的偏見,他們也不會選擇改變。原因在于,學校和教師可以因為看得見、看得清以及看得懂的“分數評估”而獲得具有廣泛性、普遍性和代表性的認可,與此同時,他們也能用“分數提高”為政府、家庭乃至社會提供教育進步的交代和政績。反之,那些即便在觀念、知識和技術層面更加公平的教育評價算法也可能因為上述隱性利益而被排斥、被冷落和被擱置。可見,當那些源于認知的教育算法偏見一旦因為歷史、現實、文化或者其他因素而摻雜了隱性利益之后,它們很有可能變成尾大不掉的教育痼疾。

(二)排名陷阱

與近代科學數字化的發展歷程類似(吳國盛,2019,第187—188 頁),所有算法都會“自動”在教育領域鞏固自己的“話語”和“量綱”。一是數字話語。盡管如今的人們都喜歡說“數字說話”,但數字本身顯然不能開口說“人話”。究其實質,那些所謂“數字化語言”也是人為構造的結果(楊欣,2021c)。更何況,這種數字化的教育評價話語已成為全社會的普遍共識。也正因此,教育評價要拒絕“五唯”這種片面數字化的教育評價,亟須借助算法組織另外一種更加全面和深刻的數字化教育評價話語。二是數字量綱。從現有算法的基本假設來看,它背后的思想是要將豐富多彩的事實還原為刻板單一的量綱,進而將一切質上的不同還原為量的差異。當教育質量被數字化時,既意味著開辟了可計算的教育質量領域,也意味著忽略人的質性差異,對所有的對象一視同仁。在此基礎上,運用算法對它們進行處理,人們僅從數字大小就能輕易、直觀地識別教育質量的水平高低。從上述邏輯出發,教育評價算法即便可以體現源于數字化的科學性、客觀性和專業性,但付出的代價卻是導致教育評價墮入“排名陷阱”之中。

究其原因,當某個算法應用于實踐(尤其是大范圍)時,它自身的話語和量綱可能帶來一個扭曲、糟糕的教育排名體系。在此方面,大學排名可謂典型。歷史地看,大學排名各種算法的依據僅僅是人們對教育質量的憑空想象,然后,他們根據這些“頭腦中的標準”去尋找那些可以測量的相關變量,最后“隨意”地在公式中賦予每個變量一個數學權重(奧尼爾,2018,第49 頁)。僅就理論而言,這些大學排名都可以為自己找到科學、專業和客觀的依據,并且它們在小范圍予以應用也沒有太大問題。但是,當基于某種算法的教育排名成為區域、國家甚至全世界的標準時,這些排名就會墮入“自動鞏固”的陷阱之中—無論這樣的排名有著怎樣的局限甚至錯誤,學校里的師生都會根據這些算法標準來優化自己的行為,反過來強化算法的合理性。于是乎,學校里的所有人必須為了獲得更高排名在人生高峰期把大量的精力投入與排名算法有關的“事業”之中,他們不得不因為算法的需要而永不停歇地寫論文、申請課題、爭獎勵和搶帽子,以便學校提高排名、獲得良好口碑、籌集更多資金、吸引更多的優秀人才。需要特別指出的是,除了這種排名陷阱的算法目的值得批判之外,即便它的算法基礎也充滿了可疑之處。對此,用菲爾茨獎獲得者朱迪亞·珀爾的話來形容就是,“現有算法在運用數學分析解決問題時,不得不將真實問題轉化為關于關聯的偽問題”(珀爾,2019,第323 頁)。也正因此,教育評價算法必須永遠警惕上述排名陷阱,“因為它和其他主觀排名一樣,必然充滿過時的偏見和無知”(奧尼爾,2018,第53 頁)。

(三)數字鴻溝

誠如社會學奠基人涂爾干在《教育思想的演進》一書中表明的那樣,“一個社會若按自身的形象來塑造其成員,最有力的工具便是教育。并且無論在什么時代,教育都密切聯系著社會中的其他制度、習俗和信仰,以及重大的思想運動”(涂爾干,2016,第3 頁)。也正因此,一方面跨領域的教育算法極有可能推動教育與社會在思想、行為以及制度層面實現深度的知識融合和治理協同。但另一方面,也可能因為跨領域教育算法面臨的技術壟斷、人群偏差和信息繭房,反而加大社會的“數字鴻溝”。

首先,在很多情況下,信息時代的治理決策權已成為技術精英的專屬(阿米蒂奇,羅伯茨,2016,第4—5 頁)。與此同時,考慮到算法導致的信息不對稱進一步加劇了社會各階層的“數字鴻溝”,且形成了明顯的馬太效應(曾智洪等,2020)。我們有足夠理由憂慮,教育評價算法或將很難擺脫“信息獨裁”“唯數據論”和“精英治理”等技術壟斷的影響。這也意味著,教育評價算法對數據、信息和精英的過度依賴又會將政校互動、家校互動、校社互動從治理決策中剝離。而這既可能導致學校、家庭和社會的協同育人落入欲壑難平的“數字鴻溝”,也悖離了“共建共治共享”的社會格局。

其次,現階段并非所有人都善于或者習慣用現代化的信息渠道表達自己的教育偏好。所以,教育評價最后收集到的各種數據很可能只是反映某些特定年齡階段、收入水平、社會背景的特殊人群意見,從而促使教育部門的政策向著更有利于他們的方向傾斜,直至給社會帶來更大的不公平。換言之,教育評價算法在某些情境下得出的結論,很可能只是反映了評價對象的“數字鴻溝”,而非所謂科學、專業、客觀的數字規律。

再者,鑒于算法具有了解和預期公民生活的能力(Ruppert,2012),且能“能單獨和自適應地嵌入和引導行為,提供個性化輸出”(Knig,2020)。所以,教育評價算法難免基于不同人群的偏好和需求,塑造不同人群接受的教育信息。然后,人們會習慣性地被自己的興趣所引導,接受那些能夠讓他們感到被肯定和被認同的教育評價,最終把自己的“教育世界”桎梏于如同蠶繭一般的“繭房”中,即形成教育的信息繭房(楊欣,2021d)。如此周而復始,人們的教育意見自然會因為算法而越來越分化,并且屏蔽那些持不同見解的人,直至在人性與制度層面埋下深不可見的“數字鴻溝”。

(四)物化困境

過去的“五唯”一再證明,教育評價算法往往意味著“將人擬物”“以物為基礎”的評價方式。同時,為了滿足算法的需求,評價者必須找到適宜的“物化”指標。辯證而言,這種基于算法的“物化”評價不僅有助于提升教育評價的科學性、專業性和客觀性,也能從可計算、易操作的角度滿足表面公平的教育訴求。但與此同時,它也在認知層面造就了以下人與世界悖離的“物化困境”。

第一,思維局限。以“五唯”背后的算法為例,它通過可測量、具體、有時間限制、客觀、可操作的“分數、升學、文憑、論文和帽子”將學生和學者分為三六九等,盡管體現了所謂“科學性”“專業性”和“客觀性”,但它孤立地將靜止的“分數、升學、文憑、論文和帽子”片面等同于人的知識和能力,不僅與實際不符,還在客觀上限制了人們的主動性和發展潛能。并且,為了滿足可測量、具體、有時間限制、客觀、可操作的算法條件,人們往往會選擇更加簡單、可見的任務,放棄那些復雜、內隱的任務。

第二,缺乏同理心。教育評價算法會習慣性地將“人”視作無差別的無生命對象。這種貌似科學、專業、客觀的評價不但衍生了評價者的“傲慢感”,尤其是相較于被評價對象的“優越感”,甚至在相當程度上滋生了一種對人的“無情之心”。畢竟,即便算法可以準確定位和篩選那些在教育中經歷困難和痛苦的人,但算法本身并不能決定(也不在乎)是拒絕和懲罰他們,還是為其提供資源和幫助。

第三,遠離真實世界。在此方面,2021 年4 月央行官方微信發布的《關于我國人口轉型的認識和應對之策》可謂典型代表(陳浩等,2021)。該文基于數據提出“重視理工教育,東南亞掉入中等收入陷阱的部分原因就是文科生太多”這一觀點,不僅與東南亞經濟停滯的實際情況存在差異(姜文輝,2016),也與東南亞高等教育發展歷程不符(黃建如,2000),更忽視了新高考取消文理分科的戰略意圖。究其實質,上述觀點差異除了可以歸結為統計口徑的差異,更源于數字世界與真實世界的隔閡。當研究者受困于“數字世界”時,他們會忽略了人的具體處境,錯誤地把報告中的數字及其規律當成了真正的教育。于是乎,他們更加依賴算法推薦的教育數據、教育事實或者教育案例,而不是深入真實世界了解數據的背景、案例的本質以及教育的意義。最終的結果就是,有些人在沒有切實理解教育的情況下,僅僅根據數字的規律進行問題分析、問題解釋乃至問題解決。

三、教育評價改革的算法突破

誠如前文所表,算法對教育評價擁有不易覺察卻更為深刻的影響力。至于這種影響力是在改革中表現為教育評價科學性、專業性和客觀性的提升,還是轉化為教育評價的偏見強化、排名陷阱、數字鴻溝和物化困境,它絕非簡單取決于算法優劣,而是算法背后的認知。其中的微妙區別就像很多計算機科學家隱喻的那般,“算法只能把一匹馬帶到水邊,至于馬喝不喝水,還是去做別的什么,那不是算法的事”。在此意義上,算法本身自有其重要性和答題解惑方式。不過,筆者作為教育學者更關心后者:一是認知方法,人們如何根據算法進行推理;二是認知目的,人們用算法來做什么;三是認知對象,人們在算法中關注什么;四是認知模式,人們如何理解算法。相應地,本文嘗試勾勒教育評價算法在認知層面的方法突破、目的突破、對象突破和模式突破,以期實現“化風險為機遇”的改革追求。

(一)方法突破:用溯因推理超越自證預言

就其認知方法而言,教育評價算法的偏見強化源于人們更習慣用有限的結論進行自證預言。這種認知方法與十九世紀風靡歐洲的顱相學有異曲同工之妙(奧尼爾,2018,第136 頁)。顱相學家通過摸頭蓋骨得出的結論往往和他的觀察相一致。如果一個人極度焦慮或者嗜酒,顱相學家總可以在病人的頭蓋骨中發現與這些問題相對應的腫塊和凹陷,反過來強化人們對顱相學的信任。說到底,顱相學也可視作一種算法,只不過這些算法只能依靠偽科學建立權威。因為顱相學所謂“用顱相預言人類發展的規律”不過是些經不起科學檢驗的種群偏見。如今,教育評價算法若要逃脫顱相學的認知窠臼,亟須在方法層面從自證預言走向“溯因推理”(abductive reasoning)。二十世紀初,美國哲學家查爾斯·皮爾士提出了溯因推理的概念。并且,皮爾士本人把溯因推理同演繹法和歸納法并列為基本的論證方法。簡言之,溯因推理是探究結論背后的成因及其解釋,它追求從反對和支持的事實(案例)中尋找更具解釋力的原因,而非立足于用假定的結論預言未來(梅吉爾,2019,第188—194 頁)。換言之,溯因推理的前提在于,存在某種原因比其他任何原因都能更好解釋已有結論,所以它又名“最佳解釋推論”。

在此意義上,與“自上而下”(從已知結論推出假設的結果)的自證預言所導致的算法偏見相比,“自下而上”(從已知結論推理出假設的原因)的溯因推理之所以能稱為方法突破,是因為歷史經驗表明,注重融通性、簡潔性和類似性的認知方法更有益于消弭偏見(梅吉爾,2019,第194—197 頁)。一是融通性,算法能解釋的現象(問題)越多越好。還是以考試分數為例,盡管它作為算法可以解釋個人在應試范圍的好壞,以及由應試衍生的諸多利益,但如果將考試分數放在國家發展、民族興旺的尺度,它就會陷入解釋困境。原因在于,國家每年都會組織各種考試,也會提供相應的學位和崗位,所以無論人的素質是否提高、國家是否發展、民族是否興旺,都會有人“上岸”或者“搶到位置”。所以,考試分數永遠只能解釋個人的成敗,且注定充滿“優勝劣汰的個體偏見”,而不能對國家發展、民族興旺作出解釋和回應,也看不見整體的使命、協同和互構。也正因此,教育評價算法應在認知方法上告別自證預言似的“分數享樂”,轉而推崇溯因推理帶來的深刻解釋以及由此構成的知識進步,以期用“為黨育人、為國育才的普遍使命”超越“分數成功的個體追求”。二是簡潔性,算法需要的輔助假設越少越好。當教育評價中沒有足夠證據來支持它對教育問題的假設時,它就需要有輔助假設,其目的就是為了使得這個教育評價算法能夠自圓其說。在此方面,“五唯”的形成可謂典型。當過去教育評價的“分數假設”(分數高的是人才)和“文憑假設”(文憑高的是人才)面臨失靈的境況,它就加入了“論文假設”“帽子假設”“證書假設”“課題假設”等。然而事與愿違的是,隨著假設越來越多,識別人才的準度非但沒有增加,反而衍生了更多未經證實的人才偏見。舉例而言,人才會有論文和課題,但反過來講,有論文和課題卻未必是人才。與之相反,從認知的簡潔性來看,教育評價更應青睞那些需要更少輔助假設來讓結果符合當時條件的算法。換言之,簡潔的教育評價算法更應推崇“就事論事”和“一事一議”,而不是無休止的“假設累加”,或者對評價結果進行“加減乘除”。畢竟,很多時候假設之間還可能構成沖突。不然,我們就得接受類似“艾薩克·牛頓=第谷·布拉赫+約翰尼斯·開普勒”這樣頗為荒謬的科學成就評價算法。三是類似性,某個算法與已經被證實為真的算法越相似越好。正如前文所表,每個算法都有其局限。所以,單個教育評價算法得出的“優劣”并不足以說明對象的優劣—它僅能代表這個算法的運算邏輯。而這也是過去教育評價中某些算法的拙劣之處,它用以偏概全的方式偷換(隱匿)了其他算法的價值和效用。面對過去單一教育評價算法帶來的偏見和盲目,《方案》已然提出“改進結果評價,強化過程評價,探索增值評價,健全綜合評價”的要求。從這樣的趨勢來看,教育評價改革的方法突破在于能否推動結果評價算法、過程評價算法、增值評價算法和綜合評價算法在事實層面的交互印證,從而全面、立體、深刻地展示(還原)教育的樣態。

(二)目的突破:用和平協議超越軍備競賽

現實而言,始于數字話語和數字量綱的教育評價之所以被稱為排名陷阱,是因為以排名為目的的算法總會不斷吹響教育系統“軍備競賽”的號角。而這場競賽的慘狀亦如凱西·奧尼爾所言,“《美國新聞》的排名模型以由此產生的工具和焦慮為養分成長為一個龐然大物。排名模型有力地刺激了各方在教育上的不斷投資,而飆升的學費則被忽視了……結果就是,教育體系偏向于特權階層,偏離于窮人和中產階級,淘汰后一類家庭出身的絕大多數學生,將他們推向貧窮之路,進一步加劇社會的階層固化”(奧尼爾,2018,第60—65 頁)。盡管中美高等教育的環境和問題有所不同,但如果我們將眼光放到中小學階段,看看那些飽受教育焦慮的國人和被“刷題班”掏空荷包的家庭,這場圍繞排名的軍備競賽恐怕也不遑多讓。為此,我們不得不追問,難道人類教育演化至今就是為了把所有人培養成適應各種算法排名的機器,以便他們在殘酷的競爭脫穎而出?如果拘泥于當前歷史條件而言,這樣的軍備競賽或許更契合教育算法的目的設定,所以顯得有些無解。但如果我們把眼光放到人類幾十萬年的演化史來看,這教育的算法目的很可能擁有完全不同的答案。

值得注意的是,瑞士巴塞爾大學的神經科學研究者在《鸚鵡螺》雜志介紹了演化的最新觀點(Clancy,2017)。文中分析了現代進化生物學核心概念,名為“放松的選擇”(relaxed selection),意為把環境選擇的壓力減小,讓生物們活得輕松,以便帶來繁榮和創新。進化史表明,人類發明用火、把肉類食物加工之后再吃,縮小了自己的牙齒和下巴,從而讓大腦的容量可以更大 —人類解放了自己的大腦;人類馴化動物,解放了自己的勞動力;現代人不再終日從事體力勞動,解放了自己的天性。概言之,從演化趨勢來看,人類的發展不是為了在殘酷環境中挑戰自我,而是設法放松自己的環境,讓自己探索新的可能,從而解放自我。同理,幫助師生擺脫基于排名陷阱的軍備競賽,也將有益于“通過教育激發人類用信息反抗熵增侵襲和進化壓力的物種的天性”(平克,2019,第253 頁)。所以,從人類演化而言,競爭與寬松同樣重要;排名也不是目的,而是手段;所以,教育評價算法不等于開啟軍備競賽,有時它更意味著和平協議。這絕非異想天開的心靈雞湯,而是有例可依的現實選擇(奧尼爾,2018,第68 頁)。在美國奧巴馬總統的第二任期間,他曾經希望由政府出面做一個教育排名,不過當時美國校長已經洞悉了排名模型的缺陷及其可能的惡性循環,所以他們強烈抵制新的排名系統。最終,美國政府作出了讓步,教育部沒有將大學重新排名,而是把大量的調查數據公布在網站上。如此一來,所有人都可以自行查詢自己關心的指標和數據,而無須再去了解任何統計法或者變量的權重。相應地,教育評價的算法目的從黑箱走向了透明、從強迫走向了自主、從標準走向了個性,而基于排名的軍備競賽也變成了基于發展的和平協議。

(三)對象突破:用整體發展超越個體特征

必須指出的是,教育算法是推動知識進步、共同發展和思想解放,還是構成新的技術壟斷、人群偏差和信息繭房,將取決于人們是關注評價對象的整體發展,還是在意評價對象的個體特征。原因在于,任何基于算法的教育評價都可以通過對象的行為模式、背景變量以及選擇偏好對人群進行排序、分類以及評分,從而“科學”“客觀”“專業”地呈現評價對象的個體特征。糟糕的是,通過對個體特征的凸顯,人們只會越來越關注那些自己以為自己需要但又對其很無知的評價信息。也正是始于這種想不明卻又能強烈感受到的焦慮,總有人或者機構利用各種個體特征開展貌似合理的“希望營銷”,然后向人們不負責地承諾通向成功的特殊道路。可嘆的是,這條道路的終點往往是弱勢群體的焦慮和痛苦,以及對教育的懷疑(奧尼爾,2018,第86 頁)。與之相反,如果研究者在理解(詮釋)評價對象時可以從人類、社會和國家的整體需求出發,承擔起教育發展的共同責任,冷靜地去感知教育質量的整體意義,并認真理解所有人在相互交織、彼此依賴的教育世界中的共同進步、協同交流和創新發展,那么這些對整體發展的關注將會給評價算法帶來超越個體特征的全新知識。

其一,重新理解教育評價對象的多元價值。群體中的“涌現”現象表明:(1)群體的能力(知識)=所有個體能力(知識)之和+能力(知識)多樣性;(2)多樣性的群體>單一性的群體(伊藤穰一,豪,第27—45 頁)。從群體的多樣性優勢來看,群體可以實現超越個體能力(知識)極限的創新和進步,這也意味著,研究者有必要從整體發展的角度重新審視教育評價對象的多元價值。在此意義上,好的教育評價算法除了告訴被試在個人能力(知識)層面的科學、專業、客觀的結果,更應體現整體的多元價值,即回答當前的教育是否符合國家的多元需要、是否有利于國家涌現創新人才。所以,研究者迫切需要做的是深刻解讀國家教育高質量發展的豐富需求場景與多元供給思路,并據此形塑足以反映教育多樣性的評價算法。如此,教育評價算法將從兼具整體性和多樣性的角度,開啟激勵人、團結人、解放人的正反饋回路,我們才更有可能通過評價改革助力科教興國戰略。否則,任何算法都可能淪為彰顯個體能力的教育排行榜,甚至形成壓抑人、孤立人、異化人的負反饋回路。

其二,在教育評價中意會人類命運共同體。意會是基于人文學科的實踐方法,它完全存在于具體的教育情境之中,而算法得出的結果則存儲于被剝離其特殊性的字節之中(馬茲比爾格,2020,第7 頁)。相應地,也只有人們學會了徜徉于豐富且真實的教育世界,用意會思維去感知與文化交流的自我、與時代演進的自我、與整體互構的自我,人們才能更加清晰地理解教育評價算法的目的與假設、價值與局限以及本質與表象。而這種意會的結果亦如邁克爾·波蘭尼在《個人知識》中所言,“它意味著人類可以通過滿懷熱情地去努力在普遍標準之下完成他的個人義務,從而超越自身的主觀性”(波蘭尼,2017,第19 頁)。由此可知,偉大的教育評價算法就是要意會人類命運共同體的精神實質、時代召喚和偉大故事:一方面坦陳教育評價的算法假設及其排名局限,時刻警惕基于評價對象個體特征的狂熱、偏狹和迷思;另一方面使人與這個時代形成共鳴,邀請他們與真實世界的各種人群產生共情,從而使評價對象回歸人群中,實現正常、普遍、共有的整體發展。這也預示著,人們藉由意會得出的解釋不僅可以為評價對象補充更多有意義的內容,也更有可能使源于技術壟斷、人群偏差、信息繭房的數字鴻溝消弭于人類命運共同體的“劇本”之中—正如成功的演出往往需要不同角色的構成和演繹,但卻只能有一個劇本。所以,在教育評價對象中融入多元價值和意會人類命運共同體就是要處理好“角色”和“劇本”的關系。

(四)模式突破:用“厚”數據超越“薄”數據

從更深層的原因而言,教育評價算法之所以導致人與世界悖離的“物化困境”,其實是因為人們沒有理解“數據的薄與厚”(馬茲比爾格,2020,第63—82 頁)。“薄”數據只關注抽象特殊的形式、規律和方法,旨在用數據解釋人類,所以容易出現思維局限、同理心缺乏以及對真實世界的疏離。而“厚”數據先關注具體真實的主觀解釋、歷史文化、視角預設以及語境差異,旨在根據人類與所生活的世界聯系來解釋人類—這也是撰寫教育評價“劇本”的思路所在。相應地,教育評價算法的模式突破意味著用“厚”數據超越“薄”數據。具言之,這種具有綜合性的算法認知模式擁有以下特點:第一,教育評價算法關涉主觀解釋。現有教育評價算法也會有一定的視角,而這種視角只是眾多選擇中的某一種。不同算法的視角(理論出發點)很可能不一樣,并且會因此得出不同的結果。所以,人們若想讀懂教育評價的算法結果,就必須學會解釋自己以及由自己構成的教育命題、教育活動和教育情境,否則,他們就不可能確切地知道評價數據究竟對他們而言意味著什么。作為交換,當人們可以解釋清楚自己的命題、活動和情境時,他們就會放棄那些不切實際、片面狹隘的教育幻覺,轉而擁抱更加真實、豐富、動人的教育世界。第二,教育評價算法會受到歷史文化的影響。一旦數據沒有了具體的歷史背景和文化內涵,所呈現的結果不過只是對這個世界的抽象表征,而非世界本來面目(馬茲比爾格,2020,第15 頁)。比如,在中國教育中異常重視的分數、升學、文憑、論文和帽子,在其他文化中未必如此,只是因為不同歷史文化給某些教育評價結果賦予了特殊的意義和價值。所以,教育評價算法亟須找準相應的歷史坐標和文化參照。第三,教育評價算法中的視角是平等的。如分數、升學、文憑、論文和帽子并不能天然在任何教育評價中高人一等。從這個意義而言,教育評價算法要破“五唯”,要破的正是它唯一正確、唯一合理的視角,而非徹底擯棄分數、升學、文憑、論文和帽子的視角。第四,視角決定語境,每種教育評價算法都是在某種語境之下。為此,基于算法的教育評價也應有明確的語境。比如,如果是基于結果算法的語境,那么相關討論就應關注教育的絕對值高低及其橫向比較的優劣。如果是基于增值算法的語境,那么相關討論就應關注教育的進步大小和變化范圍。而不是用結果否定增值,或者用增值壓倒結果。因為不同語境的爭論更像是意氣之爭,而非建設性地研討。第五,同一語境之下,教育評價算法得出的結果有高低優劣之分。如果在教育評價算法中強調主觀解釋、歷史文化、視角差異以及語境預設之后,而不對評價結果區別高低優劣,很可能陷入后現代不分對錯的虛無主義、自我否定的相對主義。所以,教育評價算法必須有明確的視角和清晰的事實,所得結論也必須是清楚的。如此,才能通過教育評價算法研磨出更多真實可靠、令人信服、經得起檢驗的結論與觀點。

(楊欣工作郵箱:77185270@qq.com)

猜你喜歡
評價教育
國外教育奇趣
華人時刊(2022年13期)2022-10-27 08:55:52
題解教育『三問』
當代陜西(2022年4期)2022-04-19 12:08:52
軟件工程教育與教學改革
軟件導刊(2022年3期)2022-03-25 04:44:48
SBR改性瀝青的穩定性評價
石油瀝青(2021年4期)2021-10-14 08:50:44
“雙減”如劍,“體外教育”何去何從?
當代陜西(2021年15期)2021-10-14 08:24:24
中藥治療室性早搏系統評價再評價
教育有道——關于閩派教育的一點思考
辦好人民滿意的首都教育
基于Moodle的學習評價
關于項目后評價中“專項”后評價的探討
主站蜘蛛池模板: 无码免费试看| 呦视频在线一区二区三区| 亚洲香蕉在线| 亚洲欧美人成人让影院| 亚洲最大看欧美片网站地址| 国产一区二区三区日韩精品| 丁香综合在线| 青草娱乐极品免费视频| 91麻豆精品国产高清在线| 九色在线观看视频| 亚洲精品无码久久久久苍井空| 最新亚洲人成网站在线观看| 亚洲精品国产首次亮相| 欧美午夜视频| 欧美日韩一区二区三区四区在线观看| 另类专区亚洲| 日本精品影院| 在线亚洲小视频| 91久久国产综合精品| 日韩最新中文字幕| 亚洲色婷婷一区二区| 日韩在线永久免费播放| 亚洲中文字幕国产av| 成人精品视频一区二区在线 | 无码中字出轨中文人妻中文中| 天堂亚洲网| 毛片三级在线观看| 亚洲乱码在线播放| 日韩高清成人| 色悠久久久| 国产精品吹潮在线观看中文| 亚洲av中文无码乱人伦在线r| 99热这里只有免费国产精品 | 国产AV无码专区亚洲A∨毛片| 久久久久夜色精品波多野结衣| 亚洲女同一区二区| 毛片网站在线看| 久久久久久国产精品mv| 欧美日本在线一区二区三区| 国产又粗又猛又爽| 国产女人在线视频| 日本在线欧美在线| 在线国产毛片| 精品国产乱码久久久久久一区二区| a级高清毛片| 91视频精品| 欧美全免费aaaaaa特黄在线| 中国丰满人妻无码束缚啪啪| 国产综合在线观看视频| 欧美成人国产| 亚洲国产一区在线观看| 中文字幕在线免费看| 亚洲AⅤ综合在线欧美一区| 亚洲国产无码有码| 国产精品永久在线| 国产女人喷水视频| 免费无码网站| 九九久久精品国产av片囯产区| 欧美国产在线看| 国产青青操| 国产成人综合网| 欧美日韩亚洲国产主播第一区| 国产原创第一页在线观看| 欧美日本在线观看| 日本高清在线看免费观看| 国产95在线 | 亚国产欧美在线人成| 久操线在视频在线观看| 亚洲视频二| 亚洲一区二区成人| 熟妇丰满人妻| 成年人国产视频| 亚洲一区第一页| 亚洲AV无码不卡无码| 国产哺乳奶水91在线播放| aa级毛片毛片免费观看久| 成人午夜视频网站| 中文字幕第1页在线播| 欧美精品影院| 色哟哟精品无码网站在线播放视频| 波多野结衣在线se| 亚洲精品无码久久毛片波多野吉|