張帆
2016 年12 月,習近平總書記在全國高校思想政治工作會議上指出,“要堅持把立德樹人作為中心環節,把思想政治工作貫穿教育教學全過程?!薄陡叩葘W校課程思政建設指導綱要》的頒布,為我國高校所有學科全面推進課程思政建設提供了綱領性的指導[1]。在眾多學科中,外語類課程是中西方文化碰撞交流的前沿陣地,需要學生具備“正確的世界觀、人生觀和價值觀,良好的道德品質,中國情懷與國際視野,社會責任感,人文與科學素養,合作精神,創新精神以及學科基本素養”[1]。因此,在外語類課程中融入思政元素,是“大思政”背景下的必由之路。
自課程思政的理念提出以來,我國眾多學者針對外語類課程的思政建設開展了廣泛的研究。但目前的外語課程思政教學評價普遍存在“語言”和“思政”融合不充分、量化難的問題[2]。本研究基于以上背景,以DIT(Defining Issues Test,“確定問題測驗”)為切入點,分析其與我國外語課程思政教學評價的內在聯系,以“英語閱讀(一)”課程為依托,嘗試設計評價方式,以期構建具有可遷移性的外語課程思政顯性化的教學評價方式。
教學評價對促進外語課程思政意義重大[3]。目前評價方式主要涵蓋三個方面:
在評價內容方面,學者們認為應在語言能力測評的維度之上,增加對語言背后所蘊含的思政元素的評價維度,實現“語言”與“思想”的整合性評價,將命題測試結果與學生外在思想政治表現綜合在一起,檢驗課程思政教育效果[4],形成語言知識習得目標、語言能力提升目標和語言輸出的思想目標、價值目標、素質目標等多維育人目標協同培養的閉環路徑[5]。
在評價過程層面,應將形成性評價和終結性評價相結合[6,7],并發揮形成性評價對學習過程產生的積極反撥作用[3]。
在評價主體方面,提倡建立教師評價、學生自評、學生互評的多元評價主體[8]。評價主體的多元化,也是學生的自我反思能力、合作學習能力和見賢思齊的學習態度的體現,以此發揮評價方式本身蘊含的思政育人功能[2]。但總體而言,外語課程思政教學評價的論述主要以思辨探討為主,缺少相應的實證研究,缺乏具有推廣價值的顯性化、可量化評價方式。
思政教育和德育教育具有同源性[9],因此德育理論有向思政教育理論上的可遷移性,且以德育教育的評價方式指導課程思政建設有著一定的現實意義。美國學者Rest 所建立的DIT 評價方式是德育教育中一個里程碑式的發現。該評價方式以Kolhberg“三水平、六階段”的道德發展階段理論為基礎[10],以“道德兩難故事”為基本方法,通過將代表各發展階段的典型觀點呈現給被試者,讓他們對觀點加以評判,實現了道德發展水平測驗的客觀性、便利性和標準化,且呈現較高信度和效度[11]。該評價方法突破了具有抽象性和復雜性的道德認知發展在測評上的難度,目前已被廣泛地運用于40 多個國家和地區的道德發展水平測驗中[12-15]。
西方對于DIT 的論證和應用起步較早,研究也較深入。其中,學者們發現高等教育中不同學科的學生道德水平發展呈現差異,因此建議將DIT 和具體的學科結合,并提出了具體學科專業背景下的道德發展測驗量表[12],這些研究為該評價方式在特定學科專業背景下的探索和改進奠定了基礎。
我國DIT 相關研究尚在起步階段,用它研究道德認知和發展的學者并不多。迄今為止,研究焦點主要包括:①該評價方式的理論介紹[16-18],②應用于信度效度研究[19],③不同年齡段道德發展分析的實證研究[20,21],④具體學科和專業(以醫學為主)的應用研究[22]。
值得注意的是,DIT主要被用于特定群體道德發展水平的分析,并未從外語課程思政建設的角度,探討德育與思政教育理論上的同源性。同時,該測驗在道德困境故事的設置上存在文化差異[19],且主要運用于商務、醫學等倫理道德沖突較為明顯的學科,但是在外語類學科的應用研究還未出現,更無結合外語課程思政建設的相關要求進行調整改進的相關研究。鑒于此,如何在參考DIT 評價方式的基礎上,設計出既符合我國國情和意識形態,又能對應不同學科和專業思政建設要求的評價方式顯得尤為重要。
基于思政教育和德育的同源性以及DIT 的理論和模式,本研究構建了外語課程思政教學評價理論和評價模式。首先,將Kolhberg 的道德發展水平模型遷移到外語課程思政教學評價理論,并豐富其內涵。具體說來,“三水平、六階段”道德發展水平理論的后三個階段——個體在現有社會規則和法律的基礎上形成的道德認知和價值觀,以及對集體、社會如何更好發展的理念,較好地契合了《高等學校課程思政建設指導綱要》中規定的憲法法治意識、政治認同、家國情懷、文化素養、道德修養等培養目標。由此建立了思想政治素質發展階段理論(表1)。

表1 思想政治素質發展階段理論
此外,DIT中用到的“困境故事”討論法是道德教育和道德測評中的有效方式,這是由于人們面對相沖突的價值觀時,會更加積極地思考和表達自己的觀點,從而可以有效診斷出個體道德發展水平[23]。本研究在將該測驗遷移到外語課程思政評價時,以“困境故事”討論法為基礎,構建了外語課程思政教學評價模式(圖1),從顯性(語言)和隱性(思想政治素質)兩個維度出發,挖掘素材并創設情境,圍繞困境故事閱讀、預設觀點評判、主觀思想表達三個階段展開,實現多維育人目標協同的融合性評價。

圖1 基于DIT的外語課程思政教學評價模式設計
目前,有關外語課程思政教學評價設計的研究較少,該項研究工作十分迫切。外語課程思政教學評價方式的科學性和有效性,需要經相關教學實踐進行驗證和提升,并結合各方反饋和學科發展,不斷提升其理論和實踐價值。為此,設計了如下的實證研究。
首先,依據上述外語課程思政教學評價理論和評價路徑,結合外語學科特點和培養目標,設計針對具體外語課程的思政教學效果評價方式。其次,將該評價方式運用于課程教學中,收集并分析前測、即時后測、延時后測三個階段的定性及定量數據,驗證其信度和效度,分析學生的認知狀況,最終構建出可運用于外語課程教學中形成性評價和終結性評價相統一的外語課程思政教學評價方式(圖2)。

圖2 基于DIT的外語課程思政教學評價方式的過程化設計
以筆者所在高校英語專業一年級開設的一門英語知識與技能模塊必修課程——“英語閱讀(一)”課程為例,進行評價方式設計和應用研究。課程教材選用上海外語教育出版社出版的《泛讀教程1(第二版)》,課程旨在培養學生的閱讀興趣和良好的閱讀習慣,擴大詞匯量,拓寬文化視野,提高人文素質,使學生循序漸進地掌握和運用各種閱讀技能,提高捕捉信息的能力,并提高綜合概括和分析推理、判斷及解決問題的能力。同時,在教學中融合思政教學內容,幫助學生建立對人生價值的正確認識和積極向上的人生觀、價值觀,養成對國家、民族、社會和他人的責任感和奉獻精神。課程歷時16周,每周2學時,共32 學時,分為兩個教學班,選取80 名學生作為研究對象。
經過2022 年第一學期的教學和思政教學效果評價方式的使用,借助在線問卷調查和測評平臺——“問卷星”,收集了80 名學生的前測、即時后測和延時后測的過程化測試結果,并運用SPSS 26.0軟件進行信度和效度分析。另外,對測試主觀論述部分的數據進行主題分析和歸納整理。驗證觀點評判和主觀論述的一致性,定量和定性結果互證以達到數據的真實有效。
其中,為了實現定性數據對定量數據的驗證,借鑒了另一權威的道德認知發展測評方法——“道德判斷訪談(Moral Judgement Interview)”的數據分析方法。該方法由Kolhberg 創立,圍繞困境問題進行訪談,結果經過標準問題評分(Standard Issue Scoring)的分析步驟轉化為道德發展階段類型指標,該方法通過具體而明確的評價框架,盡可能地降低評判者的主觀性,具有較好的實操性[24]。運用該方法將被試針對困境故事的主觀論述數據轉換為定量數據,首先將每個困境故事均劃分為兩個核心問題(具體劃分方式見表2);其次,參考標準問題評分中的評判標準,對被試回答中關于兩個核心問題的敘述進行思政素質發展階段的匹配;最后,參照“道德判斷訪談”總階段(Global Stage)的計算方法,綜合得出五個故事的總分,即被試的思想政治素質發展階段類型指標(Stage-typing Index)。

表2 “英語閱讀(一)”課程思政評價方式困境故事設置
困境故事分為假設的困境故事和真實的困境故事,前者可以反映出被試者做出道德推理的認知結構[11],但具有過于抽象和局限性的缺點。后者更貼近人們真實的生活環境,在保證效度的前提下,能夠反映出人們真實生活中面對道德困境的觀點和態度[25]。評價方式沿用了DIT的困境故事設計,選取了5 個思政困境故事,包含假設和真實兩種困境故事。其中,故事2“求職困境(CV Dilemma)”改編自Lotto,Manfrinati 和Sarlo 創作的道德困境[26],故事5“疫苗困境(Vaccine Policy Dilemma)改 編 自Conway 和Gawronski 創作的道德困境[27]。而故事1、3、4 均提煉于與英語專業學生相關的真實生活和工作場景。困境故事的描述見表2。
評價方式的量表部分在問題設置方法上與DIT 類似,主要分為三個部分。第一部分為對故事主人公的行為肯定與否的直觀評判,第二部分題目是對12 個體現不同階段思政認知水平的問題通過運用李克特五級量表進行重要性判斷(最重要、比較重要、一般重要、比較不重要、完全不重要),這些題目基本對應于科爾伯格道德發展理論中的第二到第六階段的水平(因被試均為本科生,超過了第一階段所處年齡段,因此沒有列出第一階段)。第三部分是針對上一部分12 個問題中選擇最重要的4 個,并進行排序。以故事5 為例(表3),第二部分題目設置情況如表4 所示。其中,M 題是無意義題目,用于檢驗被試是否正確理解問題和測試要求,而不是隨機地或按照措辭語義的復雜性來選擇答案。

表3 故事5疫苗困境故事

表4 故事5疫苗困境第二部分題目設置及對應思想政治素質發展階段
評價方式量表部分基本沿用DIT 對被試者結果的賦分規則。在分析測試結果時,將第三部分題目中的排序結果進行賦分。排在第一重要的記4 分,排在第二重要的記3 分,排在第三重要和第四重要的分別得2分和1分。
但在評價理論包含的具體階段上,DIT 與外語課程思政教學評價方式略有不同。前者的計算結果P 值側重于測評后習俗圖式的發展水平,即科爾伯格道德發展理論的第五、六階段,公式表示為而外語課程思政教學評價理論增加了第四階段,因此在計算最終分值時,將5 個故事階段四、五、六的分數相加除以總分(5 個故事50 分)再乘以100,得出被試者的最終分數,命名為S 值,公式表示為另外,規定若被試五個故事總M 值大于5 時,則說明無意義題目的分數過高,認為該測試結果無效。
例如,在疫苗困境中,某一被試把第2 題列為第一重要,第3題列為第二重要,第9題列為第三重要,第5題列為第四重要,則該被試的得分情況如表5所示。因此在疫苗困境故事中,該被試的M 值為2,S值得分為

表5 某被試在故事5疫苗困境中得分情況
根據評價路徑設計,開放性問題環節旨在為學生提供主觀思想表達的空間,問題圍繞困境故事、測驗設計和課程思政教學展開,如表6 所示。通過語言的輸出,檢驗了學生的語言表達能力和思辨思維。同時,也能夠反映出被試對思政困境的觀點態度,與S 值互為驗證,準確體現其思想政治素質發展情況。學生對評價方式和教學環節的反饋對完善外語課程思政教學評價方式設計和課程思政教學工作具有重要意義。

表6 外語課程思政教學評價方式開放性問題設置
信度研究旨在衡量測量工具的精準性、穩定性和一致性,表示一個數據反復測量的近似程度,常用相關系數表示。在測量中,通常使用Cronbach’s α作為考核指標,該指標需在SPSS 軟件中進行數量演算獲得。在本研究中,由于量表部分的S 值來源于排序數據,而排序的自比性決定了量表的內部一致性無法在單獨的問題層面進行探討,而應在兩難故事的層面進行驗證[28]。因此信度分析結果顯示,Cronbach’s α 系數為0.786,該值結果滿足DIT 在其他相關實證研究中的信度范圍0.70~0.80,符合道德認知測驗的信度要求[19]。
在參與者信度方面,80 名被試中有63 名同學通過了參與者信度篩查(79%)。刪去的17名學生的結果中,有2 名學生沒有按照測試要求,在同一重要性層級中放入兩項,其余15 名同學的M 值大于5,反映出其并未準確理解兩難故事及問題或單純追求看似“高級”的表述,而忽略了問題真正的含義。
效度研究用以衡量測量工具或手段能夠準確測出所需測量的事物的程度,可以解釋量表的合理性和完整性。其中,內容效度運用專家判斷法進行判定。兩位我國課程思政教學研究專家經過審核和討論,一致認為該量表能夠較好地反映課程思政建設培養的各項目標,具有較好的內容效度。此外,本研究依據Rest等人提出的DIT效度標準[11],驗證了其中的兩條標準,分別是:(1)對課程思政(道德)教育干預的敏感性;(2)發展階段越高思想政治(道德)認知能力更好。
首先,對63 名學生三次評價結果S 值進行單因素重復測量方差分析,用以檢驗學生在三個不同階段的課程思政學習效果是否具有顯著性差異,進而反映該評價方式對課程思政教學干預的敏感性。分析顯示,數據通過了正態分布假設,但拒絕了球形假設(球形檢驗的顯著水平小于0.05)。由此,分析選用了Greenhouse-Geisser 方法矯正后的F 值。描述統計表明,三個階段的課程思政教學效果評價得分呈現先增長再略微下降的趨勢,如表7 所示。同時,表8 顯示了被試內效應檢驗結果達到了顯著水平。通過Greenhouse-Geisser 方法矯正后,F(1.043,64.685)=105.971,P<0.05,表明不同階段課程思政教學效果評價得分呈現顯著性差異。效應量η2p=0.631,按照Cohen 的標準[29],效應量大,說明課程思政內容的學習對課程思政教學評價得分變化的影響顯著。

表7 三個階段學生S值的描述統計

表8 三個階段學生S值主體內效應檢驗
進一步通過主體內對比檢驗(表9)可以發現,前測(級別1)和即時后測(級別2)差異顯著,F(1,62)=108.312,P<0.05,η2p=0.636,效應量大,表明課程思政教學對課程思政教學評價得分影響顯著。而即時后測和延時后測(級別3)雖然均值和標準差不同(均值分別為78.8254 和78.6984,標準差分別為6.98048和6.76002),但是差異沒有顯著性,F(1,62)=2.033,P=0.159,說明課程思政教學對評價結果的作用較穩定。

表9 三個階段學生S值主體內對比檢驗
綜上所述,本研究中課程思政教學有效提高了被試學生課程思政教學效果評價的S 值得分,且該影響較為穩定,表明該外語課程思政教學效果評價方式具有教育干預的敏感性,滿足第一條效度標準。
關于第二條效度標準,Rest 認為如果更高的評價結果代表的思維是充分發展的和高級的,那么該評價結果應與其他發展測量的結果相關[30]。因此,本研究對定量、定性兩部分數據用兩種分析方法分別得到S 值與思想政治素質發展類型指標,并比較兩組數據的相關性。如果相關性高,說明兩種測量結果相關,則驗證了第二條效度標準。本研究首先對兩個變量作散點圖(圖3),這些散點聚集在一起,自左下角至右上角延伸,可以直觀地判斷二者具有線性關系。進而使用Pearson 相關分析方法探討二者之間的關系,分析結果如表10 所示,由此可見,r=0.916,p=0.000,r2=0.839,兩個變量之間存在顯著的正相關關系,即S 值隨思想政治素質發展類型指標的增加而提高,而思想政治素質發展類型指標反映了個體思想政治認知能力,因此越高的S 值意味著個體的思想政治認知能力發展越充分。

圖3 “發展階段類型指標”與“S值”的散點圖

表10 “發展階段類型指標”與“S值”的相關分析結果
如前所述,困境故事的反思論述結果與量表部分反映出的思想政治素質發展呈正相關關系,但分析發現,一部分同學(25%)的發展階段類型指標值低于量表第三部分所選的最重要表述所對應的發展階段值。Rest 解釋這種現象為產出型任務和識別型任務的差別,他認為主觀陳述屬于產出型任務,選擇重要性表述屬于識別型任務,前者對認知和語言能力的要求更高[30]。本研究中,出現上述現象的比例并不高,這可能是由于課程思政教學環節中對相關內容的學習和探討為學生的語言和認知能力奠定了基礎,有助于提高其在產出型任務中的表現。
在梳理學生對評價方式設置以及課程思政教學的觀點時,發現學生的總體態度較為積極,同時也呈現出一些偏差和不同觀點。首先,在困境故事和題目的設置方面,絕大多數學生(87%)都表達了贊同和肯定。其中,11%的同學表示他們通過閱讀困境故事和對應陳述,學到了對應主題下的語言表達,體現了該評價方式在語言層面所發揮的作用。另外,44%的同學提到了故事的選擇貼近生活,16%的同學認為這些困境故事有助于他們關注社會和國家的熱點話題和重要議題,將個人發展與社會、國家的發展聯系在一起。同時,一部分同學(37%)在回答中提到了批判性思維的培養,他們表示對這些故事和題目的思考讓他們不再非黑即白地看待事物,學會從多個角度分析問題。但是,有10%的學生表達了對該評價方式的消極態度。其中,3%的同學認為題目有些多,完成起來比較耗時。7%的同學表示他們不能很好地理解故事和題目的設置,導致他們不能很好地完成測試。而這些同學在主觀部分的語言表述上都或多或少地出現了一些拼寫或語法錯誤,由此可知,語言能力不足會影響評價結果的準確性。
在對課程思政的教學上,學生們對困境問題討論法普遍表示認可(94%),他們認為使用英語討論可以提高自身的語言表達能力,自由的討論可以激發出不同的觀點,拓寬他們的視野和看待問題的視角,訓練邏輯思維能力。同時,也有同學為課程思政教學提供了建議(19%),他們認為現有的課堂教學受限于時間和教學安排,無法讓更多的同學表達自己的觀點,因此期待能夠有更豐富的教學形式,讓更多的同學參與進來,圍繞更多貼近他們生活的和他們關心的主題開展活動。
以DIT 及道德發展階段理論為基礎,進行了外語課程思政教學效果評價方式構建,并針對具體的閱讀課程進行設計與運用,進而使用信度分析、效度檢驗和主題分析等方法,對評價模式和效果進行驗證,研究結果如下。
第一,構建的外語課程思政教學效果評價方式具有較高的信度和效度,滿足了Rest 確定的兩條重要的效度標準。該評價方式能夠有效地反映出學生的思想政治素質的發展情況,在課程思政教學前后評價結果變化顯著且穩定,說明課程思政教育在學生的思想政治素質發展中起重要作用。同時,該評價方式能夠反映出學生思想政治認知水平的發展狀況,評價結果S值越高,說明思想政治認知水平越高。
第二,學生對該評價方式認可度較高。從學生的主觀反饋中可以看出,評價實現了語言和思想政治兩個維度的評價,既檢驗了學生的英語閱讀理解能力和表達能力,又評價了面對思政困境的思辨能力和批判性思維。學生在完成題目的過程中,也積累了相關的語言表達,關注到了熱點新聞背后的真實困境,真正形成以評促學、完善課程思政評價與教學的閉環路徑,實現多維育人目標協同的融合性評價。
第三,在課程思政的課堂教學方面,困境故事討論法能夠借助學生感興趣的兩難困境,有效調動學生思政學習的積極性。但是在具體的話題選擇上,應引導學生集思廣益,提供更多更豐富生動的思政場景。同時,可以借助教育技術增加教學形式的豐富性,構建多模態教學資源,進行混合式教學實踐。例如智慧教室的使用能夠以虛擬現實技術營造真實化的場景,達到“境身合一”的學習情境,實現全景化學習[31]。此外,針對不同語言水平的學生,教師要注重差異性教學,采用多樣化的教學方法科學地設計教學活動,在評價前為學生搭建好語言和認知的腳手架,保證評價能夠準確地反映出課程思政的教學效果。
本研究以英語閱讀課程為例,構建了以“困境故事”討論法為核心、基于DIT 的外語課程思政教學評價方式。該評價方式從語言和思政兩個維度出發,能有效衡量出學生的思想政治素質發展狀況,實現了隱性思政元素的顯性化評價。在教學實踐中將其運用于形成性評價和終結性評價中,有助于評估學生課程思政學習情況,幫助教師完善課程思政教學方法,真正實現以評促學、以評促教。另外,本研究所建立的理論基礎和模式具有不同課程的可遷移性,且計分方式直觀易操作,外語教師可結合所授外語類課程的目標和特征,設計適用于具體課程的評價方式,優化外語課程思政教學評價的實踐和研究。