李莉文黃永亮
(1. 北京外國語大學 教務處,北京 100089;2.河北師范大學 外國語學院,河北 石家莊 050024)
《特爾斐報告》(TheDelphiReport)是指《批判性思維——以教育評估和教學為目的的專家共識聲明》(CriticalThinking:AStatementofExpertConsensusforPurposesofEducationalAssessmentandInstruction),因該成果的研究過程始終采用特爾斐研究法(Delphi method)而得名。有觀點認為,《特爾斐報告》中批判性思維的界定是兩個最具影響的批判性思維定義之一(武宏志,2004),是批判性思維研究的“里程碑”(Davies et al.,2015:10),對世界范圍內的教育機構、政府部門、商業團體等都有著深遠的影響(Facione,2015)。
《特爾斐報告》中批判性思維的定義大致是21世紀初引入我國教育領域的。岳曉東(2000)在考察西方學者對批判性思維的認識及其研究時,介紹了《特爾斐報告》中批判性思維的界定及內涵。洪淑媛(2003)在介紹西方批判性思維概念時,簡單提及了《特爾斐報告》中批判性思維的定義。武宏志(2004)在介紹《特爾斐報告》中批判性思維的界定和內涵的同時,簡要提及了《特爾斐報告》研制所運用的特爾斐研究法。《特爾斐報告》中批判性思維的定義對我國外語教育領域的影響尤為深刻,批判性思維能力的培養已在外語教育中占有重要位置。以文秋芳教授為代表的學者,將《特爾斐報告》中批判性思維界定的認知能力(cognitive skills)和情感特質(affective dispositions)“雙維結構模型”(文秋芳,2008:30)作為重要的理論支撐,構建了高層次思維能力層級理論模型(文秋芳,2008),以及修訂后的思辨能力層級理論模型(文秋芳 等,2009;文秋芳,2012),并據此進行了歷時十余年的系列研究。我國《普通高等學校本科專業類教學質量國家標準》(教育部高等學校教學指導委員會)(2018)和《普通高等學校本科外國語言文學類專業教學指南》(教育部高等學校外國語言文學類專業教學指導委員會)(2020)以《特爾斐報告》中批判性思維的界定為藍本,從認知能力和情感特質兩個維度定義思辨能力,將其作為我國外國語言文學類教學質量評價的關鍵指標和該專業類學生培養的關鍵能力。馬利紅(2021)簡要介紹了特爾斐研究法,采用此法構建了外語寫作思辨能力評價指標。然而,目前國內尚未見《特爾斐報告》的專項研究,亦未見對特爾斐研究法的專門探討。因此,有必要全面、清晰地了解《特爾斐報告》的目標、共識和方法,這也有助于30余年前發布的《特爾斐報告》更好地服務于我國外語教育事業。
《特爾斐報告》是隨著北美批判性思維運動的深入開展而出現的研究成果。為了能夠較準確地理解《特爾斐報告》中批判性思維界定的專家共識,我們首先要了解報告研制的背景。
依據理查德·保羅(Richard Paul)(2011)的考察,批判性思維的研究可分為三個階段:(1)20世紀70年代哲學家主導的形式邏輯和非形式邏輯階段,該階段聚焦論證邏輯結構的確定和論證過程的評價;(2)始于20世紀80年代教育領域專家廣泛參與的、關注學習者個體發展的階段,該階段逐漸聚焦批判性思維與態度、情感、直覺、創造性等個體特征的關系,開始關注學習者自身;(3)21世紀方興未艾的批判性思維理論發展的階段,該階段側重批判性思維理論的建構。上述階段既相對獨立,又不乏重疊之處。
《特爾斐報告》的研制過程正值批判性思維研究開始關注學習者個體發展的階段,該階段迎來了批判性思維研究的新勢頭:大學開設批判性思維課程,中小學課程規劃中設置批判性思維教育目標,批判性思維教材和教師隊伍的批判性思維培訓項目增長迅速。到80年代末,批判性思維已徹底告別“作坊手工業”時代(Facione,1990:2)。隨著批判性思維運動的蓬勃開展,北美教育領域對批判性思維研究萌生了新的期待。這主要表現為:(1)批判性思維教學應聚焦學習者如何解決問題及其推理過程;(2)批判性思維教育應關注優秀的批判性思維者應具備的認知技能和情感特質;(3)批判性思維評測應側重學習者得出答案的批判性思維過程的質量,而非僅僅停留在問題的答案正確與否(Facione,1990)。也就是說,要厘清批判性思維的界定、批判性思維教育涵蓋的典型技能與特質、批判性思維教學的有效途徑,以及如何在更大的范圍內評測批判性思維。為此,《特爾斐報告》將研制目標設定為:提供一個“足夠清晰、準確、豐富的批判性思維界定”(Facione,1990:6),以此“指導各學段的批判性思維測評與相關課程的開發”(Facione,1990:6)。為了達成上述目標,美國哲學學會下設的大學入學前階段哲學委員會(The Committee on Pre-College Philosophy)于1987年委托彼得·費希萬(Peter A. Facione)教授牽頭組織哲學、教育、社會科學和自然科學等四個領域的批判性思維專家(1)逾半數參與調研的批判性思維專家來自哲學研究領域,占比52%;其余三個領域的專家依次為教育領域專家(占比22%)、社會科學領域專家(占比20%)和自然科學領域專家(占比6%)(Facione,1990:34)。這也從側面反映出批判性思維運動發展到了哲學領域專家主導、教育領域專家較廣泛參與的階段。,就批判性思維及其教學與測評展開了系統的調查研究。該研究于1988年2月啟動,1989年11月結束,歷時近兩年,整個研究過程始終采用特爾斐研究法。
《特爾斐報告》是1990年發布的。報告由批判性思維運動與批判性思維測評、研究方法與研究目的、批判性思維的認知技能維度、批判性思維的特質維度、批判性思維教學與測評的相關建議、特爾斐研究專家團隊成員等六個章節,以及批判性思維商用測評工具、側重批判性思維測評的參考文獻、《特爾斐報告》研究過程中的往來信件等三則附錄構成。
《特爾斐報告》專門列出了七個相關表格,其中包括四個專家共識意見表,分別是表1“關于批判性思維和理想批判性思維者的共識聲明”、表3“批判性思維認知技能及其子技能的共識清單”、表4“核心批判性思維技能及其子技能的共識描述”和表6“批判性思維技能教學與評測的共識聲明”。報告也呈現了表2“項目的研究過程”和表7“參與調查研究的專家組成員”。報告還列出了表5“批判性思維的情感特質”,涵蓋“對待生命和生活的總體方式”和“對待特定事件、疑問和難題的方式”兩個方面(Facione,1990:25)。需要特別指出的是,報告描述表5并未使用“共識”這一表述。也就是說,表5并非專家共識,這一點得到了《特爾斐報告》牽頭人費希萬教授的確認(2)費希萬教授在2020年8月19日的確認郵件中指出:“With regard to Table 5, you would be correct in thinking that the experts did not reach consensus.”。上述專家共識意見表中,表1“關于批判性思維和理想批判性思維者的共識聲明”是我國外語教育領域關注的焦點。

表1 關于批判性思維和理想批判性思維者的共識聲明(Consensus Statement Regarding Critical Thinking and The Ideal Critical Thinker)(Facione,1990:3)(3) 表2—表7原文請參見Critical Thinking:A Statement of Expert Consensus for Purposes of Educational Assessment and Instruction. Research Findings and Recommendations(Facione, 1990:7-35)。
從表1可見,《特爾斐報告》中批判性思維的界定是明確的,且為專家共識。依據專家共識意見,“批判性思維是有目的的、自我調整性的判斷”(Facione,1990:3)。《特爾斐報告》指出:“這一判斷可促成對其所依據的論據、概念、方法、標準或背景等因素加以解釋、分析、評價、推論與闡釋。”(Facione,1990:3)專家共識意見也肯定了批判性思維至關重要的作用,認為“批判性思維是必不可少的探究工具。就其自身而論,批判性思維是教育中的解放力量,為人們的個人生活和社會生活提供強力支撐。批判性思維雖非優秀思維的代稱,但它確是一種人類普遍存在、自我矯正性的現象”(Facione,1990:3)。專家共識意見還認為,批判性思維包括解釋、分析、評價、推論、闡釋和自我調整等六項核心認知技能以及相應的若干子技能。《特爾斐報告》對上述核心技能及其子技能做了較為詳細的描述,且明確指出這是專家共識意見,這也可以從表3“批判性思維認知技能及其子技能的共識清單”(Facione,1990:12)和表4“核心批判性思維技能及其子技能的共識描述”(Facione,1990:13)的表述中直觀地看出來。可見,《特爾斐報告》中批判性思維界定的專家共識未提及認知技能和情感特質的“雙維結構”。
《特爾斐報告》中的表1之后,有這樣一句表述:“如表1所示,該調查的一個重要結果是批判性思維專家組明確從認知技能和情感特質兩個維度來界定批判性思維。”(Facione,1990:3)《特爾斐報告》第三、四章還分別以“批判性思維的認知技能維度”(Facione,1990:8)和“批判性思維的特質維度”(Facione,1990:20)為標題進行闡述。據初步統計,整個報告中“批判性思維的(認知)技能維度”的表述出現約20次,“批判性思維的特質維度”的表述出現約15次。這或許是外語學界認為《特爾斐報告》中批判性思維界定中認知技能和情感特質的“雙維結構”是專家共識的主要原因。
事實上,《特爾斐報告》(Facione,1990:25)指出,“多數(61%)專家將上述情感特質視作批判性思維界定的組成部分”,而其余專家則堅持情感特質并不在批判性思維界定的范疇之內。《特爾斐報告》也指出,“超過83%的專家組成員就優秀的批判性思維者可能具備上述情感特質達成了共識”(4)依據亞里什·達加尼(Jaris S.Dajani)、邁克爾·辛考夫(Michael Z. Sincoff)和韋恩·塔利(Wayne K. Talley)(1979:85)的觀點,共識是指達到完全一致,未達到完全一致卻超過了半數則為多數。從這個意義上講,情感特質屬于批判性思維者也非共識。此外,《特爾斐報告》明確指出,即使在同意批判性思維具有兩個維度的專家中,約三分之一的專家認為應該采用“特質”而非“情感特質”來表述這一概念(Facione,1990:21)。(Facione,1990:25)。換句話說,情感特質屬于批判性思維者只是多數專家的意見,批判性思維界定中的情感特質維度也不是專家共識,這一點也得到了費希萬教授的確認(5)費希萬教授在2020年8月19日的確認郵件中指出:“The majority regarded the dispositions as vitally important personal attributes. But the majority did not think that these dispositional elements should be part of the definition of ‘critical thinking’.”。
情感特質屬于批判性思維者,而非批判性思維。《特爾斐報告》中的表1在批判性思維專家共識之后,詳細列出了理想批判性思維者(the ideal critical thinker)理應具備的諸多特質,認為“培養優秀的批判性思維者就意味著朝著培養上述特質的理想目標而努力”(Facione,1990:3)。而要實現培養優秀批判性思維者的目標,則需“將培養批判性思維技能和培養上述特質結合起來,這些特質能夠持續地萌生真知灼見,也是理性和民主社會之基”(Facione,1990:3)。這既明確了情感特質為批判性思維者所有,又強調了情感特質的重要價值。為此,報告以表格(表5)的形式呈現出優秀批判性思維者所應具備的情感特質。同時,《特爾斐報告》也指出,盡管描述批判性思維中的自我審視和自我修正離不開特質成分,“但是大多數專家更希望將個體特征、思維習慣、態度或情感特質用來描述優秀的批判性思維者的特征”(Facione,1990:20)。這也為情感特質屬于批判性思維者的結論提供了證據支撐。
此外,報告表述的相悖之處也易誤導讀者。例如,報告指出,“專家組就優秀的批判性思維者具備的情感特質清單達成了共識。共識清單請見表5”(Facione,1990:20)。與之相應的表5題名則赫然變成了“批判性思維的情感特質”(Facione,1990:25),而非批判性思維者的情感特質。
由此可見,《特爾斐報告》在解讀批判性思維界定時存在歧義(6)這一點得到了費希萬教授的認同。費希萬教授在2020年8月27日的確認郵件中指出:“You are correct to see the ambiguity in the Delphi Report at a purely theoretical level.”,甚至存在相悖之處,這尤其表現在報告理想批判性思維者的情感特質的表述中,給人們正確理解報告中批判性思維的內涵制造了困難,使得不少研究者對批判性思維界定專家共識的理解出現了偏差,誤以為認知技能和情感特質兩個維度均為專家共識意見。
有觀點認為,《特爾斐報告》研制的參與專家人數多、研究過程持續時間長、討論輪次多,研究結論是專家組的集體智慧,因此,《特爾斐報告》中批判性思維定義中的認知技能界定“更具科學性和權威性”(文秋芳,2008:30)、“肯定更具普遍性”(文秋芳 等,2009:41),《特爾斐報告》中批判性思維的定義“頗具權威性”(孫有中,2011:52)。事實上,要相對客觀地評價《特爾斐報告》中的批判性思維定義以及《特爾斐報告》的定位,需要我們更為深入地認識特爾斐研究法。
如前所述,《特爾斐報告》是通過特爾斐研究法完成的。特爾斐研究法是指“通過專家組成員深入地回答系列調查問題與可控性意見反饋交互進行的方式,旨在就調查問題獲得最可靠的專家意見共識的研究方法”(Dalkeyet al.,1963:458)。該方法是通過個人訪談或問卷調查的方式、并就調查問題多次單獨征詢專家組成員的意見而完成的。特爾斐研究法的實施流程大致如下:(1)確定研究目標和研究問題,制定問題征詢單;(2)選定相關專家并向專家組成員發出問題征詢單;(3)收集、分析、評估專家意見,依據總結出的專家意見精心設計下一輪次的可控性反饋并發給專家組成員。如此迭代,達到預期目標后,調查終止。特爾斐研究法的實施過程主要具有匿名性、可控性和統計性三個基本特點(Dalkey,1969)。其中,匿名性體現在調查通過問卷或其他正式交流渠道進行,避免專家組成員直接相互見面。可控性是指將前一輪次的調查結果進行總結之后,再反饋給專家組成員進行下一輪次的調查。這里反饋給專家組成員的總結意見也是匿名的。統計性則體現為研究者在調查的最后一輪匯總專家組成員的意見,經過數據統計后,最終報告專家意見的相關數據,確保專家組所有成員的意見得以呈現。特爾斐研究法實施過程中體現出的上述特點,有助于“最大限度地降低專家組主導成員、與研究的無關交流和來自專家組趨向一致意見的壓力等因素帶來的偏誤影響”(Dalkey,1969:408)。
特爾斐研究法旨在通過結構化的小組交流解決復雜的問題(Linstone et al.,1975)。《特爾斐報告》涉及的批判性思維問題即為復雜的問題,這體現在參與研究的專家數量、研究時長、函詢次數和討論輪數等方面。參與《特爾斐報告》撰寫的首批專家組成員是由大學入學前階段哲學委員會推薦給項目牽頭人費希萬教授的。首批專家組成員又推薦了第二批相關專家,最終共46位被業界廣泛認可的批判性思維教學專家、批判性思維測評專家和批判性思維理論研究專家組成了專家組。《特爾斐報告》展示了專家組采用特爾斐研究法歷時近兩年,借助16次函詢,歷經六輪數回合而達成的書面“共識”意見。
特爾斐研究法自1948年用于提高賽馬結果預測的準確率(Pill,1971)以來,至今已有逾70年的歷史。特爾斐研究法采用集思廣益的方式,“旨在解決現有知識暫無法明確解決的問題”(Dalkey,1969:408)。該方法主要靠的是專家組成員的已有經驗和直覺判斷。特爾斐研究法采用匿名的方式讓專家組成員間的交流成為可控性互動,意在避免相左觀點通過專家圓桌討論等傳統方式直接交鋒帶來的弊端,有助于專家進行獨立思考,也有助于專家提出深思熟慮的意見(Dalkeyet al.,1963)。同時,特爾斐研究法是一種理論依據顯而易見、流程系統易于理解、快捷、方便、成本低的研究方法,可用于幾乎任何領域來征求專家意見,確定專家共識(Sackman,1976)。不過,特爾斐研究法的使用是一個極為復雜且要求很高的過程。首先,在使用特爾斐研究法時要特別注意調查問卷的設計、專家組成員的選擇,以及確保專家答復方式的有效性、防止出現專家光環效應等技術問題(Sackman,1976)。以調查問卷的設計為例。要設計調查問卷,首先要完整回顧相關文獻、檢驗構念效度,確保所選問題的系統性,并對調查問題進行試測和項目分析。其次,在各輪次給專家組的反饋信息應避免研究者的個人偏好(Dalkeyet et al., 1963)。反饋信息主要包括兩類:一是備好的專家組某一成員事先要求準備的資料,二是專家組成員在研究過程中所建議的潛在相關因素。對于后者,反饋信息往往很難做到真正隱藏其他專家的真實觀點,而僅展示不帶任何傾向性的考慮因素。實際上,特爾斐研究法是一把“雙刃劍”,因為該方法“在收集專家組集體意見的同時,也沖淡了在特定問題研究領域真正的專家的意見”(Pill,1971:62)。特爾斐研究法的匿名性也是如此。哈羅德·薩克曼(Harold Sackman)(1976:445)明確指出:“就專家組、研究者和研究結果的使用者而言,研究過程采用專家匿名的方式可能導致專家組成員個體失責。專家擇選程序中的匿名方式和相關的個體失責可能導致精英主義,也可能導致蓄意操縱研究結果從而滿足既定利益。”由此可見,匿名性的潛在風險亦不容小覷。同時,對于專家組作答各種問題和個別專家或少數專家僅作答那些他們深入研究的問題,哪種方式的效果更佳,依然沒有答案(Pill,1971)。
如何檢測特爾斐研究結果的有效性也是一個關鍵問題。亞里什·達加尼、邁克爾·辛考夫和韋恩·塔利(1979)較深入地探討了如何依據穩定性和一致性標準終止特爾斐研究,提出了采用卡方檢驗的方式檢測各輪次之間專家集體穩定性的方法。威爾基·查芬(Wilkie W.Chaffin)和韋恩·塔利(Wayne K.Talley)(1980)在此基礎上進行了推進性研究,他們區分了專家集體穩定性和個體穩定性,聚焦于個體穩定性的檢測。上述研究成果為特爾斐研究有效性的驗證提供了可行性方案。
從《特爾斐報告》所呈現的內容來看,《特爾斐報告》在遵循上述特爾斐研究法使用注意事項和保障研究結果有效性兩個方面仍存在進一步完善的空間。同時,《特爾斐報告》“研究過程持續時間長”受限于當時“蝸牛式的”(Facione,1990:63)書面信函往來的通信條件。費希萬教授指出,部分專家組成員尚未使用電子郵件,研究僅能通過信件往來的方式進行(7)從《特爾斐報告》的附錄三(Facione,1990:63)來看,確定地講,費希萬教授本人當時也不會使用電子郵件,第二輪討論采用書面信函和電話兩種方式進行。。若在當前條件下進行該研究,或許僅需幾個月就能完成當時兩年才能完成的工作(8)費希萬教授在2020年8月19日的確認郵件中指出:“Back in the late 1980’s, we had to use paper mail since some on the panel of experts did not have access to email. I and my graduate research assistant required two years to accomplish something that today might take only a few months. ”。從《特爾斐報告》研制的過程可以看出,研究的前兩輪旨在組建專家組,第三、四輪和第五輪的第一回合聚焦認知技能,第五輪第二回合討論(情感)特質,第三回合側重有關認知技能的教學和測評的建議,第六輪邀請專家組成員就報告初稿給出反饋(Facione,1990:7)。因此,該報告“討論輪次多”的說服力也值得商榷。
此外,學界對于《特爾斐報告》的關注度差別較大。我國外語教育領域關注的焦點在于《特爾斐報告》中的批判性思維界定、認知技能及其子技能和情感特質,卻未見《特爾斐報告》相關的專項研究,亦未見對報告所用特爾斐研究法的研究成果。國外教育領域除了《特爾斐報告》牽頭人費希萬教授始終關注優秀批判性思維者的認知技能和情感特質的測評之外,報告研制專家組46位成員中,僅有保羅(2011)、戴維·希契科克(David Hitchcock, 2017)等簡要提及報告中的批判性思維界定,未見其余成員就報告研究或特爾斐研究法的相關著述。因此,上述現狀也從側面為《特爾斐報告》定位的重新認識提供了佐證。
在重新認識特爾斐研究法的基礎上,相對客觀地看待《特爾斐報告》,準確理解《特爾斐報告》中的專家共識,尤其是批判性思維界定的專家共識,有助于更加深刻地認識《普通高等學校本科專業類教學質量國家標準》中的相關指標,認真落實《普通高等學校本科外國語言文學類專業教學指南》中的相關培養任務,進而助益外語學習者運用批判性思維“理解、掌握和吸收文化現象背后的思想和價值內涵”(姜鋒 等,2020:29),恰當處理全球視野和國家意識二者間的關系(陳新仁,2020),更好地“推動中國文化、學術、思想和主張的對外表達”(寧琦,2020:14)。
通過考察《特爾斐報告》文本、報告的研制背景、專家組成員的相關論著以及與報告牽頭人的電子郵件核實,我們能夠明確的是,批判性思維界定中的認知技能和情感特質的“雙維結構”不是《特爾斐報告》中的專家共識,這一點得到了費希萬教授本人的確認。認知技能和情感特質雖非批判性思維界定的兩個維度,二者卻可以統一到通過教育教學培養優秀的批判性思維者的軌道上來。換句話說,只有將認知技能和情感特質的培養結合起來,才有可能培養出優秀的批判性思維者。這既是《特爾斐報告》中的專家共識,也代表了費希萬教授當下的觀點(9)費希萬教授在2020年8月19日的確認郵件中指出:“There is today a strong consensus that to be a strong and successful critical thinker a person must build the skills and cultivate the habits of mind (dispositions). ”。
特爾斐項目組采用特爾斐研究法對批判性思維及其教學與測評進行了研究,發布了《特爾斐報告》。從某種程度上講,在批判性思維研究中采用特爾斐研究法是一種創新性活動。同時,特爾斐研究法的使用過程相當復雜、要求很高,其研究結果還需進行有效性驗證。而《特爾斐報告》未提供遵循該方法使用要求的詳細說明,亦未提供驗證研究結果有效性的相關證據,這或許會在一定程度上影響《特爾斐報告》的科學性和權威性。此外,特爾斐研究法在報告專家組集體意見時,也存在沖淡真正的專家意見之可能。《特爾斐報告》是費希萬教授牽頭組織46位專家歷時近兩年,歷經六輪數回合討論后折中的產物,側重大學生的批判性思維教學與測評(10)費希萬教授在2020年8月29日的確認郵件中指出:“1001ba the goal of the Delphi Research project was to seek expert consensus for purpose of educational instruction and assessment at the college level1001bathe purpose was practical.”,報告中共識的理論原創性則難免受到影響。較為全面地了解特爾斐研究法有助于相對客觀地評價《特爾斐報告》的定位。