


[摘 要] 效度是高考公平性的基礎,也是其存在的法理依據。大學學習成績是高考的重要效度標準。研究分析2068名大學生的高考成績對其大學成績的預測效度。結果發現,高考三大主科均有一定預測效度。英語的效度最好(與專業課均分、畢業論文成績及12門大學課程成績正相關,平均相關系數為0.115),語文次之(與專業課均分、畢業論文成績及8門大學課程成績正相關,平均相關系數為0.097),數學最差(與7門大學課程成績正相關,平均相關系數為0.106)。英語和語文成績能較好地預測專業課成績和以政治思想課為代表的通識課成績。英語對畢業論文成績的影響很可能是通過提高專業課成績而實現,語文則直接影響畢業論文成績,數學成績不能預測專業課和畢業論文成績。
[關鍵詞] 高考成績;大學成績;預測效度;調節的中介效應
[中圖分類號] G424.74 [文獻標識碼] A
[文章編號] 1673—1654(2025)02—025—007
一、問題提出
考試的質量主要通過其信度(reliability,考試分數的穩定性和可靠性)和效度(validity,考試分數的有效性)來衡量[1]。效度反映了考試能否真正測量到考生的潛在能力和特質。效標(criterion)是檢驗效度的實證依據[2]。只有當測驗或考試得分與真實表現建立關聯時,才真正說明有效度。例如在盡責性人格測驗上得分高的人在學習工作中認真負責且有較好的業績,就說明測驗有效度。高考或大學入學考試的目的是選拔勝任大學學習的人,大學的學業表現理所當然是其效標[1],這里的邏輯是:高考成績好,說明學習能力(或動機)強,學習能力(或動機)是穩定不易改變的,在大學學習中也會表現出來,因此高考成績好的人在大學學習取得的績點也高[1]。當然還有其他可能,例如高中學習的知識為大學學習打下了基礎。但無論何種情況,高考成績(即測驗得分X)與大學績點(即效標得分Y)之間的相關(RXY)都可以稱為效標效度(criterion validity)。
有效性是考試公平性的基石。高考能否選拔出優秀人才關乎其存在的法理性[3]。高考在中國是社會關注的焦點,國外亦然。美國的高考以學術能力傾向測驗(SAT)和美國大學測驗(ACT)為代表。每年都有專門機構檢測其效度。SAT考試包括閱讀(測量基于文本篇章的廣泛閱讀技能)、數學(測量算術、代數、幾何、三角知識和概念理解、問題解決和計算能力)、寫作和語言(測量全方位的寫作技能)三部分考試內容。ACT則測試閱讀、數學、文法、科學(涉及生物、物理、化學、地理學等理科知識)四部分內容[4]。
國外關于外語在外國留學生大學入學考試中預測效度的研究主要集中于TOEFL(the Test of English as a Foreign Language)和IELTS(the International English Language Testing System),二者相當于英語高考。TOEFL考查外國人用英語進行聽說讀寫的能力,超過11000所大學在招收本科階段留學生時參考TOEFL成績,累計測試人數超過3500萬。每年參加IELTS的人超過350萬,其測試成績被10000多家大學等院校認可。TOEFL測試學業背景中的英語能力,IELTS則兼顧學業和日常兩種背景[5]。美國的一些高校在錄取外國留學生時會綜合考慮TOEFL或IELTS成績和大學入學考試成績(前者出色時,即使后者略低于錄取線也可能錄?。?。
絕大多數研究肯定了英語測試可以預測大學期間的學業表現,即使效力不強。一項元分析發現,TOEFL與大學績點間的平均相關為0.21;而另一項元分析發現,IELTS與大學績點間的平均相關為0.23[5]——其預測效度均低于普通的大學入學考試。例如,Westrick等發現ACT對大學績點的預測效度為0.53[6]。元分析還發現,TOEFL和IELTS在預測效度上沒有區別。不同的是,發現英語對本科和研究生階段的績點有相同的預測能力[5]。
高考的目的在于選拔出德才兼備的人才,高考成績好的人未來對社會的貢獻也應該大。但“社會貢獻”不易量化,且很難進行大樣本研究。高考要選拔勝任大學學習的人,能否培養出對社會有貢獻的人則是大學的使命,因此大學的學習成績可以作為高考的效標[7-8]。每年都有學者或專門機構向公眾發布美國高考的效度分析報告[5];國內的研究則相對缺乏,且沒有連續性和系統性[1]。本研究以某大學為對象,分析高考三大主科對四年大學成績的預測效度。希冀以此為切入點檢視高考命題的優勢與不足,以及大學教育的得失,并據此作出改進。
二、研究方法
抽取某省屬重點高校的2068名2018級本科生為被試(男生1727人)。分析2018級本科生的原因是能采集到其大學各科全部成績。其中文科和理科生分別有835人和1233人。就讀于文科學院(如文學院、法學院)和理科學院(如數學與統計學院、生命科學學院)的人數相對均衡??荚囁玫氖侨珖鞩II。語文、數學、英語是必考科目,加上文綜和理綜成績。對比語文、數學、英語三科的高考成績對大學成績的預測能力,以檢驗其效度。大學期間開設的課程包括通識課(20多門)、專業課(20多門)和實踐課(至少3門)三類,合計50多門。通識課和實踐課由全校統一制訂教學計劃,包括教材、課時、命題和考試等。但是各專業的任課教師不同。這兩類課程沒有同質性,且任課教師在評分時會在不同專業的優秀率和及格率上進行平衡,因此總績點缺乏區分性。每個專業開設的專業課門數和種類各不相同,研究針對每個學生計算了其專業課的均分?;谝陨显?,研究設定語文、數學、英語三科的高考成績為自變量,每門通識課和實踐課分別為因變量,專業課均分單獨當因變量。
三、結果分析
(一)相關和回歸分析
對自變量和因變量進行Pearson零階相關分析,結果發現:
1. 高考語文成績與馬克思主義原理、毛澤東思想、中國近現代史、思想道德、大學英語、物理實驗、職業技能1、實習8門課的成績,以及專業課均分和畢業論文成績有顯著正相關(平均相關系數為0.097),但與高等數學成績呈負相關(-0.074)。
2. 高考數學成績與毛澤東思想、計算機、高等數學、概率統計、大學物理、職業技能訓練1、職業生涯規劃7門課的成績有顯著正相關(平均相關系數為0.106),但與體質健康檢測(-0.056)、創新創業訓練(-0.053)成績呈負相關。
3. 高考英語成績與馬克思主義原理、中國近現代史、思想道德、大學英語、物理實驗、計算機、職業技能1、職業技能2、實習、社會實踐、就業指導、體育12門課的成績,以及專業課均分和畢業論文成績有顯著正相關(平均相關系數為0.115)。高考英語與大學期間的任何成績都沒有負相關。以上述大學課程為因變量進行回歸分析,發現大部分情況下英語能帶來額外的預測力,即在回歸方程中存在語文或數學兩個自變量的情況下,英語成績對因變量預測的回歸系數仍然顯著。
高考英語成績對大學學習成績的預測效度最好(存在顯著正相關的大學課程門數最多,平均相關系數也最大,且沒有負相關的情況出現),高考語文成績(在預測文科類大學課程方面有優勢)和數學成績(在預測理科類大學課程方面有優勢)也有一定的預測效度,但整體上明顯不如英語成績。高考英語成績與大學期間通識類思想政治(馬克思主義、近現代史、思想道德)、通識類學科素養(計算機、物理實驗)、專業類課程(專業課均分、畢業論文)都有正相關。說明扎實的外語知識能促進政治思想素質的提高,外語學習能促進專業知識的學習和整體學科素養的提高,且能提升解決問題的能力和實踐能力。
(二)中介和調節效應分析
大學期間最能體現專業素養的是專業課學習。專業課反映了一個專業不同于其他專業的核心競爭力。有些專業在就業上優于其他專業,主要是因為所開設的專業課更符合社會需求。本研究將專業課成績作為一個重點分析對象。進入大學四年級后最重要的培養方案是畢業論文。畢業論文考察的是運用專業理論知識解決問題(包括理論和現實問題)的能力。畢業論文體現了4年學習的整體成果,可以體現學生的理論素養、實踐能力、創新能力等品質。在本課題中設置畢業論文成績為因變量(Y),高考成績(語文、數學、英語)為自變量(X),大學期間的專業課成績為中介變量(M)。研究假設是高考成績越好則大學期間的專業課成績越好,專業課成績越好則畢業論文成績越好。
文科和理科學院對專業課學習和畢業論文的要求可能有較大差異。文科類課程對思辨能力要求較高,理科課程對實證能力要求較高。就畢業論文而言,文科學院一般要求寫一篇學術論文(如戰爭與氣候變暖的關系、運動與健康的關系等),強調理論性和創新性;理科學院通常要求做一個畢業設計(如編寫計算機程序、設計電路圖、模擬一個化學反應等),強調創新性、實踐性和應用性。
基于以上分析可以認為,在自變量X通過中介變量M影響因變量Y的過程(即X→M→Y)中,文理科可能起著調節變量W的作用,即X→M和X→Y的路徑在文科和理科學院會有所不同。同時,不認為M→Y的路徑會受文理科的調節,因為二者的文理科性質一致。假設的有調節的中介(moderated mediation)模型如圖1所示:
有調節的中介效應分析由PROCESS micro for SPSS 4.1軟件實現。以語文為自變量或預測變量時共建立兩個方程。方程1:專業課= B01 + B1*語文 + B2*文理 + B3 *(語文x文理)+ e1。方程2:專業課= B02 + B1 *語文 + B2*文理 + B3*專業課 + B4*(語文x文理)+ e2。分析結果見表1。以上回歸方程是以語文為自變量時建立的。當以英語為自變量時,只需要將方程中的“語文”改為“英語”即可。由于數學成績與大學期間的專業課均分和畢業論文成績都不相關,不符合中介分析的條件,故不予分析。
可見方程1和方程2的調節效應都不顯著。分析條件效應(conditional effect)發現,語文對畢業論文的直接效應在文科生中為0.078(SE=0.030),在理科生中為0.058(SE=0.024),全部顯著。然后分析語文通過專業課成績對畢業論文產生的間接效應。結果發現,間接效應在文科生中為0.000(SE=0.010),在理科生中為0.004(SE=0.010),都不顯著??梢钥闯?,無論文科生還是理科生,語文都直接影響畢業論文成績,但不能通過專業課間接影響畢業論文成績。以英語為自變量時分析結果見表2。
可見方程2中的調節效應顯著。進一步分析條件效應發現,英語對畢業論文的直接效應在文科生中為-0.025(SE = 0.024),不顯著;在理科生中為0.035(SE = 0.015),顯著。然后分析英語通過專業課成績對畢業論文產生的間接效應。結果發現,間接效應在文科生中為0.023(SE = 0.007),顯著;在理科生中為0.028(SE = 0.007),也顯著。因此可以認為,在理科生中英語可以直接影響畢業論文成績,也可以通過專業課間接影響畢業論文成績;在文科生中,英語只能通過專業課間接影響畢業論文成績。
值得注意的是,高考語文成績與大學專業課成績存在顯著相關,但回歸系數卻不顯著(表1)。這是因為方程中加入了其他變量(如文理科),這些變量起到了控制變量的作用。但這些控制變量卻不影響英語的顯著性(表2)。說明英語對專業課的預測力更穩定(robust)。此外還發現,高考成績通過專業課學習而影響畢業論文成績的假設只在以英語為自變量時才成立;以語文為自變量時則不然,盡管語文可以直接預測畢業論文成績。
四、討論
效度是考試公平性的保障。對某大學的分析表明,高考的三大主科都有一定的預測效度,因此高考是有效的。言語能力是其他能力得以發展的基礎[9]。這可以解釋高考語文成績影響大學學習成績的原因。數學訓練的是計算能力和邏輯思維能力,因此高考數學成績可以預測大學理科類課程的學習成績。
較為出乎意料的是英語對大學成績的預測效度遠高于語文和數學。這得到了國內部分研究的證實[10]。研究結果有助于消除對第二語言學習的誤解。一方面,外語成績對人的學習能力(如記憶力、理解力、堅持性等)有很好的鑒別力;另一方面,外語學習能提高和拓展人的認知能力。近幾十年來心理學、認知神經科學深入探討了第二語言學習對學生心理功能發展的影響。
第二語言學習的好處主要表現為以下兩個方面。
首先,第二語言學習可以促進認知-心理發展,進而促進大學學習成績。掌握一門與母語不同的語言后,大腦中就會有兩種表征體系。對同一事物或事物間關系,大腦中要有兩種表達方式。雙語者需要啟動認知控制、抑制、轉換過程以根據語境選擇對事物的恰當表征形式,其認知功能就得到更多訓練的機會[11]。對雙語者來說,調用語言的過程更有挑戰性,他們必須動用執行控制和注意資源以確保在切換語言時不出錯誤(如阻斷干擾信息),而每一次切換就是對腦力或認知能力的鍛煉。對大腦的訓練類似于對肌肉的訓練,大腦執行的任務越復雜則訓練的效果越好。掌握和使用雙語的過程對大腦的訓練使其結構(如灰質體積增加)和功能(腦區之間的聯結增多)得以強化。盡管不是所有的研究都支持學習外語的好處,但幾乎沒有人發現學習外語有負作用[12]。外語學習對心理發展的促進作用表現在以下幾方面。
(一)大腦結構的改變。第二語言學習能增加前額、頂葉、顳葉皮層及海馬區域的灰質腦灰質(灰質負責人類思維或信息加工過程,是神經元細胞體集中的地方)的體積和密度、腦白質(白質負責不同腦區間神經信號的傳遞,是神經元軸突集中的地方)體積和完整性,以及不同腦區間在結構和功能上的聯結強度[13]。中年以后人類腦白質的體積和完整性就會下降,以往建立的意義聯結因此會丟失,雙語學習則能減緩白質體積完整性隨年齡而破壞的速度[14]。
(二)認知能力的提高。第二語言學習有利于執行功能(executive function)的改善,包括認知靈活性(cognitive flexibility,面對新要求或新規劃而轉變視角和方法的能力)、抑制控制(inhibitory control,抑制沖動和對刺激的自然、習慣化、主導性反應的能力)和工作記憶(working memory,對信息暫時保存并進行心理操作的能力)三種核心能力[11]。對雙語者而言,在大腦中激活一種語言系統的同時要抑制另一種語言系統,這種抑制性控制的能力可以外溢并泛化到其他認知任務中,帶來一般認知能力的提高[12]。
(三)減緩認知能力衰退。雙語者患老年癡呆(dementia)的年齡平均比單語者晚4年多,這是因為雙語經驗增加了認知儲備(cognitive reserve,指有效使用神經網絡等資源或調用備用神經網絡的能力,使人在生理性腦衰退后保持認知功能不下降),對認知能力有更好的保護功能。學習第二語言讓人學會了解決問題的不同策略,強化了腦區之間的神經聯結,即形成了更多的神經網絡,在大腦功能受損或病變、老化后,認知功能也能得到補償。
(四)有利于元語言意識(metalinguistic awareness,指的是把一門語言當客體,并反思和評價它)和能力。對語言(語音、語義、詞匯、語法規則、句子結構)本身的分析和解構可以幫助人們更好地理解和應用語言規則,并根據語境使用語言,甚至進行語法、語義等方面的創新。具備元語言意識后,不僅人們學習新語言(多門外語)的能力會增強,對母語的理解也更加深刻;元語言意識還可能促進對其他學科語言的學習。
(五)提高共情能力和創造性。外語學習讓人意識到同一事物有不同解讀,更能包容異見和多元文化,接納新事物,形成更強的經驗開放性。研究發現,雙語者在思維的流暢性、變通性、獨創性方面優于單語者[15]。同時雙語者也更能理解其他文化的價值觀、生活方式、情感態度等,并與他人產生認知和情感上的共鳴[16]。
其次,外語學習可以促進專業課學習。很多大學課程都帶有研究性課程的性質,需要閱讀英文資料。很多專業術語源自英文,學好英文對深入理解這些專業術語非常有幫助。舉例來說,計算機語言是以英文為基礎的,很多軟件都是英文版,不會英語就會遇到很大障礙。其他學科如化學、醫學、心理學等也是如此。
五、結論與啟示
本研究得出以下結論:
(一)高考三大主科的成績對大學成績都有一定預測效度。首先是英語成績的預測效度最好,其次是語文,再次是數學。高考英語和語文成績能很好地預測大學期間通識類(政治思想素質和一般學科素質)和專業類(專業課均分、畢業論文)課程的學習。
(二)高考英語和語文成績都能預測畢業論文成績,但機制不同。外語學習能促進專業知識的學習,進而提高畢業論文成績,即高考英語成績對畢業論文成績的影響表現為間接效應而非直接效應。高考語文成績不能通過影響專業課成績影響畢業論文成績,但能直接影響畢業論文成績(言語能力強的人能取得更好的寫作成績)。
(三)高考英語成績的高預測效度佐證了外語學習對心理發展帶來的好處,包括大腦結構的功能優化、執行功能的提高、元語言意識的增強、共情能力和創造性的發展等。外語學習還能有力地促進專業知識的學習(準確理解專業術語,把握學科前沿進展等)。
本研究發現的一個重要問題是高考成績對大學成績的預測能力整體上低于國外。例如TOEFL與大學績點間的平均相關為0.23[5],而本研究中英語與大學成績的相關系數平均為0.11左右。ACT對大學績點的預測效度為0.50左右[6],而本研究中高考總成績對任何一門課程包括總績點的相關都不超過0.3。這有幾種可能。第一,大學階段的考試更重視達標性而非鑒別性,不及格的極少,分數變異性不大;第二,被試來自同一高校,其高考成績彼此相類,存在全距限制弱化變量間關系的情況;第三,大學生與所在專業存在嵌套關系,不同專業的平均績點可能相差不大。
本研究發現數學的預測效度較差,數學高考對大學大部分課程的學習沒有影響,在知識和能力上缺乏連續性,這可能說明高考數學主要考查的是解題技能而非數學能力。高考英語和語文的預測效度較好,但對大學成績的預測能力有限。可見,高考命題整體上需要進一步改進。另一方面也說明大學教育的一些問題。如大學教育要更加重視創新能力和解決問題能力的培養,大學考試要有更強的鑒別性等。
參考文獻:
[1] 張厚粲.教育測量學:高考科學化的技術保障[J].中國考試,2017,(8):4-7.
[2] Bai C.E.,Chi W.,Qian X. Do College Entrance Examination Scores Predict Undergraduate GPAs? A Tale Of Two Universities [J]. China Economic Review,2014,30:632-647.
[3] Aguinis H.,Culpepper S.A.,Pierce C.A. Differential Prediction Generalization In College Admissions Testing [J]. Journal of Educational Psychology,2016,(7):1045–1059.
[4] Fischer F.T.,Schult J.,Hell B. Sex-Specific Differential Prediction Of College Admission Tests:A Meta-Analysis [J]. Journal of Educational Psychology, 2013,(2):478.
[5] Ihlenfeldt S.D.,Rios J.A. A Meta-Analysis On The Predictive Validity Of English Language Proficiency Assessments For College Admissions [J]. Language Testing,2023,(2):276-299.
[6] Westrick P.A.,Le H,Robbins S.B.,et al. College Performance And Retention:A Meta-Analysis Of The Predictive Validities Of ACT? Scores,High School Grades,And SES [J]. Educational Assessment,2015,(1):23-45.
[7] Galla B.M.,Shulman E.P.,Plummer B.D.,et al. Why High School Grades Are Better Predictors Of On-Time College Graduation Than Are Admissions Test Scores:The Roles Of Self-Regulation And Cognitive Ability [J]. American Educational Research Journal, 2019,(6):2077-2115.
[8] Zorzie M. Prediction Of 4-Year College Student Performance Using Cognitive And Noncognitive Predictors And The Impact On Demographic Status Of Admitted Students [J]. Journal of Applied Psychology,2009,(6):1479.
[9] Roslan M.H.B.,Chen C.J. Predicting Students’ Performance In English And Mathematics Using Data Mining Techniques [J]. Education and Information Technology,2023,28:1427-1453.
[10] 趙軒,趙靜宇,郭學恒,等.基于相關性分析的高考試卷信度與效度研究[J].中國考試,2022,(3):37-43.
[11] 王瑞明,焦魯,范小月,等.第二語言學習的利與弊:語言與認知的角度[J].華東師范大學學報(教育科學版),2016,(1):90-97.
[12] Bialystok E. Bilingualism:Pathway To Cognitive Reserve [J]. Trends In Cognitive Sciences, 2021,(5):355-364.
[13] Bialystok E.,Craik F I M. How Does Bilingualism Modify Cognitive Function? Attention To The Mechanism [J]. Psychonomic Bulletin amp; Review,2022,(4):1246–1269.
[14] DeLuca V.,Voits T. Bilingual Experience Affects White Matter Integrity Across The Lifespan [J]. Neuropsychologia,2022, 169:108191.
[15] Kharkhurin,A V. Bilingual Verbal and Nonverbal Creative Behavior [J]. International Journal of Bilingualism,2010,14:211-226.
[16] Tiv M.O’Regan E.,Titone D. In A Bilingual State Of Mind:Investigating The Continuous Relationship Between Bilingual Language Experience And Mentalizing [J]. Bilingualism:Language and Cognition,2021,24(5):918-931.
Comparison of the Predictive Validity of College Entrance Examination Performance of Chinese, Math and English for University Academic Performance
Guo Qingke1" Xie Lihui2" Xie Cuixue2
1 Faculty of Education,Guangxi Normal University,Guilin,Guangxi,541001
2 Academic Affairs Office,Guangxi Normal University,Guilin,Guangxi,541001
Abstract:Validity is the basis for the fairness of the National College Entrance Examination(Gaokao)and the jurisprudential basis for its existence. University academic performance is an important criterion for assessing the validity of Gaokao scores. This study analyzes the predictive validity of Gaokao scores for the university academic performance of 2068 college students. The results showed that all three main subjects of Gaokao had predictive validity. English demonstrates the best predictive validity(positively correlated with the average score of major courses,thesis grades,and grades of 12 university courses,with an average correlation coefficient of 0.115),Chinese the next best(positively correlated with the average score of major courses,thesis grades,and grades of eight university courses,with an average correlation coefficient of 0.097),and math the worst(positively correlated with grades of seven university courses,with an average correlation coefficient of 0.106). English and Chinese can effectively predict the mean grades of major subjects and the grades of general education courses represented by political and ideological courses. The effect of English on thesis grades is likely to be realized by improving grades in major courses. Chinese,on the other hand,has a direct impact on thesis grades. Mathematics does not predict major and thesis grades.
Key words:College Entrance Examination Performance,University Academic Performance,Predictive Validity,Effects of Moderated Mediation
(責任編輯:吳茳)
作者簡介" 郭慶科,教授,廣西師范大學教育學部。廣西桂林,541001。謝立慧,助教,廣西師范大學教務處;謝翠雪,講師,廣西師范大學教務處。廣西桂林,541001。
基金項目" 本研究受教育部教育考試院“十四五”規劃支撐專項課題“新高考改革中統考與選考科目的統計測量分析指標研究”(NEEA2021045)資助。