曹文振 王濤利



摘 要:在“雙一流”建設目標指引下,我國高等教育邁向國際化,源于歐美國家的平均學分績點(GPA)成為大學生學業評價的新制度并出現了“分數膨脹”(Grade Inflation)現象,但強調微觀層面個體利己主義的過往研究視角或許掩蓋了背后的結構性制度困境。研究采用內容分析法對“雙一流”建設高校成績評價制度的關鍵要素開展編碼與分析,發現“雙一流”高校的學生成績評價制度存在明顯差異,GPA生產過程有著清晰的制度線索,“分數膨脹”不僅是個體行為的結果,更是制度邏輯的產物。基于此,研究提出GPA轉換體系應有合理敏感度,突出其作為分級評價與原始分的不同作用;建立具有可比性的GPA制度框架,增強其在跨校評價中的作用;優化GPA評價結果的理性分布,兼顧教師享有的評價自主權;改進GPA評價制度的整體公平性,為學習困難學生留下“容錯”空間。
關鍵詞:平均學分績點;GPA;“雙一流”建設高校;成績評價制度;大學生;學業表現
一、研究緣起
改革開放以后,我國高校對大學生學業成就的評價制度經歷了從不完備到逐漸完善,乃至體系化的過程。自2005年教育部頒布《普通高等學校學生管理規定》提出“考核和成績評定方式,由學校規定”[1]以后,政府對高校的控制權開始下放,高校對學生進行考核和評定的自主權逐漸擴大,學分制改革的進程不斷加快。在2017年教育部正式提出建設“世界一流大學和一流學科”的目標以后,中國大學成績評價體系逐漸與歐美高校并軌,作為舶來品的平均學分績點(Grade Point Average,簡稱GPA)成為愈發盛行的學習質量評價指標。在學生評獎評優、推薦免試攻讀研究生、海外升學等特定情景下,原始分數發揮的作用被削弱,GPA的地位愈加突出,儼然成為了成績評價的代名詞;在就業市場中,GPA也是有吸引力的衡量依據[2]。
在這一背景下,與西方高校類似的“分數膨脹”(Grade Inflation)現象隨之而來,成為我國高等教育的新痛點。美國精英大學在上世紀就開始面臨“分數膨脹”問題,在普遍實行平均學分績點制度后,學生成績嚴重向高分段集中[3]。例如杜克大學1961年平均GPA為2.7,到1994年時已上升到3.3[4];華盛頓大學也從1964年的2.31上升到3.12[5]。美國藝術與科學院(AAAS)在2002年發布了《評價與學院:我們做得對嗎》報告,其中將分數膨脹定義為“在一個較長時期內,學生的學業成就未提高,但其GPA卻明顯上升的現象”[6]。與海外情況類似的是,我國高校學生的GPA也呈現出逐年上升的趨勢,且在“雙一流”高校中表現尤為明顯。以天津大學為例,自2009年起短短三年學生的GPA就從2.95升至3.17[7];2015年清華大學頒布了《“建立促進學生全面發展的學業評價體系”改革方案》,毫不避諱地指出該校存在嚴重的“GPA導向學業成就觀”和“分數膨脹”現象[8]。
許多大學的行政部門都曾試圖采取措施降低“分數膨脹”,但由于對產生的原因莫衷一是,常常導致政策的失敗與抵抗[9][10]。已有研究多從現象本身或是理論視角出發探究這一現象產生的緣由。基于問題導向的研究發現,教師在對學生進行學業評價時已不再單純基于能力和學業表現,受到新自由主義思潮影響,學生對高分的追求被當作消費者需求得以滿足[11][12][13]。基于理論導向的研究則多采用“經濟人”和“理性人”假設為視角,認為高校內部在各利益相關者功利主義心態膨脹的氛圍中,教師與學生可能會通過學生成績和評教分數“雙向膨脹”的方式滿足自身利益訴求[14][15]。前人多將利己主義視作“矛盾根源”的研究取向,造成囿于個體層面的分析難以突破功利主義視角的束縛。值得反思的是,高校所設定的學生學業評價制度才是教師開展分數評定的合法性來源,但學業評價制度在這一過程中的深層影響卻被當前的研究忽視,使得對現象背后因素的探究存在結構性失察。因而,本研究希望將考察視野從微觀個體轉移到宏觀制度層面,通過深入評價制度本身追溯高校學生成績評定的運作機制,以期挖掘造成GPA上漲的根源性因素,建立看待“分數膨脹”現象的不同視角,并基于新的發現提出有力的解決對策。
二、資料與方法
(一)數據來源與總體情況
結合教育部發布的“雙一流”高校建設名單,本研究從各高校官方網站中的“信息公開”等欄目、教務處等職能部門網站以及其他文件匯編材料(如學生手冊)中獲取與本科生成績評價的有關政策文本。除政策文件外,各高校頒布的學分制管理辦法、學分績點算法方案、本科生成績單等也是該研究主題的重要印證和補充材料。經過梳理與驗證原始文件頒布時間,研究選取各高校最新修訂的文件進行分析,共納入41所“雙一流”建設高校的學業評價政策文本作為分析素材,具體情況見表1。
受教育部等發布的“雙一流”建設實施辦法(暫行,2017年)的影響,2017年成為高校對相關文件進行更新的重要時間節點。有34所入選“雙一流”建設名單的高校都在2017年及以后新制定或修訂了本科生成績評價政策文本(其中2017年23所、2018年5所、2019年6所)。我國高校的本科生學業成績評價政策主要由教務處(部)頒布并同時享有對規定的解釋權,這部分高校共有36所。其次,有5所高校的本科生院是學生成績的管理部門,還有部分學校則由黨委學生工作部、招生辦公室、注冊中心等職能部門參與有關工作。
(二)研究方法
由于高校成績評定制度的原始文本過長且較為繁瑣,需要對其進行概念提取,并對相似概念展開重編碼,研究采用內容分析法的研究范式進行編碼方案的設計和提取。內容分析法是社會科學領域一種專門用以對文本內容進行分析的慣常方法,最大的優勢是能夠揭示出文本中的隱含事實及內容[16]。由于本研究沒有可供借鑒的前人研究框架,研究者在廣泛閱讀政策文本并征求有關專家學者意見的基礎上,經過多次討論并結合我國高校成績評定與GPA形成方式的特點及對部分文本的試編碼情況,確定內容分析所需的編碼框架方案,一級類目包括成績評定形式、過程評價要求和重修成績評定等七類,并細分為28個二級類目,具體內容如下:
根據編碼框架形成的編碼簿,由兩名研究者對41所“雙一流”大學的政策文本進行逐一編碼。為了提高內容編碼的效度,參與編碼的成員首先明確了編碼規則和類目內涵,而后分別獨立開展互不干擾的編碼工作。為了對編碼信度進行檢驗,研究采用了Cohens Kappa系數來考察兩位編碼者的一致性,其具體的計算方法為:
K=po-pe1-pe
其中p0代表實際編碼結果中不同編碼者的結論一致性比例,pe是理論上預期的一致性概率。一般而言,Kappa系數值達到或超過0.75即可認為編碼結果的一致性較為可靠。本研究的編碼結果Kappa系數為0.932,不同編碼者的一致性檢驗結果較優。對于不一致的編碼結果,研究者引進一位非原始編碼成員,再次進行討論,直至所有編碼最終形成共識。
三、“雙一流”大學學生成績評價關鍵要素識別
(一)成績評價方式
編碼結果表明,考試與考查并行是課程考核的主流形式;除少數高校未作說明外,32所高校均采用了這種方式。百分制是“雙一流”高校最為重要的成績記載形式,有37所高校(90.24%)采用了這種形式。但受到前述的學分制和績點制改革影響,以五級制和通過制為主的等級制正在成為另一種重要形式,超過75%的高校目前都使用百分制、等級制并存的成績記載方式。
通常情況下,學生修讀過的課程均納入GPA計算范圍,補考、重修、緩考等非正常情況下取得的成績也會被單獨標記或另行記載。但在政策文本編碼過程中發現,有5所“雙一流”高校(12.20%)允許學生放棄或更改不滿意的課程成績,或是通過選修其他同性質課程取代原始課程成績。例如,清華大學允許學生每學期最多放棄一門任選課成績,華南理工大學則規定通識教育課程不合格的學生可選修其他課程進行替代。
“雙一流”建設高校多采用過程性評價和終結性評價相結合的方式評定課程成績,即平時成績與期末成績按一定比例折算后計入最終成績。有11所高校(26.83%)為了加強對過程性評價的管理,還對過程性評價在最終成績中的占比作出了明確規定,這些高校規定的平時成績最低占比在30%-50%之間浮動,有的還規定了50%-70%的平時成績最高比例。
對于沒有通過的課程,所有“雙一流”高校都提供重修的途徑讓學生能夠重新獲得學分。少數高校限制了單門課程最多的重修次數,但大多數學校(35所,85.37%)在培養期內可以反復修讀未通過的課程。針對多次修讀同一門課程的情況,有的學校在出具成績單時以重修成績覆蓋原始成績(26.83%),有的學校則將每一次得分都予以登載(60.98%)。為了能夠獲取更高的學分績點,重修已通過課程被學生稱為“刷課”,但編碼結果表明,真正提供“刷課”途徑的“雙一流”高校僅有1/3不到(13所),重修已通過課程并非政策范圍內提高GPA的主流方式。
(二)GPA算法方案
高校需要對學生獲得的原始成績(實得成績)進行相應的績點轉換,才能夠得出GPA。除北京理工大學和西北工業大學未在成績評價政策文本中明確GPA制度,僅以實際考試分數作為衡量標準外,其余39所“雙一流”高校均在政策文本中提供了GPA轉換方式及其方法說明。
與此同時,不少“雙一流”高校在引進西方GPA制度時都進行了本土化調整,調整內容包括納入計算的課程性質、績點浮動范圍、等級劃分等等,形成了直接使用原始分(9.76%)、連續化(19.51%)、區間化(53.66%)、連續區間混合(12.20%)等多種轉換形式,具體轉換方案多達27種。連續化轉換算法得到的是按百分制成績計算的連續曲線,例如南京大學采用“課程原始分÷20”的轉換方式來計算績點。區間化轉換方式意味著每一個分數段折合成對應檔次的績點。連續區間混合制則代表在一定的分數段內,績點呈現出連續變化的曲線(連續制),但在達到某個臨界值以后績點即保持固定不變(區間制),電子科技大學的績點折算標準就是此種轉換方式的代表(X代表百分制成績,下同):
課程績點=4.0 (85≦X≦100)(X-45)/10(60≦X≦84)
無論采用哪種形式的換算方法,課程績點與原始成績都呈正相關關系,差異主要體現在反映原始成績變化的敏感度不同,比如同濟大學采用了比較粗粒度的轉換方式,不同檔次之間的績點差距為1;大連理工大學采用了以0.1為變化區間的細粒度計算方法;北京大學和北京航空航天大學采用了完全連續化的計算公式,原始分的細微變化都會在保留小數點后兩位的績點上得以體現,其具體計算公式為:
課程績點=4-3(100-X)2/1600(60≦X≦100)
對于全部課程GPA的計算,美國高校普遍采用的計算方式是∑(原始成績對應績點*課程學分)/∑課程學分。38所“雙一流”建設高校均沿用了這種典型算法,僅有哈爾濱工業大學制定了特殊的GPA算法,將不及格的考查課學分納入計算范疇,該校制定的具體算法如下:
平均學分績=∑考試課程績點×課程學分∑課程學分-∑考查課不及格學分數∑學期數
除了明確GPA的計算方法以外,不少高校還對納入計算的成績范圍進行了具體的規定。比如,對于通過制(P/NP)這樣的非百分制成績,參與GPA計算(17所)與不參與GPA計算(18所)的學校基本相當;又如對于重修課程成績參與GPA計算的方式,涵蓋了每次成績均計入(7所)、以首次通過成績計入(5所)、以最高一次成績計入(5所)、以最新一次成績計入(9所)四種形式。
(三)GPA評價尺度
在GPA評價制度中設置了檔次的所有18所“雙一流”建設高校都采用了五檔評價方式,即將學生成績劃分為A、B、C、D、F五檔。其中,14所高校在檔次內部還進行了+/-檔的細分,如將A檔細分為A+、A、A-三個內部檔次。
在GPA的制度設計上,不同高校轉換后的績點上下域值存在差異。從“滿績”(即最高績點)來看,“雙一流”高校共規定有5種滿績點,最大可有1分的差距(4.0-5.0)。以4.0為滿績的高校最多(46.34%),其次為5.0滿績(24.39%),也有部分高校采取了4.3、4.5、4.8等非整數形式的滿績點。美國研究型大學主要采用滿績點為4.0的GPA作為學生學業的整體評價方式[17],這再次反映出我國高校在引進西方制度時融入了本土化思考。“雙一流”高校在最低通過成績(通常為60分或及格檔次)所對應績點上的范圍差異更大,存在2分的浮動(1.0-3.0),但采用1.0作為通過課程績點下限的學校最多(58.54%),其他則分布較為零散。對于未通過課程的成績,幾乎所有高校的GPA績點方案都計為0分,無論百分制原始成績位于0-60分中的哪個位置,僅有南京大學規定“不及格的課程在補考或重修通過之前按實得分數計入學分績”。
在最高與最低績點的區間范圍內,不同檔次之間績點變化的最小尺度一般為0.3分,或者采用不設檔次的連續值(即用平滑曲線涵蓋所有績點,不劃分區間段),設置這兩種變化尺度的高校分別有16所(39.02%)和14所(34.15%)。
(四)優秀檔(A檔)轉化方式
前人研究表明,“分數膨脹”更容易出現在精英高校追求高分檔次的學生中[18]。從編碼結果可以看到,“雙一流”大學對高分檔次的績點轉換方案規定得尤為詳細。在“優”“A”等本身代表優秀學業表現的檔次之上,有10所高校(24.39%)還細分出“A+”檔次來授予最優秀的學生;甚至有4所高校的“A+”僅僅是一種表彰學業突出學生的榮譽檔次,獲得“A”與“A+”的學生在績點上完全相同。
當百分制原始成績被轉換為對應的等級和績點時,“優秀”檔次成為評價的醒目標簽。“雙一流”大學對取得優秀檔次的分數下限進行了以下兩種設計:參考傳統的百分制標準,將90分作為優秀檔次分界線;為了讓更多學生能夠進入“優秀”檔次,將對應的原始成績放寬到87、86和85分(兩種方式均有11所高校采用);不存在將優秀檔次對應的分數線提高的學校。當然,也有近一半的高校(46.34%)僅是將原始分數進行績點轉換,未賦予檔次的標簽加以區分。
基于上述兩部分的分析可以發現,由于高校在百分成績與等級成績之間的對應轉換方案不同,產生了高校間“同分不同等”或“同分不同績”的現象,相同分數在連續制、等級制(GPA4.0、GPA5.0)標準下的績點可能相距甚遠。以百分制原始成績85分為例(見表7),不同GPA轉換制度下的對應績點范圍從3.3分直至4.5分,有著最高1.2分的差距;對應的檔次則可以是“良”、“B+”、“B”、“A-”。即使同為北京地區的“雙一流”高校,85分在中國人民大學里的績點為3.3(GPA4.0),等級為B+;中央民族大學的績點為3.5(GPA5.0),等級為良;而在同樣采用GPA4.0制度的中國農業大學里,績點為3.7,等級為A-。若以GPA作為校際之間學生學業表現的比較標準,由此可見并不存在太多適用空間,反而容易造成諸多困惑和混淆。
(五)成績分布要求
研究者在編碼過程中發現,共有10所高校在政策文本中進一步對學生的成績分布做出了兩類強制性或半強制性規定:要求總體成績符合正態分布與限制優秀率(或不及格率)的比例。有4所“雙一流”高校明確規定學生成績應符合正態分布規律;5所高校要求獲得優秀的學生比例最高不超過30%,各有1所高校要求優秀率不得超過15%、20%和40%。為了讓成績分布更加“正態”,部分學校還提出了更為嚴格的要求,如清華大學規定了獲得A+的比例不得超過5%,北京師范大學則規定了獲得65分以下者不得少于3%。
與對優秀學生的諸多規定相比,高校對不及格率的關注程度明顯較低。僅有北京大學一所高校規定不及格(60分以下)的比例不超過10%,不滿足該規定的課程需要進行“調分”以符合學校的分布要求。
與此同時,“雙一流”大學對成績分布限制又保留了一定的調整空間,僅有1所高校明確表示不允許突破規定的分布比例限制,其余高校則大多給予了任課教師一定的自主權,但是需要在突破成績分布限制時提出申請及做出說明。例如,北京大學規定“優秀率超過40%或不及格率超過15%的課程成績,須經院(系、所、中心)教學主管領導審核、教務部備案后方可登錄”;清華大學的表述是“如有特殊情況,任課教師需向教學主管部門提交情況說明”。
四、“雙一流”大學學生成績評價制度反思
(一)GPA變化敏感度與學業評價適切性之思
通過對“雙一流”建設高校成績評價的政策文本進行分析發現,大多數高校都提供了原始分數與GPA之間較為細粒度的轉換方案。但是當百分制原始分數被轉換為績點時,轉換方法的敏感度有所不同。研究者選取五所具有典型轉換算法的“雙一流”高校進行比較,從圖1可以看到,有些高校的績點轉換算法呈現出一條連續性的平滑曲線,學生成績的每一分變化都精確體現在GPA上,如北京大學;有的學校則呈現出區間式的折線形態,處于同一區間的學生共同享有相等的GPA,位于不同區間的學生績點至少相差0.3分,如中國人民大學、復旦大學。
GPA的首字母G所代表的Grade一詞本身可做等級之意[19],意指通過分級對事物進行評價。既然是一種等級制度,筆者認為與原始分逐一對應的高敏銳度的轉換體系似乎并不恰當,因為這樣與直接采用原始分作為評價標準并無本質差別,失去了轉換的意義。另一方面,學生的學業表現無法通過每一分的絕對差距進行衡量,等級制即是一種把簡單的連續性分數轉化為學業表現的層次性評價方法,讓學生明白自身的學業表現處于哪個檔次。然而,中國的在學本科生數量已超1750萬人[20],位居全球第一。從評價的角度而言,作為評價對象的在校生基數龐大,因而也不能簡單地采用過于寬泛的分段方法,造成在需要以GPA進行學業水平評價時無法保證合理的區分度。從當前的“雙一流”大學實踐上來看,絕大多數高校采用的是每5分進一檔的GPA轉換方式,相對而言,這是一種比較合理的方式,既體現了分級評價的作用,又弱化了原始百分制的精確性評價;但也有部分高校存在過度敏感和較為遲鈍的問題,甚至失去了GPA評價制度與原始百分制成績的差異化價值,有待在后續政策調整中進行優化。
(二)不同GPA制度與學業表現可比性之思
從之前的分析結果可以看到,當前“雙一流”大學所采用的GPA轉換方式較為多元,轉換算法、“滿績”設定、參評課程范圍、是否允許重修已通過課程等等都是GPA得分的影響因素。相同分數在不同GPA標準下的績點存在較大差異,甚至相同成績能否獲得“優秀”的標簽也各有不同,產生了高校間“同分不同等”或“同分不同績”的現象,進而影響到學生GPA表現的跨校比較。清華大學學生之所以對學校的GPA轉換方法存在質疑之聲,原因就在于該校課程績點比同類高校平均要低約0.25分,導致學生失去與其他高校的競爭優勢。也正是考慮到同樣的原因,在國內高校保研與海外高校深造等需要對校際之間學生的學業表現進行橫向評價時,并不具有可比性的GPA正在失去它的作用,相對位置與排名成為了考察候選者時更為關心的重點。
當不同高校的學生從本校脫穎而出,進入到新的目標高校尋求深造時,如何真正發揮GPA本應具有的評價作用,在一個可比的制度框架下衡量和評估GPA所反映的學業表現,仍舊是一個頗具挑戰的議題。考慮到標準化的考試可以成為高校教學優秀評估和校級比較的指標[21],且在高等教育大眾化的進程中,國家始終是主要的發動者、組織者和監護者[22],筆者建議在高校擁有成績評價自主權的基礎上,應當由教育部等政府主管部門或高等教育行業組織出臺一份具有指導性作用的成績評價建議文本,基于我國高等教育的實際情況來統籌不同高校之間的評價制度設置,讓來自全國各個高校的學生可以擁有相對的可比性,而不致讓GPA制度淪為實質上難以發揮作用的一紙空文。
(三)“正態分布”與教師評價自由性之思
從表面上看,由單一的百分制到引入等級制,加以精細的GPA轉換方法,我國大學成績評價制度在不斷趨于完善、合理。然而,功利主義心態卻無法通過政策文本予以調控,政策文本似乎反而成為一種可乘之機,令學生整體成績呈現出上揚的“負偏態”[23]。這也正是由西方而起的被稱作Grade Inflation或GPA Inflation的“分數膨脹”備受關注的直接原因。在中國高校普遍推行學生評教的制度情境下,教師愿意給學生高分以換取學生的滿意度。[24]學生為了獲得高分在選課時會將任課教師打分情況考慮在內,使選課在某種程度上成為基于風險規避的理性選擇過程,分數則成為這種理性選擇的收益。[25]然而,在成績普遍很高的課程中,認真勤奮、能力較強的學生很難脫穎而出[26],高校準確評估學生素質和知識水平的能力受到損害[27]。
許多高校對“正態分布”和優秀率的限制正是為了避免上述問題發生,強化教師給予學生成績認定的制度公平性。由于成績分布相關規定的存在,教師必須更加客觀地去評定學生之間的學習成效優劣,也激發了學生在同輩群體中取得更好學業表現的動力。筆者認為這種做法不僅應當被寫入政策文本,也應當在實際執行過程中得到遵守,例如可以將教務系統設置為對成績分布情況進行自動校驗。事實上,教師如果采取差別獎勵的方式進行學生成績分配,有助于促進學生學業表現。[28]不過,當學生的學業表現在整體上超出預期或低于預期時,教師也應當享有對成績分布進行調整的可能性和自主權。這種自主權的行使應當有明確的政策支持,并且在具體操作時不至于給教師造成行政流程上的過分負擔。
(四)關注高分考生與整體評價公平性之思
就學生自身而言,綜合能力、努力程度、同輩素質,甚至人格特質[29]等都是學業表現的影響因素,這些因素的個體分化造成了學生之間的學習效果和學業績效差異,也是成績存在分布的本質原因。同時,由于教育部各類專項計劃對中西部、農村、貧困地區的招生傾斜,一些基礎薄弱的學生在起步階段存在較大的學習困難。[30]高等教育并非只是培養出類拔萃優等生的絕對篩選機制,也應當讓每一位學生在高等教育中得以發展,因而學業成績評定政策需要考慮對全體學生的合理評價,同時兼顧高分與低分學生的學業表現。
在“雙一流”大學的政策文本中可以明顯發現,與對優秀學生的關注相比,GPA制度對學習困難學生的關注度較低,甚至抹殺了他們進步的可能性:對低于60分或等級為F的成績,經過轉換后的績點常常統一記載為0分。盡管補考、重修等方式讓成績不合格的考生不必擔心留級和末位淘汰[31],但這種GPA的絕對差距已然造成他們在評獎、評優、保研、出國等競爭中的劣勢,并且難以通過后續努力扭轉。已經有研究表明促進高分成績、篩選優異學生或防止“分數膨脹”的做法(如限制成績分布),會影響成績較差學生的學業表現以及GPA成果[32];低學業能力的學生很容易受到來自高能力學生的負面影響[33]。對于這種現象也有高校提出了一些新的主張,例如中國科學技術大學允許學生放棄最多兩門課程成績參與GPA評定,南京大學允許學生重修1次已通過的課程以獲得更高的成績納入GPA計算。無疑這種做法提高了學生的期望水平,更有利于激發學生的上進心與積極性,有助于提升學生的GPA[34],也為在個別課程中表現不優秀甚至存在學習困難的學生留下了“容錯”的空間和機會。在未來的成績評價制度改革中,對優秀學生的遴選與對后進學生的激勵應當同時被納入政策文本制訂的考量范圍。
五、結語:構建合理的大學成績評價制度
隨著“雙一流”高校建設步伐的不斷加快,我國高等教育更加開放和自由,GPA制度也成為我國高校融入全球高等教育體系的必經之路。當高校不斷地改進學業評價體系,希望客觀、科學地對我國的學生學業成就進行評價時,“分數膨脹”現象反而成為高等教育新的痛點。本文采用內容分析法對“雙一流”建設高校學業評價的政策文本進行研究后發現,“分數膨脹”不僅是個體行為的結果,更是制度邏輯之下的產物,GPA的生產過程有著清晰的制度線索,過往簡單的個人利己主義研究視角掩蓋了背后的制度邏輯困境。
盡管在具體制度設計和操作層面上“雙一流”高校的評價體系不盡相同,但它們都應當發揮出平衡篩選與培育功能,以及促進不同層次學生均衡發展的作用。高分成績不是高等教育的“指揮棒”[35],作為學業表現衡量尺度的成績評價制度不僅應當扮演遴選和排序的角色,更應當發揮出反饋和激勵的作用。仍有一些問題需要在將來的制度設計與政策制定中予以更為充分的討論與合理的安排,例如如何對優秀學生進行合理區分,避免高分的激烈競爭所帶來的“分數膨脹”;又如在作為選拔性學生評價制度的同時,如何引入發展性學生評價[36],在選課退課、課程成績放棄、重修等退出和容錯機制上為困難學生的激勵創造空間等。
誠然,本研究仍有進一步發展的空間。首先,受政策文本可獲得性的限制,本研究僅選取了41所“雙一流”建設高校作為樣本院校,對普通院校、高職高專院校和民辦院校的制度文本并未進行更廣泛的收集與分析。這些院校在生源結構、師資力量以及管理制度等方面均存在差異,今后的研究可以擴大樣本范圍以探究廣泛意義上的中國高等教育學生評價體系。其次,高校教師和學生作為該制度下最為重要的利益相關者,他們對政策文本的評價和對實施效果的內在感知將為研究者帶來更深層次的思考,并為回溯到制度層面開展的研究提供認知層面的補充,在后續研究中可以嘗試引入質性研究方法以加深對這一議題的洞察力。
參考文獻:
[1]國家教育部.普通高等學校學生管理規定(2005)[EB/OL].(2005-03-25)[2019-10-11].http://www.moe.gov.cn/srcsite/A02/s5911/moe_621/200503/t20050325_81846.html.
[2]Imose R,Barber L K.Using Undergraduate Grade Point Average as A Selection Tool:A Synthesis of the Literature[J].The Psychologist-Manager Journal,2015,18(1):1–11.
[3]Johnson V E.Grade Inflation:A Crisis in College Education[M].New York:Springer-Verlag,2003.
[4]Bliwise R J.Where are the C's of yesteryear:Indexing Achievement[J].Duke University Alumni Magazine,1997,83(3):8-13.
[5][26]Felton J,Koper P T.Nominal GPA and Real GPA:A Simple A Djustment that Compensates for Grade Inflation[J].Assessment & Evaluation in Higher Education,2005,30(6):561-569.
[6]Rosovsky H,Matthew H.Evaluation and the Academy:Are We Doing the Right Thing?Grade Inflation and Letters of Recommendation[R].Massachusetts:American Academy of Arts and Sciences,2002.
[7]天津大學檔案館,天津大學教務處.天津大學檔案館大數據之GPA的秘密[EB/OL].(2018-05-31)[2019-05-19].https://mp.weixin.qq.com/s/PD0mqAbJd7R8r2XTNwWBYA.
[8]清華大學注冊中心,清華大學教務處,清華大學研究生院.“建立促進學生全面發展的學業評價體系”改革方案[EB/OL].(2015-05-15)[2019-04-23].http://www.doc88.com/p-4962506925441.html.
[9]Hyde T.ShouldSchools Implement Tougher Grading Standards? The Economics of Grade Inflation[EB/OL].(2015-09-09)[2019-08-30].https://www.aeaweb.org/research/should-schools-implement-tougher-grading-standards.
[10]張藝璇.深度丨誰動了我的GPA?[EB/OL].(2019-04-15)[2019-04-20].https://twd2.me/wp-content/uploads/2019/04/mygpa.pdf.
[11]李麗麗,李江霞.美國高校分數膨脹現象述析[J].黑龍江高教研究,2007(4):38-40.
[12]Gilpin G A,Saunders J,Stoddard C.Why has for-profit Colleges Share of Higher Education Expanded so Rapidly? Estimating the Responsiveness to Labor Market Changes[J].Economics of Education Review,2015(45):53-63.
[13]鄧勇.美國高校學生分數膨脹現象研究[D].長沙:湖南大學,2015.
[14]劉強.論高校學業考試“分數膨脹”及其應對策略:兼談高校“等級制”取代“百分制”改革[J].高等教育研究學報,2016,39(2):86-91.
[15][24]哈巍,趙穎.教學相“漲”:高校學生成績和評教分數雙重膨脹研究[J].社會學研究,2019,34(1):84-105.
[16]Neuendorf K A.The Content Analysis Guidebook[M].2nd ed.Los Angeles:SAGE Publications,2017:44.
[17]邱政.美國研究型大學本科生學業標準研究[D].上海:華東師范大學,2010.
[18]Beckman K.The Top 15 Universities with the Highest Average GPAs[EB/OL].(2018-05-23)[2019-08-03].https://ripplematch.com/journal/article/the-top-15-universities-with-the-highest-average-gpas-4f4b544d/.
[19]Cambridge University Press.Grade | Definition in the Cambridge English Dictionary[EB/OL].[2019-10-28].https://dictionary.cambridge.org/us/dictionary/english/grade.
[20]國家教育部.2019年全國教育事業發展統計公報[EB/OL].(2020-05-20)[2020-07-31].http://www.moe.gov.cn/jyb_sjzl/sjzl_fztjgb/202005/t20200520_456751.html.
[21]田建榮.學業成績考試:高校教學過程的重要環節[J].廈門大學學報:哲學社會科學版,2002(2):15-18.
[22]王洪才.大眾高等教育論:高等教育大眾化的文化-個性向度研究[M].廣州:廣東教育出版社,2004:265.
[23]潘懋元.關于學業成績負偏態分布問題的初步探討[G]//潘懋元.潘懋元論高等教育.福州:福建教育出版社,2000:469-480.
[25]彭筱.本科生課程成績評定中的師生博弈[D].上海:華東師范大學,2019.
[27]Tucker J,Courts B.Grade Inflation in the College Classroom[J].Foresight,2010,12(1):45-53.
[28]Johnson V E.An Alternative to Traditional GPA for Evaluating Student Performance[J].Statistical Science,1997,12(4):251-269.
[29]Farsides T,Woodfield R.Individual Differences and Undergraduate Academic Success:the Roles of Personality,Intelligence,and Application[J].Personality and Individual Differences,2003,34(7):1225-1243.
[30]宋潔絢.民族院校學生學業成績評價改革的困境與出路[J].民族高等教育研究,2019(4):11-16.
[31]陳玉祥.高校學生淘汰制度的社會學分析[J].江蘇高教,2009(2):114-116.
[32]Wetzler E L.HowUsing A Restricted Grading Range Distorts GPAs and Disproportionately Penalizes Low-performing Students[J].Frontiers in Education,2019(4):23.
[33]Contreras S,Badua F,Adrian M.Peer Effects on Undergraduate Business Student Performance[J].International Review of Economics Education,2012,11(1):57-66.
[34]Seirup H,Rose S.Exploring the Effects of Hope on GPA and Retention among College Undergraduate Students on Academic Probation[J].Education Research International,2011:1-7.
[35]韓玉志.創新人才培養呼喚高校學業成績考試改革[J].中國高教研究,1999(6):73.
[36]劉青.高校發展性學生評價制度研究[D].蘭州:蘭州大學,2012.
(責任編輯 賴佳)