
中圖分類號:G642 文獻標志碼:A 文章編號:1005-2909(2025)04-0143-16
土木工程專業旨在培養具備建筑、交通、水利、環保等行業所需的設計、施工、管理及科研能力的高級專門人才,它在大學專業體系中占據著至關重要的位置。一方面,學生培養需注重理論知識和實踐技能的綜合應用,為有效提升土木工程專業的教學水平,亟需建立科學合理的教學效果評價體系,以發現教學過程中存在的不足[]。另一方面,課程建設作為高等學校人才培養中的基礎性系統工程,需基于整體思維和系統學視角對教學目標、教學內容和教學效果評價進行合理規劃[2-4]。因此,教學效果評價在土木工程專業的課程教學與建設中有著舉足輕重的作用。
有關教學效果評價方面的研究較多,比如,楊冰清和劉美鳳5基于文獻資料海量分析,發現分層教學評價需圍繞學生的學業成績、心理發展,以及同伴和教師的社交展開;陳明等基于深層次學習理論構建了由課前(教學設計)、課中(在線學習、課堂教學)和課后(成績與教學成果、教學研究)構成的翻轉課堂發展性評價體系;丁雪梅等[7通過調查學生人學以來的學習成績,采用客觀與主觀評價相結合的方式,將傳統教學與翻轉課堂的教學效果評價結果進行對比,研究翻轉課堂教學對不同綜合素質學生的教學效果;BERGFJORD和HEGGERNES8基于翻轉課堂實踐構建了以學生體驗、學習成果和考試成績為評價標準的框架;董慶華和王成偉[9基于馬爾科夫鏈穩定性理論,建立學習“進步程度\"對學生群體進行形成性評價的數學模型,以“考試成績”為指標來衡量學生的進步,對不同教學模式下兩個學生群體在數學課程中的未來學術表現進行預測。
綜上所述,教學效果評價主要是對學生學習效果和教師教學工作過程的評價,是土木工程專業課程建設的重要環節,而測試成績代表學生學習真相,是教學效果評價的重要指標[10-11]。被試者的考試成績與能力水平、題目難度密切相關,而考試成績取決定于考生自身能力水平和題目難度[2]。測試成績的終極目標是合理反映被試者的能力水平,比如:相同測試成績,題目難度越大,表明被試者能力水平越高;同等題目難度時,被試者分數越高,表明能力水平越高。
試題難度一般用難度系數來表示,值越大表示試題越難[13]。楊曉冬和于玲[14]提出將每個學生每道試題的成績標準化計算題目的難度系數。王明蘭等[15]則根據專家給定的難度系數與考試中實際計算的難度系數,認為兩者之間存在線性關系。艾小偉和王有遠[16]將題目難度系數分為理論難度系數和樣本難度系數,隨著考試次數的增加,理論難度系數會收斂于定值常數,而樣本難度系數由考生的失分情況計算得出。因此,試題難度可根據考生測試之后的測試成績分布來衡量,也就是根據試題\"難度系數\"來衡量。
但是,根據卷面成績來衡量被試者知識掌握程度的差異存在諸多不盡合理之處[17]。比如:被測試者正確完成分數相同但難度不同的題目,題目難度越大,表明被測試者的能力水平越高,在被測試者能力水平相同的情況下,題目難度越大教學效果越好,土木工程專業課更是如此。因此,考試成績作為土木工程專業課教學效果評價的重要指標,應充分體現這一特點。為此,提出基于試題難度的測試成績計算方法,旨在解決傳統卷面成績計分方法的不合理之處,并將該方法應用于土木工程專業核心課程建筑結構設計,所得結論可供有關人員參考。
一、試題及試卷難度系數
土木工程專業課程測試大都以試卷形式出現,一套試卷由多個單獨的試題組成,試卷的難度由所有組成該試卷的試題難度分布決定。因此,要確定試卷的難度,其關鍵在于確定單個獨立試題的難度系數[18]。為便于敘述,該文所稱的試題是指試卷中的單個題目,而試卷由一個個試題組成,即試題是個體,試卷是總體。
(一)試題難度系數
從理論上講,特定試題的難易程度是確定的,與測試對象無關。但是,由于試題難度的標準難以建立,使得試題難度系數的確定變得非常復雜。對學生每道試題的成績進行標準化處理,并采用基于失分率確定的難度系數,實際上反映的是樣本難度系數。這種方法并未考慮考生個人能力水平的差異,也就是說,難度系數實際上受到了考生能力水平的影響。比如,對某一特定的測試題,被測試對象都能答對,不代表該試題沒有難度,也許被試者能力水平都非常高;反之,被試者都答錯,不代表該試題難度很大,也許被測試者能力水平都非常低。
為解決上述問題,我們提出將試題難度分為客觀難度和樣本難度兩部分。試題客觀難度,可理解為給定能力水平被測試者作答試題時,被測試對象的平均失分率;試題樣本難度,根據被測試對象作答該試題的平均失分率確定。試題客觀難度系數的確定方法:方法一,聘請有經驗的試題專家進行評分確定;方法二,將該試題提請具有給定標準能力水平的測試對象進行測試,采用平均失分率確定。顯然,方法一主觀性較強。方法二面臨的問題:如何明確設定標準能力水平、如何確定參與測試的人數、如何確保試題的保密性等,這些都使得實施起來頗具挑戰。鑒于客觀難度的確定不屬于該文研究的重點,在此不進行詳細論述。
試題樣本難度系數根據被試者的實際卷面得分,采用平均失分率的辦法確定,計算公式如下[19]:

式中: Gs,i 為第 i 題的樣本難度系數; Xji 為第 j 名測試對象第 i 題得分; n 為測試對象人數; Mi 為第 i 題滿分值。
試題客觀難度和樣本難度系數確定后,按下式計算試題難度系數:
Gi=G0B,i+(1-G0B,i)Gs,i,
式中: Gi 為第 i 題的難度系數; G0B,i 第 i 題的客觀難度系數。
試題客觀難度系數、試題樣本難度系數和試題難度系數取值均在 0~1 之間,試題難度系數在客觀難度系數 G0B,i 和1之間,難度系數取值越大試題越難。
(二)試卷難度系數
顯然,試題的難度分布決定整套試卷的難度。關于試卷難度系數的計算方法,可采用以下兩種方法進行計算。
方法I:按類似于試題難度系數的計算方法,把試卷難度分為客觀難度和樣本難度兩部分。試卷客觀難度,可理解為給定能力水平被測試者作答該套試卷時,被測試對象的平均失分率;試卷樣本難度,按被測試對象作答該試卷的平均失分率確定。
方法ⅡI:整套試卷的難度系數由試題的難度系數和試題的分值共同決定,分值越高、難度越大在整體難度中的占比越大。
方法I由于試卷客觀難度難以確定,實際應用較為困難,文中采用方法 II 確定試卷難度系數,計算公式如下:

式中: G 為試卷難度系數; m 為試題題目個數。
二、基于題目難度的測試成績計算方法
(一)考慮試題難度的卷面分數換算值
如上所述,合理的成績計算方法應能反映如下需求:相同測試分數,題目難度越大,表明被試者能力水平越高;同等題目難度時,分數越高,表明被試者能力水平越高。
為體現上述特點,我們提出測試分數當量值的概念。試題測試分數當量值為試題難度系數與
試題得分的乘積,試題分數當量值之和便為卷面分數換算值,可以表示為:
dji=GiXji,

式中: dji 為第j名學生第i題的測試分數當量值; Dj 為第 j 名學生考慮題目難度的卷面分數換算值。
(二)基于試題難度的成績計算
卷面分數的換算值能夠反映試題難度對考生分數的影響,這無疑是合理的。然而,由于試題難度系數總是小于1的數值,因此換算后的分數會低于原始的卷面分數。為了得到考生的最終成績,必須依據這些換算值進行計算。在考慮試題難度時,最終成績的計算原則是確保難度調整后的分數與卷面分數的最低分和最高分保持一致,而中間的分數則通過線性插值的方法來處理。令:

考慮難度系數的成績分數按下式計算:

式中: Xj 為第j名學生的卷面分數; Xmax,Xmin 分別為卷面分數最高分和最低分; Dmax,Dmin 分別為卷面分數換算值的最大值和最小值; Sj 為第 j 名學生考慮題目難度的測試成績。
(三)基本流程
首先,給定試題客觀難度系數,統計被試者每一試題所得分數,以此為基礎計算試題樣本難度系數,進而計算試題難度系數和試卷難度系數。然后,根據被測試者每一試題所得分數和試題難度系數,計算被試者每一試題測試分數當量值及卷面分數換算值。最后,根據測試者的卷面分數及卷面分數換算值計算最終分數。圖1為基于題目難度的測試成績計算方法(簡稱難度計分法)基本流程。
被測試者每道試題得分 ?Xji 試題滿分值M 計算試卷難度系數G√
計算試題樣本難度系數 Gs,i 試題客觀難度系數GoB.i√
計算試題難度系數Gi
計算卷面分數換算值 Dj 被測試者卷面分數Xj↓被測試者最終分數Sj
步驟I:根據被測試者每道試題得分 Xji 和試題滿分值 Mi ,按式(1)計算試題樣本難度系數 Gs,i° 步驟II:根據試題樣本難度系數 Gs,i 和給定的試題客觀難度系數 GoB,i ,按式(2)計算試題難度系 數 Gi° 步驟III:根據試題難度系數 Gi 和試題滿分值 Mi ,按式(3)計算試卷難度系數 G 步驟IV:根據被測試者每道試題得分 Xji 和試題難度系數 Gi ,按式(5)計算卷面分數換算值 Dj° 步驟V:根據卷面分數 Xj 和卷面分數換算值 Dj ,按式(6)一式(10)計算考慮難度系數的最終分數。
三、難度計分法在土木工程專業課中的應用
以筆者所負責的土木工程專業核心課程建筑結構設計期末考試成績為例,說明難度計分法在土木工程專業課中的具體應用,并深人分析試題的客觀難度、試卷整體難度,以及多教學班合并與單獨計算對最終分數產生的不同影響。
(一)課程情況
建筑結構設計是西南交通大學土木工程專業建筑工程方向的專業核心課,為大學三年級第(2)學期課程,最近4年的選課人數及開班情況如表1所示。各學期期末考試試卷試題分布及卷面得分情況如下。
2017—2018(2)學期:選擇題30個,每題1分,共30分;填空題8個,每題2分,共16分;簡答題4個,每題3分,共12分;計算題4個(6分1個,12分3個),共42分。1個教學班,卷面成績最高分99分,最低分23分。
2018—2019(2)學期:選擇題30個,每題1分,共30分;填空題8個,每題2分,共16分;簡答題4個,每題3分,共12分;計算題4個(8分3題,9分2題),共42分。1個教學班,卷面成績最高分97分,最低分37分。
2019—2020(2)學期:選擇題30個,每題1分,共30分;填空題15個,每題1分,共15分;名詞解釋10個,每題2分,共20分;計算題3個(10分2題,15分1題),共35分。2個教學班,A班卷面成績最高分100分,最低分11分;B班卷面成績最高分93分,最低分39分。
2020—2021(2)學期:選擇題30個,每題1分,共30分;填空題15個,每題1分,共15分;名詞解釋5個,每題2分,共10分;計算題4個(10分2題,12分1題,13分1題),共45分。2個教學班,A班卷面成績最高分93分,最低分31分;B班卷面成績最高分90分,最低分26分。

(二)因素影響分析
1.試題客觀難度系數
從理論上講,試卷中每道試題的客觀難度是不一樣的,難度系數取值也不一樣。鑒于客觀難度系數取值的復雜性,文中暫未考慮這種影響,而是將所有試題的客觀難度系數取為相同的數值。
表2—表7為各教學班不同試題客觀難度系數取值時的分數統計參數值(均值、上四分位數、中位數、下四分位數、偏度、峰度),圖2為各教學班統計參數隨客觀難度系數的變化。試題客觀難度系數取1時,按難度計分法得到的分數和卷面分數相同。分數統計參數具體如下。
(1)均值。分數均值隨著試題客觀難度系數取值減小而減小,對均值影響幅度最小為 3.5% ,最大為 17.7% 。試題客觀難度系數由1減小為0時,2017—2018(2)學期A班由75.76減小為70.26,減小幅度為 7.2% ;2018-2019(2)學期A班由70.35減小為64.33,減小幅度為 8.6% ;2019—2020(2)學期
A班由74.33減小為61.17,減小幅度為 17.7% ;2019—2020(2)學期B班由67.58減小為62.36,減小幅 度為 7.7% ;2020—2021(2)學期A班由62.10減小為59.91,減小幅度為 3.5% ;2020—2021(2)學期B班 由59.06減小為56.75,減小幅度為 3.9% 。



(2)下四分位數。下四分位數隨著試題客觀難系數的減小而減小,對下四分位數的影響幅度最 小為 8.5% ,最大為 38.2% 。試題客觀難度系數由1減小為0時,2017—2018(2)學期A班由65.5減小為
58.75,減小幅度為 10.3% ;2018—2019(2)學期A班由63.00減小為53.03,減小幅度為 15.8% ;2019— 2020(2)學期A班由62.75減小為38.78,減小幅度為 38.2% ;2019-2020(2)學期B班由59.75減小為 53.54,減小幅度為 10.4% ;2020—2021(2)學期A班由47減小為43.01,減小幅度為 8.5% ;2020—2021 (2)學期B班由48減小為43.35,減小幅度為 9.7% 。



(3)中位數。中位數隨著試題客觀難度系數的減小而減小,對中位數的影響幅度最小為 2.8% , 最大為 18.8% 。試題客觀難度系數由1減小為0時,2017—2018(2)學期A班由80減小為73.7,減小 幅度為 7.9% ;2018—2019(2)學期A班由71.0減小為62.63,減小幅度為 11.8% ;2019—2020(2)學期A 班由75.50減小為61.27,減小幅度為 18.8% ;2019—2020(2)學期B班由69.0減小為61.74,減小幅度 為 10.5% ;2020—2021(2)學期A班由63.5減小為59.87,減小幅度為 3.63% ;2020—2021(2)學期B班 由57減小為55.38,減小幅度為 2.8% 。
(4)上四分位數。上四分位數隨著試題客觀難度系數的減小而減小,對上四位數的影響幅度最小為 1% ,最大為 10.5% 。試題客觀難度系數由1減小為0時,2017—2018(2)學期A班由90減小為
85.02,減小幅度為 5.5% ;2018—2019(2)學期A班由78.5減小為72.19,減小幅度為 8.0% ;2019—2020 (2)學期A班由90減小為86.34,減小幅度為 4.1% ;2019—2020(2)學期B班由75.25減小為69.98,減 小幅度為 10.5% ;2020—2021(2)學期A班由76.0減小為76.17,基本保持不變;2020—2021(2)學期B 班由69.5減小為68.81,減小幅度為 1.0% 。

(5)偏度系數。無論初始成績偏度系數是正數還是負數,計算偏度系數都是隨著試題客觀難度 系數的減小而增大。試題客觀難度系數由1減小為0時,2017—2018(2)學期A班由-1.08增加為 -0.72;2018—2019(2)學期A班由-0.23增加為0.32;2019—2020(2)學期A班由-0.92增加為-0.13; 2019—2020(2)學期B班由-0.07增加為0.39;2020—2021(2)學期A班由0增加為0.16;2020—2021 (2)學期B班由0.16增加為0.28。
(6)峰度系數。不同班級分數峰度系數隨試題客觀難度系數的變化規律是特定的,即要么隨試 題客觀難度系數減小而增加,要么隨試題客觀難度系數減小而減小。從四個學期6個教學班的數據 來看,5個班的峰度系數試題客觀難度系數減小而減小,僅2019—2020(2)學期B班是增加的,說明 該班級學生對基礎知識的掌握程度較為接近,對難點部分掌握程度差異較大。試題客觀難度系數 由1減小為0時,2017—2018(2)學期A班由1.15減小為0.11;2018—2019(2)學期A班由0.06減小為 -0.20;2019—2020(2)學期A班由1.25減小為-1.15;2019—2020(2)學期B班由0.02增加為0.30; 2020—2021(2)學期A班由-1.04減小為-1.18;2020—2021(2)學期B班由-0.39減小為-0.68。
上述結果表明,試題客觀難度系數取值對均值、下四分位數、中位數、上四分位數的影響程度從大到小依次為,下四分位數、均值、中位數和上四分位數,即對卷面分數高分段影響小對低分段影響大,原因在于卷面分數較低的學生能作答正確的試題大都是難度系數相對較低的。偏度系數均隨著試題客觀難度系數的減小而增大,說明難度系數減小,低分數會更多,反之亦然;峰度系數隨客觀難度系數的減小而減小,說明客觀難度系數越小,分數越分散。
2.卷面分值
為分析考慮難度系數測試成績計算方法對不同卷面分數的影響,定義分數變化率如下:

式中: λ 為考慮難度系數計分分數相對于卷面分數的變化率; s 為考慮難度系數計分分數; X 為卷面分數。
同時,為分析分數變化率最大絕對值所出現的位置,定義位置系數如下:

式中: X0 為成績變化率最大絕對值所對應的卷面分數。
表8為各教學班位置系數及分數變化率最大值統計結果,圖3為不同試題客觀難度系數取值時,成績變化率隨卷面分數變化的變化情況。具體如下:


(1)2017—2018(2)學期A班:除客觀難度系數取0.7,卷面成績為46分時成績變化率為正值外,其余情況均為負值;卷面分數為47分(位置系數 μ 為0.32)時,成績變化率絕對值最大,客觀難度系數取0、0.5和0.7時,成績變化率最大分別為 -18.8% -3.9% 和 -1.9% 。
(2)2018—2019(2)學期A班:除客觀難度系數取0.7,卷面成績為37、50和69分時成績變化率為正值外,其余情況均為負值;卷面分數為59分(位置系數 μ 為0.37)時,成績變化率絕對值最大,客觀難度系數取0、0.5和0.7時,成績變化率最大分別為 -23.5% -7.0% 和 -2.8% 。
(3)2019—2020(2)學期A班:成績變化率均為負值;卷面分數為41分(位置系數
為0.34)時,成績變化率絕對值最大,客觀難度系數取0、0.5和0.7時,成績變化率最大分別為 -55.4%,-11.7% 和 -5.7% 。(4)2019—2020(2)學期B班:成績變化率均為負值;卷面分數為55分(位置系數
為0.30)時,成績變化率絕對值最大,客觀難度系數取0、0.5和0.7時,成績變化率最大分別為- 15.8% -4.7% 和- .2.5% 。(5)2020—2021(2)學期A班:成績變化率有正有負,負值居多;卷面分數為38分(位置系數 μ 為0.11)時,成績變化率絕對值最大,客觀難度系數取0、0.5和0.7時,成績變化率最大分別為 19.9% ,4.8% 和 2.5% 0
(6)2020—2021(2)學期B班:成績變化率有正有負,負值居多;卷面分數為51分(位置系數 μ 為0.39)時,成績變化率絕對值最大,客觀難度系數取0、0.5和0.7時,成績變化率最大分別為 19.4% ,6.1% 和 3.2% 。
從4個學期6個教學班的分析可知:成績變化率有正有負,負值居多,即考慮難度系數后的分數大多比卷面分數要低;客觀難度系數取值對分數變化率的影響較大,客觀難度系數為0時的變化率最大,最大為 -55.4% ,最小為 -15.% ,為0.5時的變化率最大為 -11.7% ,最小為 -3.9% ,為0.7時的變化率最大為 -5.7% ,最小為 ±2.5% ;實際應用時客觀難度系數建議取值范圍為 0.5~0.7 ;變化率絕對最大值出現在最低分數和最高分數之間,偏向最低分一側,位置系數除2020-2021(2)學期A班為0.11外,其余在 0.30~0.39 之間,說明卷面分數越低受影響越大;卷面分數越接近最高分或最低分,變化率絕對值越小,即受影響越小。
3.多教學班分合并計算
選擇土木工程專業課的人數每年都有變化,從而導致同一門課程在不同學期或學年的開課班數會有所變化。根據課程教學班的數量,土木工程專業課的教學存在兩種情況:(1)同一門課程僅有1個教學班;(2)針對同一課程開設多個平行教學班的情況,探討難度計分法應采用分班計算還是合并計算的合理性問題。選取2019—2020學年第二學期和2020—2021學年第二學期兩個學期(均包含2個平行教學班)的期末考試成績作為分析樣本,從試題題目難度系數差異;試卷難度系數和分數變化率三個維度展開對比研究。
圖4為試題客觀難度系數分別為0.5和0.7時,試題題目難度系數變化曲線,圖5為試卷難度系數隨試題客觀難度系數的變化曲線。從中可以看出,當教學班級為兩個時,采用單班級分別計算和兩班級合并計算對試題題目難度系數和試卷難度系數影響不大。AB班合并計算后的試題題目難度系數和試卷難度系數處于A班和B班單獨計算結果之間,整體影響較小。


圖6為2019—2020(2)學期、2020—2021(2)學期分別采用各教學班單獨計算和多班合并計算分數的對比情況。2019—2020(2)學期:A班,當客觀難度系數為0.5和0.7時,單獨計算和多班合并計算分數的偏差在 ±3% 以內;B班,當客觀難度系數為0.5,單獨計算和多班合并計算分數的偏差在-10%~+2% 以內,當客觀難度系數為0.7,單獨計算和多班合并計算分數的偏差在 -4%~+2% 以內。2020—2021(2)學期,當客觀難度系數為0.5和0.7時,A、B班單獨計算和多班合并計算分數的偏差均在 ±3% 以內。
從2019—2020(2)和2020—2021(2)兩個學期的對比分析可以看出,當客觀難度系數為0.5時,單獨計算和多班合并計算分數的偏差在 -10%~+3% 以內;當客觀難度系數為0.7時,單獨計算和多班合并計算分數的偏差在 -4%~+3% 以內。客觀難度系數取值越小,單獨計算和多班合并計算分數的偏差越大,反之亦然。考慮客觀難度系數取值較大時,單獨計算和多班合并的偏差并不大。同一門土木工程專業課存在多個教學班時,當客觀難度系數取不大于0.6時,建議多班合并計算,大于0.6時,各教學班可單獨計算。圖7為客觀難度系數取0.6時,兩個學期單獨計算與合并計算的對比,當客觀難度系數取為0.6時,單獨計算與合并計算分數及偏差率的差別較小。

4.試卷難度系數
試題難度系數僅僅是反應單個題目的難度,而試卷難度系數反應了整個試卷的難易程度。試題難度系數由試題客觀難度系數和主觀難度系數組成,主觀難度系數系根據教學班卷面考試成績統計得出,而客觀難度系數的確定卻十分復雜,需要進一步研究。表9為不同學期,根據各教學班卷面考試成績計算得到的試卷難度系數隨試題客觀難度系數,圖8為試卷難度系數隨試題客觀難度系數變化。從中可以看出,試卷難度系數值隨試題客觀難度系數取值的增大而增大,試題客觀難度系數取值越小,不同學期教學班試卷難度系數的差別越大。


(三)難度計分法計算結果
圖9為教學班采用文中所提出的考慮試題難度的計算分數與卷面分數對比


(1)試題客觀難度難度系數取0.5時,2017—2018(2)學期A班,難度計分法計算分數與卷面分 數的偏差在 -3%~1% 之間;2018—2019(2)學期A班,偏差在 -7%~1% 之間;2019—2020(2)學期A 班,偏差在 -12%~1% 之間;2019—2020(2)學期B班,偏差在 -5%~1% 之間;2020—2021(2)學期A 班,偏差在 -6%~5% 之間;2020-2021(2)學期B班,偏差在 -6%~5% 之間。
(2)試題客觀難度難度系數分別取0.6時,2017-2018(2)學期A班,難度計分法計算分數與卷面分數的偏差在 -3%~1% 之間;2018-2019(2)學期A班,偏差在 -5%~1% 之間;2019—2020(2)學期A班,偏差在 -9%~1% 之間;2019—2020(2)學期B班,偏差在 -3%~1% 之間;2020—2021(2)學期A班,偏差在 -4%~5% 之間;2020-2021(2)學期B班,偏差在 -4%~5% 之間。
(3)試題客觀難度難度系數分別取0.7時,2017—2018(2)學期A班,難度計分法計算分數與卷 面分數的偏差在 -3%~1% 之間;2018—2019(2)學期A班,偏差在 -4%~1% 之間;2019-2020(2)
學期A班,偏差在 -7%~1% 之間;2019-2020(2)學期B班,偏差在 -3%~1% 之間;2020—2021(2)學期A班,偏差在 -3%~5% 之間;2020—2021(2)學期B班,偏差在 -3%~5% 之間。
根據4個學期6個教學班的計算結果可知:試題客觀難度難度系數越大,難度計分法計算分數與卷面分數之間的偏差越小;試題客觀難度難度系數分別取0.5時,難度計分法計算分數與卷面分數的偏差在 -12%~5% 之間;試題客觀難度難度系數分別取0.6時,難度計分法計算分數與卷面分數的偏差在 -9%~5% 之間;試題客觀難度難度系數分別取0.6時,難度計分法計算分數與卷面分數的偏差在 -9%~5% 之間。
四、總結
測試成績作為土木工程專業課教學效果評價的重要指標,傳統意義上卷面得分法存在不能完全反映被測試者測試得分和能力水平之間的關系。就此,文中提出考慮試題題目難度的測試成績計算方法,并以建筑結構設計為例分析其在土木工程專業課中的具體應用,主要結論如下。
(1)試題客觀難度系數取值對教學班計算分數的影響由小到大依次為上四分位數、中位數、均值和下四分位數,對卷面分數高分段影響小,對低分段影響大。
(2)客觀難度系數取值越小,難度計分法計算分數與卷面分數之間的偏差越大,低分數會更多,分數越分散,單獨計算和多班合并計算分數的偏差越大,客觀難度系數為0.5時,單獨計算和多班合并計算分數的偏差在 -10%~+3% 以內,當客觀難度系數為0.7時,單獨計算和多班合并計算分數的偏差在 -4%~+3% 以內。
(3)分數變化率絕對最大值在卷面最低分和最高分之間,偏向最低分一側,卷面分數越低受影響越大,卷面分數越接近最高分或最低分,受影響越小,客觀難度系數取0時的分數變化率最大,在-55.4%~-15.0% 之間,客觀難度系數取0.5時,在 -11.7%~-3.9% 之間,客觀難度系數取0.7時,在-5.7%~2.5% 之間。
(4)試卷難度系數值隨試題客觀難度系數取值的增大而增大,試題客觀難度系數取值越小,不同學期教學班試卷難度系數的差別越大。
(5)考慮試題難度的測試成績計分方法,能合理反映分數和被測試者能力水平間的關系,客觀難度系數建議取0.5\~0.7,同一門土木工程專業課存在多個教學班時,當客觀難度系數取不大于0.6時,建議合班計算;大于0.6時,可采用教學班單獨計算。
參考文獻:
[1]程海根.土木工程專業教學效果的模糊綜合評價[J].西南師范大學學報(自然科學版),2017,42(1):163-167.
[2]李楠,李正良.新時代課程建設與教師教學評價研究[J].中國大學教學,2019(10):91-96.
[3]劉志軍,徐彬.我國課堂教學評價研究40年:回顧與展望[J].課程.教材.教法,2018,38(7):12-20.
[4]周玉容.大學教學評價標準的雙重困境與破解之道[J].高等教育研究,2019,40(10):75-81.
[5]楊冰清,劉美鳳.分層教學的教學效果評價維度研究——基于2000—2020年中、外文文獻的系統性文獻分析[J].現代教育技術,2021,31(11):28-36.
[6]陳明,陸建峰,牛浩.基于深層次學習理論的翻轉課堂發展性評價體系的構建[J].現代遠距離教育,2017(6):20-26.
[7]丁雪梅,張蓼紅,于子陽,等.基于SPSS軟件的教學效果評價分析[J].黑龍江畜牧獸醫,2016(7):271-272.
[8]BergfjordOJ,HeggeresT.Evaluationofa\"flippedclasroom\"approachinmanagementeducationJ].Jouralofuiversi-ty teachingamp; learning practice,2016(5):1-13.
[9]董慶華,王成偉.馬爾科夫鏈在高等數學教學效果評價中的應用[J].數學的實踐與認識,2018,48(8):314-320.
[10]楊開城,盧韻.一種教學評價新思路:用教學過程證明教學自身[J].現代遠程教育研究,2021,33(6):49-54.
[11]宋丹,劉洞波,豐霞.基于多源數據分析的課程成績預測與課程預警研究[J].高等工程教育研究,2020(1):189-194.
[12」張金勇,何妃霞.教育測驗中學生能力水平與測驗項目難度的Rasch模型分析——個體能力與題目難度之間的對應關系[J].當代教育科學,2012(12):11-14.
[13]張葵.基于離散化誤差補償的試題難度題量控制方法[J].計算機科學,2012,39(S1):515-518.
[14]楊曉冬,于玲.關于試題難度系數的方差分析法[J].工業技術經濟,2002,21(6):87-88.
[15]王明蘭,葉恒青.評估試題難度的檢驗[J].華南師范大學學報(自然科學版),2001,33(2):55-58.
[16]艾小偉,王有遠.基于統計學習的試題難度系數修正算法[J].計算機工程與應用,2008,44(36):227-229.
[17]朱高峰.中國的工程教育——成績、問題和對策[J].高等工程教育研究,2007(4):1-7.
[18]潘璋榮.試題難度的客觀標準探索[J].教學與管理,2013(19):83-84.
[19]程書肖.教育評價方法技術[M].北京:北京師范大學出版社,2004.
Calculation method of test scores based on the difficulty of test questions: taking the course of architectural structure design as an example
LIN Yongjun, ZHANG Zengpeng, ZHANG Jing, LU Liheng (School of Civil Engineering, Southwest Jiaotong University,Chengdu 6loo31,P.R.China)
Abstract: Asan essential indicator of teaching efect evaluation,test scores can reasonably reflectthe ability level of the examinees.However,the paper scores in the traditional sense cannot fully reflectthe relationship between the test scores and the ability level of the examinees.Therefore,this paper proposes a test score calculation method that adjusts the test scores according to the dificulty of the testquestions andanalyzes its specific application by taking the civil engineering course architectural structure design asan example.The results show that thevalue of theobjective difficultycoefficient of the test questions has litle influence on the high-score section of the test paper but has a significant influence on the low-score section; The maximum absolute value of the score change rate is between the lowestscore and the highest score,which is biased toward the lowest scoreside.The closer the score is to the highestor lowest score,the lessit willbe affected.When the objective difficulty coefficient is taken as O, the score change rate is between - 55.4% to- 15.0% ; When it is taken as O.5, the rate is between - 11.7% to- 3.9% ;When it is takenas O.7, the rate isbetween - 5.7% to 2.5% The smallerthe objective difficultycoeffcientis,the greater thedeviationbetween thecalculated score and the paper score.The more dispersed the score is,the greater the difference between the test paper difculty coefficients of different teaching classes is,and the more significant the difference between the scores calculated by the teaching class aloneandbythe combined calculationof multipleclasses is.When the objective difficultycoefficient is O.5,the deviation between thescores calculated bythe teaching class alone and by the combined calculation of multiple classes is within - 10% to + 3% ,and whenit is O.7, the deviation is within - 4% to
. The test score calculation method considering the difficulty of the test questions can reasonably reflect therelationship between the scoresand the ability level of the examinees.The objective diffculty coefficient is recommended tobe O.5 to O.7.When there are multiple teaching classes in the same civil engineering professional course,when the objective diffculty coefficient is not greater than O.6,it is recommended that multiple classes be calculated together.Each teaching classcan be calculated separately when it is greater than 0.6.
Key words: teaching effect; civil engineering; professional course; test score; difficulty coefficient
(責任編輯 梁遠華)