摘要:就試題庫建設(shè)過程中的命題原則、試題設(shè)計方法、試題質(zhì)量控制、試題評價等關(guān)鍵問題進行了詳細的分析和研究,提出了一系列具有可行和可操作性的措施,并以《計算機操作系統(tǒng)》試題庫為例進行實踐,對試題庫建設(shè)質(zhì)量控制和評價具有一定借鑒意義。
關(guān)鍵詞:試題庫;質(zhì)量控制;評價技術(shù)
面對21世紀(jì)社會對人材的高素質(zhì)要求,大學(xué)課程教育也面臨著新的挑戰(zhàn)和機遇。突飛猛進的計算機技術(shù)也為改善各門課程教學(xué)手段、方法及考試方法提供了有利的工具。全國高校都在利用現(xiàn)代化教學(xué)手段對教學(xué)各方面進行大膽的改革和探索。作為大學(xué)課程教育的重要環(huán)節(jié)——考試方法已經(jīng)成為教學(xué)改革的重點,也成為提高教學(xué)效率的重要突破口。科學(xué)建立試題庫,自動抽題組卷,實現(xiàn)考教分離成為解決這個問題根本途徑和有效手段。它可以促進教師根據(jù)人才培養(yǎng)目標(biāo)的要求,嚴(yán)格按照教學(xué)大綱授課,改善教學(xué)質(zhì)量;可以科學(xué)檢查學(xué)生對本課程的基本知識、基本理論和基本技能掌握程度,很大程度激發(fā)學(xué)生的學(xué)習(xí)興趣;可以為同一門課程教學(xué)質(zhì)量評價提供有利條件,能更好的激發(fā)教師的教學(xué)熱忱,增強愛崗敬業(yè)的熱情。
一、試題設(shè)計的原則和方法
1.試題設(shè)計原則
(1)目的性原則:《計算機操作系統(tǒng)》將全部試題作為一個整體,應(yīng)該符合考試的目的要求,即通過解答或完成這些題目,應(yīng)該能夠測出預(yù)定需要測定的知識和能力水平。試題內(nèi)容、形式、難度等均應(yīng)服從于考試的目的;(2)科學(xué)性原則:《計算機操作系統(tǒng)》的試題表述要科學(xué)準(zhǔn)確。客觀性試題的答案應(yīng)該確切唯一,研究型、討論型題目研討方向應(yīng)該清晰,即學(xué)生可以使用不同的方法,但要解決的應(yīng)該是同一個問題;非探討性問題所給條件要做到既不多余也不欠缺;(3)考試與教學(xué)要求相一致原則:《計算機操作系統(tǒng)》的結(jié)業(yè)考試,作為目標(biāo)性檢測考試,其考核內(nèi)容及試題難度應(yīng)該與教學(xué)大綱要求為準(zhǔn),教學(xué)的重點和難點也是考試的重點。不能怕學(xué)生“押題”而回避教學(xué)重點。考題設(shè)計的形式和難度要求可以在教學(xué)大綱范圍之內(nèi)根據(jù)學(xué)生的學(xué)習(xí)情況稍微變動;(4)知識與能力并重原則:《計算機操作系統(tǒng)》作為計算機類專業(yè)的專業(yè)基礎(chǔ)課程,是學(xué)生將來從事計算機行業(yè)必備的基礎(chǔ)知識。不僅要考核學(xué)生對知識的掌握程度,更應(yīng)該考核學(xué)生對所學(xué)知識的理解程度和應(yīng)用能力。在試題設(shè)計時不能忽略能力的測試,否則無法有效實現(xiàn)教學(xué)目標(biāo)。
2.試題設(shè)計方法
《計算機操作系統(tǒng)》試題庫中包含單項選擇題、多項選擇題、填空題、判斷題、簡答題、算法分析題等六種題型。在試題設(shè)計之前先根據(jù)教學(xué)目標(biāo)和教學(xué)大綱以及考試目的,設(shè)計不同難度要求的試題,供以后抽題組卷時選用。(1)選擇題的編寫應(yīng)注意:每一選擇題的選擇項數(shù)應(yīng)保持一致,單選題以4 項,多選題可設(shè)4 項;選擇支的位置安排要具有邏輯性,正確支的位置要具有隨機性和相對均衡性;正確支與干擾支要具有相似性,干擾支與題干的聯(lián)系要與正確支與題干的聯(lián)系同樣密切,不能生搬硬湊,人為臆造。(2)填空題的編寫應(yīng)注意:填充的內(nèi)容應(yīng)該是關(guān)鍵字詞,并要求與上下文有密切聯(lián)系;一道填空題中不宜有過多、過長的空白,而且空白處所能填充的內(nèi)容應(yīng)該是惟一的;如果填充的內(nèi)容是計算的結(jié)果,當(dāng)為概念、法則等常規(guī)運算時,則計算不宜復(fù)雜。若是根據(jù)某些性質(zhì)進行計算,則所用性質(zhì)應(yīng)該是重要的或簡單的,不宜過分要求解題技巧,不能將綜合題變成填空題。(3)判斷題的編寫應(yīng)注意:每個題面最好只包含一個重要概念,盡量避免兩個或多個概念同時出現(xiàn);試題措辭必須含義清晰,語句簡練,避免用較長的復(fù)合語句命題;盡量不用否定式語句,尤其不要用雙重否定語句故意制造難點;不要用“可能”、“有時”、“通常”等“特加限定詞”。(4)算法題的編寫人們比較熟悉,這里只強調(diào)以下三點:為考核學(xué)生對概念、法則的理解而編寫的計算題,主要是考查學(xué)生對方法而不是對技巧的掌握,因此計算量不要過大,數(shù)字不要復(fù)雜;要注意一題多解,如果一個題目有多種解法,且?guī)追N解法的難度差異較大,則可注明要求學(xué)生使用的解題方法,以避免學(xué)生回避所要考核的知識點;盡量少出為計算而計算的題目,要把計算和實際應(yīng)用結(jié)合起來。
二、試題質(zhì)量評價指標(biāo)
1.試題難度
試題的記分方法分兩種,客觀性題目在評分時,只有得分和不得分兩種情況,稱為二分法,而主觀性題目學(xué)生可能得到不超過題目分值的任何分數(shù),稱為非二分法。兩種記分方法對應(yīng)的難度計算方法也不相同,他們的計算方法這里不詳細列出[4]。從計算公式可以知道, 難度值P 的最小值為0,表示該題不難;難度值P 的最大值為1 ,表示該題很難,無人做對。難度過大或過小, 都不能區(qū)分學(xué)生的學(xué)習(xí)水平。一般情況下,難度在0.3 以下為容易題,0.3~0.6 的為中等題,0.6 以上的為難題。由于難度與區(qū)分度有關(guān), 難度越接近0.5,區(qū)分度越高。例如,在期末考試中,為了期望平均成績?yōu)?0~75 分,適當(dāng)調(diào)整易、中、難題的比例,設(shè)計分值比為5:4:1,且三種試題的平均難度分別為0.19、0.35、0.16,這樣可期望平均難度為0.295。試題的難度與考試的性質(zhì)有關(guān),一般說來,作為教學(xué)檢查性題目,其難度不宜過大,以0.2~0.4 為宜,而作為選拔性考試的題目,其難度在0.4~0.6 比較適合。
2.區(qū)分度
區(qū)分度是反映試題對學(xué)生實際學(xué)習(xí)水平區(qū)分能力的指標(biāo)。區(qū)分度好的試題,學(xué)習(xí)好的學(xué)生得分高,學(xué)習(xí)差的學(xué)生得分低;而區(qū)分度低的試題,從得分上不能判斷出學(xué)生學(xué)習(xí)的實際情況。一般以試題得分與試卷得分的相關(guān)系數(shù)作為區(qū)分度。相關(guān)程度越高,區(qū)分度越好。正式考試試題的區(qū)分度應(yīng)該在0.3 以上,好的試題應(yīng)該達到0.4 以上。對于試題區(qū)分度因為區(qū)分度與標(biāo)準(zhǔn)差成正比, 所以要使區(qū)分度達到0.3 以上的良好水平,成績標(biāo)準(zhǔn)差應(yīng)大于12 分,但這會使不及格的人數(shù)增多。一般期末考試成績標(biāo)準(zhǔn)差應(yīng)控制在10 分,平均區(qū)分度以0.25 為宜。
3.信度
在教學(xué)評價中,考試結(jié)果的可靠性稱為信度,就是同一個測驗對同一組被試先后實施兩次, 其測驗結(jié)果的一致性的程度, 所以信度是反映考試結(jié)果穩(wěn)定性的一個指標(biāo)。目標(biāo)參考性測驗信度的估計, 目標(biāo)參考性試驗由許多所要考查的目標(biāo)組成, 而每個目標(biāo)又由許多測題組成。在估計這種測驗的信度時,可將每個目標(biāo)的測題視為一個測題組,用信度的測試方法,如再測法、復(fù)分法、分半法等來估計每個測題組的信度, 然后用各測題組的復(fù)本信度系數(shù)來表示整個測驗的信度。在估計測題的信度時采用內(nèi)在一致性信度。信度的最大值規(guī)定為1.0 ,一般標(biāo)準(zhǔn)化考試要求信度達到0.90。考試的理想結(jié)果是學(xué)生的考試分數(shù)與其真實水平(“理想分數(shù)”) 完全相同,這時考試的信度最大。
4.效度
效度是指一次考試在多大程度上測量了需要測量的東西。計算效度一般采用“效標(biāo)分數(shù)”法,即把學(xué)生有關(guān)考試成績和有經(jīng)驗而且了解學(xué)生的教師對學(xué)生的評定等作為效度的標(biāo)準(zhǔn)(效標(biāo)) ,把考試分數(shù)和效標(biāo)分數(shù)之間的相關(guān)系數(shù)作為考試的效度值。如果測試的結(jié)果與學(xué)生平時學(xué)習(xí)情況基本一致,這樣的考試有較高的效度。測試過程中,效度的最大值為1,表示測試結(jié)果符合測試目的,最小值為0, 一般測試的效度應(yīng)在0.4~0.7 之間為宜。
三、試卷質(zhì)量統(tǒng)計分析與評價
試卷質(zhì)量統(tǒng)計分析與評價是考試管理中一項重要工作,也是我們評價考試質(zhì)量的最重要、最有效的方法。它能夠為改進考試設(shè)計工作,使之更符合考生實際提供重要信息;也能夠為改進命題工作提供大量信息,提高試題和試卷的編制質(zhì)量;也是完善題庫,提高題庫試題質(zhì)量的重要途徑。試卷質(zhì)量統(tǒng)計分析與評價主要包括:考試成績分布的統(tǒng)計估計、考試的信度分析、考試的效度分析、試題的難度分、試題的區(qū)分度分析