蔡佳
(陜西國際商貿學院 基礎課部, 咸陽 712046)
大學英語考試作為英語教育的重要環節,目前主要參考《大學英語四級考試大綱》。以對學生英語能力完成準確客觀的測量為目的,促進大學英語教學水平的提高。大學英語考試面向全校學生,是一項大規模標準化考試,為確保考試成績的參考價值,需保證試卷整體質量,需根據教育測量理論的試卷質量的要求完成設計。傳統組卷算法已無法與教育信息化的需求相匹配。優化智能組卷方法是大學考試實現自動化的重點[1]。
完成智能組卷的重點在于構建滿足實際需求的組卷模型,應用高效優質的組卷算法。智能組卷以人工智能為技術支撐,通過計算機程序從試題庫中自動選擇試題,根據要求組合試卷,考試系統的核心目標之一是實現智能化操作,是計算機輔助教學的優勢所在。效率和質量作為智能組卷的兩個重要評價指標,其實現與否主要取決于組卷算法。設計的算法要全局尋優,能夠做到快速從題庫中抽取一組滿足考試要求的試題,涉及到快速收斂問題。本文對大學英語考試智能組卷問題的研究正是基于差分進化算法,支持軟件系統的開發與優化。提出了一種優化組卷問題的數學模型,滿足大學英語考試中的精確組卷需求。將差分進化算法應用于該數學模型中,給出一種新型智能組卷算法。
差分進化算法(DE)以群體智能為基礎,是一種隨機并行的優化算法,遵循達爾文的進化原則,即“適者生存、優勝劣汰”。差別進化算法具有獨特的記憶能力,可以對當前的搜索情況實現動態跟蹤,完成自適應尋優,根據實際需要自動調整搜索策略,具有較強的全局收斂性和魯棒性,能夠突破常規數學規劃方法的限制,完成復雜環境中的優化問題的求解,在試題庫智能組卷方面有極大的優勢。
通過對問題中變量間的關系進行分辨、聯系,把實際問題轉化為數學模型,并運用計算機完成求解,從而實現智能組卷的過程,數學模型決定了組卷質量。所以做好智能組卷的基礎工作首先是建立數學模型[2]。
應用計算機技術,按照一定的教育測量理論規定,組成某種學科題目的集合稱之為題庫。智能組卷系統的試題都來自題庫,題庫中題目的質量起到決定性作用,根據經典測量理論(CTT)的題目量化指標,對影響試卷質量的指標進行分類歸納,包括:可信度反映考試結果的穩定程度,程度高表明考生分數可排除偶然性因素的影響,使考生實際水平能夠真實的測量出來。可信度的影響因素包括試題數量及難度、題目用語準確性等;有效度反映實際的考試結果同預期考試目標匹配的程度。有效度高的試卷,能夠準確地測試出考生知識掌握的程度。在考試目標明確的前提下,提高試卷有效度需保證試題與課程標準一致;試題難度以試卷能否有效考查出學生的知識和能力水平為依據(分數在中等難度呈正態分布,較高難度呈負偏態分布,較低難度呈正偏態分布),因為試題難度值的確認需在考試成績公布后統計得到,組卷時需比較準確的估計試題難度;試卷區分度實現鑒別不同層次考生能力的目標。試卷區分度高能有效區分不同知識水平及不同能力的學生,區分度和難度關系密切,好的區分度離不開合適的難度[3]。
2.2.1 構建矩陣模型
結合英語考試實際情況,依據組織一份試卷時的考慮因素(如確定滿分值、知識點分布、數量、試題難度及考查的能力層次等指標),本文構建的智能組卷數學模型由 9 項核心屬性,將一份試卷的參數指標分解成一個9 維空間向量,一道試題由 9 個參數指標(指試題編號,分值,答題時間,知識點,題型,難度系數,區分度,能力層次,使用頻率)決定,由9維向量空間 (a1,a2,…,a8,a9)的特征決定。(n×9)的矩陣如下式所示,其中n表示試題數。
2.2.2 矩陣參數指標
1)試題編號作為試題的唯一標識,由(a11,a21,…,an1)表示,對計算機處理極為重要。


4)大學英語教學的能力層次根據《大學英語課程教學要求》主要分為三個(即一般要求、較高要求、更高要求)[4],各能力層次對應相應的編碼(如第i道試題的能力層次編碼由ai4表示),應根據指定的能力層次要求,完成試題的選擇。




9)使用頻率。第i題單位時間內(可以是年或學期)使用的次數用ai9表示,使用頻率較高,則學生易于考過該題,從而影響對考生能力的真實測評,組卷時要充分考察使用頻率,替換使用頻率較高的試題[5]。
差分進化算法作為一種進化算法,是以實數編碼為基礎的,本文的數學模型的構建主要圍繞變異、交叉和選擇這三種操,其與遺傳算法的最大區別在于變異操作上,差分進化算法中的變異操作是以染色體的差異向量為基礎進行的,其余操作則和遺傳算法基本相同[6]。
變異操作主要通過差分方式實現,是差分進化算法的重要操作。方法是隨機從當前種群中選取兩個相異個體,縮放其差向量,然后通過與其他待變異個體的向量運算,進而生成新的個體。





由上式可知,變異操作實際是將兩個不同父代個體的差值加權后,再加到第三父代個體,然后得到一個新個體。差分化算法具極好的幾何意義。
在多重約束條件下,組卷問題實質是求最優解問題,滿足條件的最優解不止一個。計算機智能組卷依據數學模型進行軟件開發。差分進化算法在大學英語考試智能組卷中應用的流程,如圖1所示。

圖1 智能組卷程序流程圖
a.初始化組卷參數,包括組卷算法數學模型的參數(包括等難度系數、知識點、題型、區分度、答題時間、使用頻率,能力層次等)和差分進化算法參數(包括種群的大小、最大迭代次數、變異算子、交叉算子等)。


d.計算個體適應度值。適應度通過數值表示,用來評估相對于整個群體,個體向量質量的指標。計算適應度數值需要適應度函數(評價函數)。DE算法的適應度函數可隨意設定區域,不需要連續可微的限制,適應度函數取非負值,可提高適應性能好的個體被選擇的機率,使設計盡可能簡便化,降低計算的復雜度。
e.判斷是否滿足算法終止條件。最大進化代數作為算法的終止條件,還需其他判定準則。通常情況下,程序終止發生在目標函數值小于閾值(閾值常選為10)時;或者經判斷發現,連續若干代種群中的最優值都沒發生顯變化,程序終止。
f.差分進化操作。依據算法模型進行變異、交叉、選擇操作。
通過利用不同規模的真題庫,進行算法的模擬檢測。檢測結果表明,同基本遺傳算法相比,在組卷成功率與質量方面,該算法具備更優的性能。
大學英語考試實現自動化的重點工作就是智能組卷,保證智能組卷最大程度的與考試需求相匹配,使隨機智能組卷過程科學合理。在基于差分進化算法的智能組卷過程中,探索最優解用變異算子來實現,局部開發通過交叉算子實現,利用選擇策略保優,使種群完成最優進化。相比其他算法,BE算法高效穩定,具有魯棒性強、原理簡單、收斂性好、受控參數少等特點。根據大學英語教學和考試的需求,可快速構建智能組卷系統。但同時也需進一步完善優化,DE算法缺少相關理論基礎的支撐,為了進一步提高智能組卷系統的科學性合理性,需對DE算法進行擴展,同時注意有效融合其他算法,將是未來智能組卷算法的研究方向。