張美玲 王化雪
(東北石油大學,黑龍江 大慶 163000)
2020 年中共中央國務院印發的《深化新時代教育評價改革總體方案》明確要求“充分利用信息技術,提高教育評價的科學性、專業性和客觀性”。 傳統的語言測試往往只提供一個籠統的考試分數或語言能力估值,對“具有相同分數或相同語言能力的學生具有不同的知識狀態及不同的認知結構”這一現象無法做出解釋,相同分數的個體間差異無法區分,是什么因素導致學生試題做錯,學生掌握了什么語言技能、未掌握什么語言技能等信息無法獲取。 語言測試研究的發展已不滿足于研究側重整體語言能力的水平測試和成就測試,語言測試專家們更希望語言測試能夠提供診斷信息,能夠報告學生的認知結構[1]。 認知診斷通過分析學生內部的心理加工過程,不僅能夠得到宏觀的分數,還能評估學生的認知結構以挖掘其不足之處,并提供給師生具有診斷功能的反饋報告和補救性的學習建議,突破了以“分數”為維度的評價方式,能夠達到“診斷—反饋—補救”為一體的目標,與國家正需要的教育評價方式不謀而合。
廣義的認知診斷指測驗所得的分數與內部認知結構之間的關系,包括了在心理學、醫學和教育學中的應用。 而狹義的認知診斷僅指在教育教學中的應用,通過實施測驗來檢查學生是否掌握了本次測驗所要求的技能、知識以及掌握的程度,并根據測試的結果給予教師反饋,從而幫助教師調整教學方式。 本研究中采用狹義的認知診斷概念。
認知屬性是被試正確完成任務所需要的知識、技能、策略等,它是對被試問題解決心理內部加工過程的一種描述。
認知屬性之間是相互關聯的,它們可能存在一定的邏輯順序、心理順序和層級關系[2],雷頓由此總結提出了屬性層級關系模型,并將屬性層級關系劃分為5 種基本類型,分別是線性型、收縮型、分支型、無結構型和獨立型。
G-DINA 模型的假設是試題所考查的各屬性的掌握與否都會對回答正確的概率產生影響,即該模型考慮到了屬性之間相互作用對正確率的影響。該模型有兩個特征:第一是補償性,即某個屬性的掌握過剩能夠彌補其他屬性的掌握不足;第二是飽和性,即不僅包含所有單一屬性參數,還包含多屬性間的交互參數[3]。 其數學表達式為:
即正確回答試題的概率是在不同屬性掌握情況下的答對概率的累加。P(Xij=1 |a*lk)是指被試對項目j的答對概率;&j0是指被試未掌握項目測量的所有屬性而答對項目的概率,即猜測答對的概率,&j0≥0;&jk是指被試掌握單一屬性alk時,對答對項目j的概率的貢獻;&jkk′代表被試掌握屬性alk和alk′對項目j作答正確率的交互作用;&j12…k*j是指被試掌握項目j所測量的全部屬性對作答正確率的交互作用。
進行認知診斷分析需要借助認知診斷模型,不同的模型有不同的假設和適用條件,所以要根據實際情況選擇恰當的模型。 語言能力的各組成部分之間不是簡單的線性關系,而是一種互動關系,即交際活動中的各種知識、技能、心理活動以及場景因素相互作用、相互影響且不可分割[4]。 聽力技能具有抽象、綜合的特征,對認知診斷模型要求高,補償型模型契合了聽力技能的綜合性和多元性,飽和型模型比較理想地對應聽力能力的抽象性和難區分性[5],因此文章選擇補償飽和模型——G-DINA模型進行診斷分析。
Buck 和Tatsuoka 曾經利用規則空間模型診斷了TOEFL 的聽力部分[6],但是該套試題的題型極其單一,只有簡答題,且規則空間模型對認知屬性的劃分及屬性層級關系合理性的要求非常高,并不適合診斷抽象、多元和復雜的語言技能。
Lee 和Sawaki 開展了對TOEFL IBT 聽力部分的研究。 在該研究中,聽力認知屬性被劃分為理解主旨大義、理解文本結構、理解說話者的意圖、連接信息[7],但是認知屬性的劃分過于粗暴簡單,沒有考慮到聽力的認知加工特征。
Farchad 對目前應用最廣泛的6 種認知診斷模型做了比較,分析聽力技能的交互關系。 從擬合度來看,G-DINA 模型對聽力測試能夠生成最佳擬合度[8]。 隨后,研究者利用G-DINA 模型診斷被試聽力認知屬性掌握情況,發現詞匯和句法理解這兩個認知屬性對學生的聽力技能掌握程度影響最大。
孟亞茹將聽力認知屬性按照語言語篇能力和策略能力兩個維度劃分出7 個認知屬性:辨音語調和重音、詞匯和口語表達、語法結構、細節捕獲、主旨的抓取、上下文和文化背景推測、記憶和記筆記能力[9]。
肖云南和羅娟利用G-DINA 模型診斷了湖南大學2017 級新生的聽力能力。 研究者從語言學與認知心理學的角度劃分了7 個認知屬性,與其他聽力認知屬性劃分不同的是,該研究的聽力認知屬性在組成成分上更加具體明確[10],且能準確理解聽力的認知過程,有助于認知診斷分析。
趙亮在其博士論文里,對比分析了常用的認知診斷模型(G-DINA、DINA、DINO、ACDM、RRUM 和LLM)哪一個對聽力測試的診斷擬合度更高,結果表明G-DINA 模型的各項指標優于其他模型[11]。
本研究利用G-DINA 模型分析非英語專業大一學生的聽力認知屬性掌握情況,重點探究以下兩個問題:
1. 被試的聽力認知屬性掌握概率如何?2. 被試的聽力認知屬性掌握模式如何?
本研究選取東北D 大學1109 名非英語專業大一學生作為被試,參與大學英語聽力認知診斷測試。
作者在《中國英語能力等級量表》的基礎上,參考《大學英語教學指南(2020 版)》、《大學英語》教學大綱、《大學英語四六級》考試大綱和已有文獻,利用專家確定法和口語報告法確定了7 個影響非英語專業大一學生的聽力認知屬性,分別是:辨音(A1)、詞匯知識(A2)、語法知識(A3)、概括主旨大意(A4)、上下文推理(A5)、捕捉細節(A6)和短時記憶(A7)。 A1、A2、A3 和A4 屬于基礎聽力認知屬性,而A5、A6、A7 屬于高階認知屬性,這7 個認知屬性的層級關系屬于獨立型。
本研究的研究工具是由作者自主編制的大學英語聽力認知診斷測試卷。 作者通過上文所確定的聽力認知屬性和屬性層級關系,構建了Q 矩陣。在Q 矩陣的指導下廣泛搜索聽力真題,組合形成了大學英語聽力認知診斷測驗卷,共計19 道題,全部為選擇題。 經過量化檢驗,該試卷信度、效度良好,可用于施測。
通過分析聽力認知屬性掌握概率我們能夠清楚地獲知被試對每一個認知屬性的掌握情況,如果被試答對的考查了某一屬性的測驗題目越多,則說明被試對這一屬性的掌握情況越好。 利用G-DINA模型對1109 名被試的作答數據進行分析,可以得到被試整體的聽力認知屬性掌握概率。
通過表1 發現,被試整體對A1、A2 屬性掌握情況比較好,這說明被試在平時的學習中注重做辨音的練習,對詞匯的掌握也比較熟練。 但是對A3 和A4 屬性掌握情況比不上A1 和A2 屬性,這可能是因為被試平時多在閱讀或者寫作中比較注重語法概念,但是在聽力練習中更多關注了是否聽懂大義的問題,而沒有精聽語法細節。 被試的推理能力需要在綜合所聽到的所有信息基礎上才能做出正確的選擇,所以難度較大,導致A5 掌握概率較低。 A6與其他屬性綜合考查的次數多,被試需要更加復雜的心理加工技能,因此該屬性的掌握概率不高。 被試對A7 屬性的掌握概率只有32%,有很大的提升空間,平時可以做一些note-taking 的練習。

表1 被試整體聽力認知屬性掌握概率
通過分析聽力認知屬性掌握模式,可以精準地獲得被試對聽力認知屬性的掌握類型、被試當前知識狀態處于什么位置以及下一步努力的方向。 這些信息有利于幫助教師針對被試的知識漏洞精準地開展補救教學。 通過極大后驗估計法能夠得到每一個被試的聽力認知屬性掌握模式,將G-DINA模型測算出的被試的聽力認知屬性掌握模式歸入到理想屬性掌握模式,獲得被試整體的聽力認知屬性掌握模式比例分布。 標識聽力認知屬性掌握模式的7 位數字分別代表A1 到A7 這7 個屬性,用“1”表示掌握了該屬性,用“0”表示未掌握該屬性,由此能夠形成27=128 種理想屬性掌握模式。 在此只列舉占比較大的7 種理想屬性掌握模式。
從表2 可知,有72.75%的被試認知屬性掌握模式可以歸入到理想屬性掌握模式里,歸入率較高。一方面,說明G-DINA 模型與聽力測試的擬合度較高;另一方面,驗證了屬性劃分較為合理。 此外,被試的聽力認知屬性掌握模式進一步證明了被試對A5、A6 和A7 這三個高階認知屬性掌握的情況較差。 因此,教師應該著重補救這三個屬性,提高被試的高階聽力能力。 值得注意的是,還有將近三成的被試屬性掌握模式無法歸入到理想屬性掌握模式中,這部分被試應該是重點需要補救的對象。

表2 被試整體的理想屬性掌握模式比例分布
本研究利用G-DINA 模型分析非英語專業大一學生的聽力認知屬性掌握情況。 首先確定了影響非英語專業大一學生聽力的認知屬性和屬性層級關系,而后建立Q 矩陣,并在Q 矩陣的指導下編制了包含19 道題目的認知診斷測試卷用于施測。研究發現,非英語專業大一學生對辨音、詞匯知識、語法知識、概括主旨大意掌握程度較好,對上下文推理、捕捉細節和短時記憶的掌握程度較差;另外,有七成的被試聽力認知屬性掌握模式可歸入到理想屬性掌握模式中,說明被試當前的聽力認知結構良好。 本研究雖然生成了詳細的診斷結果,但是由于條件限制,并沒有根據診斷結果開展補救教學,后續研究可在此方面著手。