范奕敏 張湘琳 曹玉卿 李 虹
(1 北京師范大學心理學部,兒童閱讀與學習研究院,應用實驗心理北京市重點實驗室,心理學國家級實驗教學示范中心(北京師范大學),北京 100875) (2 認知神經科學與學習國家重點實驗室(北京師范大學),北京 100875)(3 IDG/麥戈文腦科學研究院,北京 100875)
發展性閱讀障礙兒童擁有正常的智力以及良好的受教育機會,其神經器質無明顯缺陷,但閱讀能力顯著差于同齡兒童,其發生率約為5%~15%(舒華,孟祥芝,2000;Bender & Wall,1994),若未得到及時識別和干預,閱讀障礙兒童的學業表現、知識獲取、心理發展及職業選擇均會受到不良影響。
早期診斷是盡早干預的前提與基礎。基于能力?成績差異模型,研究者通過比較兒童的閱讀能力與IQ 所預期的閱讀能力之間的差異來判斷兒童是否存在閱讀障礙(劉云英,陶沙,2007)。盡管這種鑒別程序邏輯清晰,在研究中被廣泛使用,但智力測驗和閱讀能力測驗均需要專業人員一對一施測,難以大規模展開。因此,有研究者提出閱讀障礙兒童診斷的兩階段模型,即先根據兒童典型行為的頻率進行前期篩查,再對篩查出的高危兒童進行全面的專業檢測(Ho,2010)。這樣,相對于個別測驗,家長或教師可在日常生活中觀察兒童的真實行為表現,通過評定典型行為篩選高危兒童,可提高后續診斷的針對性和時效性,因而具有良好的實際運用前景。
針對漢語閱讀障礙兒童的日常行為表現,目前已有研究者進行了探索,并編制了適用于粵語閱讀障礙兒童的成熟篩查工具。如,Chan,Ho,Tsang,Lee 和Chung (2003,2004)參考英語閱讀障礙篩查工具(Dyslexia Screening Instrument)和當地教師經驗,編制了香港小學生讀寫困難行為量表(Hong Kong Specific Learning Difficulties Behavior Checklist,HKSLDBC)第一版,該量表包含65 個項目、12 個維度(字詞識別、漢字書寫、寫作、通常表現、數學、口語、記憶、專注、順序能力、動作協調性、空間方向性和社會/情感調整),除“動作協調性”和“社會/情感調整”外,其他維度均能顯著區分閱讀障礙兒童和正常兒童。Chan,Ho,Chung,Tsang 和Lee(2010)進一步簡化量表,研發了僅包含36 個項目、8 個維度(字詞識別、漢字書寫、寫作、通常表現、口語、記憶、專注、順序能力)的香港小學生讀寫困難行為量表第二版,而閱讀障礙兒童在8 個維度上均表現出明顯的問題行為。為了擴大適用范圍,Ching,Ho,Chan,Chung 和Lo(2013)編制了香港初中學生讀寫困難行為量表(Behavior Checklist of Specific Learning Difficulties in Reading and Writing for Junior Secondary School Students,BCL-JS),該量表包含52 個項目、7 個維度(字詞識別、漢字書寫、寫作、記憶組織能力、學習動機、內隱行為、外顯行為)。Wong(2004)研發了學前兒童學習情況行為量表(Parental Behavioral Checklist),該量表包含67 個項目、10 個維度(口語能力、學習能力、寫字表現、專注力、記憶力、順序能力、空間感、動作協調、小肌肉功能、社交及情緒表現)。
綜合分析上述問卷的維度,不難看出這些維度不僅包含認知技能缺陷對語言活動的特異性影響,如字詞識別、書寫、口語、言語記憶等,也包含認知缺陷對非語言特異性的日常生活的影響,如專注、空間感、動作協調、數學、學習動機等。前者符合閱讀障礙的語音核心缺陷(Morris et al.,1998)、雙重缺陷(Wolf & Bowers,1999)等語言特異性理論的預測,即閱讀障礙兒童的核心缺陷集中在語言學層面,表現為語言表征和加工困難;后者涵蓋了自動化缺陷假說(Nicolson & Fawcett,1990)等非語言特異性理論的觀點,即閱讀困難是由更深層的基本視覺、聽覺、記憶以及運動技能的發展缺陷造成的,行為問題在非語言任務中也會有所表現。
上述問卷在粵語閱讀障礙兒童的前期篩查方面發揮了巨大作用,但由于粵語與普通話的語言差異,研究者不能直接采用上述問卷篩查普通話閱讀障礙兒童(Ho,2010)。現有兩個類似目的的問卷探究了普通話兒童的閱讀相關行為特點,但兒童漢語閱讀障礙量表(盧珊,吳漢榮,2007;吳漢榮,宋然然,姚彬,2006;Hou et al.,2018)包含了不易在日常生活中觀察到的臨床指標,如“讀書時常常有看不清楚,或者看到的字有顫抖和閃爍的感覺”,導致家長作答難度大;兒童閱讀與書寫能力家長問卷(孟祥芝,劉紅云,周曉林,孟慶茂,2003;孟祥芝,周曉林,孔瑞芬,2002)只驗證了量表的信度及結構效度,缺少效標效度檢驗,不宜直接作為篩查工具。故本研究通過梳理閱讀障礙理論文獻并參考已有量表,確立量表維度,編制適用于漢語(普通話)兒童的閱讀障礙行為篩查家長問卷,進行修訂和信效度檢驗并計算量表區分分數,致力為閱讀障礙前期篩查提供有效工具。
樣本1。選取北京市一所小學1~6 年級學生共549 名。請輔導孩子學習的家長填寫量表,用于量表初步修訂。回收446份問卷,回收率為81.24%。去除無效率大于50%的問卷,最終有效問卷為432 份。被試信息見表1。

表1 樣本1 被試構成(n=432)
樣本2。選取北京市兩所小學2~4 年級學生共326 名。請輔導孩子學習的家長填寫正式量表,用于正式量表的信度和結構效度檢驗。回收有效問卷321 份,被試信息見表2。

表2 樣本2 被試構成(n=321)
樣本3。請樣本2 中的所有學生完成瑞文智力測驗(張厚粲,王曉平,1985)、不限時漢字識別測驗(依次命名從易到難排列的150 個漢字,不限時,記錄兒童正確識別的漢字數量為測驗成績)(Liu et al.,2017)和限時漢字識別測驗(要求兒童在1 分鐘內命名從易到難排列的100 個漢字,被試1 分鐘內正確識別的漢字數量為測驗成績)。基于以往研究者對閱讀障礙的操作定義(李虹,舒華,2009),選出智力正常且兩個漢字識別測驗中至少有一個低于同齡人一個標準差以下的學生為閱讀障礙組。參考前人研究(盧珊,吳漢榮,2007),在匹配年級、年齡和性別的前提下,在其余學生中選出兩倍數量的學生為對照組,用于正式問卷的效標效度檢驗和區分分數計算,兩組被試的年齡及測驗得分見表3。

表3 樣本3 中兩組被試的年齡及測驗得分(n=114)(M±SD)
從表3可以看出,兩組被試的年齡和智力水平無顯著差異,閱讀障礙組的漢字識別能力顯著落后于對照組。
2.2.1 量表維度確立及項目編制
首先,綜合參考已有漢語閱讀障礙兒童篩查行為量表的維度,梳理閱讀障礙兒童在日常生活和學習中可能出現的相關問題行為,合并、刪減、修改各量表維度,最終歸納為9 個維度:字詞識別、漢字書寫、寫作、口語表達、言語記憶、動機與態度、專注、數學、運動技能。
其次,借鑒、改編既有漢語閱讀障礙兒童行為量表家長問卷相關項目,編制各維度的項目。參考問卷包括香港小學生讀寫困難行為量表第一版及第二版(Chan et al.,2010;Chan et al.,2003)、香港初中學生讀寫困難行為量表(Ching et al.,2013)、學前兒童學習情況行為量表(Wong,2004)、兒童漢語閱讀障礙量表(吳漢榮等,2006)及兒童閱讀與書寫能力家長問卷(孟祥芝等,2002)。
最后,參考4 名閱讀障礙家長訪談以及專家意見,補充已有項目中未包含的漢語閱讀障礙兒童典型行為,修改部分項目表述,使之通俗易懂。最終選擇最符合各維度操作定義且維度歸屬明確清晰的78 個項目組成問卷初稿。
問卷為5 點頻率量表(1 代表“從未”,5 代表“總是”),要求家長根據孩子近期行為表現填寫,得分越高,代表孩子問題行為發生的頻率越高。
2.2.2 初步量表修訂和正式量表形成
根據樣本1 問卷結果,進行項目編制分析。
首先,采用臨界比率法根據量表總分高低將被試排序并劃分高低分組,得分最高的27%為高分組,得分最低的27%為低分組,進行t檢驗考察項目的區分能力,發現所有項目均能顯著區分兩組(p<0.001)。采用題總相關法計算各項目與維度總分的相關,系數大于0.6 時表明項目具有區分度。刪除相關系數小于0.6 的6 個項目,剩余72 個項目。
其次,用每個項目所有被試的平均分除以項目滿分(5 分)計算項目難度。發現難度平均為0.42,難度范圍為0.29~0.55,被試評分總體傾向于2~3 分,即問題行為頻率中等。
最后,參考劉紅云(2019)的方法,對72 個項目進行驗證性因素分析,根據結果進行項目刪除。刪除標準為:(1)在指定維度的因素載荷小于0.4 的項目;(2)允許項目與其他維度載荷自由估計時,修正指數較大的項目;(3)允許項目特殊因子相關時,修正指數較大的項目。每刪除一個項目后重新計算,直至模型擬合結果良好,且每個維度至少有3 個項目。據此刪除項目39 個,刪除后模型擬合良好(χ2/df=1.967,RMESA=0.047,TLI=0.935,CFI=0.944)。最終形成具有33 個項目、9 個維度的小學生閱讀障礙行為篩查家長問卷正式量表。9 個維度中,字詞識別指兒童正確識別漢字的能力;漢字書寫指兒童正確書寫漢字的能力;寫作指兒童使用書面符號表達思想的能力;口語表達指兒童使用口頭語言表達思想的能力;言語記憶指兒童對言語材料的識記、保持及再現能力;動機與態度指兒童參加學習活動的積極程度;專注指兒童集中注意力的能力;數學指兒童正確理解、記憶數字概念及計算的能力;運動技能指兒童的運動表現和協調性。
根據樣本2 數據,進行相關、信度和結構效度分析。使用樣本3 中兩組被試的數據進行效標效度分析,采用方差分析檢驗量表總體及各維度對兩組被試的區分能力;使用接受者操作特征曲線分析(receiver operating characteristic curve,ROC 曲線分析),計算能較好區分兩組兒童的區分分數。
首先,用樣本2 數據計算項目難度,發現難度平均為0.41,難度范圍為0.26~0.53,評分總體傾向于2~3 分,即問題行為頻率中等;其次,項目的題總相關均大于0.60,且項目均能區分得分最高的27% 的高分組與得分最低的27% 的低分組,項目區分度較好。上述結論與樣本1 結果一致,說明本問卷具有一定的穩定性。
計算樣本2 中量表總分和各維度分數的均值和標準差,并計算總平均分和各維度平均得分的相關,結果見表4,結果發現總量表和各維度得分間均顯著相關。

表4 樣本2 中總平均分、各維度平均分的描述統計及相關系數(n=321)
計算總量表和各個維度分量表的內部一致性系數,樣本1 和樣本2 的33 個項目量表的結果見下表,發現兩次施測的量表信度結果良好且穩定。見表5。

表5 量表信度檢驗(Cronbach’s α 系數)
3.4.1 結構效度
采用樣本2 數據進行驗證性因素分析,并將樣本1 的結果一同呈現,結果見表6。結果顯示兩次施測量表結構效度良好且穩定。

表6 模型擬合指數
3.4.2 效標效度
采用樣本3 數據,分別計算兩組被試的量表各維度平均分,并采用方差分析比較差異,結果見表7。結果發現除“運動技能”外,其他維度得分均能顯著區分兩組被試,且閱讀障礙組得分均高于對照組,即閱讀障礙兒童更頻繁地表現出問題行為。

表7 兩組被試的量表得分比較(n=114)
由于“運動技能”維度無法顯著區分兩組兒童,參考Chan 等人(2004)的方法,刪除這個維度,得到包含30 個項目8 個維度的最終版小學生閱讀障礙行為篩查家長問卷。計算閱讀障礙組和對照組的修正總平均分為2.45(SD=0.58)和1.97(SD=0.57),使用判別分析檢驗其區分能力,發現修正總平均分可以顯著區分兩組被試[Wilks’Λ=0.864,χ2(1,n=114)=16.337,p<0.001]。
對最終版量表的30 個項目8 個維度進行項目分析,發現項目難度平均為0.41,難度范圍為0.26~0.53,評分總體傾向于2~3 分,即問題行為頻率中等。項目的題總相關均大于0.60,即最終量表項目具有較好的區分度。最終量表的量表總分平均為2.06,標準差為0.62,量表總分與各維度平均分間顯著相關,具體見表4。最終量表內部一致性系數為0.959,該量表信度良好。驗證性因素分析發現最終量表模型擬合較好(χ2/df=2.281,RMESA=0.063,TLI=0.903,CFI=0.916),即結構效度良好。判別分析顯示最終量表總平均分顯著區分閱讀障礙兒童和正常能力兒童,即效標效度良好。
為了探究兒童被篩查為閱讀障礙高危兒童的得分標準,采用樣本3 數據,使用ROC 曲線分析,計算最終量表總平均分的敏感性(正確選出閱讀障礙兒童的比例)和特異性(正確選出正常兒童的比例),找出最合適的區分分數(敏感性和特異性之和最大值對應的分數),結果見表8。修正總平均分為2.00 時,敏感性(81.58%)和特異性(52.63%)之和最大。

表8 量表修正總平均分的區分分數(n=114)
使用該行為量表時,當得分等于或高于2.00,意味著兒童存在閱讀障礙高風險,應推薦進行專業檢測;當得分低于2.00,可認為目前風險較低,家長可持續關注兒童日常表現即可。
本研究研發了一個適用于普通話兒童的閱讀障礙前期篩查工具,并探索了其有效性和準確性。編制過程中參考已有工具的維度劃分和相關結果,使得量表維度包含閱讀障礙語言特異性理論指向的典型問題行為和非語言特異性理論預測的日常問題行為。綜合梳理現有問卷項目并進行內容分析、家長訪談和專家分析,使得項目來源具有可靠性;修改不易理解的表述或不易日常觀察的行為例子,保證家長對項目的可理解性,確保家長可通過觀察日常行為評估兒童,具有較好的實用性。
分別針對不同學生樣本和不同數量項目,對量表進行了多次分析,發現項目難度、區分度、各維度的相關系數、內部一致性系數和結構效度的結果保持一致且良好,說明該量表具有較好的穩定性和有效性,達到了量表開發的心理測量學基本要求。
比較本研究的最終量表和已有工具的結果,在信度方面,本量表總體一致性系數為0.959,維度內部一致性系數在0.623~0.878 之間,和已有工具的信度指標相近,但本量表只有30 個項目8 個維度,維度平均項目數為3.75,項目較少。而兒童漢語閱讀障礙量表(吳漢榮等,2006)總體一致性系數為0.724,維度內部一致性系數在0.750~0.867 之間,有56 個項目8 個維度,維度平均項目數為7;兒童閱讀與書寫能力家長問卷(孟祥芝等,2003)的維度內部一致性系數在0.524~0.895 之間,有36 個項目8 個維度,維度平均項目數為4.50;香港小學生讀寫困難行為量表(第一版)(Chan et al.,2004)維度內部一致性系數在0.73~0.96 之間,有65 個項目12 個維度,維度平均項目數為5.42。通常項目越多,維度內部一致性越好。本量表采用較少的項目就得到和前人相近的信度指標,這可能意味著本量表有更高的測查效率。
其次,在效度方面,針對本研究最終量表的驗證性因素分析顯示,8 個維度的模型擬合良好,效標效度分析顯示這8 個維度能夠有效區分閱讀障礙兒童和正常兒童。這與前人的閱讀障礙行為研究結果一致(張承芬,張景煥,常淑敏,周晶,1998;Chan et al.,2004;Chung,Ho,Chan,Tsang,& Lee,2011),且彌補了現有問卷未能驗證效標效度的不足(孟祥芝等,2002),表明對閱讀障礙兒童的問題行為觀察應重點集中于字詞識別、漢字書寫、寫作、口語表達、言語記憶、動機與態度、專注、數學8 個方面。本量表項目數量少,作答方便,可作為大面積篩查閱讀障礙的工具,起到風險預警作用。
值得注意的是,本研究未找到支持閱讀障礙兒童存在運動技能缺陷的證據,這與香港小學生讀寫困難行為量表(第一版)相關研究結果一致(Chan et al.,2004),該研究發現動作協調性維度無法顯著區分正常能力兒童和閱讀障礙兒童,可能是由于閱讀障礙存在不同亞類型(Nicolson & Fawcett,1995),具有不同行為表現,今后需要更大樣本的研究進行深入探索。
區分分數計算中,ROC 曲線分析顯示量表修正總平均分2.00 為最佳區分分數,此時敏感性(81.58%)和特異性(52.63%)之和最高。敏感性高于80%表明該量表能有效地檢測出八成以上的閱讀障礙高風險兒童。即當某名兒童的總平均分高于或等于2.00 時,提示該名兒童存在風險,應該讓其接受后續的綜合閱讀能力評估,以得到及時診斷和干預。
雖然本研究的量表特異性只有52.63%,表明量表在判定正常兒童時準確性有限,有可能錯誤地將約一半的正常兒童判定為高危兒童,但現有篩查問卷的特異性均不太高。例如,Chan 等人(2004)的65 個項目12 個維度的問卷特異性為6 4%,3 6 個項目8 個維度問卷的特異性也是64%(Chan et al.,2010)。一方面,這可能是由于現有行為量表的維度設計涵蓋了豐富多樣的維度,在全面刻畫兒童行為的同時,也可能使閱讀障礙風險篩查針對性較低,尤其閱讀障礙和多動癥有較高的共患率(Willcutt & Pennington,2000),家長和教師觀察到兒童的問題行為,但不能區分真正原因,因此必須結合后續閱讀能力測量才能真正診斷閱讀障礙。另一方面,這可能與中國家長普遍的望子成龍心態有關,嚴格的教育理念易使家長注意到孩子的不足,容易虛報正常兒童的問題行為頻率。此外,閱讀能力高低是一個連續體,高分閱讀障礙兒童和低分正常兒童之間的差異本就不大,從前期篩選、盡早干預的目的出發,誤判正常兒童為高危兒童,可能有助于發現閱讀落后,但尚未達到障礙程度的有特殊教育潛在需要的兒童。本量表主要目的是早期篩選,提示風險的存在,只有后續測查確認或者排除閱讀障礙,才能確定兒童今后的干預目標與方法。
本研究編制的最終版小學生閱讀障礙行為篩查量表包含30 個項目,分為8 個維度(字詞識別、漢字書寫、寫作、口語表達、言語記憶、動機與態度、專注、數學)。題目通俗易懂,作答方便,量表信效度良好,有明確的區分分數,可用于今后漢語閱讀障礙兒童的前期篩選,提高后續的評估效率。