潘 峰
(南通大學 紡織服裝學院,江蘇 南通 226019)
托尼非語文智力測驗(普及版乙式)的心理測量學分析
潘 峰
(南通大學 紡織服裝學院,江蘇 南通 226019)
本研究采用TONI—3(普及版乙式)測驗了上海市區的496名兒童及青少年,對被試樣本進行樣本分布分析,信效度分析、項目分析,且對被試的性別、年齡差異進行顯著性檢驗,結果表明性別差異不顯著,而年齡差異顯著,為該智力測驗的本土推廣提供參考。
TONI—3 智力測驗 心理測量 統計檢驗
托尼非文字智力測驗(TestofNonverbalIntelligence,簡稱TONI)是以非文字的方式評價被試者的問題解決能力和智力水平的一個智力測驗,于1982年出版,1990年修訂后簡稱TONI—2,1997年Brown等人再編制 《托尼非語文智力測驗第三版》(TONI—3)。此次中文版的修訂即根據第三版,第三版延續原TONI的基本精神——不受語言文化影響,且能評價被試的問題解決能力。美國原版測驗適用于6至89歲的被試。該測驗不受被試的文化背景和教育水平的影響,適合測量的年齡范圍較廣、篩查較細,是應用于團體和個人的一個鑒別效果較好的潛能評估測驗。由于國內非文字類智力測驗種類很少,而當前教育教學等實際應用急需對一般和特殊兒童的智力水平進行具有較高鑒別力的評估,因此,很有必要引進和修訂這個測驗。
托尼非文字智力測驗是由L.Brown,R.J.Sherbenon和S.K. Johnsen編制的。該測驗主要是以非文字測驗的七項原則為根據編制的,這七項原則是:1.用作業的方式取代紙筆測驗;2.以手勢而非口語或文字方式施測;3.正式施測前設有例題幫助被試者熟悉答題過程;4.測驗時間不作限制;5.測驗題型具有抽象性;6.著重推理或問題解決而非具體知識的回憶;7.測驗題目應該避免過去學習經驗的影響。
此外,在編制的基本指導思想上,該測驗是以評價被試者對抽象圖形的問題解決能力為目的的,編制者認為:問題解決是在認知過程中的一種普遍、共通性的活動,足以反映個人的智力水平。強調以問題解決能力作為智力評價的核心成分的重要性。在這方面,有著名心理學家提出類似的觀點:“智力是指個體解決問題所需的能力”,“問題解決能力是智力的共同成分或智力結構的核心,而不是一種獨特分離的技能,或是次要的認知成分”。此外,在編制本測驗時,編制者還仔細研究了瑞文標準推理測驗(SPM)、彩色推理測驗(CPM),以及韋氏智力測驗各版本的操作測驗等。與這些測驗的主導思想的不同之處在于,瑞文測驗十分強調推理能力,認為推理能力包括有效解決問題的能力,而本測驗的編制者認為,推理只是在解決問題時的一種思考過程,推理能力只是問題解決能力的一種。
因此,“問題解決能力”可以說是智力結構中最重要的部分。在托尼測驗中,是以簡單配合、相似性、分類、交叉、漸進五種解決抽象圖形問題的基本策略界定“問題解決能力”結構的。在施測過程中,被試者需要鑒別、分析抽象圖形之間的關系,并據此解決問題。本測驗的每一個題目都呈現出一個刺激組型,其中缺少一個(或一組)圖形,被試者必須從選項中選出一個正確答案完成此組型。這些解決抽象圖形問題的策略由易到難、循序漸進。該測驗的施測一般不作時間限制,中文修訂版寬限至30分鐘。測驗題目均為非文字圖形方式的題型。受試者的回答反應過程可以不涉及聽、說、讀、寫能力,只需要運用簡單的動作反應。并且測驗題冊一頁一題,依難易程度排列。中文版設有五個例題可以讓受試者熟悉題型和回答方式。施測時主試可以用手勢說明,受試者則以簡單的動作指出答案 (尤其適用于低年齡或身心障礙者),或在答案紙上劃記作答。
本次施測由華東師范大學金瑜教授引進臺灣修訂的TONI—3中文版,檢查其中各項目在中國上海的可用性,嘗試制作出中國上海的智力測驗常模。

表2 各年級性別分布
本研究選擇了上海市26個學校的學生,涵蓋了從幼兒園到高中的學生樣本,在所選學校隨機分別抽取一個普通班作為樣本進行普及版乙式的施測。最后選取的樣本總數為496人,樣本的年齡分布從7歲6個月到18歲5個月,其中男生252名,女生244名。具體各年齡階段男女生人數分布見表1,各年級男女生人數分布信息見表2。卡方檢驗表明,12歲6個月到13歲5個月這一年齡段和7年級的男女生人數分布在0.01水平上,存在顯著差異,而其余年齡段、年級段及總人數的男女人數分布均無顯著差異。
本研究用團體測驗法施測,即主試將測驗題本和測驗紙發放給學生,由學生在班上集體作答。之前,先由主試者帶領做五道練習題,以熟悉測驗的題型和作答方式。然后正式開始作答,時間為30分鐘。最終回收試卷496份。數據利用Excel和SPSS12.0進行統計分析。
1.原始分數的分布情況
原始數據一般信息見表3、圖1及圖2。由圖1、圖2可知,測試分數呈負偏態分布。經T檢驗,男女不存在顯著差異。

表3 原始分數分布情況

圖1 原始數據分布直方圖

圖2 原始數據分布正態QQ圖
2.不同年級之間測試得分平均數的差異分析
本研究采用方差分析考查不同年級受測者在得分上的差異,結果見表4。

表4 不同年級組平均分及標準差
方差分析結果表明,不同年級之間的測試得分存在顯著差異。由于組間存在方差不齊性現象,故采用Tamhane’s T2方法進行多重比較,結果如表5所示。分析結果表明,一年級和三年級的得分與其他年級幾乎不存在顯著差異,可能是本研究在這三個年級中所選取的樣本數量過少。其余年級則均與除自身之外的其他年級平均得分間存在顯著差異,但是相鄰年級之間得分不存在顯著差異。

表5 事后多重比較檢驗表

注:*p<0.05。
3.項目分析
本測驗采用回答正確率作為難度估計指標,用項目鑒別指數作為區分度指標。區分度的具體計算方法為以總分最高的27%的被試作為高分組,而總分最低的27%的被試為低分組,高分組被試在某一項目上的通過率減去低分組被試的通過率即為該項目的項目鑒別指數。本研究的項目分析結果如表6所示。不難發現,總體測題的難度分布不均,樣本中有32題回答正確率在90%以上。此外,有不少題目的項目鑒別指數都低于0.19,按照測量理論,這些題目是應該刪除的,但是我們并不能排除可能存在其他干擾因素而導致這樣的結果。

表6 測驗的難度及區分度分析結果
4.信度分析
本研究用KR—20公式計算內在一致性信度為0.9,用分半法計算分半系數為0.92。以上兩種信度系數均基本達到心理測量學的要求。由于本研究沒有進行重復測量,也沒有對甲式版本進行分析,因此未使用重測信度和復本信度指標。
5.效度分析
因手頭資料不夠充足,故筆者沒有對樣本進行實證效度研究,本研究采用以上信度研究中的內在一致性信度指標對本測驗進行結構效度的分析。
在樣本方面,本次測試研究所選取的被試樣本數量可能不算太大,且其測驗所得的分數分布呈一個明顯的負偏態,兩端人數很少。這些與我們本次所抽取測試的被試均為正常學校而未涉及特殊學校有關。因此,樣本的這一特點使得我們后續研究,諸如項目分析、信度研究及效度研究中得到一些不太優良的指標。然而,盡管對樣本的選取存在一定問題,但是根據項目分析結果,確實存在某些區分度并不好的測題,這可能會影響整個測驗的效度。
[1]L·克羅克,J·阿爾吉納著.金瑜等譯.經典和現代測驗理論導論[M].上海:華東師范大學出版社,2004.
[2]金瑜.心理測量[M].上海:華東師范大學,2005.
[3]盧紋岱主編.SPSSfor Windows統計分析(第三版)[M].北京:電子工業出版社,2006.
[4]郭志剛.社會統計分析方法——SPSS軟件應用[M].北京:中國人民大學出版社,2001.