摘 要 效度是測量中的一個重要指標,本文簡單回顧效度概念發展的三個階段:單一效度觀時期、分類效度觀時期、效度一元化時期,并著重分析了效度概念現階段——效度一元化的發展。可以看出,效度概念是一個不斷發展的動態過程,現階段人們將不同的效度類型統合起來,形成統一的概念。對效度概念的新認識,大大拓寬了效度研究的范圍,對心理與教育測驗的研究有重要的指導意義。
關鍵詞 效度 構想效度 效度概念一元化
中圖分類號:B84 文獻標識碼:A
Development Review of Unitary Concept of Validity
SUN Yaqin[1], LIU Ling[1], WANG Jian[2]
([1] Professional Development Institute, Shenyang Normal University, Shenyang, Liaoning 110034;
[2] School of Art and Design, Shenyang Normal University, Shenyang, Liaoning 110034)
AbstractValidity is an important indicator in measurement, this article reviews three developmental period concerning the concept of validity: the period of single concept of validity (before 1950'), the period of categorized concept of validity (from 1950'to 1980') and the period of unitary concept of validity (from1980' to nowadays). Nowadays people integrate different types of validity, forming a unified concept. Validity has become a comprehensive concept that integrates different types of evidence of validity. It's significant that understanding of the concept of validity guides research of psychological and educational testing.
Key wordsvalidity; construct validity; unitary concept of validity
一個好的測驗必須具備兩個特點:一是可靠;二是有效。有效性是心理測驗最重要的特點之一,那么如何衡量一個測驗的有效性?效度是衡量一個測驗的有效性的尺度,是教育科學研究設計中應該遵守的標準之一,也是評價教育與心理研究及研究結果的科學性水平和質量的標準,如果沒有效度,包括信度在內的一切標準將毫無意義。效度是保證科研價值的關鍵,缺乏效度的研究往往缺失實際意義。本文從效度概念的發展階段入手,主要對效度概念的新進展,即效度一元化進行討論,以拓寬效度研究的范圍,指導心理與教育測驗的研究。
1 效度概念的發展階段
效度作為評價測驗工具有效性的重要指標,經歷了一個歷史演進的過程。效度概念的發展經歷了三個階段:
第一階段,單一效度觀時期(20世紀50年代之前),主要代表人物有Hull、Bingham、Guilford等人。這時的效度僅僅被看成一個相關系數,如Bingham認為,測驗的成績與采用其它客觀方法進行度量所得結果之間的相關就是效度;① Guilford甚至認為,只要一個測驗與某事物相關,那么對于該事物來說它就是有效的,也就是說相關即有效。②這種簡單的定義雖然符合測驗發展之初的需要且簡單易于理解,但是存在一種標準無法確定的問題。隨著效度理論和實踐的不斷發展,人們逐漸意識到盲目使用相關,研究有時可能會得出毫無意義的結果。
第二階段,分類效度觀時期(20世紀50年代至80年代中期),與第一階段比較簡單的定義相比,第二階段研究者們針對不同性質測驗的不同方面,提出多種類型的效度。據Angoff統計,在30年代至80年代的心理測量學文獻中至少有16種效度,如內容效度、構想效度、共時效度、聚斂效度、區分效度、效標關聯效度、生態效度、因子效度等等,這些令人眼花繚亂的效度概念,一方面說明效度的復雜性,另一方面也說明人們對效度的認識雖有深化但并未達成共識。③1954年,在美國心理學會編制的“教育和心理測驗標準”第二版中把效度分為4種,即內容效度、預測效度、共時效度和構想效度。由于預測效度和共時效度考察的都是測驗結果與另一客觀效標之間的相關程度,于是1966年出版的《教育和心理測驗標準》第三版中,將效度類型進一步簡化為效標關聯效度、構想效度和內容效度三種。這種“三分說”在70年代末和80年代初占統治地位,至今仍有很大影響。這一階段,人們普遍認為,不同的測驗有不同的效度要求,出現了上述各種與特定測驗目的相聯系的效度類型。
第三階段,效度一元化時期(80年代中期至今),一些學者認識到,人們在選擇效度證據時存在嚴重的隨意性,效度三分法是零散、不全面的。④在近十幾年的探索中,構想效度逐漸成為效度的核心,效度概念逐漸一元化,即效度一元化時期到來了。
2 效度概念一元化的發展的過程
2.1 構想效度的核心地位逐步顯現
效度概念一元化的過程,正是作為一元化理論基礎的構想效度的重要地位逐漸顯現的過程。
Messick認為,即便是為了應用,僅僅依賴效標效度和內容效度,范圍也是不夠的。測驗的使用者總是希望從測驗分數中得出對被試的各種表現的推論,而這種被試的表現最好能用一個表示某種特定心理結構的詞加以歸類。“實質上所有對測驗的應用都無可避免地需要把測驗分數解釋為能力的指標,而一旦我們提出‘這個測驗測量的是什么’的問題,我們就是在要求建立構想效度。所以構想效度被看成是一個一元化的概念;而構想效度的建立被看作是一個結合所有效度的基本證據的過程”。⑤
同樣,Cronbach的觀點也表達了相同的意思,“由分數得到的內容和效標證據都可歸于分數解釋”,那么“有關測驗的幾乎所有證據都可以歸于構想效度。而如果這些信息與理論的適應程度越高,它們就越有理由歸為構想效度。”因此,“構想效度包括了幾乎所有效度證據。”構想效度在測驗分數解釋中具有框架和核心作用。⑥
Anastasi總結說,“構想效度著眼于對特質或能力的更寬泛、更持久、也更抽象的描寫,綜合了人們關于內容及效標等方面的考慮,是一種具有高度概括性和包容性的概念。”⑦
2.2 效度概念逐漸一元化
多年來,效度研究的焦點逐漸演變。最初,其焦點放在具體參照標準的預測上。關于這一點,Gui1ford的描述最為典型,“概括地說,一個測量總是需要相對于它所關聯的那個東西有效”。⑧之后,效度研究的焦點漸漸轉移到有限幾種效度類型上,即內容效度、效標關聯效度和構想效度。再以后,焦點進一步轉移到測驗分數的解釋上。由此,效度概念逐漸一元化,Gronbach把這一趨勢簡潔地概括為“所有效度都是一個”。⑨
1966年美國心理學會(APA) 最早嘗試性地指出了一元化觀念:三種類型僅在概念上相互獨立,其重要性僅因需要而異,若想全面考查一個測驗,則需要考慮所有效度信息。1985年效度概念在日益廣泛的職業化應用中越來越系統;也正是在這一版本中,效度一元化被自然地提出;內容效度、效標關聯效度和構想效度也不再被稱作效度種類,而被作為了效度證明的三種范疇。
Anastasi在1968、1976和1982年出版的《心理測量》中,構想效度的比重逐漸增大。而1982年版中更稱內容、效標關聯和構想三種為是證明效度的證據而非效度。1984年版Cronbach《心理測量基礎》強調效度驗證的三方面統一結合起來對測驗進行解釋。
伴隨效度一元化概念的發展,出現了效度證明這個概念。效度證明是指效度證據的收集與評價過程,研究者對效度證明的關注與使用遠遠超過了效度本身,效度證明更能強調測驗的意義是一個建構、累積、辯證的動態過程。效度證明概念的出現也就標志著進入效度概念一元化階段,并隨著一元化效度的發展,效度證明概念被人們接受且逐漸成熟。效度證明是一個永無止境的過程,有兩方面的原因:(1)效度是一個“程度問題”,是一個相對概念,為了追求“高”效度,必須搜集盡可能多的證據。(2)世界上沒有一個測試永遠都是有效的,盡管某次測試的效度已經得到檢驗證明,但隨著影響測試行為因素的變化,效度研究也要繼續開展下去。效度的證明沒有一個最后的終點,而是一個持續進行的連續性過程。
3 結語
研究者們將效度概念一元化階段的發展特點概括為:效度是一元且多維的。人們將不同的效度類型統合起來,形成統一的概念,且這個概念是豐富的,它涵蓋效度對整個測驗多層次、多方面的要求。效度只有一個,但證明效度的證據卻可以來自許多方面,可以從內容、效標以及構想等多種渠道尋求支持。這個階段,效度已經成為一個統合各方面效度證據的綜合的、多維的概念。效度一元化把不同的效度類型統合起來,使效度理論既接近科學,又可照顧經驗層面及社會效應,是效度理論發展臻于完備的必然趨勢,也是當前教育與心理研究效度問題的焦點,我們期待效度概念進一步完善和成熟,并將用其指導于心理與教育研究過程的實踐中。
注釋
①BINGHAM,W. V. Aptitude and Aptitude Testing[M].New York: Harper Brother,1937,3
②GUILFORD,J. P. The nature of human Intelligence[M].New York: McGraw-Hill,1967,8-9
③孫曉敏,張厚粲.效度概念演進及其新發展[J].心理科學,2004.27(1):2-4.
④張寶均.傳統效度理論與統一構想效度的比較研究[J].北京林業大學學報(社科版),2003.2(4):69-72.
⑤MESSICK,S.Validity of psychological assessment:Validation of inferences from person’s responses and performance as scientific inquiry into scoring meaning[J].American Psychologist,1995.9:741-49.
⑥⑨CRONBACH,L.J.Essentials of psychological testing(4th ed.)[M].New York: HarperRow,1984.
⑦ANASTAS,A.Evolving concepts of test validation [J].Annual Review of Psychology,1986.37:1-15.
⑧GUILFORD,J. P. The nature of human Intelligence[M].New York: McGraw-Hill,1967.