王瑞明 林哲婷,2 劉志雅
(1華南師范大學心理應用研究中心/心理學院, 廣州 510631) (2北京師范大學心理學院, 北京 100875)
類別學習能力是人類的基本能力, 人類通過分類來進行信息的檢索, 把紛繁復雜的世界知識進行有序的組織。當遇到新的事物或刺激時, 這種世界知識的組織方式, 將決定這些新信息如何有效地存儲, 以至于決定了隨后的推理或者行為反應。類別學習的研究一直備受關注, 特別是學習了某個新的類別知識后形成的類別表征(Ashby & Maddox,2005)。目前, 類別學習的研究主要有兩種形式。一是分類學習, 即根據樣例所具有的特征判斷其類別屬性。如判斷空中飛翔的動物是老鷹還是蒼蠅。此類研究主要探討材料的物理特征、呈現方式、個體心理差異等對歸類活動的影響。二是推理學習, 即在已知類別歸屬的情況下預測樣例的未知特征。如已知空中飛翔的是老鷹, 可以推測它有一對翅膀。此類研究主要探討特征典型性(Yamauchi &Markman, 2000)、因果知識(Rehder & Burnett, 2005;Hayes & Thompson, 2007)對預測準確性的影響。這兩種學習任務信息加工策略不同, 分類任務使被試更為關注類別間差異信息, 推理任務則更為關注類別間的共同信息(Yamauchi, Love, & Markman,2002; 劉志雅, 莫雷, 2006)。
研究者發現有兩種重要的信息參與了類別表征, 診斷性(diagnosticity)特征信息和典型性(prototypicality)特征信息(Chin-Parker & Ross, 2002;2004; 陰國恩, 李勇, 2007)。所謂診斷性特征信息,是指可以區分類別歸屬的特征; 典型性特征信息是類別內與樣例原型一樣的特征。診斷性特征傾向于成為類別內部的典型性特征, 而典型性特征卻不一定可以成為診斷性特征。比如“會吠”是區分狗和貓類別的診斷性特征, 它同時也是狗的典型性特征,“短毛”是狗的典型性特征, 但卻不是區分狗和貓的診斷性特征。而非診斷性特征(nondiagnostic feature)信息是指在樣例中除了診斷性特征以外的典型性特征信息, 如狗的“短毛”特征。
如果把類別標簽和類別特征都看成是類別的相應維度, 那么, 假如某個樣例屬于類別 A (或者B), 并擁有 5個類別特征, 每個特征又有兩種水平(特征值0或1), 當其特征值都為0時, 即可將其表示為(A,0,0,0,0)。由此, 類別分類任務可表示為(?,0,0,0,0); 推理任務可表示為(A,0,?,0,0)。可見, 無論類別分類任務還是類別推理任務本質上都是個體根據類別的心理表征對未知的樣例維度信息做出預測, 這種預測的一個關鍵問題是如何借助于可以區分類別歸屬的特征, 即診斷性特征信息(Markman & Ross, 2003)。
先前研究主要比較了分類和推理這兩種不同類別學習任務的難易程度、學習的性質以及信息加工過程等(Yamauchi & Markman, 2000; Yamauchi,Love, & Markman, 2002; 劉志雅, 莫雷, 2006;2009)。Chin-Parker和 Ross (2002, 2004)的研究表明,不同的類別學習方式形成不同的心理表征。分類學習者關注類別間的區分性信息, 對診斷性特征信息更為敏感。而推理學習者則關注的是類別內的相同信息, 對典型性信息則更為敏感。而 Yamauchi和Markman (2000), Yamauchi, Love和Markman(2002)所做的有關類別學習中順序效應的研究表明, 先進行推理學習有利于隨后的分類學習, 而分類學習對于隨后的推理學習則沒有顯著影響。也就是說, 在推理學習任務中, 可以同時學到典型性和診斷性特征信息, 而在分類學習任務中只能學到診斷性特征信息, 不能學習非診斷性特征信息(Markman &Ross, 2003)。例如, Chin-Parker和 Ross (2004)研究了類別學習中的特征診斷效應。實驗材料由5個特征組成的蟲子構成, 兩個類別原型是重疊的(A,0,0,0,0,0)和(B,0,0,1,1,1)。所有學習的樣例都只有一個特征和原型不同, 構成家族相似性結構。遷移測驗的項目與原型有不同程度的重疊。例如, 某個項目3個特征和原型A重疊, 可能重疊的都是診斷性特征(A,1,1,0,0,0), 也可能重疊的有2個診斷性特征和一個非診斷性特征(A,1,0,0,0,1)。結果發現,對于分類學習者, 典型性評價主要的影響來自和原型重疊的診斷性特征的數目, 總特征重疊的數目多少幾乎沒有影響, 對于推理學習者, 單獨的診斷性特征重疊的數目對典型性判斷影響很小, 更多的是總特征重疊數目。以往研究側重于利用選擇注意假設(selective attention hypothesis)來解釋這種結果(Kruschke,1992; Nosofsky & Zaki, 2002; Medin &Schaffer, 1978; Rehder & Hoffman, 2005a, 2005b;Hoffman & Rehder, 2010; Kim & Rehder, 2011), 即在注意資源有限的情況下, 分類學習導致了注意分配的不均勻, 注意資源更多地分配到了診斷性信息上, 相應的, 非診斷性信息具有的注意資源就減少了。
而 Taylor和 Ross (2009)認為需要對類別學習做一個更全面的理解, 為此, 他們針對分類學習不能學到非診斷性信息提出兩種假設。一是非診斷性特征不能促進分類學習; 二是分類學習中也能夠學習到非診斷性特征, 只是實驗室的非自然條件難以觀察到這種結果。Taylor和Ross (2009)根據第二種假設, 設計了新的類別學習任務。采用了三維立體的刺激作為材料, 由于在兩維的顯示屏上呈現, 必然使到刺激的背面的特征被遮擋, 并通過這種方法操縱缺失特征來進行分類學習。他們指出這種任務更接近自然的條件, 即絕大部分的事物都存在一些被遮擋了的特征。Taylor等人的研究中使用了全部呈現和部分呈現(缺失 2個特征)兩種條件, 結果表明, 部分呈現條件下的分類學習也能表征典型性信息, 即分類學習任務中仍然可以學到非診斷性信息。作者用注意廣度來解釋這種現象, 認為由于注意的資源有限, 部分呈現條件下分類學習的被試需要注意的特征較少, 此時就有更多的注意資源分配到非診斷性特征上, 而在全部呈現條件下, 被試要注意更多的特征, 注意的廣度變大, 而被試的注意資源有限, 只能將注意資源放在了作用性更大的診斷性特征上。
但是, 本研究因為, Taylor和Ross (2009)的研究中部分呈現條件下的分類學習能學會非診斷性信息, 并不是注意廣度的影響, 實際上是因為被試在這種分類學習任務時也同時進行了推理學習。而推理學習是能夠表征非診斷性信息的, 這樣就跟先前大多數研究者認為的“推理學習任務中可以同時學到典型性和診斷性特征信息, 分類學習任務中只能學到診斷性特征信息而不能學習非診斷性特征信息”的觀點相一致。
為了進一步探討 Taylor和 Ross (2009)實驗結果的真正原因, 并驗證本研究的基本設想。我們設計了2個實驗。實驗1在重復Taylor和Ross (2009)的實驗的基礎上增加了“缺失1個特征”這一實驗條件, 如果部分呈現條件下的分類學習能學會非診斷性信息是注意廣度的影響, 那么“缺失1個特征”和“缺失2個特征”條件下非診斷性信息的變化也會有顯著差異; 如果部分呈現條件下的分類學習能學會非診斷性信息是被試進行了推理學習造成的, 那么只會出現部分呈現條件下非診斷性信息有變化, 全部呈現條件下非診斷性信息沒有變化。實驗2則進一步確證部分呈現條件下的分類學習能學會非診斷性信息確實是被試進行了推理學習造成的。實驗條件有3種, 全部呈現7個特征、全部呈現5個特征和部分呈現5個特征。前兩個水平間的注意廣度不同(一個水平要注意7個特征、一個水平要注意5個特征)但推理情況相同(都不需要進行推理學習)。而后兩個水平間的注意廣度相同(都只需要注意 5個特征)但推理情況不同(一個水平需要推理學習、一個水平不需要推理學習)。如果前兩個水平在非診斷性息加工上出現差異, 則說明是注意廣度的影響; 如果后兩個水平在非診斷性信息加工上出現差異, 則說明是推理加工的影響。
在學習后的遷移材料中增加了 14個低典型的評定材料(見表1), 在重復Taylor和Ross (2009)的實驗的基礎上增加了“缺失 1個特征”這一實驗條件,進一步探討部分呈現條件下的分類學習中能否學會非診斷性信息以及學會非診斷性信息的原因。
大學一年級本科生 72名, 分為 3組, 每組 24人, 男女各半。
借用了Taylor和Ross (2009)所用的實驗材料,并進行了改進。包括兩種虛構的昆蟲, 第一類命名為“Deeger”, 第二類稱為“Koozle”。這兩種類昆蟲均具有 6個特征維度(觸角、翅膀、前肢、后腳、眼睛、尾巴), 每個維度又有兩種特征, 分別用1和0表示相同維度下的不同特征。同一類別內部特征的典型性值是一樣的, 但其中有 4個診斷性特征(如尾巴、前肢、眼睛、后腳)和2個非診斷性特征(如翅膀、觸角), 其特征診斷力分別為 83%和 50%。“Deeger”的類別原型是 111111, “Koozle”的類別原型是000011。圖1為兩種類別的原型。實驗1首先探討具有相同原型的分類學習中, 缺失特征的數目是否影響分類學習的結果。
材料是兩種昆蟲的樣例, 即“Deeger”和“Koozle”。
學習階段, 全部呈現條件下的學習項目是 12張昆蟲圖片, 不包括原型。而部分呈現條件下則是在這12張圖片中隨機遮掉1個或2個特征作為學習項目, 缺失1個特征時總共有72個學習項目, 缺失2個特征時總共有180個學習項目。所有學習的樣例只有一個特征和原型不同, 構成線性分離的家族相似性類別結構(linearly separable category,Yamauchi & Markman, 2000)。
典型性評定階段, 樣例分別是由與原型有 4個、5個和 6個相同的特征組成, 所有典型性評定階段的樣例都是完整呈現的。與原型有4個相同特征的樣例稱為低典型, 與原型有5個相同特征的樣例稱為高典型, “高典型”和“低典型”后面的數字2,3,4分別表示的是診斷性特征的數目。例如, 原型為Deeger樣例 111110即可表示為高典型4。表1中所示的是實驗1典型性評定的樣例。
本實驗采用單因素被試間設計, 自變量是材料呈現的完整性, 分為全部呈現、缺失1個特征、缺失2個特征的學習任務3種水平。

圖1 實驗1所用材料示例

表1 實驗1中典型性評定項目
實驗分為學習階段和典型性評定階段。在學習階段, 屏幕呈現指導語, 被試理解后屏幕正中央開始呈現圖片, 要求被試判斷其為“Deeger”還是“Koozle”。如果是“Deeger”則按 D 鍵, 是“Koozle”則按K鍵, 判斷后即刻給予反饋, 接著圖片上方呈現正確答案, 并和圖片一起保持 2s, 然后出現下一張圖。類別學習的開始階段被試只能猜測和試誤,隨著實驗的進行, 他們會逐漸根據自己的觀察和反饋信息對類別特征進行學習。不管是全部呈現還是部分呈現, 被試都被要求做完至少 50個 trial直到對連續9張圖片判斷完全正確為止才能達到學習標準。接下來是典型性評定階段, 在屏幕上逐個呈現表 1中的完整樣例圖片和類別的標簽(Deeger和Koozle), 要求被試對該圖片在這個類別中的典型性進行評定。按1~7數字鍵反應, 數字越大代表典型性越高。
學習階段:
全部呈現條件下, 被試達到學習標準平均需要83.46個trials (SD
=30.92), 缺失1個特征條件下需要82.96個trials (SD
=32.98), 缺失兩個需要72.91個trials (SD
=19.28)。盡管缺失條件下被試達到學習標準比全部呈現條件下快, 但是三者差異不顯著,F
(2,69)=0.99,p
>0.05。說明了3種學習條件下, 被試以相同的效率達到的相同的學習程度, 這個結果與Taylor和Ross (2009)的研究一致。典型性評定:
實驗1中各條件的典型性評定的均值見表2。
從表 2看, 3種呈現條件下都表現出了顯著的診斷性信息變化, 與學習樣例的原型相似在診斷性特征數目越多, 獲得的典型性評價越高(表 2:4>3>2); 但是, 只有在缺失特征的條件下, 非診斷性信息的變化差異顯著。表3計算出了被試在樣例不同呈現形式條件下對于診斷性和非診斷性信息變化的均值與標準差。
通過學習后對新刺激(表 1)的典型性評定, 分析被試對診斷性信息和非診斷性信息的加工差異。計算診斷性信息變化下的典型性評定量的變化, 方法是求具有相同典型性但相差一個診斷性特征樣例間的典型性評定均值的差, 見表 1, 計算高典型4-(減號)高典型3; 低典型4-低典型3; 低典型3-低典型2的典型性評定均值的差, 然后三者再求均值,就是診斷性變化一個等級下的典型性評定量的變化; 同理, 計算非診斷性變化下的典型性評定量的變化, 求具有相同診斷性但相差一個非診斷性特征樣例間典型性評定均值的差, 即計算原型-高典型4; 高典型 4-低典型4; 高典型 3-低典型3; 然后三者再求均值, 就是非診斷性變化一個等級下的典型性評定量的變化, 結果見表3。
采用典型性評定變化量與基線值0進行t檢驗的方法進行差異比較。結果表明, 只有在全部呈現形式和非診斷性變化下的均值(0.04)與基線值差異不顯著,t
(25)=1.71,p
=0.10, 說明全部呈現學習條件下, 被試對新刺激的典型性評定, 未受到非診斷性信息變化的影響。此外, 表3中其它的5組平均數與基線值的比較均顯著差異。其中, 診斷性變化和全部呈現條件,t
(25)=11.57,p
<0.01, η=0.83;診斷性變化和缺失 1個特征條件,t
(23)=7.54,p
<0.01, η=0.71; 診斷性和缺失2個條件,t
(21) =3.24,p
<0.01, η=0.37, 說明不管是全部呈現條件還是部分呈現條件, 被試對新刺激的典型性評定,均受到診斷性變化的影響, 診斷性信息都能夠促進被試進行分類學習。其中, 非診斷性變化和缺失1個特征條件,t
(23)=3.01,p
<0.01, η=0.28,非診斷性變化和缺失2個特征條件,t
(21)=2.30,p
<0.05, η=0.20, 說明部分呈現條件下, 被試對新刺激的典型性評定, 受到非診斷性變化的影響,這時候的非診斷性信息都能夠促進被試進行分類學習。
表2 實驗1中典型性評定各類型樣例的均值

表3 不同呈現形式條件下被試判斷診斷性和非診斷性信息變化的均值與標準差
3種呈現條件下診斷性變化的方差分析結果表明, 三者差異顯著,F
(2,69)=5.30,p
<0.01, 多重比較結果說明, 全部呈現和缺失2個特征條件間的診斷性變化有顯著差異:t
(46)=3.18,p
<0.05, η=0.18; 缺失2個和缺失1個條件下的診斷性變化也有顯著差異:t
(44)=2.29,p
<0.05, η=0.11, 這個結果表明, 只有在缺失2個特征條件下的分類學習者才顯著受到診斷性信息的變化的影響。3種呈現條件下非診斷性變化的方差分析結果表明, 三者差異顯著,F
(2,69)=3.73,p
<0.05, 多重比較結果表明, 全部呈現<缺失1個特征=缺失2個特征,t
(46)=1.87,p
<0.05, η=0.07;t
(44)=0.87,p
>0.05, η=0.27, 即非診斷性信息(典型性信息)促進了部分呈現條件下的分類學習。總的來說, 本實驗結果符合預期, 并且與Taylor和Ross (2009)研究結果一致。證明不管是在全部呈現條件下還是缺失條件下, 被試都能夠學習到診斷性特征信息, 但是, 只有在缺失條件下, 被試在做典型性評定的時候才會受到非診斷性特征變化的影響。同時還表明, 缺失2個特征條件下學習的速度最快(但差異不顯著), 平均只需要 72.91個 trials就達到學習標準, 而缺失 1個特征條件下需要 82.96個 trials, 全部呈現條件需要 83.46個trials, 說明缺失特征越多, 學習效率越高。
為何缺失條件下分類學習能夠加工非診斷信息, 而且學習效率還更高, Taylor和Ross (2009)研究的解釋是因為注意廣度的影響, 相對于全部呈現條件下, 在缺失條件下有更充分的注意資源去加工診斷性信息外的其它信息。然而, 如果被試在缺失條件下對缺失特征進行了推理, 也能夠解釋為何缺失條件下分類學習能夠加工非診斷性息, 而且缺失的特征越多, 加工的程度越深, 這樣還進一步解釋了為何缺失特征越多, 學習效率反而越好。并且實驗1中“缺失1個特征”和“缺失2個特征”條件下非診斷性信息的變化沒有顯著差異, 這也說明注意廣度沒有產生影響。因此實驗2進一步探索缺失條件下分類學習者對非診斷性信息的加工, 是否確實是推理學習造成的。
學習階段的學習材料是線性分離的家族相似性類別結構(linearly separable category, Yamauchi &Markman, 2000), 這種類別結構每個樣例都和所屬的原型有一個特征不同。實驗1采用了全部呈現、缺失1個特征和缺失2個特征這3個水平設計, 因此這 3個學習條件的被試分別面對了 6個特征, 5個特征和4個特征的刺激進行分類學習, 所以3個條件的注意廣度是不同的; 實驗2改變為全部呈現7個特征, 全部呈現5個特征和部分呈現5個特征的三水平設計, 前兩個水平間的注意廣度不同(7個特征和 5個特征)但推理情況相同(都是全部呈現),而后兩個水平間的注意廣度相同(都是5個特征)但推理情況不同(全部呈現和部分呈現)。如果前者對非診斷性息加工出現差異顯著, 則說明是注意廣度的原因; 如果后者對非診斷性信息加工差異顯著,則說明是推理加工的原因。
大學一年級本科生 60名, 分為 3組, 每組 20人, 男女各半。其中一名女生沒有達到學習標準。
實驗2采用類似實驗1的兩類虛構的昆蟲, 還是命名為“Deeger”和“Koozle”。除了保留 5 個特征維度的類別學習材料, 原型分別為11111和00011,還增加了7個特征維度的類別學習材料, 原型分別為 1111111和 0000011, 構成線性分離的家族相似性類別結構。

圖2 實驗2所用材料示例
學習階段給予3組被試3種不同的學習材料。一為全部呈現 7個特征材料, 原型分別為 1111111和0000011的線性分離類別結構, 有14個學習樣例。二為全部呈現5個特征材料, 原型分別為11111和00011的線性分離類別結構, 有10個學習樣例。三為部分呈現5個特征材料, 由全部呈現7個特征材料基礎上隨機遮掉兩個特征所得, 有 14個學習樣例。
典型性評定階段, 全部呈現 7個和部分呈現 5個的樣例分別是由與原型有5個、6個和7個相同的特征組成, 所有典型性評定階段的樣例都是完整呈現的。與原型有5個相同特征的樣例稱為低典型性, 與原型有6個相同特征的樣例稱為高典型性。“高典型”和“低典型”后面的數字 3,4,5分別表示的是診斷性特征的數目。全部呈現5特征條件的樣例則是由與原型有3個、4個和5個相同的特征組成。
單因素被試間設計, 自變量是材料呈現方式,分為全部呈現7個特征、全部呈現5個特征和部分呈現5個特征3種水平。
實驗程序同實驗1。
學習階段:
學習效率分析的結果與實驗1一致, 同樣的表現出缺失特征條件下有最高的學習效率, 但條件間差異不顯著。全部呈現7個特征條件下, 被試達到學習標準所需要的trials的平均數為85.13個(SD
=15.31), 全部呈現 5個條件下, 被試達到學習標準平均需要90.83個trials (SD
=25.14), 而在缺失2個特征的情況下, 被試學習7個特征數的類別需要76.50個trials (SD
=15.17)。方差分析結果表明, 三者差異不顯著,F
(2,56)=1.38,p
>0.05。典型性評定階段:
同實驗1。典型性評定評定了被試對診斷性信息和非診斷性信息的敏感性, 其計算方法也和實驗1的類似。在本實驗中, 具有 7個特征的類別的診斷性變化相當于高典型5-高典型4, 低典型5-低典型 4, 低典型 4-低典型 3的均值, 非診斷性變化則是原型-高典型 5, 高典型 5-低典型 5, 高典型 4-低典型4三者的均值, 而具有5個特征的類別的診斷性變化為高典型3-高典型2, 低典型3-低典型2, 低典型 2-低典型 1的均值, 非診斷性變化是原型-高典型3, 高典型3-低典型3, 高典型2-低典型2的均值, 具體見表4。
3種條件下都表現出了顯著的診斷性信息的變化, 但是只有在部分呈現5個特征的條件下才出現非診斷性信息的變化差異顯著。在樣例不同呈現形式條件下對于診斷性和非診斷性信息變化的均值與標準差見表5。
同樣采用典型性評定變化量與基線值0進行t檢驗的方法進行差異比較。非診斷性變化與基線值0的差異進行t檢驗時發現, 全部呈現形式, 包括全部呈現7個和全部呈現5個, 非診斷性變化下的均值(0.04, 0.32)與基線值差異不顯著,t
(22)=0.29,p
>0.05,t
(17)=2.10,p
>0.05; 部分呈現形式非診斷性變化下的均值(0.25)與基線值差異顯著,t
(17) =2.80,p
<0.05, η=0.31。結果說明, 注意廣度不同但推理情況相同的前兩個條件都沒有加工非診斷性信息, 而注意廣度相同但推理情況不同的后兩個條件則不同, 其中全部呈現5個條件沒有加工非診斷性信息, 而部分呈現5個條件加工了診斷性信息。這個結果說明缺失條件下分類學習者對非診斷性信息的加工, 不是注意廣度造成的, 而是推理學習造成的。
表4 實驗2中典型性評定各類型樣例的均值

表5 不同呈現形式條件下對于診斷性和非診斷性信息變化的均值與標準差
此外, 診斷性變化與基線值0進行比較時都有顯著差異。全部呈現 7個條件下:t
(22)=7.55,p
<0.01, η=0.74; 全部呈現5個下:t
(17)=5.28,p
<0.01, η=0.62; 部分呈現 5個條件下:t
(17) =4.73,p
<0.01, η=0.56。這個結果和實驗1一致, 說明3種學習條件下被試均能夠習得診斷性信息。以往研究認為, 在類別學習任務中, 分類學習者只對診斷性信息敏感, 而推理學習者對于典型性信息(包括診斷性和非診斷性信息)更加敏感。在這些研究中, 實驗材料往往是完整呈現的, 然而, 在日常生活中, 我們對物體進行分類和預測時常常不能了解到該物體的全部特征, 如看到一只狗, 我們知道它有 4條腿, 兩只眼睛, 會跑會跳, 但是我們并不清楚它是公的還是母的, 它是什么品種等, 不過, 這并不影響我們對它進行分類。
我們基本沿用了 Taylor和 Ross (2009)所用的研究范式, 采用缺失特征的材料進行實驗, 并對材料進行了改進, 驗證了部分呈現條件下的類別分類學習的學習者也是能夠學習到非診斷性信息的。所以, 不僅在推理學習中可以學習到非診斷性信息,而且在部分呈現條件下的分類學習也可以。
本研究中采用的類別結構是線性分離類別結構, 在類別內部每個特征維度只有一個成員的特征值是例外的。對于部分呈現條件下的分類學習者,由于特征缺失, 學習者將注意力轉移到每個類別內的成員的所有特征, 包括診斷性和非診斷性特征,學習到關于類別的典型性信息, 即包括了診斷性信息和非診斷性信息。而全部呈現條件下的分類學習者主要關注診斷性信息, 在所有特征都呈現的情況下, 被試記住所有呈現的特征會比較困難, 診斷性特征能使類別判斷具有較高的正確率, 此時, 雖然診斷性信息和非診斷性信息是同時出現的, 但是,非診斷性信息卻沒有被分類學習者納入到他們的類別表征中。
結合前人研究結果, 特別是分類和推理兩種學習模式比較研究(劉志雅和莫雷, 2006; 2009), 我們推測認為, 全部呈現條件下的分類學習可能是一種自下而上的歸納加工方式, 對個別性的特征信息進行加工, 進而習得一般性的類別知識; 而部分呈現條件下的分類學習則類似于推理學習的模式, 可能是一種自上而下的演繹加工方式, 先對一般性信息和若干個別性的特征信息進行加工, 進一步推導某些個別性的特征信息。
F
(2,61) =0.98,p
>0.05。而這幾種條件下的原型所具有的診斷性特征都只有 2個, 這從另一個角度說明了, 全部呈現條件下的學習結果跟全部的特征數無關, 而與診斷性特征有關。這個結果不支持原型理論的假設。原型理論認為(Rosch & Mervis, 1975; Markman& Wisniewski, 1997; Kim & Murphy, 2011), 類別學習實質上是學習類別的原型。當遇到一個新的樣例時, 哪個類別的原型與之最相似, 人們會把它歸類到這個類別之中。全部呈現條件下, 原型有7個特征的家族相似性類別結構里, 原型特征的典型性最高, 為12/14; 原型有6個特征的次之, 為10/12; 原型有5個特征的最低, 為8/10。如果類別學習的學習結果是原型, 不同典型性類別結構的學習效率應該存在顯著的差異, 而 2個實驗的結果表明, 不管樣例的原型有7個、6個還是5個特征, 被試達到學習標準所需要的trial數并沒有顯著的差異, 與原型理論的假設不一致。本研究結果表明, 全部呈現條件和部分呈現條件下的分類學習者對于非診斷性信息的敏感程度不同, 部分呈現條件下的分類學習者對非診斷信息的變化敏感, 這種信息表征上的差異究竟是來自心理機制本身, 還是決定于外在的學習形式, 或者兩者同時起作用, 這是我們比較關注的問題。
Taylor和Ross (2009)的研究中只使用了全部呈現和部分呈現(缺失 2個特征)兩種條件, 發現部分呈現條件下的分類學習仍然可以學會非診斷性信息, 并用注意廣度來解釋這種現象, 認為由于注意的資源有限, 部分呈現條件下分類學習的被試需要注意的特征較少, 此時就有更多的注意資源分配到非診斷性特征上, 而在全部呈現條件下, 被試要注意更多的特征, 注意的廣度變大, 而被試的注意資源有限, 只能將注意資源放在了作用性更大的診斷性特征上。
本研究實驗1在重復Taylor和Ross (2009)的實驗的基礎上增加了“缺失 1個特征”這一實驗條件,如果部分呈現條件下的分類學習能學會非診斷性信息是注意廣度的影響, 那么“缺失 1個特征”和“缺失2個特征”條件下非診斷性信息的變化就會有顯著差異。實驗結果發現, 只有部分呈現條件下非診斷性信息有變化, 全部呈現條件下非診斷性信息沒有變化, 這跟Taylor等人的研究結果一致, 但是“缺失1個特征”和“缺失2個特征”條件下非診斷性信息的變化沒有顯著差異, 這說明注意廣度沒有產生影響。
實驗1雖然證明了部分呈現條件下被試非診斷性信息的學習不是注意廣度造成的, 但還不能充分說明就是推理學習造成的, 因此本研究又設計了實驗2, 對這一問題進行進一步的探討。
實驗2中自變量有全部呈現7個特征、全部呈現5個特征和部分呈現5個特征3種水平。前兩個水平間的注意廣度不同(一個水平要注意7個特征、一個水平要注意5個特征)但推理情況相同(都不需要進行推理學習)。而后兩個水平間的注意廣度相同(都只需要注意5個特征)但推理情況不同(一個水平需要推理學習、一個水平不需要推理學習)。如果前兩個水平在非診斷性息加工上出現差異, 則說明是注意廣度的影響; 如果后兩個水平在非診斷性信息加工上出現差異, 則說明是推理加工的影響。實驗結果是在全部呈現7個特征和全部呈現5個特征的條件下, 被試都沒有學會非診斷性信息, 而只有在部分呈現5個特征的條件下, 被試才學會了非診斷性信息。也就是說, 注意廣度不同但推理情況相同前兩個條件都沒有加工非診斷性信息, 而注意廣度相同但推理情況不同的后兩個條件則不同, 其中全部呈現5個條件沒有加工非診斷性信息, 而部分呈現5個條件加工了診斷性信息。這個結果說明缺失條件下分類學習者對非診斷性信息的加工, 不是注意廣度造成的, 應該是推理學習造成的。
綜合所有實驗結果, 可以認為, 部分呈現條件下的分類學習者進行了推理加工, 由于推理學習能夠表征非診斷性信息, 因此, 在部分呈現條件下的分類學習者能夠學習到非診斷性信息。部分呈現條件下, 學習者不可能只關注一個或兩個維度上的特征就能夠順利進行分類, 因為學習過程中出現的樣例是不完整的, 學習者在關注其他特征信息的同時可能對缺失的特征進行了推理加工。
本研究通過2個實驗證明了部分呈現條件下的分類學習中可以表征非診斷性信息, 并且這種非診斷性信息的表征不是注意廣度造成的, 而是引發被試進行了推理學習造成的。當然, 部分呈現條件下分類學習中被試能夠表征非診斷性信息是被試進行了推理學習的觀點還需要進一步的實驗證據, 特別是這種推理學習是自動化進行的還是策略性發生的, 還需要在以后的研究中進一步探討。
全部呈現條件下和部分呈現條件下分類學習任務中的被試能夠學習到診斷性信息, 但只有部分呈現條件下的分類學習能夠表征非診斷性信息, 這種實驗結果不是由于注意的廣度造成的, 而是因為被試在部分呈現的分類學習中進行了推理加工。
Ashby, F. G., & Maddox, W. T. (2005). Human category learning.Annual Review of Psychology, 56
, 149–178.Chin-Parker, S., & Ross, B. H. (2002). The effect of category learning on sensitivity to within category correlations.Memory & Cognition,30
(3), 353–362.Chin-Parker, S., & Ross, B. H. (2004). Diagnosticity and prototypicality in category learning: A comparison of inference learning and classification learning.Journal of Experimental Psychology: Learning, Memory, and Cognition,30
(1), 216–226.Taylor, E. G., & Ross, B. H. (2009). Classifying partial exemplars: Seeing less and learning more.Journal of Experimental Psychology: Learning, Memory, and Cognition,35
(5), 1374–1380.Hayes, B. K., & Thompson, S. P. (2007). Causal relations and feature similarity in children’s inductive reasoning.Journal of Experimental Psychology
:General, 136
, 470–484.Hoffman, A. B., & Rehder, B. (2010). The costs of supervised classification: The effect of learning task on conceptual flexibility.Journal of Experimental Psychology: General,139
(2), 319–340.Kim, S. W., & Murphy, G. L. (2011). Ideals and category typicality.Journal of Experimental Psychology: Learning,Memory, and Cognition, 37
(5), 1092–1112.Kim, B., & Rehder, B. (2011). How prior knowledge affects selective attention during category learning: An eyetracking study.Memory & Cognition, 39
(4), 649–665.Kruschke, J. K. (1992). ALCOVE: An exemplar-based connectionist model of category learning.Psychological Review, 99
, 22–44.Nosofsky, R. M., & Zaki, S. R. (2002). Exemplar and prototype models revisited: Response strategies, selective attention, and stimulus generalization.Journal of Experimental Psychology: Learning, Memory, andCognition, 28
, 924–940.Markman, A. B., & Wisniewski, E. J. (1997). Similar and different: The differentiation of basic level categories.Journal of Experimental Psychology: Learning, Memory &Cognition,23
(1), 54–70.Markman, A. B., & Ross, B. H. (2003). Category use and category learning.Psychological Bulletin, 129
(4), 592–613.Medin, D. L., & Schaffer, M. (1978). Context theory of classification learning.Psychological Review,85
(3),207–238.Liu, Z. Y., & Mo, L. (2006). A comparative study of two types of category learning: Classification and inference learning.Acta Psychologica Sinica, 38
(6), 824–832.[劉志雅, 莫雷. (2006). 類別學習中兩種學習模式的比較研究: 分類學習與推理學習.心理學報,38
(6), 824–832).]Liu, Z. Y., & Mo, L. (2009). Prototype and exemplar on classification and inference learning.Acta Psychologica Sinica, 41
(1), 44–52.[劉志雅, 莫雷. (2009). 兩種學習模式下類別學習的結果:原型和樣例.心理學報, 41
(1), 44–52.]Rehder, B., & Burnett, R. C. (2005). Feature inference and the causal structure of categories.Cognitive Psychology,50
(3),264–314.Rehder, B., & Hoffman, A. B. (2005a). Thirty-something categorization results explained: Selective attention,eyetracking, and models of category learning.Journal of Experimental Psychology: Learning, Memory, and Cognition, 31
, 811–829.Rehder, B., & Hoffman, A. B. (2005b). Eyetracking and selective attention in category learning.Cognitive Psychology, 51
, 1–41.Rosch, E., & Mervis, C. B. (1975). Family resemblances:Studies in the internal structure of categories.Cognitive Psychology, 7
, 573–605.Yamauchi, T., & Markman, A. B. (2000). Inference using categories.Journal of Experimental Psychology: Learning,Memory, and Cognition,26
(3), 776–795.Yamauchi, T., Love, B. C., & Markman, A. B. (2002) Learning nonlinearly separable categories by inference and classification.Journal of Experimental Psychology:Learning Memory, and Cognition,28
(3), 585–593.Yin, G. E., & Li, Y. (2007). Effect of feature diagnositicity on category use.Acta Psychologica Sinica,39
(5), 819–825.[陰國恩, 李勇. (2007). 類別使用的特征診斷效應.心理學報, 39
(5), 819–825.]