999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

信號檢測論與貝葉斯決策理論的關系

2023-09-25 13:04:53胡嘯
心理技術與應用 2023年9期

胡嘯

摘 要 信號檢測論被廣泛用于解釋個體在不同類型認知任務中的決策過程。然而,經典信號檢測論的重要不足之處在于難以進一步解釋個體設置報告標準的過程對應怎樣的內在心理機制。本文從貝葉斯決策理論的視角出發,深入探討個體在信號檢測任務中的決策規則。首先基于貝葉斯定理介紹貝葉斯決策理論的基本觀點。隨后探討貝葉斯決策理論如何解釋理想觀察者的決策規則,以及在實際的信號檢測任務中個體的決策結果與理想觀察者之間的偏離。其次探討經典信號檢測論和貝葉斯決策理論在不等方差信號檢測模型中的差異。最后簡要介紹支持貝葉斯決策理論的實證研究證據。

關鍵詞 信號檢測論;貝葉斯決策理論;先驗概率;似然函數;報告標準

分類號 B841

DOI:10.16842/j.cnki.issn2095-5588.2023.09.003

1 引言

信號檢測論(signal detection theory, SDT)是實驗心理學研究中應用最為廣泛的計算模型之一。自從心理學家John A. Swets及其合作者首次將信號檢測論系統性地引入心理學領域以來(Green & Swets, 1966; Tanner & Swets, 1954),研究者們已經廣泛地應用信號檢測論模型來解釋知覺、記憶、推理等不同心理過程的內在機制(Banks, 1970; Mamassian, 2016; Wixted, 2020)。在心理學論文數據庫PsycArticles和PsycInfo中,以“signal detection theory”為關鍵詞可以檢索出超過4000篇文獻,且在2020至2022這三年間發表的文獻就達到了500篇,足以證明信號檢測論不僅在心理學研究的歷史上占有重要地位,而且在今天仍然具有旺盛的生命力。

在基于信號檢測論的心理學實驗設計中,研究者會向被試呈現兩類不同的刺激,其中一類刺激被稱為“信號”(signal),而另一類刺激被稱為“噪音”(noise)。被試的任務是判斷哪些刺激屬于信號,哪些刺激屬于噪音(Wickens, 2001)。比如,在一個聽覺任務中,被試聽到的刺激可能只包含白噪音,也可能在白噪音的基礎上疊加了一個特定聲調的聲音作為信號;被試需要判斷信號在哪些試次(trial)當中出現(Egan et al., 1959)。又如,在再認記憶任務中,被試需要首先學習并記憶一系列詞語,隨后研究者會向被試呈現一些學過的“舊詞”作為信號,和一些沒學過的“新詞”作為噪音,被試需要判斷每個詞語是新詞還是舊詞(Mickes et al., 2007; Wixted, 2007)。通常情況下,信號檢測論會假設信號和噪音的刺激強度分別符合一個正態分布,且信號分布的均值高于噪音分布;信號分布和噪音分布均值之差被稱為辨別力指數(d'),它反映了個體辨別信號和噪音的能力,d'越高則個體的辨別力越強(Wickens, 2001)。

信號檢測論關注的一個重要問題是,個體如何決策哪些刺激屬于信號,哪些刺激屬于噪音。經典的信號檢測論觀點認為,個體會直接在刺激強度的數軸上設置報告標準C,如果當前刺激的強度高于C,則個體判斷當前刺激為信號,反之判斷為噪音(Wixted, 2020)。圖1給出了信號檢測論模型的一個示例。該模型中噪音分布的均值為0,信號分布的均值為d', 兩個分布的標準差均為1;當某個刺激的強度高于C時,個體會將其判斷為信號,反之則判斷為噪音。在信號檢測任務中,個體的作答結果可以被分為四種類型:擊中(將信號刺激判斷為信號)、虛報(將噪音刺激判斷為信號)、漏報(將信號刺激判斷為噪音)和正確拒絕(將噪音刺激判斷為噪音)(Wickens, 2001)。四類作答結果出現的概率由代表信號或噪音的正態分布在C的左側或右側的面積大小來表示(見圖1)。

信號檢測論的優點在于,它可以從個體的作答正確率數據中,分離出辨別力指數d'和報告標準C這兩個指標,使得研究者可以分別探討任務難度(即d’)和個體的反應偏向(即C)如何影響個體最終的作答結果(Wickens, 2001)。然而,經典信號檢測論框架(即直接使用C來反映個體的決策判斷標準的信號檢測論模型)也存在一個重要的不足之處:它難以深入解釋個體在信號檢測任務中完成決策的過程對應怎樣的內在心理機制。雖然經典信號檢測論簡單地假設個體會直接將當前刺激的強度與一個特定的判斷標準C在數軸上的位置進行比較,并基于比較的結果來完成決策,但它通常難以進一步解釋個體為何會把報告標準C設置在數軸上的特定位置,以及對于不同個體而言或在不同實驗條件下C的位置產生差異的內在原因(Glanzer et al., 2009, 2019)。

事實上,早在信號檢測論提出之初,Swets及其合作者就開始使用貝葉斯決策理論(Bayesian decision theory, BDT)的觀點來解釋個體在信號檢測任務中的決策過程(Green & Swets, 1966)。近年來,貝葉斯決策理論與信號檢測論之間的關系開始受到越來越多研究者的重視(Fleming & Daw, 2017; Glanzer et al., 2019; Maloney & Zhang, 2010)。貝葉斯決策理論認為個體會基于觀測到的當前刺激強度,通過一個貝葉斯推理過程來決策當前刺激是信號還是噪音(Fleming & Daw, 2017; Maloney & Zhang, 2010; Pouget et al., 2016)。和經典信號檢測論相比,貝葉斯決策理論為個體如何在信號檢測任務中完成決策過程給出了更加深入的理論解釋(Glanzer et al., 2019; Lau, 2007)。

本文將從貝葉斯決策理論的視角,深入探討信號檢測論框架下個體的決策規則。本文將首先介紹貝葉斯決策理論的基本觀點,即個體在信號檢測任務中如何通過一個貝葉斯推理過程完成決策。隨后,本文將闡述信號檢測論當中的“理想觀察者”問題,并在等方差信號檢測模型的框架下,介紹貝葉斯決策理論如何解釋實際研究中的被試與理想觀察者之間的偏離。接下來,本文將討論不等方差的信號檢測模型,并闡述貝葉斯決策理論與經典信號檢測論在該模型中存在的差異。最后,本文將介紹支持貝葉斯決策理論的實證研究證據。

2 貝葉斯決策理論

貝葉斯決策理論的基礎是貝葉斯定理,它來源于對聯合概率的計算公式(胡傳鵬等, 2018)。假設有兩個事件——A和B,則A和B同時發生的概率被稱為聯合概率,記為P (A,B)。聯合概率的計算公式可以被寫為如下形式:

? ? ? ? ?P(A,B)=P(B|A)P(A) (1)

公式(1)的含義為:A和B同時發生的概率,等于A發生的概率P(A)乘以在A發生的條件下B發生的概率P(B|A)。其中,P(A)又被稱為邊緣概率,它指的是在不考慮其他事件的發生結果的情況下,某一事件發生的概率;而P(B|A)又被稱為條件概率,它指的是在確定某一個事件(如A)已經發生的條件下,另一個事件(如B)發生的概率。實際上,A和B同時發生的聯合概率,還可以被寫為另一種形式,即等于B發生的邊緣概率P(B)乘以在B發生的條件下A發生的條件概率P(A|B):

? ? ? ? ? P(A,B)=P(A|B)P(B) ? ?(2)

基于以上的公式(1)和(2),可以得出如下的公式(3):

? ?P(A|B)P(B)=P(B|A)P(A) (3)

公式(3)通常會被寫為如下的形式:

公式(4)即為貝葉斯定理的一般形式。貝葉斯定理的提出起初只是為了刻畫兩個事件的邊緣概率和條件概率之間滿足的數學關系。然而,心理學家很快意識到,貝葉斯定理可以被用來刻畫人類的推理與決策過程(Kersten et al., 2004; Lau, 2007; Wickens, 2001)。比如,公式(4)可以用來解釋個體如何通過對事件B進行觀測,來推理事件A的發生概率。此時,公式(4)中的P (A)被稱為先驗概率,它指的是在觀測到事件B之前,個體對于事件A發生概率的先驗認識。P(A|B)被稱為后驗概率,它反映了個體在觀測到事件B的發生結果之后對事件A發生概率的認識。個體在貝葉斯推理過程中,會根據對事件B的觀測結果來更新自身對事件A發生概率的認識,即從P(A)更新為P(A|B)。另一方面,P (B | A)被稱為似然函數,它反映了在給定事件A的情況下,事件B發生的可能性。在個體對事件A發生概率進行更新的過程中,先驗概率和似然函數都起到了重要的作用:一方面,當A發生的先驗概率值越高時,其后驗概率值也會越高;另一方面,在假定事件A發生的情況下,如果事件B發生的概率越高(即似然函數值越大),則個體在觀測到事件B之后也會認為事件A成立的后驗概率越高。

根據貝葉斯決策理論的觀點,在信號檢測任務中,個體會觀測到每個刺激的強度(記為x),并基于x的值來完成一個貝葉斯推理過程,以推理當前刺激屬于信號或噪音的后驗概率(Burgess, 1985; Fleming & Daw, 2017; Wickens, 2001)。下面的公式給出了個體如何基于刺激強度x對當前刺激屬于信號(記為S)的概率進行更新:

公式(5)意味著,在觀測到當前刺激之前,個體對當前刺激屬于信號的概率存在先驗認識,反映為先驗概率P (S)。而在觀測到當前刺激的強度x之后,被試將當前刺激屬于信號的概率更新為后驗概率P(S|x)。同理,個體基于刺激強度x對當前刺激屬于噪音(記為N)的概率進行更新的過程可以用如下公式表示:

貝葉斯決策理論認為,個體會基于當前刺激屬于信號或噪音的后驗概率,來決定應當把當前刺激判斷為信號還是噪音。如果刺激屬于信號的后驗概率大于其屬于噪音的后驗概率,則個體就會把當前刺激判斷為信號,反之則判斷為噪音(Burgess, 1985; Fleming & Daw, 2017; Lau, 2007)。由于刺激屬于信號和噪音的后驗概率之和為1,因此個體會把P (S|x) =0.5作為判斷標準:如果刺激屬于信號的后驗概率大于0.5則判斷當前刺激為信號,而如果小于0.5則判斷刺激為噪音。

在公式(5)和(6)中,觀測到刺激強度x的邊緣概率P(x)是相等的。具體而言,P(x)的計算方法是,根據刺激屬于信號和噪音的先驗概率——P(S)與P(N),對給定當前刺激是信號或噪音的條件下觀測到x的概率(似然函數)——P(x|S)與P(x|N),進行加權平均:

P(x)=P(x|S)P(S)+P(x|N)P(N) (7)

可以通過將公式(5)與公式(6)相除,消去P(x)項,得出下面的公式:

公式(8)意味著,貝葉斯決策過程可以被看作個體基于后驗概率的比值進行決策的過程:如果刺激屬于信號和噪音的后驗概率比P(S|x) /P(N|x)大于1,則被試會把當前刺激判斷為信號,反之則判斷為噪音。根據貝葉斯定理,后驗概率比值是由刺激強度x在信號和噪音成立的條件下的似然函數比值P(x|S)/P (x|N),以及信號和噪音的先驗概率比值P(S)/P(N)共同決定的。

由于在信號或噪音成立的條件下,刺激強度x分別滿足一個概率分布(通常假設為正態分布),因此x在信號或噪音成立條件下的似然函數反映了當刺激是信號或噪音時觀測到的刺激強度為x的相對概率,其等價于x在信號或噪音分布中出現的概率密度(即正態分布中x所在位置對應的縱坐標的值)。當刺激強度x在信號分布下出現的概率密度P(x|S)越大,或在噪音分布下出現的概率密度P(x|N)越小時,個體越傾向于將當前刺激判斷為信號,反之則更傾向于判斷為噪音。需要注意的是,個體在完成貝葉斯推理的過程中,可能并不知道信號和噪音分布的真實形態。比如,個體可能并不知道真實的信號與噪音分布的均值和標準差分別等于多少(Lau, 2007)。為了完成貝葉斯推理過程,個體必須主觀推測信號和噪音分布的形態,并據此估計當前刺激的強度x在信號和噪音分布中出現的似然函數(Lau, 2007)。

在一些情況下,個體對刺激屬于信號還是噪音可能不存在先驗的偏好。比如,被試在參加一個信號檢測實驗任務之前,可能對電腦屏幕上出現的刺激是信號還是噪音并沒有先驗的偏向,而是簡單地認為二者是等可能的。此時可以簡單假設信號和噪音成立的先驗概率相等,即P(S)=P(N)=0.5。這種情況下的后驗概率比值就等于似然函數的比值,因此貝葉斯決策的結果完全由似然函數的值來決定。然而,先驗概率并不一定始終等于0.5 (Wickens, 2001)。比如,一些個體對信號和噪音出現的先驗概率可能具有一定的主觀偏好,即可能偏向于認為信號或噪音其中之一更可能出現。此時,基于后驗概率比值的貝葉斯決策過程不僅受到似然函數比值的影響,也受到先驗概率比值的影響;當個體認為信號成立的先驗概率越大,或噪音成立的先驗概率越小時,就越傾向于把當前刺激判斷為信號,反之則越傾向于判斷為噪音。

根據貝葉斯決策理論的觀點,個體在貝葉斯推理過程中使用的似然函數值和先驗概率值,均來自個體自身的主觀估計。那么,當個體主觀估計的似然函數和先驗概率等于多少時,最終給出的決策結果是最理想的?當似然函數和先驗概率的主觀估計值發生變化時,個體的決策過程又會受到怎樣的影響?為了回答上述問題,本文接下來將從信號檢測任務中的“理想觀察者”視角出發,在貝葉斯決策理論的框架下進一步探討個體何時會給出最理想的決策,以及如何解釋實際研究中被試的決策結果與理想觀察者之間的偏離。

3 理想觀察者

根據經典信號檢測論的觀點,個體會在刺激強度的數軸上設置一個報告標準C,并通過比較當前刺激的強度x與C在數軸上的位置,來決定當前刺激是信號還是噪音。個體的作答結果可以被分為擊中、虛報、漏報和正確拒絕四種類型,其中擊中(將信號刺激判斷為信號)和正確拒絕(將噪音刺激判斷為噪音)視為正確作答,而虛報(將噪音刺激判斷為信號)和漏報(將信號刺激判斷為噪音)視為錯誤作答。那么,一個有趣的問題是,當報告標準C設置在哪里時,個體作答的正確率最大?在信號檢測論框架下,通過設置最合適的報告標準使得作答正確率最大的個體,被稱為理想觀察者(Wickens, 2001)。

為了計算出理想觀察者會把報告標準C設置在怎樣的位置,首先需要求出C值的變化如何影響作答正確率。這里以圖1中呈現的信號檢測論模型為例。在圖1所示的模型中,信號分布和噪音分布具有相等的方差(二者均等于1),該類模型又被稱為等方差信號檢測模型(Wickens, 2001)。根據圖1可知,當實驗中呈現的刺激為信號時,作答正確率(即擊中率,hit rate,HR)等于信號分布下報告標準C右側的面積。具體計算公式為:

? ? ? ? ? ? HR=1-Φ(C|μ=d',σ=1) ? ? (9)

上式中,Φ (C|μ,σ)代表均值為μ、標準差為σ的正態分布的累積分布函數,即等價于該正態分布位于C左側的曲線下方面積。同理,當實驗中呈現的刺激為噪音時,作答正確率(即正確拒絕率,correct rejection rate,CRR)等于噪音分布下報告標準C左側的面積:

CRR=Φ(C|μ=0,σ=1) ? ? ? ? ? ? (10)

假設在信號檢測實驗任務中,信號刺激出現的可能性為P(St),噪音刺激出現的可能性為P(Nt)。字母t的意思是,上述概率代表了信號和噪音刺激在實驗中出現的真實(true)概率,以與個體在貝葉斯決策過程中使用的主觀先驗概率相區分。據此可以求出總體的作答正確率Pcorrect:

Pcorrect=P(St)·HR+P(Nt)·CRR=

P(St)·[1-Φ(C|μ=d',σ=1)]+P(Nt)·Φ(C|μ=0,σ=1) ? (11)

為了求出C值等于多少時Pcorrect最大,可以先求出Pcorrect的一階導數:

公式(12)中,?(C|μ,σ)代表在均值為μ、標準差為σ的正態分布中,刺激強度等于C時的概率密度。理想觀察者的報告標準Cideal應當設置在令Pcorrect的一階導數為0的位置,即滿足如下的公式(13):

P(Nt)· ?(Cideal|μ=0,σ=1)

-P(St)?(Cideal|μ=d',σ=1)=0 (13)

當個體把強度高于Cideal的刺激全部判斷為信號,而把強度低于Cideal的刺激全部判斷為噪音時,個體的作答正確率達到最大(Wickens,2001)。根據正態分布的概率密度函數,可以進一步求出Cideal在刺激強度的數軸上的位置:

在等方差信號檢測模型中,當信號和噪音在實驗任務中出現的概率相同,即P(St)=P(Nt)=0.5時,C的位置恰好等于d'/2,即理想觀察者會把報告標準設置在信號分布均值和噪音分布均值的正中間位置。換言之,理想觀察者設置的報告標準正好處在信號分布和噪音分布交叉的位置(Wickens, 2001)。

接下來,本文將介紹如何從貝葉斯決策理論的角度來理解理想觀察者的決策規則。公式(13)又可以被寫為如下形式:

不難看出,公式(17)與反映貝葉斯決策過程的公式(8)非常相似。在公式(17)中,信號和噪音在實驗任務中出現的真實概率的比值P(St)/P(Nt),類似于個體在貝葉斯決策過程中使用的先驗概率比值;而在公式(17)中,當刺激強度等于Cideal時,信號和噪音分布中的概率密度比值?(Cideal|μ=d',σ=1) /? (Cideal|μ=0,σ=1)也類似于貝葉斯決策過程中的似然函數比值。事實上,貝葉斯決策理論指出,當個體完全清楚信號和噪音出現的客觀先驗概率以及信號和噪音分布的真實形態(即真實的似然函數值)時,采用貝葉斯決策機制可以保證個體成為理想觀察者,即能夠使得個體的作答正確率最大(Burgess, 1985)。具體而言,結合公式(8)與公式(17)可知,當刺激強度恰好等于Cideal時,后驗概率的比值(即信號和噪音條件下似然函數與先驗概率乘積的比值)等于1。而當刺激強度大于Cideal時,后驗概率的比值大于1,此時個體會把當前刺激判斷為信號;當刺激強度小于Cideal時,后驗概率的比值小于1,此時個體會把當前刺激判斷為噪音。上述基于貝葉斯推理過程的決策規則,與經典信號檢測論框架下理想觀察者的決策規則完全相同。

然而,針對實際研究的數據分析結果表明,雖然真實被試設置的報告標準與理想觀察者近似(Knill, 1998; Legge et al., 2002; Stretch & Wixted, 1998),但被試通常不會把報告標準恰好設置在公式(16)給出的Cideal的位置,這意味著被試的決策規則與理想觀察者仍然存在一定的偏離(Lau, 2007; Wickens, 2001)。根據貝葉斯決策理論,真實被試與理想觀察者的偏離可能由兩種原因造成。第一種是被試對信號和噪音出現的先驗概率的估計與二者出現的實際概率不相同。圖2A給出了一個示例:在實際的實驗任務中,信號和噪音出現的客觀概率相等,但被試主觀認為信號出現的先驗概率大于噪音的先驗概率。基于貝葉斯決策理論的觀點,被試此時會根據自身對先驗概率的主觀估計,把報告標準設置在信號分布和噪音分布均值的中間靠左的位置,以保證作答正確率最大。但由于被試主觀估計的先驗概率與信號和噪音出現的客觀概率不同,因此被試設置的報告標準在實際的信號和噪音分布上就會與理想觀察者存在偏離。第二種是被試對信號或噪音分布形態的主觀估計與客觀分布的形態不同,進而造成對似然函數的主觀估計出現偏差。在圖2B的示例中,被試對噪音分布均值的主觀估計與其真實值相等,但是對信號分布均值的主觀估計大于信號分布的實際均值。在這種情況下,被試會基于貝葉斯推理的結果,把報告標準設置在信號和噪音分布均值的主觀估計值的中點。然而,被試對信號分布均值的主觀估計偏差會導致設置的報告標準偏離實際分布上的理想標準(Lau, 2007; Wickens, 2001)。因此,和經典信號檢測論相比,貝葉斯決策理論進一步地解釋了為何個體在信號檢測任務中會把報告標準設置在特定的位置,并將其與個體對信號和噪音的出現概率及分布形態的主觀估計緊密聯系了起來。

以上結論都是基于圖1所示的等方差信號檢測模型推導得出的。在等方差信號檢測模型中,雖然和經典信號檢測論相比,貝葉斯決策理論可以對個體的決策過程給出更加深入的理論解釋,但是二者在數學上是等價的。具體而言,雖然根據貝葉斯決策理論,個體對先驗概率和似然函數的主觀估計可能與其客觀真實值存在差異,但只要個體主觀認為信號和噪音分布的方差相等,基于經典信號檢測論和貝葉斯決策理論得出的決策過程就會在數學上具有相等的形式:個體會在刺激強度x高于某一報告標準C時將刺激判斷為信號,而在x低于C時將刺激判斷為噪音(Glanzer et al., 2009, 2019; Wickens, 2001)。然而,在實際的信號檢測任務中,信號和噪音分布的方差并不會始終相等;該類模型被稱為不等方差信號檢測模型(Mickes et al., 2007)。在這種情況下,經典信號檢測論與貝葉斯決策理論之間的關系會變得更加復雜。接下來,本文將介紹經典信號檢測論與貝葉斯決策理論在不等方差信號檢測模型中存在怎樣的差異。

4 不等方差信號檢測模型

在信號檢測論模型中,為了簡化模型假設,研究者經常假設信號和噪音分布具有相等的方差(標準差)。然而,在實際研究中,這一假設并非始終成立(Green & Swets, 1966; Wixted, 2020)。比如,在前文介紹過的再認記憶任務中,研究者們發現,和“新詞”代表的噪音分布相比,“舊詞”代表的信號分布具有顯著更大的標準差,且信號和噪音分布的標準差比值通常在1.25∶1左右(Mickes et al., 2007; Rotello, 2017)。Wixted (2007)提出了一種假設來解釋再認記憶任務中信號分布方差更大的原因:與新詞相比,舊詞之所以在再認記憶任務中具有更高的刺激強度,是由于個體對這些舊詞在學習階段進行了一定程度的學習與記憶;而只有當個體對所有舊詞的學習程度均相等時,信號分布的方差才能與噪音分布保持一致。但實際上,個體對每個舊詞的學習程度必然不是完全相等的,不同舊詞的學習程度之間的變異會導致信號分布的方差顯著大于噪音分布。因此,等方差信號檢測模型雖然具有簡單的理論假設,但可能對信號檢測任務給出了過于簡化的描述;而不等方差信號檢測模型也許能夠更好地反映個體在實際任務中完成的信號檢測過程。

值得注意的是,并非所有的信號檢測任務都必須使用不等方差信號檢測模型來描述。比如,在二選一迫選任務(2 alternative forced choice, 2AFC)范式中,屏幕上每次會同時呈現一個信號刺激(如舊詞)和一個噪音刺激(如新詞),被試需要從兩個刺激中準確地選出信號刺激。即使信號和噪音分布的方差不相等,2AFC任務的信號檢測過程也能夠使用等方差信號檢測模型來定量刻畫(Wickens, 2001)。由于與本文主題不直接相關,因此本文不對2AFC任務下的信號檢測論模型進行進一步介紹。感興趣的讀者可以閱讀已有文獻中對2AFC任務的論述(Macmillan & Creelman, 2004; Wickens, 2001)。

下面,本文將介紹在不等方差信號檢測模型的框架下,個體如何根據貝葉斯決策理論來完成決策過程。圖3給出了不等方差信號檢測模型的示例。與圖1相似,圖3中噪音分布的均值為0,信號分布的均值為d'。然而,與圖1不同的是,圖3中噪音分布的標準差σN等于1,而信號分布的標準差σS與1并不相等(圖3中假設σS大于1,即與再認記憶任務中的情況相同)。為了簡化貝葉斯推理過程,這里假設信號和噪音出現的真實概率均為0.5,且個體完全清楚信號和噪音的先驗概率及似然函數。由于信號和噪音出現的先驗概率相等,因此個體的決策結果完全依賴于當前刺激的強度x在信號和噪音分布中的似然函數的比值:根據公式(8),當似然函數的比值大于1時,個體會將當前刺激判斷為信號,反之則判斷為噪音。然而,根據圖3可知,在不等方差信號檢測模型中,信號分布和噪音分布存在兩個不同位置的交叉點(C1和C2)。當x小于C1或大于C2時,x在信號分布中的概率密度高于噪音分布,因此被試會把當前刺激判斷為信號;而當x處在C1和C2之間時,x在噪音分布中的概率密度更高,被試會把當前刺激判斷為噪音。換言之,信號和噪音分布的似然函數的一個特定比值,在刺激強度的數軸上對應兩個不同的報告標準。

Glanzer等(2009)通過嚴密的數學推導,給出了在不等方差信號檢測模型中,似然函數比值與刺激強度數軸上的報告標準C之間的對應關系。Glanzer等首先計算了當刺激強度等于C時,信號和噪音分布中似然函數的比值,隨后對似然函數比值取自然對數(記為λ):

由于對數函數是單調遞增的,因此當λ取到其最大值(或最小值)時,似然函數的比值也應當能夠取到最大值(或最小值)。進一步的計算結果表明(Glanzer et al., 2009),λ與刺激強度數軸上的報告標準C之間滿足二次函數關系(見圖4)。當信號分布的標準差σS大于1時,λ有最小值(記為λ*);而當σS小于1時,λ有最大值(記為λ*)。當且僅當λ等于λ*時,刺激強度數軸上存在唯一的報告標準與其對應(記為C*);而當λ不等于λ*時,每一個λ值都對應兩個不同的報告標準。當λ等于0(即似然函數比值為1)時,對應的兩個報告標準C1和C2將整個刺激強度數軸分為三個部分。如果σS大于1,則個體會將C1和C2中間的部分判斷為噪音,而將兩側的部分判斷為信號;如果σS小于1則相反。

經典信號檢測論認為,即使在不等方差信號檢測模型中,個體仍然只會簡單地設置一個報告標準C,并當刺激強度x高于C時將刺激判斷為信號,反之則判斷為噪音(Mickes et al., 2007; Wickens, 2001)。因此,經典信號檢測論和貝葉斯決策理論為不等方差信號檢測模型中的決策機制給出了不同的預測,個體根據兩種理論給出的決策結果也不再完全等價(這一點與等方差信號檢測模型有別)。

經典信號檢測論和貝葉斯決策理論在不等方差信號檢測模型中存在的差異可以從操作者特性曲線(receiver operating characteristic curve, ROC curve)中體現出來。ROC曲線指的是在保持信號和噪音的客觀分布形態不變的基礎上,反映擊中率(HR)和虛報率(false alarm rate, FAR)之間關系的曲線(Wickens, 2001)。在經典信號檢測論框架下,通過改變報告標準C的位置(如設置寬松或嚴格的報告標準),可以同時改變擊中率和虛報率的值。而在貝葉斯決策理論框架下(假設個體完全清楚先驗概率和似然函數的真實值),可以通過改變信號和噪音刺激出現概率的方式來影響先驗概率,進而影響后驗概率比值等于1時的似然函數比值(即影響λ的臨界值);λ的臨界值對應的報告標準的位置也會隨之發生變化,進而改變擊中率和虛報率。將所有可能的擊中率和虛報率配對繪制在圖上,以虛報率為橫坐標,擊中率為縱坐標,即可得到ROC曲線。

在等方差信號檢測模型中,無論個體基于經典信號檢測論還是貝葉斯決策理論來完成決策過程(二者在數學上是等價的),只要辨別力指數d'的值大于0,ROC曲線就會始終處在對角線上方,即意味著擊中率始終高于虛報率;當d'的值越高時,ROC曲線下的面積越大(見圖5A的示例)。但是,在不等方差信號檢測模型中,如果個體基于經典信號檢測論給出的決策機制來完成決策過程,則就算d'的值大于0,ROC曲線也會有一部分處在對角線下方。比如,當信號分布標準差σS大于1時,在擊中率和虛報率都非常接近1的情況下,擊中率會小于虛報率(見圖5B);而當σS小于1時,則在擊中率和虛報率都接近于0的情況下,擊中率小于虛報率(見圖5C)。與之相對,如果個體基于貝葉斯決策理論來完成決策過程,則即使在不等方差信號檢測模型中,ROC曲線也會始終處在對角線上方(見圖5D);這一結論可以在數學上得到嚴格的證明(Wickens, 2001)。

經典信號檢測論和貝葉斯決策理論之間的差異可以在zROC曲線上得到更加直觀的體現(Macmillan & Creelman, 2004)。所謂zROC曲線,指的是首先利用下面的公式將擊中率HR和虛報率FAR轉化為z分數:

? ? ? ? zHR=Φ-1(HR|μ=0,σ=1) ? (19)

? ? ? ? ?zFAR=Φ-1(FAR|μ=0,σ=1) ? ? ? (20)

公式(19)和(20)中,Φ-1(p|μ=0,σ=1)代表均值為0、標準差為1的標準正態分布累積分布函數的逆函數,即將取值范圍在0到1之間的概率值p轉化為取值范圍在負無窮到正無窮之間的z分數。隨后,以zFAR為橫坐標,zHR為縱坐標,繪制二者之間的關系圖,即為zROC曲線。圖6給出了zROC曲線的示例。當zROC曲線位于直線y=x上方時,就意味著擊中率大于虛報率。從數學上可以證明,在經典信號檢測論框架下,zHR和zFAR之間的關系為一條直線,其斜率等于噪音分布標準差和信號分布標準差的比值σN/σS (Wickens, 2001)。在信號檢測論中,噪音分布標準差σN通常設為1。當信號分布標準差σS大于1時,zROC直線的斜率小于1,此時zROC直線必然會在右側與直線y=x相交,并導致當擊中率和虛報率的值均很大時,擊中率小于虛報率。同理,當σS小于1時,zROC直線的斜率大于1,會在左側與y=x相交,并導致當擊中率和虛報率的值均很小時,擊中率小于虛報率(見圖6A的示例)。另一方面,在貝葉斯決策理論的框架下,zHR和zFAR之間的關系為一條曲線;無論σS的值等于多少,zROC曲線始終位于y=x的上方(見圖6B的示例)(Macmillan & Creelman, 2004)。

由于在不等方差信號檢測模型中,經典信號檢測論和貝葉斯決策理論預測了不同的ROC曲線和zROC曲線形態,因此從理論上講,可以通過考察實際研究當中獲得的ROC以及zROC曲線,以及在極端條件下獲得的擊中率和虛報率數據,來確認哪一種理論能夠更好地解釋真實被試在不等方差信號檢測任務當中的決策過程。比如,在再認記憶任務中,可以考慮通過盡可能地增加舊詞的出現頻率,降低新詞的出現頻率,使得被試設置盡可能寬松的報告標準,即將絕大多數刺激都判斷為舊詞(此時擊中率和虛報率都接近1)。在該實驗條件下,如果發現被試的擊中率低于虛報率,則支持經典信號檢測論;如果擊中率始終高于虛報率,則支持貝葉斯決策理論。

然而,上述實驗設計很難在實際研究中得到應用。這是因為在經典信號檢測論框架下,當不等方差信號檢測模型中的擊中率低于虛報率時,擊中率與虛報率的真值都非常接近極端值0或1。同時,即使存在擊中率低于虛報率的情況,二者之間的差異也是很小的(見圖5B和圖5C)。在此情況下,樣本數據中計算得到的擊中率與虛報率差值會受到抽樣誤差的嚴重影響,一點細微的抽樣誤差的存在都會導致研究者難以根據實驗結果準確估計擊中率與虛報率的真實差異(Glanzer et al., 2019; Macmillan & Creelman, 2004)。那么,是否存在某種實驗設計,使得研究者可以比較經典信號檢測論和貝葉斯決策理論在解釋真實個體的決策過程時的優劣呢?

5 支持貝葉斯決策理論的研究證據

有研究者指出,兩條件實驗可以被用于比較經典信號檢測論和貝葉斯決策理論在真實決策過程中的合理性(Glanzer et al., 2009, 2019; Semmler et al., 2018; Stretch & Wixted, 1998)。所謂的兩條件實驗,指的是在一個被試內實驗設計中,要求同一批被試完成兩個不同的信號檢測任務;這兩個任務除了存在難度上的區別外,在任務要求上沒有任何差異。比如,被試可以完成兩個不同的再認記憶任務,這兩個任務的唯一區別在于學習階段被試學習每個舊詞的時間長度存在差異,學習時間越長則任務難度越低(Glanzer et al., 2009)。同時,在兩個信號檢測任務中,被試不僅需要判斷每個刺激是信號還是噪音,而且需要給出自己對作答結果的信心判斷,即被試需要在一個李克特量表上評價自己對作答結果的信心程度。此外,Glanzer等(2019)指出,在兩條件實驗設計中,被試必須清楚意識到每個試次來自哪個任務難度條件。因此,兩個不同難度的信號檢測任務最好在不同的組塊中進行;如果一定要使用混合列表設計,即把兩個難度的信號檢測任務的試次混合在一起,則必須通過特定的提示告知被試當前的試次來自哪個實驗條件,比如為屏幕上呈現的詞語標注不同的顏色等。

研究者們提出了似然比理論來解釋個體在兩條件實驗中的決策過程(Glanzer et al., 2009, 2019; Semmler et al., 2018)。似然比理論以貝葉斯決策理論為基礎,包含兩個具體假設:(1)似然比不變假設。該假設認為,在兩種不同難度的實驗條件下,個體用于貝葉斯決策過程的似然函數比值的臨界值保持不變(這一假設會在下面進行更詳細的介紹)。(2)真實似然比假設。該假設認為,個體知道信號和噪音分布的真實分布形態,并會依據刺激強度在信號和噪音分布中的真實似然函數比值來完成決策過程。需要注意的是,真實似然比假設比一般的貝葉斯決策理論更強:貝葉斯決策理論通常允許個體主觀估計的似然函數比值與真實的似然函數比值存在差異(Lau, 2007; Wickens, 2001),但真實似然比假設則認為個體知道(或至少近似知道)信號與噪音分布中的真實似然函數(Glanzer et al., 2019; Semmler et al., 2018)。根據似然比理論,個體在兩條件實驗中的決策過程應同時滿足上述兩個假設(Glanzer et al., 2009, 2019)。

在似然比理論的基礎上,Glanzer等(2009, 2019)預測了兩條件實驗中可能出現的三種實驗現象,包括鏡像效應、方差效應和zROC長度效應(zROC length effect)。Glanzer等指出,似然比理論可以很容易地解釋上述三種現象的產生機制,但經典信號檢測理論難以同時解釋這三種現象的發生。實際研究結果表明,在不同認知領域(如知覺、記憶、推理、心理旋轉等)的信號檢測任務中,上述三種現象均穩定存在(Glanzer et al., 2009, 2019; Hilford et al., 2015, 2019; Semmler et al., 2018),即在一定程度上支持了貝葉斯決策理論的合理性。由于篇幅所限,本文只著重介紹其中的一種現象——zROC長度效應。

zROC長度效應最早由Stretch和Wixted (1998)發現。Stretch和Wixted對已有的一項研究中的數據進行了再次分析(Ratcliff et al., 1994);在該研究中,被試需要完成兩種不同難度的再認記憶任務(容易vs.困難)。比如,在容易條件下被試學習每個舊詞的時間為3s,而在困難條件下每個舊詞的學習時間只有1s。在再認測驗中,被試需要在一個6點量表上針對每個詞語完成判斷任務,其中1到6分別代表“確定是新詞”“很可能是新詞”“可能是新詞”“可能是舊詞”“很可能是舊詞”“確定是舊詞”。因此,被試不僅需要針對每個詞語進行新舊判斷,還需要報告自己對作答結果的信心程度。在經典信號檢測論框架下,信心判斷任務是二分判斷任務(信號vs.噪音)的推廣形式,即在n點量表上進行的信心判斷任務等價于在刺激強度的數軸上設置(n-1)個報告標準(Wickens, 2001)。如圖7A所示,當刺激強度低于第一個報告標準C1時,被試會在信心判斷量表上報告為1;當刺激強度在C1和C2之間時,被試會在信心判斷量表上報告為2;以此類推。Stretch和Wixted發現,與困難條件(辨別力指數d'更低的條件)相比,在容易條件(d'更高的條件)下,所有的報告標準的位置均會向中間收縮,即不同報告標準之間的距離會縮短(見圖7A)。Stretch和Wixted隨后在一個新的實驗研究中驗證了上述結論。

Glanzer等(2009, 2019)使用zROC曲線對Stretch和Wixted (1998)報告的現象進行了重新表述。具體而言,Glanzer等首先根據被試在n點信心判斷量表上給出的判斷結果,通過改變報告標準的方式計算出(n-1)對擊中率和虛報率。比如,在一個6點信心判斷量表上,假設將信心判斷量表點數1視為被試把當前刺激判斷為噪音,而將量表點數2~6視為被試把刺激判斷為信號,即可計算出一組擊中率和虛報率;而如果將量表點數1~2視為被試把刺激判斷為噪音,而將量表點數3~6視為被試把刺激判斷為信號,則可計算出另一組擊中率和虛報率;以此類推。隨后,Glanzer等基于每種實驗條件下獲得的(n-1)對擊中率和虛報率繪制出zROC曲線。結果表明,與困難條件相比;容易條件下繪制的zROC曲線兩端之間的距離顯著更短(如圖7B所示);這意味著當改變報告標準時,容易條件下的擊中率和虛報率值變化幅度更小,即說明容易條件下不同的報告標準之間更為接近。Glanzer等將這一現象命名為zROC長度效應。

似然比理論指出,基于似然比不變假設可以很自然地推導出zROC長度效應。根據貝葉斯決策理論(參考公式(8)),個體在n點信心判斷量表上給出判斷的過程,可以被看作在后驗概率比值上設置(n-1)個閾值(記為β1、β2……βn-1),并將當前刺激對應的后驗概率比值與每個β值相比較的過程。假如當前刺激對應的后驗概率比值小于β1,則個體在信心判斷量表上報告的結果為1;假如刺激對應的后驗概率比值在β1和β2之間,則信心判斷的結果為2;以此類推(Green & Swets, 1966)。Glanzer等(2009, 2019)假設,當兩個實驗條件之間的唯一差異為任務難度時,個體設置的閾值β應當不會在實驗條件之間發生改變。由于后驗概率比值等于先驗概率比值和似然函數比值的乘積,且個體在貝葉斯推理過程中對于信號和噪音出現的先驗概率的主觀估計通常可以近似視為恒定(Fleming & Daw, 2017; Wickens, 2001),因此可以在數學上等價地認為,個體在信號和噪音分布的似然函數比值上設置了一組閾值,并通過每個刺激對應的似然函數比值與上述閾值之間的比較來給出信心判斷的結果。同時,個體在似然函數比值上設置的閾值應當不會在兩個實驗條件之間發生變化(Glanzer et al., 2019)。上述假設即為似然比不變假設。

接下來,本文將以等方差信號檢測模型為例,根據似然比不變假設來推導zROC長度效應。由于個體在似然函數比值上設置的閾值是恒定不變的,因此在為似然函數比值取對數之后,對數似然比(λ)上設置的閾值也不會在實驗條件之間發生改變。基于正態分布的概率密度函數(參考公式(14)和(15)),可以寫出λ與報告標準C之間的對應關系(Glanzer et al., 2009):

當λ在不同實驗條件之間維持恒定時,隨著任務難度的下降(即d'的上升),報告標準C會逐漸向d'/2的周圍收縮,因此一組報告標準之間的距離會縮短,即得出了zROC長度效應。此外,Glanzer等(2009)的數學推導結果表明,在不等方差信號檢測模型中,雖然個體的貝葉斯決策機制更為復雜,但只要個體保持λ在不同實驗條件之間的恒定, zROC長度效應就會成立。Glanzer等(2009, 2019)指出,雖然經典信號檢測論也可以對zROC長度效應進行強行解釋,即認為個體在刺激強度的數軸上直接設置的報告標準恰好隨著任務難度的降低而收縮,但它無法解釋報告標準的收縮對應怎樣的內在心理機制。因此,zROC長度效應可以被視為支持貝葉斯決策理論的證據。基于相似的方法,Glanzer等(2009)從似然比理論中推導出了另外兩種現象——鏡像效應和方差效應,并在實際研究結果中驗證了這兩種效應的存在。感興趣的讀者可以閱讀Glanzer等(2009)的數學推導過程。

根據似然比理論得出的三種實驗現象在一定程度上為貝葉斯決策理論提供了支持。然而,似然比理論一直受人質疑的地方在于其包含的真實似然比假設,即認為個體在信號檢測任務中能夠知道信號和噪音分布的真實形態。一些研究者質疑真實被試是否有能力掌握如此多的信息(Balakrishnan & Ratcliff, 1996; Criss & McClelland, 2006)。為了回應這一質疑,Semmler等(2018)提出,個體對信號和噪音分布形態的認識來自日常生活中經年累月的學習;即使個體不能通過學習精確地掌握信號與噪音分布的均值與標準差,也至少可以清楚地意識到信號和噪音分布之間的距離如何隨著任務難度的變化而發生變化(Turner et al., 2011; Wixted & Gaitan, 2002)。然而,上述觀點目前主要停留在理論層面。未來需要進一步對似然比理論的假設合理性進行考察。

6 結語

本文在貝葉斯決策理論的框架下,探討了個體如何通過貝葉斯推理過程完成信號檢測任務中的決策判斷。與經典信號檢測論相比,貝葉斯決策理論可以更加深入地解釋個體辨別信號和噪音的決策過程對應怎樣的內在心理機制。但是,貝葉斯決策理論中涉及的參數較多(包括個體對先驗概率和似然函數的主觀估計),而在信號檢測實驗任務中,根據擊中率和虛報率的實驗數據難以對上述所有參數求解。比如,個體在信號檢測任務中的報告標準發生變化,既有可能是源于個體改變了對先驗概率的主觀估計,也可能是由于對似然函數的主觀估計發生了改變;而在實際研究中很難區分這兩種情況(Fleming & Daw, 2017; Lau, 2007)。雖然似然比理論認為個體對似然函數的主觀估計和客觀真實值基本相同(Glanzer et al., 2009, 2019; Semmler et al., 2018),即對貝葉斯決策理論進行了簡化,但這一假設受到了其他研究者的質疑。因此,本文認為,在實際的信號檢測實驗任務中,經典信號檢測論(以及該理論提出的報告標準C)依然是可用于數據分析的有效工具。

本文討論的貝葉斯決策理論并不能完整反映個體在信號檢測任務中的決策機制。比如,貝葉斯決策理論認為,個體的決策結果完全基于信號和噪音出現的后驗概率的比值,當信號的后驗概率大于噪音時,被試會將當前刺激判斷為信號,反之則判斷為噪音(Burgess, 1985)。然而,在實際研究中,被試的決策結果還會受到與任務相關的獎勵及懲罰程度的影響。比如,一名司機在駕駛汽車即將到達十字路口時,需要快速判斷前方的紅綠燈上目前顯示的是哪種顏色(這里定義綠燈為信號,紅燈為噪音)。在上述的知覺判斷任務中,漏報(即將綠燈判斷為紅燈)并不會產生非常嚴重的后果,只會導致司機在十字路口多等待一段時間。然而,虛報(將紅燈判斷為綠燈)則會造成嚴重危害,比如司機闖紅燈撞到綠燈方向通行的汽車或行人。因此,司機可能會采取非常嚴格的報告標準,即傾向于將紅綠燈上顯示的顏色判斷為紅色(噪音),而這一判別標準與司機實際接收的知覺信息(刺激強度)是相互獨立的。Green和Swets (1966)指出,當不同作答結果的獎勵或懲罰程度不同時,個體的作答目標可能會從最大化作答正確率(即理想觀察者),轉變為最大化自身獲得的獎勵或最小化自身所受的懲罰。此時,個體的最終決策會同時基于信號和噪音成立的后驗概率,以及不同的作答反應可能導致的后果。

前文提到,貝葉斯決策理論認為,個體在信號檢測任務中給出信心判斷的過程,可以被視為是在后驗概率比值上設置一組不同的閾限,并將當前刺激對應的后驗概率比值與每個閾限值相比較的過程(Glanzer et al., 2009, 2019; Green & Swets, 1966)。然而,近年來,研究者逐漸認識到,基于刺激強度推理得到的后驗概率并不能準確地反映個體的信心判斷結果。這是因為個體在決策當前刺激是信號還是噪音時依賴的刺激強度,與信心判斷過程中使用的信息可能并不完全相同:個體在信心判斷中可能會丟失一部分關于刺激內容的信息,也可能基于一些額外的推理過程獲得更豐富的信息(Hu et al., 2021; Jang et al., 2012; Maniscalco & Lau, 2012; Shekhar & Rahnev, 2021)。為了將信心判斷過程更好地納入貝葉斯決策理論的框架下,Fleming和Daw (2017) 對傳統的貝葉斯決策理論進行了改進,并在改進后的理論中考慮了個體在決策過程和信心判斷過程中利用信息的差異。但是,另一些研究者認為,即使考慮了個體在信心判斷過程中利用的獨特信息,信心判斷過程自身的內在機制可能也與貝葉斯決策理論的觀點并不完全相符(Adler & Ma, 2018; Li & Ma, 2020)。關于信心判斷對應的內在心理過程是否為貝葉斯決策過程,目前仍然是一個存在爭論的話題,需要未來研究進一步探索。

參考文獻

胡傳鵬, 孔祥禎, Wagenmakers, E.-J., Ly, A., 彭凱平(2018). 貝葉斯因子及其在JASP中的實現. 心理科學進展, 26(6), 951-965.

Adler, W. T., & Ma, W. J. (2018). Comparing Bayesian and non-Bayesian accounts of human confidence reports. PLoS Computational Biology, 14(11), e1006572.

Balakrishnan, J. D., & Ratcliff, R. (1996). Testing mod-els of decision making using confidence ratings in clas-sification. Journal of Experimental Psychology: Human Perception and Performance, 22(3), 615-633.

Banks, W. P. (1970). Signal detection theory and human memory. Psychological Bulletin, 74(2), 81-99.

Burgess, A. (1985). Visual signal detection.III.On Bayesian use of prior knowledge and cross correlation. Journal of the Optical Society of America A, 2(9), 1498-1507.

Criss, A. H., & McClelland, J. L. (2006). Differentiating the differentiation models: A comparison of the retrieving effectively from memory model (REM) and the subj-ective likelihood model (SLiM). Journal of Memory and Language, 55(4), 447-460.

Egan, J., Schulman, A. I., & Greenberg, G. Z. (1959). Operating characteristics determined by binary decisions and by ratings. The Journal of the Acoustical Society of America, 31(6), 768-773.

Fleming, S. M., & Daw, N. D. (2017). Self-evaluation of decision-making: A general bayesian framework for metacognitive computation. Psychological Review, 124(1), 91-114.

Glanzer, M., Hilford, A., Kim, K., & Maloney, L. T. (2019). Generality of likelihood ratio decisions. Cognition, 191, 103931.

Glanzer, M., Hilford, A., & Maloney, L. T. (2009). Like-lihood ratio decisions in memory: Three implied regu-larities. Psychonomic Bulletin & Review, 16(3), 431-455.

Green, D. M., & Swets, J. A. (1966). Signal detection theory and psychophysics. Wiley.

Hilford, A., Glanzer, M., Kim, K., & Maloney, L. T. (2019). One mirror effect: The regularities of recognition memory. Memory & Cognition, 47(2), 266-278.

Hilford, A., Maloney, L. T., Glanzer, M., & Kim, K. (2015). Three regularities of recognition memory: The role of bias. Psychonomic Bulletin & Review, 22(6), 1646-1664.

Hu, X., Zheng, J., Su, N., Fan, T., Yang, C., Yin, Y., Fleming, S. M., & Luo, L. (2021). A Bayesian inference model for metamemory. Psychological Review, 128(5), 824-855.

Jang, Y., Wallsten, T. S., & Huber, D. E. (2012). A stoc-hastic detection and retrieval model for the study of met-acognition. Psychological Review, 119(1), 186-200.

Kersten, D., Mamassian, P., & Yuille, A. (2004). Object perception as bayesian inference. Annual Review of Psychology, 55(1), 271-304.

Knill, D. C. (1998). Discrimination of planar surface slant from texture: Human and ideal observers compared. Vision Research, 38(11), 1683-1711.

Lau, H. C. (2007). A higher order Bayesian decision theory of consciousness. Progress in Brain Research, 168, 35-48.

Legge, G. E., Hooven, T. A., Klitz, T. S., Stephen Mansfield, J., & Tjan, B. S. (2002). Mr. Chips 2002: New insights from an ideal-observer model of reading. Vision Rese-arch, 42(18), 2219-2234.

Li, H.-H., & Ma, W. J. (2020). Confidence reports in decision-making with multiple alternatives violate the Bayesian confidence hypothesis. Nature Communications, 11(1), 2004.

Macmillan, N. A., & Creelman, C. D. (2004). Detection theory: A user’s guide. London: Psychology press.

Maloney, L. T., & Zhang, H. (2010). Decision-theoretic models of visual perception and action. Vision Research, 50(23), 2362-2374.

Mamassian, P. (2016). Visual confidence. Annual Review of Vision Science, 2(1), 459-481.

Maniscalco, B., & Lau, H. (2012). A signal detection theo-retic approach for estimating metacognitive sensitivity from confidence ratings. Consciousness and Cognition, 21(1), 422-430.

Mickes, L., Wixted, J. T., & Wais, P. E. (2007). A direct test of the unequal-variance signal detection model of recognition memory. Psychonomic Bulletin & Review, 14(5), 858-865.

Pouget, A., Drugowitsch, J., & Kepecs, A. (2016). Conf-idence and certainty: Distinct probabilistic quantities for different goals. Nature Neuroscience, 19(3), 366-374.

Ratcliff, R., McKoon, G., & Tindall, M. (1994). Empirical generality of data from recognition memory receiver-operating characteristic functions and implications for the global memory models. Journal of Experimental Psychology: Learning, Memory, and Cognition, 20(4), 763-785.

Rotello, C. M. (2017). Signal detection theories of Recog-nition memory. In J. Byrne (Ed.), Learning and Memory: A Comprehensive Reference (Second Edition) (pp. 201-225). Academic Press.

Semmler, C., Dunn, J., Mickes, L., & Wixted, J. T. (2018). The role of estimator variables in eyewitness identification. Journal of Experimental Psychology: Applied, 24(3), 400-415.

Shekhar, M., & Rahnev, D. (2021). The nature of meta-cognitive inefficiency in perceptual decision making. Psychological Review, 128(1), 45-70.

Stretch, V., & Wixted, J. T. (1998). Decision rules for recognition memory confidence judgments. Journal of Experimental Psychology: Learning, Memory, and Cognition, 24(6), 1397-1410.

Tanner, W. P., & Swets, J. A. (1954). A decision-making theory of visual detection. Psychological Review, 61(6), 401-409.

Turner, B. M., Van Zandt, T., & Brown, S. (2011). A dynamic stimulus-driven model of signal detection. Psychological Review, 118(4), 583-613.

Wickens, T. D. (2001). Elementary signal detection theory. New York: Oxford university press.

Wixted, J. T. (2007). Dual-process theory and signaldet-ection theory of recognition memory. Psychological Review, 114(1), 152-176.

Wixted, J. T. (2020). The forgotten history of signal detec-tion theory. Journal of Experimental Psychology: Lea-rning, Memory, and Cognition, 46(2), 201-233.

Wixted, J. T., & Gaitan, S. C. (2002). Cognitive theories as reinforcement history surrogates: The case of likelihood ratio models of human recognition memory. Animal Learning & Behavior, 30(4), 289-305.

主站蜘蛛池模板: 99精品视频在线观看免费播放| 亚洲另类色| 中文字幕亚洲第一| jizz在线免费播放| 国产成人综合久久| 人妻熟妇日韩AV在线播放| 国产高清在线精品一区二区三区| 久久精品91麻豆| 美女一级毛片无遮挡内谢| 色欲国产一区二区日韩欧美| 亚洲国产欧洲精品路线久久| 欧美特黄一级大黄录像| 久久一日本道色综合久久| 国产免费久久精品99re不卡 | 91福利免费视频| 亚洲av中文无码乱人伦在线r| 99久久精品免费看国产电影| 国产自在自线午夜精品视频| 色一情一乱一伦一区二区三区小说| 国产丝袜无码一区二区视频| 亚洲欧洲国产成人综合不卡| 欧美人在线一区二区三区| 欧美日韩在线亚洲国产人| 国产最新无码专区在线| 99久久国产精品无码| 激情爆乳一区二区| 婷婷伊人久久| 成人一级黄色毛片| 中文字幕在线播放不卡| 91精品在线视频观看| 国产极品嫩模在线观看91| 粉嫩国产白浆在线观看| 欧美亚洲香蕉| 国产一级毛片网站| 国产黄色视频综合| 四虎国产成人免费观看| 秋霞午夜国产精品成人片| 亚洲男女天堂| 日韩一区二区三免费高清| 亚洲av日韩av制服丝袜| 五月婷婷亚洲综合| 国产精品亚洲五月天高清| 亚洲欧美成人综合| 精品国产自在在线在线观看| 午夜免费小视频| 日韩小视频在线观看| 久久99精品久久久久纯品| 亚洲精品视频免费| 久久这里只有精品国产99| 日本午夜在线视频| 日韩高清欧美| 国产女人综合久久精品视| 色播五月婷婷| 久久成人免费| 国产成人AV大片大片在线播放 | 在线欧美一区| 久久9966精品国产免费| 日韩无码视频播放| 免费a级毛片视频| 日韩无码视频播放| 日韩精品无码免费专网站| 日韩AV无码免费一二三区| 中文字幕伦视频| 亚洲一区波多野结衣二区三区| 一级毛片免费观看不卡视频| 欧美日韩激情在线| 色欲综合久久中文字幕网| 蜜臀av性久久久久蜜臀aⅴ麻豆| 秋霞午夜国产精品成人片| 久久九九热视频| 亚洲国产综合精品一区| 欧美国产日韩在线播放| 国模私拍一区二区| 青青草原国产精品啪啪视频| 国模私拍一区二区| 亚洲一区二区成人| 激情网址在线观看| 国产黑丝一区| 中文字幕无码电影| 亚洲成a人片| 欧美日韩精品一区二区视频| 在线欧美一区|