一項旨在復制心理學研究結果的大規模努力反駁了這樣的說法,即再現社會科學發現的失敗可能歸結于研究人群的差異。
該研究招募了來自世界各地的實驗室,試圖再現28項經典和當代心理學實驗的結果。利用被設定為P < 0.0001(P是判斷科學證據力度的常見測試)的嚴格的顯著性閾值,僅有一半實驗被成功再現。
此項努力對來自6個大陸的人群進行了取樣。研究團隊介紹說,總體發現表明,參與者群體的文化或者背景在決定結果能否被重現方面并非重要因素。
研究成果的再現性,尤其是心理學領域,近年來一直受到仔細審查。若干努力曾試圖重復各領域已發表的發現,但結果不一。
被稱為“眾多實驗室2”的最新努力由位于美國弗吉尼亞州夏洛茨維爾的開放科學中心心理學家Brian Nosek主導。
他和同事設計了該項目,旨在回應對此前再現努力的重要批評,包括關于取樣的問題以及研究框架可能未在再現努力中被正確執行的斷言。
研究人員獲得了每項實驗中利用的初始材料,并且讓專家(在很多情形下是研究的初始作者)提前評審其實驗框架。隨后,來自36個國家和地區的60個不同實驗室重新開展了每項實驗,并且提供了組合起來的樣本大小——平均比初始樣本大62倍。此項努力的結果日前作為預印本發表,并且即將發表于《心理科學方法和實踐進展》。
“人們總是覺得,再現努力失敗當然是因為條件改變了,人也不同了。我們就是想消除這種常見的反應。”Nosek說,“雖然這可能是一種解釋,但并非令人滿意,因為我們不知道為何差異如此重要。”
即便在這些條件下,在28項實驗中,也僅有14項的結果被再現出來。研究人員據此斷定,研究人群的多樣性對失敗產生的影響很小。