
一項7月2日發表于《自然》的研究報道了一款創新的人工智能(AI)系統——Centaur。它可以預測人們在各種情況下作出的決定,并且通常優于心理學經典理論作出的推測。
不同于谷歌DeepMind的AlphaGo等只能預測一個人就單一任務如何作出選擇的AI系統,Centaur可以模擬人類在一系列任務中的行為,包括賭博、玩記憶游戲和解決問題等。在測試過程中,Centaur甚至能預測人們在未接受過訓練的任務中的選擇。創建該系統的團隊認為,有一天它可能會成為認知科學領域有價值的工具。
“你基本可以在電子設備上運行實驗,而無須真正的人類參與者。”該研究合著者、德國慕尼黑亥姆霍茲人類中心AI研究所的認知科學家Marcel Binz說,當傳統研究速度太慢,或者很難招募到兒童或患有精神病的實驗參與者時,這個AI工具可能很有用。
長期以來,科學家一直努力使用特定任務模型模擬人類的廣泛行為,但這些工具很難推廣到大量任務中去。Binz和同事希望突破這一局限性。他們花了5天時間,利用來自160個心理學實驗的大量數據集,對美國Meta公司研發的大語言模型(LLM)——LLaMA進行了微調。在這些心理學實驗中,有6萬人在各種任務中作出了超過1000萬個選擇。最終,研究人員研發出Centaur。
研究人員測試了Centaur對未包含在訓練數據集中的參與者的行為預測能力。結果顯示,在32項任務中,除一項外,Centaur在預測參與者將作出的選擇方面都優于LLaMA和其他14個認知與統計模型。唯一例外的是要參與者判斷句子在語法上是否正確的任務。
在對接受訓練的任務進行更改后,Centaur的表現依然良好,甚至在與以往訓練任務都不同的任務中,如邏輯推理,它也表現不錯。