999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

研究發現Llama2在識別失禮行為上優于人類同樣場景下GPT頻繁出錯

2024-08-03 00:00:00
海外星云 2024年7期

人類是復雜的生物。我們的溝通方式是多層次的,心理學家已經設計了多種測試來衡量我們從互動中推斷彼此的意義和理解的能力。

人工智能模型在這些測試中的表現越來越好。近日,發表在《自然人類行為》上的一項新研究發現,一些大型語言模型在執行被稱為“心智理論”的任務時,表現與人類一樣好,在某些情況下甚至超越了人類。

這并不意味著人工智能系統實際上能夠讀懂我們的感受,但它確實表明在評估心理學家認為的人類獨有能力的實驗中,這些模型表現得越來越好。

為了更好地了解大型語言模型在這些任務中的成敗機理,研究人員希望沿用他們用來測試人類心智理論的相同系統性方法。

理論上,人工智能模型越善于模仿人類,它們在與我們的互動中就越有用和富有同情心。

OpenAI和谷歌最近都宣布了超級人工智能助手。GPT-4o和Astra的設計目的是提供比其之前版本更流暢、更自然的反饋。

但我們必須避免陷入相信它們擁有與“類人”能力的陷阱,即使它們看起來是這樣。

德國漢堡-埃彭多夫大學醫學中心的神經科學教授克里斯蒂娜·貝基奧參與了這項研究。

她說:“我們有一種自然的傾向,即認為沒有心智的實體也具備(類W6rB5TocgPykVAOKB337ycZIEUVKRGCjl6psk9ENGhY=似人類的)精神狀態、心智和意圖。將心智理論放在大型語言模型身上,這樣的風險是存在的?!?/p>

心智理論是情商和社會智力的標志,它使我們能夠推斷他人的意圖,并與其互動或表達同情。大多數孩子會在3到5歲之間學會這些技能。

研究人員測試了兩個大型語言模型家族,OpenAI的GPT-3.5和GPT-4,以及Meta的Llama的三個版本。

他們挑選的任務旨在測試人類的心智理論,包括識別錯誤信念、識別失禮行為以及理解隱含而非直接說出的意思(潛臺詞)。他們還對1907名人類參與者進行了測試,作為分數對照。

該小組進行了5種類型的測試。第一項是暗示任務,旨在衡量某人通過間接評論推斷他人真實意圖的能力。

第二項是錯誤信念任務,評估某人是否可以推斷出他人的真實信念,而他人的信念通常與事實不符。

另一項測試衡量某人是否能識別出他人的行為是失禮(或尷尬)的。

而第四項測試包括講述奇怪的故事,故事中主人公做了一些不尋常的事情,以評估某人是否能夠解釋所說的和所做的之間的反差。他們還測試了人們是否能理解諷刺。

人工智能模型在獨立的聊天中對每個測試進行了15次嘗試,這樣它們就可以獨立處理每個請求,并且它們的回答也以與人類相同的方式進行評分。

研究人員隨后對人類志愿者進行了測試,比較了兩組的分數。

在涉及間接評論、誤導和錯誤信念的任務中,兩種版本的GPT的表現都追平或偶爾超越了人類平均水平,而GPT-4在諷刺、暗示和奇怪故事測試中的表現優于人類。

Llama2的3個模型的表現均低于人類平均水平。

然而,Llama2在識別失禮行為和場景方面的表現優于人類,而GPT總是提供錯誤的反饋。

論文作者認為,這是由于GPT普遍不愿意對意見發表結論,因為模型經?;貞f,沒有足夠的信息讓它們以這樣或那樣的方式給出回答。

他說:“這些模型肯定沒有展示出人類的心智理論。但我們所展示的是,它們有能力對人物或人們的思想進行心理推理?!?/p>

美國卡內基梅隆大學助理教授瑪藤·薩普沒有參與這項研究,他對這一研究結果評價稱,大型語言模型表現得這么好的一個可能原因是,這些心理測試已經構建得很好了,很可能已經包含在模型的訓練數據中了。他說:“重要的是要承認,當你對小孩子進行虛假信念測試時,他們可能從未見過類似的測試,但語言模型可能見過了?!?/p>

然而,我們仍然不了解大型語言模型是如何工作的。

美國哈佛大學的認知科學家托默·烏爾曼說,像這樣的研究可以幫助我們加深對這類模型的理解,比如它們能做什么、不能做什么。

但重要的是,當我們進行這樣的大型語言模型測試時,要記住我們真正測試的是什么。

即使人工智能在旨在測量心智理論的測試中表現優于人類,也不意味著心智理論適用于它。

烏爾曼說:“我并不反對基準,但很多人擔心我們目前使用基準的方式已經不再有意義,我是其中之一。不管這個東西是如何通過基準測試的,它并非以一種類似人類的方式實現的,至少我是這么認為的?!保ňC合整理報道)(策劃/多洛米)

主站蜘蛛池模板: 国产又粗又猛又爽| 久久综合五月| 一级成人a毛片免费播放| 五月婷婷综合网| a亚洲视频| 天堂网亚洲系列亚洲系列| 99在线免费播放| 色噜噜综合网| 久久综合亚洲鲁鲁九月天| 97人妻精品专区久久久久| 99在线观看国产| 欧美亚洲另类在线观看| 欧美在线视频不卡| 欧美色亚洲| 视频一本大道香蕉久在线播放| 99久久国产自偷自偷免费一区| 99人体免费视频| 91国内在线视频| 精品国产免费人成在线观看| 日韩欧美中文| 亚洲精品无码日韩国产不卡| 大香伊人久久| 黄色在线不卡| 亚洲无码视频图片| 亚洲精品第五页| 久久中文无码精品| 五月综合色婷婷| 国产精品v欧美| a毛片免费在线观看| 亚洲国产系列| 在线播放真实国产乱子伦| 伊人色综合久久天天| 国产美女叼嘿视频免费看| 欧美日韩理论| 伊人成人在线视频| 欧美成a人片在线观看| 热re99久久精品国99热| 色成人亚洲| 国产成人高清精品免费5388| 波多野结衣第一页| 国国产a国产片免费麻豆| 99手机在线视频| 大学生久久香蕉国产线观看| 国产综合精品日本亚洲777| 亚洲成人网在线播放| 久久国语对白| 午夜欧美理论2019理论| 日本免费高清一区| 日韩小视频在线观看| 都市激情亚洲综合久久| 亚洲一区二区成人| 国产精品综合色区在线观看| 99无码中文字幕视频| www.91在线播放| 无码中文字幕加勒比高清| 日本手机在线视频| 亚洲视频免| 国产色伊人| 亚洲欧洲美色一区二区三区| 中文字幕在线一区二区在线| 欧美精品三级在线| 国产女人水多毛片18| 午夜视频免费一区二区在线看| 综合成人国产| 免费国产黄线在线观看| 天天干伊人| a免费毛片在线播放| 午夜不卡视频| 国产免费久久精品99re丫丫一| 国产乱子伦视频三区| 无码日韩精品91超碰| 亚洲人成网站在线播放2019| 美女被操黄色视频网站| 国产精品hd在线播放| 人与鲁专区| 秋霞午夜国产精品成人片| 亚洲愉拍一区二区精品| 亚洲日本在线免费观看| 国产精品尤物铁牛tv| 亚洲永久免费网站| 日本成人精品视频| 啪啪免费视频一区二区|