999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

科學家打造“變分偏好學習”技術助力保護少數群體用戶利益

2025-03-13 00:00:00
海外星云 2025年1期
關鍵詞:人類用戶方法

娜塔莎·雅克是美國華盛頓大學的助理教授。此前在美國麻省理工學院讀博期間,她曾開發一種語言模型微調技術,后被用于OpenAI使用到基于人類反饋強化學習訓練的產品中。

同時,她還曾在谷歌DeepMind和谷歌大腦等公司有過實習經歷,也曾擔任過OpenAI學者導師。在博士后期間,娜塔莎師從目前論文有著16萬多次引用量、谷歌學術指數為175、被人稱為“頂會狂魔”的美國加利福尼亞大學伯克利分校謝爾蓋·列文教授。

目前,除了在華盛頓大學擔任助理教授之外,娜塔莎也是谷歌DeepMind的高級研究科學家。

最近,她和團隊發表的一篇論文被神經信息處理系統大會(NeurIPS)收錄。在發表于本次大會的所有論文中,這篇論文排在前2%。

除了展示這篇論文之外,娜塔莎課題組成員也深入參與此次大會。娜塔莎在社交平臺上發帖稱,盡管自己的團隊僅成立一年,但是此次一共有10名課題組成員在NeurIPS上亮相。

而在這篇排名NeurIPS大會前2%的論文中,她和團隊開發了一種名為“變分偏好學習”的技術,能針對大模型生成內容進行微調,以便更符合用戶的個人偏好。

相關論文的題目為《通過變分偏好學習實現基于人類反饋的個性化強化學習》。

當一名低收入家庭的學生無法真正得到大模型的幫助

娜塔莎告訴媒體,盡管自己此前的研究成果為人類反饋強化學習(RLHF)帶來了助力,但是這種方法并不完美。更早之前,一個來自同行論文中的案例讓她感觸頗深:一名來自低收入家庭的學生向大模型提問,希望了解目標大學的招生信息。

但是該大模型的生成內容,是根據大多數申請者的情況生成的,而在這些人中并沒有太多來自低收入家庭的學生。

那么,對于這名來自低收入家庭的學生來說,該大模型可能并不會向其提供教育資金援助信息。這是因為目前的人類反饋強化學習技術無法解釋不同人群中個體偏好的自然差異。當這些差異出現時,該技術只會針對這些差異求平均值。

在訓練大模型的時候通常會使用到數據集,而數據集里往往包括一些固有偏見和不恰當信息。此前,人們在開發大模型時,往往是利用人類反饋強化技術,從大模型的生成內容中過濾掉這些信息。

娜塔莎表示,有些大模型公司的研究人員并沒有接受過政策或社會學方面的培訓,但是他們卻決定著大模型應該說什么和不應該說什么。

在使用人類反饋強化學習這一技術時,它會讓大模型通過比較不同的輸出,來選擇其中更好的一個輸出。

它的確能夠提高生成內容的質量,包括在不合適的生成內容上設置護欄。不過,這也意味著大模型會“繼承”真人訓練者的價值體系。

仍以低收入家庭學生查找大學申請信息的問題為例,如果大模型接受了人類反饋的訓練,它可能永遠也不會提供有關教育資金援助的信息,而這會損害來自低收入家庭的學生的利益。

與此同時,在使用人類反饋強化學習技術的時候,大模型會將所有偏好平均在一起,但這樣生成的內容可能并不準確。舉個例子,你和鄰居都在使用家用機器人來收拾盤子。假如你希望機器人將盤子放在桌子右上角,而你的鄰居希望機器人把盤子放在桌子右下角。然而,家用機器人的開發者只是根據他們自己的偏好進行訓練,那么機器人就會平均這些偏好,這樣一來就很難按照每個用戶的想法來把盤子放在正確位置。

娜塔莎對媒體直言:“(以ChatGPT為例)本質上是OpenAI的研究人員決定對模型說什么是合適的,什么是不合適的,然后將模型送到1億月活用戶的手上。但我們認為這還不夠,因為人們的偏好非常不同。什么是恰當的,什么是不恰當的,這取決于文化、規范和個人,這實際上是一個更深層次的問題。實際上,人工智能模型往往比人更有偏見,因為它們是在所有歷史數據上進行訓練的?!?/p>

“變分偏好學習”:讓大模型推測用戶的隱藏偏好

娜塔莎課題組此次提出的“變分偏好學習”方法,是一種訓練人工智能系統的方法,其能從具有不同偏好的不同用戶群體中學習,即能讓大模型用戶自己承擔改進輸出的角色。

只需四個查詢步驟,“變分偏好學習”就可以弄清用戶的偏好。這讓“變分偏好學習”不僅能用于言語交流,還能用于訓練機器人以便讓其在家庭等個人環境中執行簡單任務。

“變分偏好學習”能夠用于可操縱的個性化模型學習,以及能夠捕獲用戶偏好中的不確定性和差異?!白兎制脤W習”方法通過與用戶互動來預測用戶的偏好,然后相應地調整其輸出,即它可以讓大模型推斷出用戶的隱藏偏好。

也就是說,它能夠獲悉人類用戶更加喜歡的答案。用戶的獨特偏好便是“嵌入向量”,基于此大模型能夠針對個人偏好做出個性化預測,并在輸出內容時堅持這些判斷。

在語言實驗和模擬機器人實驗中,娜塔莎和團隊創建了一些數據集。他們發現,用于訓練ChatGPT等大模型的人類反饋強化技術根本無法適應這些數據集,在預測用戶的二元偏好方面的準確率只有50%,而當娜塔莎引入由“變分偏好學習”方法打造的大模型時,準確率能提高10%~25%。

為了滿足多元對齊的需求,娜塔莎等人還開發出一類多模態人類反饋強化學習方法,這一方法基于潛在變量公式。在沒有額外用戶特定數據的情況下,可以推斷出特定的學習獎勵模型和學習獎勵策略。

這種獎勵建模并非易事,需要圍繞模型架構和獎勵縮放進行仔細的算法考慮。為此,她和團隊在代表不同用戶偏好的多元語言數據集上進行實驗,結果發現獎勵函數的準確性確實能被上述方法提高。

總的來說,“變分偏好學習”既適用于ChatGPT等大型語言模型,也適用于機器人,也能更好地反映用戶的不同價值觀。

不過,這項成果的一個主要局限性在于,截至目前并未出現包含不同用戶意見的大規?,F實偏好數據集。在這種限制之下,娜塔莎等人只能自行創建偏好數據集。

盡管這也是人們在研究個性化人類反饋強化學習時經常采用的方法,但是未來她打算使用本次提出的“變分偏好學習”方法,從不同用戶群體中提取更真實的偏好數據。

與此同時,她認為“變分偏好學習”除能用于建模不同用戶的偏好外,還能在大模型中發揮一定的安全優勢。(綜合整理報道)

(策劃/小文)

猜你喜歡
人類用戶方法
人類能否一覺到未來?
人類第一殺手
好孩子畫報(2020年5期)2020-06-27 14:08:05
1100億個人類的清明
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
人類正在消滅自然
奧秘(2015年2期)2015-09-10 07:22:44
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
捕魚
主站蜘蛛池模板: 亚洲日韩高清无码| 国产精品流白浆在线观看| 亚洲区视频在线观看| 精品国产香蕉伊思人在线| 国产香蕉在线视频| 无码有码中文字幕| 中文字幕乱码二三区免费| 二级特黄绝大片免费视频大片| 99在线观看免费视频| 国产一级精品毛片基地| 在线观看免费人成视频色快速| 国产毛片不卡| 国产女人18水真多毛片18精品| AV不卡无码免费一区二区三区| 日本在线免费网站| 激情综合网激情综合| 国产丝袜第一页| 精品亚洲欧美中文字幕在线看| 欧美第一页在线| 麻豆精品国产自产在线| 国产精品三级av及在线观看| 一本二本三本不卡无码| 尤物亚洲最大AV无码网站| 欧美区一区| 国产永久在线视频| 日韩精品无码免费专网站| 成人午夜在线播放| 国产精品青青| 国产精品浪潮Av| 国产AV毛片| 国产精品999在线| 亚洲精品高清视频| 国产精品永久在线| 天堂成人在线| 在线欧美a| 国产精品爽爽va在线无码观看| 91福利在线观看视频| 五月天婷婷网亚洲综合在线| 亚洲天堂久久| 88av在线| 精品成人一区二区| 精品1区2区3区| 国产情侣一区| 国产欧美网站| 欧美天天干| 日韩av手机在线| 国产男女免费视频| 色综合中文综合网| 亚洲成人网在线观看| 免费A级毛片无码无遮挡| 92午夜福利影院一区二区三区| 久久香蕉国产线| 国产三级毛片| 第一区免费在线观看| 很黄的网站在线观看| 亚洲AⅤ综合在线欧美一区| 91人妻日韩人妻无码专区精品| 国产成人午夜福利免费无码r| 久久久久亚洲精品成人网| 国产高潮流白浆视频| 国产亚洲欧美在线专区| 久久精品视频亚洲| 综合色区亚洲熟妇在线| 国产成人一二三| 国产91在线免费视频| 成年人福利视频| 国产三级精品三级在线观看| 欧美精品成人一区二区在线观看| 欧美国产视频| 国产麻豆精品久久一二三| 国产成人盗摄精品| 国产91小视频在线观看| 久久国产乱子伦视频无卡顿| 色婷婷久久| 亚洲欧美日韩天堂| 日韩天堂网| 91成人在线免费视频| 久操线在视频在线观看| 国产成人精品无码一区二| 国产女人在线视频| 无码专区在线观看| 国产女人18水真多毛片18精品|