999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

谷歌DeepMind團隊為語言模型帶來新工具,可及時發現并修復有害行為

2022-03-27 00:29:09
海外星云 2022年5期
關鍵詞:文本內容用戶

語言賦予人類表達思想、交流概念、創造記憶和相互理解的能力,開發和研究強大的語言模型有助于構建安全高效的高級人工智能系統。

此前,研究人員通過使用人工注釋器手寫測試用例來識別語言模型部署前的有害行為。這種方法是有效的,但由于人工注釋成本高昂,測試用例的數量和多樣性被大大限制。

近日,谷歌DeepMind團隊發表了一項新研究,他們提供了一種名為“紅隊”的工具,可以在運行的語言模型影響用戶之前發現并修復其有害行為。

在這項研究中,DeepMind使用經過訓練的分類器來評估目標語言模型對生成測試用例的回復情況,并檢測其中的冒犯性內容。最終,該團隊在參數達280B的語言模型聊天機器人中發現上萬條冒犯性回復。

據悉,DeepMind通過即時工程來檢測語言模型生成的測試用例,以發現各種其他危害,包括自動查找聊天機器人的攻擊性回復、被聊天機器人濫用的私人電話號碼以及在生成文本中泄露的私人訓練數據等。

生成式語言模型有時會以意料不到的方式危害到用戶,其可能會輸出不良的文本內容。而在實際應用程序中,哪怕只有極小的可能性會對用戶造成傷害,也是不被允許的。

2016年,微軟推出了能夠自動發布推文給用戶的Tay機器人。但在上線的16小時內,有幾名用戶利用Tay機器人的漏洞,讓其將帶有種族主義和性意味的推文發送給了超過5萬名用戶,之后微軟將該機器人關閉。

然而,這并不是因為微軟的疏忽。微軟副總裁彼得·李表示,“我們已經做好了應對許多類系統濫用行為的準備,而且我們對這一特定攻擊進行了關鍵監督。”

癥結在于,會致使語言模型輸出有害文本的場景數不勝數,研究人員無法在語言模型被部署到現實之前找出一切可能發生的情況。

GPT-3模型用于法語語法更正

正如大家所熟知的強大語言模型GPT-3,盡管其能夠輸出高質量的文本內容,但卻不容易在真實世界中完成部署。

據了解,DeepMind的目標是通過自動查找故障案例來對手寫測試用例進行補充,從而減少關鍵疏忽的數量。

為此,DeepMind使用語言模型本身生成測試用例,從零觸發生成到監督微調和強化學習,DeepMind探索了多種方法來生成具有不同多樣性和難度的測試用例,這將有助于獲得高測試覆蓋率及模擬對抗性案例。

此外,DeepMind使用分類器檢測測試用例上有以下各種有害行為:首先是冒犯性語言,模型有時會發表具有歧視、仇恨、色情等意味的內容;其次是數據外泄行為,模型濫用訓練時給到的數據庫,包括私人的身份信息;再次是聯系信息的濫用,模型會發送無意義的電子郵件或通過電話打擾到其他真實用戶;然后是群體認知偏差,即在輸出的文本內容中包含對某些人群不公正的偏見類言論;最后,模型還會在與用戶對話時,作出有攻擊性等不良意味的回復。

在明確哪些行為會給用戶造成傷害后,如何去修復這些行為就不是難事了,DeepMind主要采取了以下幾種方式:例如,通過禁止語言模型使用在不良內容中高頻率出現的詞組,來盡量避免模型輸出有害文本;在迭代階段,篩選并刪除語言模型在訓練時使用過的攻擊性對話數據;強化語言模型的意識,訓練時嵌入特定類型輸入所需的行為案例;在標準測試中對模型進行最初輸出文本的訓練,最大化避免輸出有害文本的情況。

總的來說,基于語言模型的“紅隊”是一種具有發展前景的工具,可以發現語言模型何時在以各種不良方式運行,應該與其他許多用于發現并緩解語言模型中危害的技術工具一起使用。

Gopher模型進行對話交互

值得一提的是,DeepMind的這項研究還可用于先發制人地發現來自高級機器學習系統的其他假設危害,如由內部失調或客觀穩健性失效而引發的故障。

前不久,DeepMind對外公布了具有2800億參數的全新語言模型Gopher,其在參數量上超越了OpenAI的GPT-3。

在性能方面,研究人員測試了152個任務后得出,Gopher在絕大多數的任務中遠勝SOTA模型,特別是在需使用大量知識來應對的方面。

這些成就為DeepMind未來的語言研究奠定了基礎,進一步推動了其解決智能問題以推進科學并造福人類的使命實現。 (摘自美《深科技>) (編輯/小文)

猜你喜歡
文本內容用戶
內容回顧溫故知新
科學大眾(2022年11期)2022-06-21 09:20:52
在808DA上文本顯示的改善
基于doc2vec和TF-IDF的相似文本識別
電子制作(2018年18期)2018-11-14 01:48:06
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
主要內容
臺聲(2016年2期)2016-09-16 01:06:53
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學隱喻
如何獲取一億海外用戶
創業家(2015年5期)2015-02-27 07:53:25
如何快速走進文本
語文知識(2014年1期)2014-02-28 21:59:13
主站蜘蛛池模板: 国产一区二区三区在线无码| 国产无码网站在线观看| 亚洲综合精品第一页| 91精品视频播放| 亚洲最大在线观看| 狠狠综合久久久久综| 久久久久久国产精品mv| 欧美啪啪一区| 国内视频精品| 婷婷中文在线| 成人综合网址| 好吊日免费视频| 好吊色国产欧美日韩免费观看| 久久伊伊香蕉综合精品| 婷婷综合在线观看丁香| 一级毛片在线播放免费观看| 97人妻精品专区久久久久| 精品天海翼一区二区| 午夜啪啪网| 国产极品嫩模在线观看91| 国产jizz| 少妇露出福利视频| 精品国产污污免费网站| 亚洲男人在线天堂| 婷婷综合色| 亚洲五月激情网| 亚洲国产综合精品中文第一| 国产区精品高清在线观看| 国产97视频在线| 亚洲无码一区在线观看| 欧美日韩精品在线播放| 激情视频综合网| 久久99热这里只有精品免费看 | 波多野结衣无码AV在线| 亚洲国产系列| AV在线麻免费观看网站| 亚洲综合日韩精品| 伊人成色综合网| 国产男女XX00免费观看| 欧美日韩成人| 国产综合网站| 亚洲日韩图片专区第1页| 亚洲天堂.com| 在线亚洲精品自拍| 91偷拍一区| 日韩在线视频网| 中国黄色一级视频| 在线视频亚洲色图| 成色7777精品在线| 在线国产欧美| 国产99在线观看| av无码一区二区三区在线| 本亚洲精品网站| 三上悠亚精品二区在线观看| 蜜桃视频一区二区三区| 制服丝袜在线视频香蕉| 免费看av在线网站网址| 久久久91人妻无码精品蜜桃HD| 99热这里只有精品免费国产| 色婷婷在线影院| 国产白浆视频| 欧美成人aⅴ| 青青草a国产免费观看| 国内精品久久久久久久久久影视| 无码AV动漫| 亚洲欧美成人综合| 激情视频综合网| 91青青在线视频| 在线a网站| 国产网站在线看| 欧美日本不卡| 国产精欧美一区二区三区| 欧美色香蕉| 欧美午夜精品| 精品国产免费观看| 精品剧情v国产在线观看| 国内精品久久久久鸭| 91成人免费观看| 亚洲天堂日韩av电影| 丁香婷婷在线视频| 999福利激情视频| 青青青国产在线播放|