999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

新方法避免大語言模型“胡言亂語”

2024-10-03 00:00:00
文萃報·周二版 2024年37期

目前,大語言模型逐漸成為文學(xué)、法律、醫(yī)學(xué)、自然科學(xué)研究等領(lǐng)域中不可或缺的工具。然而,在應(yīng)用過程中,大語言模型常會出現(xiàn) “幻覺”現(xiàn)象——可能生成看似合理但實際并不準(zhǔn)確或不真實的信息。

英國牛津大學(xué)研究團(tuán)隊近日在國際學(xué)術(shù)期刊《自然》上發(fā)表論文,嘗試解決大語言模型輸出中的這種“幻覺”現(xiàn)象,從而提高輸出的可信性。通過評估大語言模型在特定提示詞下生成內(nèi)容時的不確定性,可計算出該模型的困惑程度。作為一種警示,它提醒用戶或模型自身采取額外的循證措施,以確保更準(zhǔn)確地輸出答案。

為了更準(zhǔn)確衡量模型的困惑程度,該論文引入了“語義熵”概念來計算輸出的不確定性。所謂語義熵,實際上是信息熵的一種,用于衡量一個物理系統(tǒng)中所包含的信息量。

為了簡單理解“熵”所表示的意思,我們可以想象一個人在岔路口時作出判斷的情形:如果這個人向左走或向右走的概率相同,那么這是“熵”的最大情況,代表信息不確定性的極大值,說明這個人對前方的路完全沒有把握;而如果這個人總是選擇向左走,從不選擇向右走,則這是“熵”的最小情況,代表信息不確定性的極小值,說明這個人對前方的路完全有把握。

利用語義熵概念,研究人員對包括GPT-4和LLaMA2在內(nèi)的多個大語言模型進(jìn)行深入研究。結(jié)果顯示,語義熵在所有模型和數(shù)據(jù)集上的表現(xiàn)都非常出色,是目前用于評估模型困惑程度的最佳方法,能有效識別出大語言模型是否在“胡言亂語”。另外,通過對大語言模型進(jìn)行反復(fù)提問,我們可以有效地定量計算出它對問題答案的不確定程度,并通過拒絕回答不確定的問題來提高輸出答案的整體準(zhǔn)確度。

值得注意的是,大語言模型輸出答案具有很低的語義熵,只意味著它在其已有的訓(xùn)練數(shù)據(jù)基礎(chǔ)上確信自己答案是正確的。這表明大語言模型有極高概率生成單一語義的句子,但這些句子是否實際正確仍無法完全保證。

(據(jù)中新社訊)

主站蜘蛛池模板: 国产超薄肉色丝袜网站| AV不卡在线永久免费观看| 午夜啪啪网| 日本国产精品一区久久久| 91久久偷偷做嫩草影院| 国产三级国产精品国产普男人| 成人精品亚洲| 亚洲三级视频在线观看| av无码一区二区三区在线| 亚洲高清无码精品| 日韩黄色大片免费看| 玖玖精品在线| 9999在线视频| 亚洲第一综合天堂另类专| 99热这里只有精品免费国产| 91区国产福利在线观看午夜 | 国产成人精品男人的天堂下载| 91精品国产福利| 中文字幕无码av专区久久| 久久人妻xunleige无码| 亚洲欧美日韩中文字幕一区二区三区 | 不卡午夜视频| AV网站中文| a级毛片毛片免费观看久潮| 91亚洲免费视频| 国产精品私拍在线爆乳| 高清无码一本到东京热| 91国内视频在线观看| 97视频免费在线观看| 天天操天天噜| 狼友视频国产精品首页| 国产精品网拍在线| 中国黄色一级视频| 亚洲精品第一在线观看视频| 国产欧美精品午夜在线播放| 国产精品女人呻吟在线观看| 亚洲国产一成久久精品国产成人综合| 国产精品久久国产精麻豆99网站| 99久久精彩视频| 丝袜亚洲综合| 波多野结衣第一页| 国产丰满成熟女性性满足视频| jizz国产视频| 国产在线观看91精品亚瑟| 日韩国产黄色网站| 欧美在线伊人| 欧美日韩精品在线播放| 欧美a在线视频| 三上悠亚精品二区在线观看| 国产精品人成在线播放| 制服丝袜在线视频香蕉| 日本精品αv中文字幕| 四虎在线观看视频高清无码| 伊人大杳蕉中文无码| 国产精品尤物在线| 成人日韩欧美| 日本道中文字幕久久一区| 精品国产免费观看| 91色在线观看| 国产成熟女人性满足视频| 青青青视频免费一区二区| 日韩欧美色综合| 中文字幕亚洲乱码熟女1区2区| 日韩毛片在线播放| 91热爆在线| 无码精品国产dvd在线观看9久| 亚洲无卡视频| 香蕉久人久人青草青草| 亚洲欧洲日韩综合| m男亚洲一区中文字幕| 国产清纯在线一区二区WWW| 无码人中文字幕| 中文字幕第1页在线播| 一区二区理伦视频| 国产精品19p| 波多野结衣中文字幕一区二区| 免费一极毛片| 又粗又大又爽又紧免费视频| 人妻熟妇日韩AV在线播放| 国产精品入口麻豆| 日本一本正道综合久久dvd| 最新国产精品第1页|