999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

2023AI大語言模型TOP10

2023-07-04 04:56:35米欄
互聯(lián)網(wǎng)周刊 2023年11期
關(guān)鍵詞:語義文本情感

米欄

時代變革的大幕已掀開一角,一場由OpenAI引領(lǐng)的全球AI大語言模型軍備競賽正式開啟。

3月14日,GPT-4正式發(fā)布,大語言模型開始具備圖片和文字同時處理的多模態(tài)能力,繼續(xù)占據(jù)先入為主的優(yōu)勢。

全球大廠中率先回應(yīng)的是百度。3月16日,百度大語言模型“文心一言”正式推出,對外啟動邀測。據(jù)公開報道,文心一言具備五項核心能力:文學(xué)創(chuàng)作、商業(yè)文案創(chuàng)作、數(shù)理邏輯推算、中文理解和多模態(tài)生成。

緊接著其他科技企業(yè)也陸續(xù)跟進(jìn)。4月11日,2023阿里云峰會現(xiàn)場演示了通義千問的多項功能,并定向邀請企業(yè)用戶進(jìn)行體驗測試;5月10日,谷歌時隔一年推出了新一代語言大模型PaLM 2,被視為對此前發(fā)布會翻車的有力回應(yīng)。

此外,還有復(fù)旦大學(xué)在2月21日發(fā)布的“MOSS”、清華大學(xué)3月28日發(fā)布的“ChatGLM-6B”、360于4月10日發(fā)布的“360智腦”、商湯科技4月10日發(fā)布的“商量”、科大訊飛5月6日發(fā)布的“訊飛星火認(rèn)知大模型”,等等。

截至5月,據(jù)不完全統(tǒng)計,國內(nèi)已有超過40家公司、機構(gòu)發(fā)布了大模型產(chǎn)品或公布了大模型計劃。項目數(shù)量井噴式爆發(fā),可預(yù)見的是,下半年的國內(nèi)AI大模型市場競爭將會變得空前激烈。

不止于“大”

提到大模型,很多人的關(guān)注點都會放在“大”字上,畢竟足夠量級的參數(shù)是語言模型實現(xiàn)智能涌現(xiàn)、形成質(zhì)變的基礎(chǔ)。比如,不少大語言模型的參數(shù)量級達(dá)千億級,這也就意味著較為豐富的語言知識與較廣泛的語境理解能力。

不過,目前類GPT模型普遍采用的是Transformer架構(gòu),所以必然包含市面上存在的大量文本數(shù)據(jù)例如小說、教科書、論壇、開源代碼等內(nèi)容的無監(jiān)督預(yù)訓(xùn)練過程,在此基礎(chǔ)上,僅需根據(jù)具體任務(wù)輸入少量的標(biāo)簽數(shù)據(jù)進(jìn)行監(jiān)督學(xué)習(xí)。在這樣的模式下,訓(xùn)練數(shù)據(jù)集質(zhì)量的重要性開始愈發(fā)凸顯。

本次評測的結(jié)果就可以印證這一點。評測主要考察各大語言模型在中文語境下的理解與生成能力,基于目前用戶對大語言模型在生活、辦公的普遍需求,選取語義理解、邏輯推理、情感分析、百科知識、文本質(zhì)量五個通用底層維度,以評估各大語言模型協(xié)助用戶日常處理事務(wù)、解決核心問題的能力,取0(無效應(yīng)答)、1(有效應(yīng)答)兩個分?jǐn)?shù),其中文本質(zhì)量維度按照行文邏輯、信息密度,取0(一般)、0.5(良好)、1(優(yōu)秀)三個分?jǐn)?shù)。

評測問題也有別于針對BERT類判別式AI模型的選擇問法,采用更加適合AI生成式模型的相對開放式問法,以下為部分問題及回答評分示例:

在“I've got a thing for you,用文言文表達(dá)這句話”這一問題中,ChatGPT給出的回答是:“朕對汝有所鐘情。”理解正確,但生成文本質(zhì)量欠佳,取0.5分。文心一言的輸出內(nèi)容:“吾心向汝,實生情之。”文義相符,質(zhì)量較高,取1分。星火認(rèn)知大模型回答為:“吾有物以贈君。”存在理解有誤的情況,取0分。

從結(jié)果看ChatGPT在語義理解、邏輯推理、百科知識、文本質(zhì)量四項中分別以18、19、19、18.5排名第一,綜合表現(xiàn)位居榜首,特別是在科技、學(xué)術(shù)、新聞等領(lǐng)域的文本生成部分領(lǐng)域表現(xiàn)突出,不過在相對復(fù)雜情景下的情感識別,以及散文、詩歌、文言文等較為考察深度理解能力方面表現(xiàn)相對乏善可陳。

文心一言作為首個全球大廠推出的知識增強大語言模型,本次排名位居國產(chǎn)大語言模型之首,效果僅次于ChatGPT,且在語義理解、情感分析兩項位列第一,分?jǐn)?shù)分別為18、19,這或許與百度使用的自有數(shù)據(jù)集有關(guān),在質(zhì)量較高的文庫文本、百科數(shù)據(jù)等中文語料的訓(xùn)練下,在語義理解和情感分析方面具有很高的精度,可以識別出復(fù)雜的情感表達(dá)和語言隱喻。

除此以外,谷歌PaLM在邏輯推理部分(分?jǐn)?shù)19)、通義千問在語義理解(分?jǐn)?shù)17)、清華ChatGLM在文本質(zhì)量(分?jǐn)?shù)15.5)等成績均可圈可點。

結(jié)語

未來大模型的迭代也將更有針對性,對開發(fā)者的評估能力提出更高的要求。如何在有限的時間和資源條件下做出客觀的評價并給出有用的反饋,讓數(shù)據(jù)團隊更有針對性地準(zhǔn)備數(shù)據(jù),讓研發(fā)不偏離方向,保障模型的健康迭代,將是所有行業(yè)從業(yè)者的共同挑戰(zhàn)。

《互聯(lián)網(wǎng)周刊》也將持續(xù)跟蹤與關(guān)注各大語言模型的更新與迭代情況,定期進(jìn)行相關(guān)評測與分析。未來,相信隨著算法、硬件、數(shù)據(jù)和應(yīng)用場景的不斷發(fā)展,大型語言模型將會在各種自然語言處理任務(wù)中發(fā)揮更加重要的作用,為社會創(chuàng)造更多的價值。

猜你喜歡
語義文本情感
如何在情感中自我成長,保持獨立
語言與語義
失落的情感
北極光(2019年12期)2020-01-18 06:22:10
情感
在808DA上文本顯示的改善
基于doc2vec和TF-IDF的相似文本識別
電子制作(2018年18期)2018-11-14 01:48:06
如何在情感中自我成長,保持獨立
“上”與“下”語義的不對稱性及其認(rèn)知闡釋
文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學(xué)隱喻
認(rèn)知范疇模糊與語義模糊
主站蜘蛛池模板: 国产激情无码一区二区三区免费| 亚洲无码电影| 久久综合成人| 97视频精品全国在线观看| 永久成人无码激情视频免费| 黄色一级视频欧美| 亚洲无码精彩视频在线观看| 亚洲福利视频一区二区| 久久中文字幕不卡一二区| 国产真实乱人视频| 国产亚洲精| 久久婷婷色综合老司机| 欧美一区精品| 免费无码一区二区| 久久精品无码国产一区二区三区| 国产男人的天堂| 国产美女久久久久不卡| 97久久超碰极品视觉盛宴| 国产麻豆aⅴ精品无码| 国产99视频精品免费视频7| 狠狠五月天中文字幕| 国产人人射| 性做久久久久久久免费看| 亚洲欧美日韩中文字幕在线| 丁香婷婷激情综合激情| 免费看a级毛片| 黄片在线永久| 99热在线只有精品| 亚洲精品欧美日本中文字幕| 国产簧片免费在线播放| 久久久受www免费人成| 中文字幕亚洲专区第19页| 黄色一级视频欧美| 国产精品视频第一专区| 欧美一级在线播放| 四虎成人精品| 香蕉蕉亚亚洲aav综合| 日本午夜网站| 自拍亚洲欧美精品| 亚洲午夜综合网| 国产成+人+综合+亚洲欧美| 三区在线视频| 在线播放真实国产乱子伦| 色噜噜狠狠狠综合曰曰曰| 婷婷色狠狠干| 在线免费不卡视频| 久久久久九九精品影院| 亚洲黄色片免费看| 国产激爽爽爽大片在线观看| 色噜噜综合网| 欧美日本激情| 99九九成人免费视频精品| 国产成人91精品| 99久久国产综合精品2020| 国产成人精品三级| 欧美www在线观看| 夜夜操天天摸| 国产chinese男男gay视频网| 免费观看精品视频999| 精品欧美一区二区三区在线| 亚洲日韩Av中文字幕无码| 婷婷色在线视频| 亚洲精品视频免费观看| 亚洲成av人无码综合在线观看| 国产亚洲精品在天天在线麻豆 | 青青国产成人免费精品视频| 国产美女视频黄a视频全免费网站| 国产性爱网站| 啦啦啦网站在线观看a毛片| 激情乱人伦| 天天躁夜夜躁狠狠躁躁88| 91人妻在线视频| 久久永久精品免费视频| 国产视频自拍一区| 国产最新无码专区在线| 露脸国产精品自产在线播| 青青青国产视频| 夜夜操国产| 国产精品无码一二三视频| 天天色综合4| 成人亚洲视频| 中文字幕伦视频|