999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

2023AI大語言模型TOP10

2023-07-04 04:56:35米欄
互聯網周刊 2023年11期
關鍵詞:語義文本情感

米欄

時代變革的大幕已掀開一角,一場由OpenAI引領的全球AI大語言模型軍備競賽正式開啟。

3月14日,GPT-4正式發布,大語言模型開始具備圖片和文字同時處理的多模態能力,繼續占據先入為主的優勢。

全球大廠中率先回應的是百度。3月16日,百度大語言模型“文心一言”正式推出,對外啟動邀測。據公開報道,文心一言具備五項核心能力:文學創作、商業文案創作、數理邏輯推算、中文理解和多模態生成。

緊接著其他科技企業也陸續跟進。4月11日,2023阿里云峰會現場演示了通義千問的多項功能,并定向邀請企業用戶進行體驗測試;5月10日,谷歌時隔一年推出了新一代語言大模型PaLM 2,被視為對此前發布會翻車的有力回應。

此外,還有復旦大學在2月21日發布的“MOSS”、清華大學3月28日發布的“ChatGLM-6B”、360于4月10日發布的“360智腦”、商湯科技4月10日發布的“商量”、科大訊飛5月6日發布的“訊飛星火認知大模型”,等等。

截至5月,據不完全統計,國內已有超過40家公司、機構發布了大模型產品或公布了大模型計劃。項目數量井噴式爆發,可預見的是,下半年的國內AI大模型市場競爭將會變得空前激烈。

不止于“大”

提到大模型,很多人的關注點都會放在“大”字上,畢竟足夠量級的參數是語言模型實現智能涌現、形成質變的基礎。比如,不少大語言模型的參數量級達千億級,這也就意味著較為豐富的語言知識與較廣泛的語境理解能力。

不過,目前類GPT模型普遍采用的是Transformer架構,所以必然包含市面上存在的大量文本數據例如小說、教科書、論壇、開源代碼等內容的無監督預訓練過程,在此基礎上,僅需根據具體任務輸入少量的標簽數據進行監督學習。在這樣的模式下,訓練數據集質量的重要性開始愈發凸顯。

本次評測的結果就可以印證這一點。評測主要考察各大語言模型在中文語境下的理解與生成能力,基于目前用戶對大語言模型在生活、辦公的普遍需求,選取語義理解、邏輯推理、情感分析、百科知識、文本質量五個通用底層維度,以評估各大語言模型協助用戶日常處理事務、解決核心問題的能力,取0(無效應答)、1(有效應答)兩個分數,其中文本質量維度按照行文邏輯、信息密度,取0(一般)、0.5(良好)、1(優秀)三個分數。

評測問題也有別于針對BERT類判別式AI模型的選擇問法,采用更加適合AI生成式模型的相對開放式問法,以下為部分問題及回答評分示例:

在“I've got a thing for you,用文言文表達這句話”這一問題中,ChatGPT給出的回答是:“朕對汝有所鐘情?!崩斫庹_,但生成文本質量欠佳,取0.5分。文心一言的輸出內容:“吾心向汝,實生情之。”文義相符,質量較高,取1分。星火認知大模型回答為:“吾有物以贈君。”存在理解有誤的情況,取0分。

從結果看ChatGPT在語義理解、邏輯推理、百科知識、文本質量四項中分別以18、19、19、18.5排名第一,綜合表現位居榜首,特別是在科技、學術、新聞等領域的文本生成部分領域表現突出,不過在相對復雜情景下的情感識別,以及散文、詩歌、文言文等較為考察深度理解能力方面表現相對乏善可陳。

文心一言作為首個全球大廠推出的知識增強大語言模型,本次排名位居國產大語言模型之首,效果僅次于ChatGPT,且在語義理解、情感分析兩項位列第一,分數分別為18、19,這或許與百度使用的自有數據集有關,在質量較高的文庫文本、百科數據等中文語料的訓練下,在語義理解和情感分析方面具有很高的精度,可以識別出復雜的情感表達和語言隱喻。

除此以外,谷歌PaLM在邏輯推理部分(分數19)、通義千問在語義理解(分數17)、清華ChatGLM在文本質量(分數15.5)等成績均可圈可點。

結語

未來大模型的迭代也將更有針對性,對開發者的評估能力提出更高的要求。如何在有限的時間和資源條件下做出客觀的評價并給出有用的反饋,讓數據團隊更有針對性地準備數據,讓研發不偏離方向,保障模型的健康迭代,將是所有行業從業者的共同挑戰。

《互聯網周刊》也將持續跟蹤與關注各大語言模型的更新與迭代情況,定期進行相關評測與分析。未來,相信隨著算法、硬件、數據和應用場景的不斷發展,大型語言模型將會在各種自然語言處理任務中發揮更加重要的作用,為社會創造更多的價值。

猜你喜歡
語義文本情感
如何在情感中自我成長,保持獨立
語言與語義
失落的情感
北極光(2019年12期)2020-01-18 06:22:10
情感
在808DA上文本顯示的改善
基于doc2vec和TF-IDF的相似文本識別
電子制作(2018年18期)2018-11-14 01:48:06
如何在情感中自我成長,保持獨立
“上”與“下”語義的不對稱性及其認知闡釋
現代語文(2016年21期)2016-05-25 13:13:44
文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學隱喻
認知范疇模糊與語義模糊
主站蜘蛛池模板: 国产精品刺激对白在线 | 三级欧美在线| 久久不卡精品| 亚洲精品无码在线播放网站| 欧美高清三区| 国产内射一区亚洲| 扒开粉嫩的小缝隙喷白浆视频| 欧美亚洲欧美区| 欧类av怡春院| 亚洲成a人片在线观看88| 国产精品三区四区| 色呦呦手机在线精品| 特级毛片免费视频| 久久国产精品波多野结衣| 欧美a在线视频| 22sihu国产精品视频影视资讯| 欧美va亚洲va香蕉在线| 国产亚洲视频播放9000| 不卡国产视频第一页| 亚洲一区免费看| 国产99热| 97国产在线播放| 2021国产精品自产拍在线观看| 真人免费一级毛片一区二区| 2022国产91精品久久久久久| 日本成人在线不卡视频| 日韩精品无码不卡无码| 国产精品第一区在线观看| 国产一区亚洲一区| 为你提供最新久久精品久久综合| 精品国产黑色丝袜高跟鞋| 久久一级电影| 国产成人av大片在线播放| 99久久精品国产精品亚洲| 国产精品浪潮Av| 国产99在线观看| 免费高清a毛片| 国产在线观看精品| 国产欧美在线观看一区| 国产精品视频公开费视频| 91福利免费| 黄色网站在线观看无码| 婷婷亚洲最大| 日韩在线欧美在线| 国产视频入口| 亚洲乱码视频| 一本视频精品中文字幕| 国产在线高清一级毛片| 国产情侣一区二区三区| 精品久久综合1区2区3区激情| 国产AV无码专区亚洲A∨毛片| 被公侵犯人妻少妇一区二区三区 | 免费看的一级毛片| 成人日韩精品| 免费一看一级毛片| 亚洲国产清纯| 毛片在线区| 99热国产这里只有精品无卡顿" | 国产一区二区免费播放| 性色生活片在线观看| 欧美性猛交一区二区三区| 精品久久香蕉国产线看观看gif | 国产在线欧美| 色综合久久无码网| 69综合网| 亚洲欧美成人在线视频| 欧美在线精品怡红院| 欧美精品一区在线看| jizz国产视频| av在线无码浏览| 中文字幕精品一区二区三区视频| www.狠狠| 亚洲区欧美区| 日韩午夜伦| 99久久精品免费看国产免费软件| 九色综合伊人久久富二代| 日韩国产黄色网站| 日韩在线影院| a在线观看免费| 波多野吉衣一区二区三区av| 91亚洲精品国产自在现线| a在线观看免费|