
AI幻覺(jué)源于統(tǒng)計(jì)學(xué)上的“隨機(jī)鸚鵡”現(xiàn)象,所有大模型都不可能完全避免,而且推理能力越強(qiáng)的大模型產(chǎn)品,如DeepSeek,越可能出現(xiàn)AI幻覺(jué)。
有媒體報(bào)道,經(jīng)調(diào)查,近日引發(fā)廣泛關(guān)注和討論的“截至2024年末,‘80后’死亡率突破5.2%,相當(dāng)于每20個(gè)‘80后’中就有1人已經(jīng)去世”“‘80后’的死亡率已經(jīng)超過(guò)‘70后’”等消息,與真實(shí)情況不符。類(lèi)似虛假數(shù)據(jù)很可能是與大模型產(chǎn)品對(duì)話的結(jié)果。
大模型產(chǎn)品之所以會(huì)輸出假數(shù)據(jù),是因?yàn)樯墒饺斯ぶ悄埽ˋI)始終存在著“AI幻覺(jué)”問(wèn)題,可能對(duì)事實(shí)性信息進(jìn)行胡編亂造。
從原理上說(shuō),AI幻覺(jué)源于統(tǒng)計(jì)學(xué)上的“隨機(jī)鸚鵡”現(xiàn)象,所有大模型都不可能完全避免,而且推理能力越強(qiáng)的大模型產(chǎn)品,如DeepSeek,越可能出現(xiàn)AI幻覺(jué)。據(jù)報(bào)道,AI行業(yè)權(quán)威的Vectara HHEM人工智能幻覺(jué)測(cè)試顯示,DeepSeek-R1的幻覺(jué)率為14.3%,遠(yuǎn)高于行業(yè)平均水平。
不過(guò),這種現(xiàn)象可以盡力消除,也應(yīng)該盡力消除。如果大模型只用作虛構(gòu)性的娛樂(lè)工具,寫(xiě)寫(xiě)“小作文”、幫助調(diào)節(jié)情緒,出現(xiàn)AI幻覺(jué)似乎問(wèn)題不大。可是,如果將之作為高效勞動(dòng)工具和嚴(yán)肅的信息來(lái)源,AI幻覺(jué)問(wèn)題處理不好就會(huì)存在風(fēng)險(xiǎn),甚至是致命危險(xiǎn)。比如,上述AI虛假信息的傳播導(dǎo)致大范圍的信息混亂,煽動(dòng)了某種社會(huì)負(fù)面情緒的傳播,在一定程度上觸發(fā)了信息安全問(wèn)題。毫不夸張地說(shuō),解決AI幻覺(jué)問(wèn)題事關(guān)信息安全,是生成式AI發(fā)展的基礎(chǔ)性和前提性問(wèn)題,任何一種大模型應(yīng)用都無(wú)法繞過(guò)該問(wèn)題。
當(dāng)然,在處理事實(shí)性問(wèn)題方面,大模型并非一點(diǎn)作用也沒(méi)有。比如,目前使用DeepSeek收集學(xué)術(shù)資料,雖然常會(huì)出現(xiàn)將作者與作品張冠李戴、杜撰子虛烏有的文獻(xiàn)與作者以及胡亂進(jìn)行內(nèi)容描述的情況,但是僅作為資料收集的框架性參考和提示,它還是能發(fā)揮一定輔助作用的。總的來(lái)說(shuō),在目前階段,完全相信DeepSeek提供的數(shù)據(jù)信息,不僅無(wú)法切實(shí)提高工作效率,反而會(huì)導(dǎo)致矛盾、混亂和錯(cuò)誤。
應(yīng)該說(shuō),一個(gè)數(shù)字素養(yǎng)高的人很可能會(huì)避開(kāi)AI虛假信息的“坑”,但當(dāng)前很多人數(shù)字素養(yǎng)不高,容易迷信大模型產(chǎn)品。
2025年春節(jié)以來(lái),DeepSeek由于在中文問(wèn)答方面的優(yōu)異表現(xiàn),受到中文大模型用戶的追捧,同時(shí)帶動(dòng)了其他中文大模型產(chǎn)品,如文小言、豆包、Kimi、騰訊元寶的下載。即便不做專(zhuān)業(yè)技術(shù)測(cè)評(píng),用戶也可以直觀感受到DeepSeek強(qiáng)大的推理能力可能超過(guò)很多忽視邏輯推理能力訓(xùn)練的普通人。此外,DeepSeek令人驚艷之處還有中文表述上的文采,很多人評(píng)價(jià)其“辭藻華麗”“情緒給到位”“人情味很濃”。加上AI創(chuàng)新競(jìng)爭(zhēng)的國(guó)際環(huán)境,DeepSeek幾乎被很多人盲目推崇,不許有任何質(zhì)疑,哪怕是善意的質(zhì)疑。這屬于典型的“AI迷信”現(xiàn)象。

比如,最近網(wǎng)上出現(xiàn)不少用DeepSeek評(píng)價(jià)學(xué)者、著作、論文和某項(xiàng)研究水平的帖子,聲稱它絕對(duì)客觀公正,可以杜絕人情、關(guān)系和權(quán)力等因素的干擾。這些人崇拜AI,大模型至上,將之凌駕于人的判斷之上。事實(shí)上,國(guó)際通行的學(xué)術(shù)評(píng)議方式是同行評(píng)議,也就是由專(zhuān)業(yè)小同行進(jìn)行學(xué)術(shù)評(píng)價(jià)。從根本上說(shuō),大模型產(chǎn)品不理解人類(lèi)作品的含義,只是通過(guò)搜索、學(xué)習(xí)、上下文概率排序和模式識(shí)別等技術(shù)手段生成內(nèi)容,本質(zhì)上是網(wǎng)上信息、數(shù)據(jù)和內(nèi)容的“鏡子”或“平均值”。顯然,網(wǎng)上內(nèi)容大部分不專(zhuān)業(yè)、不精確、不客觀,如此得到的AI生成內(nèi)容(AIGC)怎么可以取代同行評(píng)議呢?因此,完全以幻覺(jué)嚴(yán)重的AI產(chǎn)品作為研究根據(jù),在學(xué)術(shù)上萬(wàn)萬(wàn)不行。
AI幻覺(jué)嚴(yán)重的大模型產(chǎn)品如果接入新聞、自媒體,大量假消息、假信息會(huì)迅速生成。再加上開(kāi)放和便捷的互聯(lián)網(wǎng)傳輸,以及社交媒體的去中心化、反權(quán)威性,肯定會(huì)大大加劇后真相時(shí)代AI虛假信息泛濫。

此外,網(wǎng)上泛濫的虛假信息,讓AI幻覺(jué)雪上加霜,因?yàn)锳I根本沒(méi)有真假的概念,更沒(méi)有輸出內(nèi)容與真實(shí)世界必須相符合的要求。
長(zhǎng)久以來(lái),網(wǎng)絡(luò)水軍肆虐,各種謠言、陰謀論層出不窮,到處是“鍵盤(pán)俠”,上來(lái)就站隊(duì)、開(kāi)懟、開(kāi)罵,毫無(wú)根據(jù)地“灌水”,完全沒(méi)有耐心也不想搞清楚真相是什么,“干就完了”。于是,網(wǎng)上的消息不斷反轉(zhuǎn),時(shí)常比肥皂劇的劇情還離譜。現(xiàn)在有了生成式AI工具,開(kāi)啟不拿工資、24小時(shí)不眠不休的AI水軍模式,真相更加難以尋覓。此種狀況,有人總結(jié)為“后真相狀況”,即網(wǎng)絡(luò)世界越來(lái)越?jīng)]有真相,很多人越來(lái)越忽視真相,思考問(wèn)題、處理問(wèn)題、評(píng)價(jià)問(wèn)題越來(lái)越訴諸個(gè)人情緒、成見(jiàn)甚至迷信。
AI幻覺(jué)嚴(yán)重的大模型產(chǎn)品如果接入新聞、自媒體,大量假消息、假信息會(huì)迅速生成。再加上開(kāi)放和便捷的互聯(lián)網(wǎng)傳輸,以及社交媒體的去中心化、反權(quán)威性,肯定會(huì)大大加劇后真相時(shí)代AI虛假信息泛濫。使用大模型輔助生成各種文本的學(xué)生、文員和策劃人員,如果長(zhǎng)期使用AI幻覺(jué)嚴(yán)重的大模型產(chǎn)品,則會(huì)逐漸喪失判斷力,甚至覺(jué)得只要形式精致、表述華麗就可以,是真是假不重要。
當(dāng)事實(shí)性輸出有問(wèn)題時(shí),不管AI工具的推理能力多強(qiáng)大,以錯(cuò)誤事實(shí)為基礎(chǔ)作決策都是非常危險(xiǎn)的。當(dāng)然,不可否認(rèn)會(huì)有“瞎貓碰到死耗子”的情況出現(xiàn),但概率微乎其微,因?yàn)榭茖W(xué)決策以準(zhǔn)確而完善的信息收集為前提。有了決策對(duì)象各方面的信息,才能提出有針對(duì)性的備選方案,決策者才能從中挑選適合國(guó)情、社情的決策方案。因此,最近多見(jiàn)諸新聞報(bào)道的大模型產(chǎn)品用于政務(wù)活動(dòng),首先要認(rèn)真評(píng)估產(chǎn)品的除幻性能才行。
那么,如何防范AI幻覺(jué)可能導(dǎo)致的信息安全問(wèn)題?現(xiàn)階段首要責(zé)任在大模型企業(yè)。首先,它們必須投入人力、財(cái)力、物力壓縮幻覺(jué)率,使之達(dá)到安全閾值。其次,要提高大模型產(chǎn)品使用人員的數(shù)字素養(yǎng),不迷信AI,牢記以AI輔助勞動(dòng)的“輔助”為主,讓AI為人所用,嚴(yán)防AI反客為主。再次,對(duì)于一些專(zhuān)業(yè)領(lǐng)域的大模型運(yùn)用,文本生成精度要有特殊標(biāo)準(zhǔn),接入前要進(jìn)行嚴(yán)格而有針對(duì)性的幻覺(jué)率評(píng)估,切不可操之過(guò)急。最后,從長(zhǎng)遠(yuǎn)來(lái)看,大模型信息安全問(wèn)題值得各方合作進(jìn)行深入而細(xì)致的跨學(xué)科研究,形成系統(tǒng)化防范方案,有步驟、有預(yù)案、有章法地推進(jìn)大模型產(chǎn)品在各行各業(yè)的深度應(yīng)用。