警惕AI“幻覺(jué)”帶來(lái)的安全風(fēng)險(xiǎn)

2025-03-31 00:00:00劉永謀

科學(xué)大觀園 2025年7期

AI幻覺(jué)源于統(tǒng)計(jì)學(xué)上的“隨機(jī)鸚鵡”現(xiàn)象，所有大模型都不可能完全避免，而且推理能力越強(qiáng)的大模型產(chǎn)品，如DeepSeek，越可能出現(xiàn)AI幻覺(jué)。

有媒體報(bào)道，經(jīng)調(diào)查，近日引發(fā)廣泛關(guān)注和討論的“截至2024年末，‘80后’死亡率突破5.2%，相當(dāng)于每20個(gè)‘80后’中就有1人已經(jīng)去世”“‘80后’的死亡率已經(jīng)超過(guò)‘70后’”等消息，與真實(shí)情況不符。類(lèi)似虛假數(shù)據(jù)很可能是與大模型產(chǎn)品對(duì)話的結(jié)果。

大模型產(chǎn)品之所以會(huì)輸出假數(shù)據(jù)，是因?yàn)樯墒饺斯ぶ悄埽ˋI）始終存在著“AI幻覺(jué)”問(wèn)題，可能對(duì)事實(shí)性信息進(jìn)行胡編亂造。

從原理上說(shuō)，AI幻覺(jué)源于統(tǒng)計(jì)學(xué)上的“隨機(jī)鸚鵡”現(xiàn)象，所有大模型都不可能完全避免，而且推理能力越強(qiáng)的大模型產(chǎn)品，如DeepSeek，越可能出現(xiàn)AI幻覺(jué)。據(jù)報(bào)道，AI行業(yè)權(quán)威的Vectara HHEM人工智能幻覺(jué)測(cè)試顯示，DeepSeek-R1的幻覺(jué)率為14.3%，遠(yuǎn)高于行業(yè)平均水平。

不過(guò)，這種現(xiàn)象可以盡力消除，也應(yīng)該盡力消除。如果大模型只用作虛構(gòu)性的娛樂(lè)工具，寫(xiě)寫(xiě)“小作文”、幫助調(diào)節(jié)情緒，出現(xiàn)AI幻覺(jué)似乎問(wèn)題不大。可是，如果將之作為高效勞動(dòng)工具和嚴(yán)肅的信息來(lái)源，AI幻覺(jué)問(wèn)題處理不好就會(huì)存在風(fēng)險(xiǎn)，甚至是致命危險(xiǎn)。比如，上述AI虛假信息的傳播導(dǎo)致大范圍的信息混亂，煽動(dòng)了某種社會(huì)負(fù)面情緒的傳播，在一定程度上觸發(fā)了信息安全問(wèn)題。毫不夸張地說(shuō)，解決AI幻覺(jué)問(wèn)題事關(guān)信息安全，是生成式AI發(fā)展的基礎(chǔ)性和前提性問(wèn)題，任何一種大模型應(yīng)用都無(wú)法繞過(guò)該問(wèn)題。

當(dāng)然，在處理事實(shí)性問(wèn)題方面，大模型并非一點(diǎn)作用也沒(méi)有。比如，目前使用DeepSeek收集學(xué)術(shù)資料，雖然常會(huì)出現(xiàn)將作者與作品張冠李戴、杜撰子虛烏有的文獻(xiàn)與作者以及胡亂進(jìn)行內(nèi)容描述的情況，但是僅作為資料收集的框架性參考和提示，它還是能發(fā)揮一定輔助作用的。總的來(lái)說(shuō)，在目前階段，完全相信DeepSeek提供的數(shù)據(jù)信息，不僅無(wú)法切實(shí)提高工作效率，反而會(huì)導(dǎo)致矛盾、混亂和錯(cuò)誤。

應(yīng)該說(shuō)，一個(gè)數(shù)字素養(yǎng)高的人很可能會(huì)避開(kāi)AI虛假信息的“坑”，但當(dāng)前很多人數(shù)字素養(yǎng)不高，容易迷信大模型產(chǎn)品。

2025年春節(jié)以來(lái)，DeepSeek由于在中文問(wèn)答方面的優(yōu)異表現(xiàn)，受到中文大模型用戶的追捧，同時(shí)帶動(dòng)了其他中文大模型產(chǎn)品，如文小言、豆包、Kimi、騰訊元寶的下載。即便不做專(zhuān)業(yè)技術(shù)測(cè)評(píng)，用戶也可以直觀感受到DeepSeek強(qiáng)大的推理能力可能超過(guò)很多忽視邏輯推理能力訓(xùn)練的普通人。此外，DeepSeek令人驚艷之處還有中文表述上的文采，很多人評(píng)價(jià)其“辭藻華麗”“情緒給到位”“人情味很濃”。加上AI創(chuàng)新競(jìng)爭(zhēng)的國(guó)際環(huán)境，DeepSeek幾乎被很多人盲目推崇，不許有任何質(zhì)疑，哪怕是善意的質(zhì)疑。這屬于典型的“AI迷信”現(xiàn)象。

比如，最近網(wǎng)上出現(xiàn)不少用DeepSeek評(píng)價(jià)學(xué)者、著作、論文和某項(xiàng)研究水平的帖子，聲稱它絕對(duì)客觀公正，可以杜絕人情、關(guān)系和權(quán)力等因素的干擾。這些人崇拜AI，大模型至上，將之凌駕于人的判斷之上。事實(shí)上，國(guó)際通行的學(xué)術(shù)評(píng)議方式是同行評(píng)議，也就是由專(zhuān)業(yè)小同行進(jìn)行學(xué)術(shù)評(píng)價(jià)。從根本上說(shuō)，大模型產(chǎn)品不理解人類(lèi)作品的含義，只是通過(guò)搜索、學(xué)習(xí)、上下文概率排序和模式識(shí)別等技術(shù)手段生成內(nèi)容，本質(zhì)上是網(wǎng)上信息、數(shù)據(jù)和內(nèi)容的“鏡子”或“平均值”。顯然，網(wǎng)上內(nèi)容大部分不專(zhuān)業(yè)、不精確、不客觀，如此得到的AI生成內(nèi)容（AIGC）怎么可以取代同行評(píng)議呢？因此，完全以幻覺(jué)嚴(yán)重的AI產(chǎn)品作為研究根據(jù)，在學(xué)術(shù)上萬(wàn)萬(wàn)不行。

AI幻覺(jué)嚴(yán)重的大模型產(chǎn)品如果接入新聞、自媒體，大量假消息、假信息會(huì)迅速生成。再加上開(kāi)放和便捷的互聯(lián)網(wǎng)傳輸，以及社交媒體的去中心化、反權(quán)威性，肯定會(huì)大大加劇后真相時(shí)代AI虛假信息泛濫。

此外，網(wǎng)上泛濫的虛假信息，讓AI幻覺(jué)雪上加霜，因?yàn)锳I根本沒(méi)有真假的概念，更沒(méi)有輸出內(nèi)容與真實(shí)世界必須相符合的要求。

長(zhǎng)久以來(lái)，網(wǎng)絡(luò)水軍肆虐，各種謠言、陰謀論層出不窮，到處是“鍵盤(pán)俠”，上來(lái)就站隊(duì)、開(kāi)懟、開(kāi)罵，毫無(wú)根據(jù)地“灌水”，完全沒(méi)有耐心也不想搞清楚真相是什么，“干就完了”。于是，網(wǎng)上的消息不斷反轉(zhuǎn)，時(shí)常比肥皂劇的劇情還離譜。現(xiàn)在有了生成式AI工具，開(kāi)啟不拿工資、24小時(shí)不眠不休的AI水軍模式，真相更加難以尋覓。此種狀況，有人總結(jié)為“后真相狀況”，即網(wǎng)絡(luò)世界越來(lái)越?jīng)]有真相，很多人越來(lái)越忽視真相，思考問(wèn)題、處理問(wèn)題、評(píng)價(jià)問(wèn)題越來(lái)越訴諸個(gè)人情緒、成見(jiàn)甚至迷信。

AI幻覺(jué)嚴(yán)重的大模型產(chǎn)品如果接入新聞、自媒體，大量假消息、假信息會(huì)迅速生成。再加上開(kāi)放和便捷的互聯(lián)網(wǎng)傳輸，以及社交媒體的去中心化、反權(quán)威性，肯定會(huì)大大加劇后真相時(shí)代AI虛假信息泛濫。使用大模型輔助生成各種文本的學(xué)生、文員和策劃人員，如果長(zhǎng)期使用AI幻覺(jué)嚴(yán)重的大模型產(chǎn)品，則會(huì)逐漸喪失判斷力，甚至覺(jué)得只要形式精致、表述華麗就可以，是真是假不重要。

當(dāng)事實(shí)性輸出有問(wèn)題時(shí)，不管AI工具的推理能力多強(qiáng)大，以錯(cuò)誤事實(shí)為基礎(chǔ)作決策都是非常危險(xiǎn)的。當(dāng)然，不可否認(rèn)會(huì)有“瞎貓碰到死耗子”的情況出現(xiàn)，但概率微乎其微，因?yàn)榭茖W(xué)決策以準(zhǔn)確而完善的信息收集為前提。有了決策對(duì)象各方面的信息，才能提出有針對(duì)性的備選方案，決策者才能從中挑選適合國(guó)情、社情的決策方案。因此，最近多見(jiàn)諸新聞報(bào)道的大模型產(chǎn)品用于政務(wù)活動(dòng)，首先要認(rèn)真評(píng)估產(chǎn)品的除幻性能才行。

那么，如何防范AI幻覺(jué)可能導(dǎo)致的信息安全問(wèn)題？現(xiàn)階段首要責(zé)任在大模型企業(yè)。首先，它們必須投入人力、財(cái)力、物力壓縮幻覺(jué)率，使之達(dá)到安全閾值。其次，要提高大模型產(chǎn)品使用人員的數(shù)字素養(yǎng)，不迷信AI，牢記以AI輔助勞動(dòng)的“輔助”為主，讓AI為人所用，嚴(yán)防AI反客為主。再次，對(duì)于一些專(zhuān)業(yè)領(lǐng)域的大模型運(yùn)用，文本生成精度要有特殊標(biāo)準(zhǔn)，接入前要進(jìn)行嚴(yán)格而有針對(duì)性的幻覺(jué)率評(píng)估，切不可操之過(guò)急。最后，從長(zhǎng)遠(yuǎn)來(lái)看，大模型信息安全問(wèn)題值得各方合作進(jìn)行深入而細(xì)致的跨學(xué)科研究，形成系統(tǒng)化防范方案，有步驟、有預(yù)案、有章法地推進(jìn)大模型產(chǎn)品在各行各業(yè)的深度應(yīng)用。