999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

ChatGPT能否讀心:證實或證偽?

2025-06-09 00:00:00胡婉蕾
宜賓學院學報 2025年4期
關鍵詞:人類理論語言

自2017年谷歌團隊在《注意力即為你所需的一切》(Attention IsAllYou Need)一文中提出用“Transformer\"取代卷積神經網絡(CNN)和循環神經網絡(RNN)兩種深度學習模型后,再次將人工智能在自然語言處理(NLP)領域推向高潮。Ope-nAI公司于2018年開發第一代基于該架構的自然語言處理模型一 一ChatGPT,經過5年的不斷訓練與優化后已經更新至第四代版本,該模型不僅可以完成諸多理性任務,自動生成更加流暢、高質量的自然語言文本,如對話、文章、新聞報道等,甚至可以解決 100 % 的“意外遷移任務”和 90 % 的\"錯誤信念任務”。正如斯坦福大學計算心理學家米哈爾·科辛斯基(MichalKosinski)所言:“這將預示著人工智能發展的一個分水嶺:推斷他人心理狀態的能力將極大地提高人工智能與人類(以及彼此)互動和交流的能力,并使其能夠發展其他依賴心智理論的能力,如共情、道德判斷或自我意識。\"①ChatGPT能否在感性方面恢復人類思維和AI之間的隱喻聯系,即是否擁有讀心能力,成為討論的熱點,并掀起了爭論。

一、ChatGPT讀心之爭

“ChatGPT”作為一個自回歸的大語言模型,相較于一般的生成式AI而言,它更具交互性和智能性。該模型已經具備了強大的自然語言處理能力,當研發人員進一步探討其是否具備感性能力時,在“ChatGPT能否讀心\"這一問題上引發了爭論。

(一)ChatGPT能讀心

ChatGPT在一些場景下能夠產生類似于人類反應的響應,對他人心理活動進行預測,甚至能與人進行高效溝通。研發人員通過對比ChatGPT的不同版本后發現,隨著模型不斷提升自身的復雜度,它解決與心理有關的問題的能力也在不斷提高。據此,他們認為該模型具備“讀心\"的能力。

美國得克薩斯大學奧斯汀分校的研發人員在《自然神經科學》(NatureNeuroscience)期刊發表了《從非侵入性大腦記錄中重建連續語言的語義》(Semantic reconstruction of continuous language fromnon-invasivebrainrecordings)一文,聲稱他們研發出一種名為無創解碼器的人工智能系統,該系統部分依賴于LLM(LargeLanguageModels),而這正是ChatGPT運行的基礎。研發人員讓被試躺在功能性磁共振(fMRI)機器中,在接受掃描的同時從耳機中聽取播客(Podcast)故事。他們將被試的fMRI數據所顯示的大腦活動與播客故事里的語言特征聯系起來,通過記錄這種皮層語義表征來重建連續語言,使得被試可以理解單詞序列、感知中的或想象中的語音甚至是無聲視頻的含義。實驗結果顯示,這一系統雖然達不到 100 % 的準確度,但是它能夠讀出被試大腦中的故事大意。這種語義解碼器證明了非侵入型腦機接口的可行性,為ChatGPT等語言模型提供了可以讀心的有力證據。

摩根大通公司約瑟夫·勒普頓(Joseph Lup-ton)等經濟學家在ChatGPT的基礎上推出解碼央行鷹鴿的Robo-Fedwatchers模型。該模型通過回溯和學習美聯儲過往25年央行官員在宣布政策或講話時的表情與音調,旨在揣摩并破譯美聯儲官員釋放的潛在交易信號,最后根據所謂的\"鷹鴿評分\"(Hawk-DoveScore),對政策信號進行從寬松到緊縮的評級分類,高效預測利率政策出現變化的時間點。“鷹鴿評分”最初作為一種進化的穩定策略,“是一種程序預先編制好的行為方式。\"2188通過對老鷹與鴿子搏斗結果進行賦分,使二者在比例上產生明顯的差別,從而保持進化的穩定性。當官員在兩次政策會議之間講話的鷹派基調突然上升時,Robo-Fedwatchers模型預測下一次政策聲明會變得更加鷹派,便于相關人員實施下一步計劃。經濟學家將該模型指數與一系列資產表現進行對比后發現,其預測結果極具準確性,且使得美聯儲等歐美主要央行的貨幣政策聲明變得更為通俗易懂,這種轉變也將有助于AI在這一領域中對大數據剖析時的應用。以色列心理生物學研究中心的佐哈(ZoharElyoseph)及其團隊利用情緒意識水平量表(LEAS)來作為一個客觀的、基于表現的測試并分析ChatGPT對20種情景的反應,在兩次測試中將其情感意識(Emo-tionalAwareness,EA)表現與一般人群的表現進行比較。在第一次測試中,ChatGPT在所有LEAS表上的表現明顯高于一般人群(Z得分 = 2 . 8 4 )。在第二次測試中,ChatGPT的成績顯著提高,幾乎達到了LEAS的最高分數(Z分數 = 4 . 2 6 ),其準確率水平也極高(9.7/10)3。可見,ChatGPT等AI系統在轉換講話內容及其隱含的情緒的\"讀心\"能力上,邁出了重要的一步。

斯坦福大學計算心理學家米哈爾·科辛斯基及其團隊在ArXiv平臺提交了一篇名為《心智理論可能自發地出現在大型語言模型中》(TheoryofMind May Have Spontaneously Emerged in LargeLanguageModels)的預印本論文,他們發現Chat-GPT能夠完成經典ToM(TheoryofMind,ToM)任務,并針對這一情況推測ChatGPT能讀心。ToM是一種能將心理狀態歸因于自己或他人,并據此來預測和解釋人類行為的能力。該團隊通過Smarties(意外內容)任務和Sally-Anne(意外遷移)任務來訓練ChatGPT的多個版本后得出結論:隨著ChatGPT版本的不斷更新,其完成任務的能力越強,ChatGPT-4甚至可以解決 100 % 的Sally-Anne任務和 90 % 的Smarties任務,在心智理論方面甚至可以和9歲的兒童比肩。事實上,這種心智理論問題在2018年DeepMind的計算神經學家尼爾·拉賓諾維茨(NeilRabinowit)那里就初次顯現了,尼爾和同事設計了神經網絡模型ToM-net,使其成功通過了一個類似“Sally-Anne\"的測試,認為通過深度學習的方法可能足以讓AI具有心理能力。德國埃爾福特國際應用科技大學的克里斯·蒂娜(KristinaSchaaff)等人就“共情能力\"對ChatGPT做出測試,結果表明在 9 1 . 7 % 的情況下,ChatGPT能夠正確識別情緒并產生適當的答案。在對話中,ChatGPT在 7 0 . 7 % 的情況下會產生類似的情緒反應。4這意味著ChatGPT模型已經達到了相應的條件,符合“讀心”能力的部分要求。

通過上述模型的實驗結果可以看出,ChatGPT已經在很大程度上將計算機語言轉換為人能理解的自然語言,甚至是能夠作為實現人與人工智能高效交互的橋梁的心理語言。當ChatGPT能夠生成類似于人的心理語言時,就能認為該模型擁有了“讀心”的本領,但當進一步深究其內在的運行機制后,又引發了新推測,即ChatGPT不能讀心。

(二)ChatGPT不能讀心

ChatGPT在某些實驗結果中顯得可以完成部分與心理有關的任務,但究其根本,在進行更深入的實驗和分析后,認為這種模型只是在\"Trans-former\"這一架構的基礎上,形成一種\"大數據 + 大模型\"的大規模生成型預訓練范式轉變[5],目的在于通過AI\"深度學習\"后,生成人類可理解的自然語言。但這種生成是計算生成而不是智能生成,不能做到真正意義上的讀心。

本德爾(Bender,E.M)等人指出,像ChatGPT這類的生成式AI,就像是隨機鸚鵡,它們只是在不理解任何東西的情況下,依賴LLM模型來重復文本。ChatGPT只是基于自身的Transformer架構來深度學習,憑借其自注意力機制來進行機械的重復,實際上并不理解內容及其意義。通過編碼器(Encoders)解碼器(Decoders)、前饋網絡(FNN)和自注意力機制(SA)四個部分來構成預訓練模型,在運行過程中,首先要接受大量的自然語言文本數據,采用一組預訓練的參數來學習文本數據的統計分布;其次再從這些數據中學習語言的結構和規則;最后根據已學到的知識和概率來對識別到的輸入語言生成響應。該語言模型最大的特點是對詞語序列的概率相關性進行建模,即根據輸入的語句來預測接下來不同語句出現的概率分布,塞爾(Searle,J.R)提出“中文屋(Chineseroom)\"的思想實驗,即假設不懂中文的塞爾被關在一間房子里,房間內有一本可以解決中文問題的英語書,當塞爾接收從門外遞進來的中文紙條后,他能夠利用那本英語書來向門外遞出中文答案。經過長期訓練,門外的人很難從塞爾的答案中看出他不懂中文。但塞爾認為這個類似于計算程序的“塞爾”并不具備真正的智能,因為“沒有一個程序憑借自身而對于意向性來說是充分的\"8],人類智能的本質在于頭腦中的意向性,通俗來講就是理解現實世界的能力,而程序只是根據在純形式句法上進行的計算操作來定義的,就算Chat-GPT等AI能夠完成一些智能任務,也只是從計算主義的角度來簡單重復學習的結果,并不是從意向性出發來表達認知,“讀心”也就更無從談起。

哈佛大學心理學系教授托默·厄爾曼(TomerUllman)等人就科辛斯基在ToM上的發現提出質疑,認為ChatGPT等LLM模型并不滿足ToM。厄爾曼在不違反心智理論基本原則的前提下,以GPT-3.5的ToM結果為閾值,向該大語言模型提出相對復雜的變體問題,利用經過修改的ToM任務來測試GPT-3.5,找出了“物體可見性陳述”、“放置在物體上的無信息標簽\"或“是由可信的人給出的信息\"等在測試中失敗的微妙條件②。厄爾曼指出,當這些微妙條件不能被合理參考時,GPT-3.5在分層或信息整合方面就存在疏忽或不連貫的問題。正如他陳述的那樣:“雖然像GPT-3.5這樣的LLM現在會對基本的ToM小插曲作出合理的反應,但保持ToM原理不變的簡單擾動會顛覆它們的答案。”③比較心理學奠基人勞埃德·摩根(C.LloydMorgan)對動物心理進程的理解也可以為這種觀點提供一些新的思路。他認為,如果一種動物的行為可以通過低級別的心理進程來解釋,那么就不應該將其解釋為更高級別的心理進程。0]動物完成“心智理論\"實驗其實是一種通過機械的條件反射過程,而非推斷其他客體的內心狀態;且動物或許是根據研發人員的非語言信號進行推斷,而非使用了“讀心術”。同理,面對ToM任務的實驗結果,我們仍然無法斷定究竟是ChatGPT深度學習了“真實存在的規則\"才正確回答了問題,還是真的能“了解他人的想法”。而佐哈等人也提出,考慮到ChatGPT在與患者直接對話的背景下的相關性,盡管我們的研究結果表明,ChatGPT可以“理解\"對方的情緒狀態,但尚不清楚人類患者是否會因其答案而感到\"被理解”,以及知道他們正在與AI聊天機器人而不是人類治療師交談是否會影響患者的可理解感。3但無論如何,目前ChatGPT也只能完成相對簡單的ToM任務,而不能和人類一樣,擁有解決多元復雜問題的心智能力。

山西大學尤洋教授認為,ChatGPT是將因果性識別為相關性,再對人類的因果推理能力進行模擬,這種模擬只是在計算語言的生成中實現了與人類智能相關的表現,并非在因果上擁有智能。這種相關性的表現,從計算主義進路來看,ChatGPT把心理狀態、活動和過程進行符號式處理后形成計算機語言與數據,通過計算來得到“認知”;從聯結主義進路來看,“實現機器智能的最快途徑是解決大腦的工作原理\"2,ChatGPT通過建模的方式,將算法、算力抽象為神經元,通過構建神經元網絡結構來展現智能。但無論是哪種方式,都只能說明相關性的架構僅僅提供了一種邏輯上的工具,而不能解決丹尼特所說的人類智能生成的難題。人工智能在實際應用中可能遇到的難題是“框架問題”,一個系統為了達到其目的,必須考慮與之相關的無數個可能的因素,但人類是為了達成目的而采取行動,并不是為了解決相關性的“框架問題”。也就是說,盡管在ChatGPT那里,計算主義和聯結主義作為邁向強人工智能的必要路徑,已經為該模型提供了相關的內容,但二者仍沒有制造出“懂因果推理”的智能體,甚至這種相關性因素還會使得ChatGPT有時會提供虛幻的反應,在基于知識的交互中更容易識別不正確的答案,而情感感知的反應本質上是主觀的,因此確定其正確性具有挑戰性,因此,ChatGPT仍無法擁有和人相同的讀心能力。

可見,隨著探究的深人,Transformer架構、變體ToM任務、因果性等又為“ChatGPT不能讀心”這一假設提供了例證和推斷。但考慮到LLM自身的進展速度,這些模型在未來的迭代中很可能會通過更多的心智理論模型的測試。這一令人不安的趨勢促使我們不斷地去驗證其本質上是否擁有讀心能力,因為這種AI所展現出的種種類似人類的感知與思維功能,反過來也能提供一種幫助人類認識自我的可能性。

二、ChatGPT讀心的可證實性

從可證實性原則出發,倘若“ChatGPT能讀心\"這一假設能夠經得起經驗證實、實驗檢驗和或然性推論等方式的驗證,即該假設被提出后,能夠允許被實際數據或實驗結果支持,那么就能夠說明該假設成立。

(一)ChatGPT讀心的經驗證實

相較于其他的大規模語言模型,ChatGPT使用了多輪對話數據來進行指令微調,這使其擁有了建模對話的能力,能持續和用戶交互,輸出更符合人類預期的結果。這種通過大量指令激發的泛化能力在零樣本和少樣本場景下具有顯著優勢,在未見過的任務上也可以有所表現。但正如石里克所言:“一個命題的意義,就是證實它的方法。\"[13]400一個命題或理論只有在經驗中找到根據,才能稱作是有意義的、科學的命題。這意味著,只有ChatGPT能夠符合人們在經驗中認為可以“讀心\"的條件,才能說明該模型能讀心的命題經過經驗證實后具有科學意義。

在科辛斯基及其團隊的ToM任務中,隨著ChatGPT版本的不斷更新,該模型在經典的Sally-Anne任務和Smarties任務中的完成率越來越高,在心智理論方面顯示出來的能力和9歲兒童相近,甚至可以完成各種高難度變體的ToM任務而實現\"偽裝\"14]。團隊選擇ToM來作為測試的方法,是因為該理論在經驗中被視作一個人擁有自我意識和道德,在社會中與他人互動溝通、共情的核心,這種能力將心理狀態歸因于自己或他人,并據此來預測和解釋人類行為,符合人類通過環境和語境來推測他人的心理狀態和思維信念的經驗。因此,ToM實驗的結論認為該任務可以間接地幫助我們判斷某機制能否理解并預測他人目標和行為,即可判斷該模型是否擁有讀心的能力。

這種間接證實的方法,使命題先得到一時的、不完全的證實,通過不斷提高其“驗證度\"來對其證實。只要GPT-4能夠解決 9 5 % 的Smarties任務和Sally-Anne任務,我們就有理由認為目前的ChatGPT在某方面上是擁有讀心能力的,只要不斷地進行相關測試,就可以得到更進一步的答案。此時不必探究與這種事實有關的因果,只需要檢驗在各種變體條件下ChatGPT是不是在實驗中都取得了越來越高的正確率,就可以推斷“ChatGPT能讀心”是個不斷得到證實的命題。在ToM任務上對其進行概率上的假設,一旦ChatGPT在該任務上的正確率越來越高時,就會越來越符合人們經驗中對“可讀心\"的認識,在概率上不斷地增加對“ChatGPT可讀心”的支持度。

(二)ChatCPT讀心的實驗檢驗

在驗證“ChatGPT能讀心”這一命題時,采用近代經驗科學的方法一一實驗檢驗。通過大量實驗來對該命題進行驗證,試圖讓ChatGPT及其背后的大語言模型機制達到“讀心”條件,并展示出類似于人類的“心智”特征。

ChatGPT在無創解碼器的人工智能系統實驗中,扮演了高效模擬人類讀心過程和簡化預測工作的角色。為了研究語言是如何在整個大腦中表現出來的,需要以大量的單詞序列為載體,將編碼模型和人腦的實際情況進行對比。該編碼模型要預測受試者的大腦對自然語言中的短語的反應,但絕大多數的單詞序列不像自然語言那樣連貫流暢,使用ChatGPT這種生成式神經網絡語言模型可以預測接下來可能出現的單詞,使整個故事更加豐富立體。實驗結果顯示,當被試聽了16個小時的自然口語敘事故事后所產生的數據與經過預訓練的ChatGPT二者之間的相似度雖然達不到100 % ,但ChatGPT已經能夠讀出被試大腦中的故事大意,說明該模型在很大程度上能夠還原被試的心理過程。

人類在擁有讀心能力后可以將自己或他人的內心活動記錄下來,根據綜合環境來推測他人的情感,并不斷地調整自己的反應。對于ChatGPT而言,目前它已經可以通過數據成功地將一個人在聽故事或默默想象講述故事時的大腦活動翻譯成連續的文本流,只要在后續實驗中,我們能夠不斷地提高該模型與人類的fMRI數據的匹配度,或是找到更確切的讀心表現,都能夠從某些方面證明ChatGPT的實驗結果,能被服從于我們語法規則的語句描述出來而體現出一種在邏輯上的讀心的可能性。

(三)ChatGPT讀心的或然性推論

“ChatGPT能讀心”這一命題也可以從或然性推論這里進行證實。每個證實的實驗結果都是一個確定的真前提,但最終“ChatGPT能讀心”只是作為一種可能的結論而存在,并不一定為真。或然性結論作為概率假定,是通過歸納各種實驗結果,來得到一種“預言性的陳述”。

這種能讀心的假定通過實驗結果的概率來顯現,一個事件的概率度愈高,那么它成為真的可能性就愈大。無論是在所有LEAS表上的得分、ToM任務的完成度,還是在“共情能力”的測試中,ChatGPT都在不斷提高其正確率,這種“能讀心”的概率也隨之增加。這種概率還能體現“Chat-GPT能讀心\"這個假定的價值,即在\"ChatGPT能讀心”和\"ChatGPT不能讀心\"的爭論之間,通過歸納相關實驗,我們更傾向于選擇前者,因為前者成為真的可能性更大。當我們不斷地提高解碼器的靈敏度、將情緒進行多元化綜合解讀、找到更貼合人類心理狀態的模型理論時,此時“ChatGPT能讀心”未必真,但我們再觀察下一個實驗結果,能讀心的可能性就比不能讀心的可能性大。這種或然性的結論可以使得我們對該命題進行思考和聯想,在進一步引發各種可能的過程中,通過不斷地積累實驗信息來基本把握命題的發展趨勢,更接近最終的正確答案。

或然性歸納只要求我們觀察所有的實驗結果,將其壓縮到最小的標準量,如腦信號復現程度、概率大小等,并和人類智能的表征相比較即可。當這個最小標準量可以體現出人類智能時,就可以把這些經驗的事實歸納為一個或然性結論,即“ChatGPT能讀心\"可能為真。

三、ChatGPT讀心的可證偽性

作為驗證“ChatGPT能讀心”的第二條路徑,可證偽性原則要求該假設能夠被經驗或實驗設計所反駁,也就是說,“ChatGPT能否讀心”不是通過證明某種理論永遠正確來驗證,而是通過反復檢驗和尋找證據,從理論證偽、演繹推理和概率生成等方式來發現其潛在的錯誤。

(一)ChatGPT讀心的理論證偽

ChatGPT也許在實驗中擁有了一些類人的表征,但經驗的數次驗證都始終無法徹底說明Chat-GPT這一模型已經能完全模擬人類的心理過程,也就無法證實它已經全然掌握了讀心的本領。在面對實驗結果時,如何從理論上就模型本身對語料的偽裝進行突破,真正識別人類的讀心內核,仍是努力的方向。

波普爾曾舉了“凡是天鵝都是白的”這一命題作為例子來說明理論證偽的重要性,我們無法找到所有天鵝來驗證,可證實性就不能作為一種判斷依據;相反,可證偽性才是科學命題的判據,因為一旦我們發現一只黑天鵝的存在,就可以否證它。同理,無論復刻腦信號、ToM任務、情緒識別等實驗如何顯示ChatGPT的表現與人類似,我們始終不能窮盡所有實驗來證實命題。但是我們卻找到了諸多能夠否證\"ChatGPT能讀心”的論據,如厄爾曼對ToM任務進行微妙改動后,在添加了關于交際意圖存在的線索、詢問了關于角色意圖的特定問題、涉及物體可見性等物理屬性或更復雜推論的項目上,ChatGPT在面對16個變式問題時,它僅僅答對了其中一個。這表明,或許ChatGPT在經典的Smarties任務和Sally-Anne任務中可以展現出類似心智理論的語言能力,但當它面對其他變體任務時,似乎又不具備這種語言能力。

目前的實驗讓我們無法確定“ChatGPT能讀心\"這一命題的真假,因為人類心智是一個涵蓋內容極多、普遍性極強的理論,隨著信息量的增加,“讀心能力”所表述的經驗內容越是普遍和精確,其可證偽度就越高,否證的論據就越多,ChatGPT能讀心的可證偽性就越大。事實上,該模型只是憑借其自身的Transformer架構,恰好能夠解碼某種包含在我們語言中的心智理論編碼模式,只是通過預先設計好的算法來對于人類語言知識進行模擬而已,并不是真正的能讀心。就連科辛斯基也指出:“ChatGPT可能不是在理解心智理論的情況下解決了該任務,而只是發現和利用了一些未知的語言模式。”①

(二)ChatGPT讀心的演繹推理

“ChatGPT能讀心\"這一命題可以通過演繹推理來證明。這種演繹推理所采用的根本方法為試錯法,波普爾將其整理為科學的發展模式,即P1-TT-EE-P2。在ChatGPT的證偽實驗中,能否讀心開始于第一個問題,即該模型生成的結果為什么能復現腦信號、分析情緒暗號、完成ToM任務?為了解決這個問題,我們繼而提出試探性理論,即“ChatGPT是否因具有人類智能而擁有讀心的本領\"這一假設與猜想,進而通過演繹分析其內在機制與運行原理,在邏輯上指出這種Transformer架構的計算結果并不是人類智能生成,不符合“讀心\"的經驗事實,排除了該模型可以讀心的這一錯誤。但隨之而來的思考是,為什么Transformer的架構可以模擬人的神經網絡結構?算法及算力如何才能更具可解釋性?人類智能的終極定義和理論究竟是什么?這些新的問題作為新問題而出現,使得波普爾的科學發展的動態模式重新運行并周而復始,“ChatGPT能否讀心”這一爭論及其相關的知識將在這個永無止境的循環中逐步增長。

通過演繹的方法,在推理ChatGPT及其實驗結果的全過程后發現,根據Transformer架構來建模的ChatGPT,只是將海量數據編碼為大語言模型可深度學習的計算機語言,通過自注意力機制來預訓練模型,當ChatGPT識別到輸入的語言后會立馬根據已學到的知識和概率來生成響應。而其生成結果之所以顯得與人類似,只是計算的結果的呈現,這種呈現在當下并不能直接說明Chat-GPT具備讀心能力,相反,我們能從呈現的結果中找到諸多反面例證,說明ChatGPT不能讀心。

(三)ChatGPT讀心的概率生成

ChatGPT的運行機制揭示,ChatGPT根據預訓練數據來進行深度學習,所生成的結果事實上只是一種概率大小的問題,即這種計算“生成\"非人類的智能生成,看似能讀心的結論只是一種數理邏輯上概率的大小,并非真正擁有讀心能力。這種概率生成體現在以下三個方面。

其一,就其生成概率的因果效應而言,可以從概率改變的角度來定義因果關系。15如果事件B先于事件A發生,B發生的概率大于0,并且B的發生提高了A發生的概率,那么就可以初步認定B是A的原因。正如本德爾所言,我們應該注意到,ChatGPT就像隨機鸚鵡,所有能“讀心\"的實驗證據只能作為一種被我們觀察到的現象,這種派生的結果表明,模型本身什么也不懂,其生成的原因本質是它自身的運行機制與原理。在Trans-former這種自注意力機制的神經網絡結構下,ChatGPT只是根據算法和算力來進行概率上的統計。這種不是人類智能的概率生成作為“因”,不能得出該模型已具備人類心智的“果”。

其二,就其預訓練的規模而言,可以從概率推導出的結論來分析生成原因。科辛斯基教授和厄爾曼用于測試ChatGPT的Smarties任務和 Sally-Anne任務的結果不同,原因可能在于前者所采用的測試都是取自經典的實驗,ChatGPT作為一個深度學習海量數據的大語言模型,在訓練的過程中已經多次閱讀過相關論文和實驗,并將其結果全部納入自身獨特的編碼語言模型中,再轉化為相應的知識儲備。一旦對其進行改動,要求Chat-GPT去回應沒有接受預訓練的知識時,它就不能完成任務。觀察從同一理論衍生出的兩種不同的實驗結果時,我們必須把握概率在深度學習機制中的作用,才能正確看待ChatGPT的生成結果。

其三,就理論的真實度而言,可以從概率之間的數量關系來驗證推理過程。根據波普爾的觀點,只能通過不斷地猜測來逼近真理。“我們的目標是通過批判以找到愈來愈接近真理的理論\"[16]231。理論一旦被經驗證實過,其內容就具有真實性;但理論是一種猜測,具有虛假性。一個理論的逼真度(VS)等于其真實性內容的量(ST)與虛假性內容的量(SF)之差。也就是說,“ChatGPT能讀心”這一理論的逼真度,取決于證明能讀心的實驗結果與證明不能讀心的實驗結果,并且當二者在量上的差異足夠大時,才能在數學概率上說明這一理論是無限逼近真理,即該模型能讀心這一命題的發展過程就是不斷提高逼真度與概率的過程。

ChatGPT的生成結果看似具備“讀心”的能力,但深究其自身的因果效應、預訓練的規模和理論的真實度后發現,概率在其中扮演著計算傾向的角色,無法說明該模型已經擁有“讀心”的本質屬性。

四、ChatGPT讀心的證實與證偽

無論采取實證主義的“或然性”歸納證實,還是證偽主義的“概率性\"演繹證偽的方法,都無法徹底驗證“ChatGPT能否讀心”這一假設,也就無法回應與之相關的爭論,因為二者都存在自身的缺陷和不足,均不能作為可靠的路徑。

(一)或然性的間接證實是不可靠的

“ChatGPT能讀心”是一個待證實的命題,“ToM任務可以表達一定的讀心能力”是關于心智理論的定理,而“ChatGPT能完成ToM任務”是可以用實驗來直接驗證的事實,因此用間接證實的方法得出“ChatGPT能讀心”這一命題。但卡爾納普指出,這種間接證實是或然性的,也就是說,“ChatGPT能讀心”一旦被證實,就是一個普遍性理論,“ToM任務的完成”只能表達讀心能力的某一方面,而讀心能力的屬性是無限的、全面的。因此,這種或然性歸納方法在兩個方面看來都是不可靠的。

一方面,或然性不是必然性,無法得出與本質屬性有關的結論。在必然性推理中,前提的意義包含了結論的意義,當前提真時則結論一定為真;

而或然推理結論的意義有超出前提的意義的部分,即使前提真,結論也有可能是假的。相較于過往基于小數據的AI而言,ChatGPT是被大數據所預訓練的語言模型,得出的結論比以往更具正確性。相關的實驗數據作為這種歸納前提的證據,都是由有限數目的單稱陳述組成的,只能說經驗證據每增加一個,對結論中的科學定律和理論原理的支持程度就有所提高。但作為或然性的結論,“ChatGPT能讀心”這一全稱陳述,它是無限數據斷定的研究對象,也就是說,數據只能增加自身的概率,而與命題本身的性質無關。各數據對結論的支撐作用是等價的,但其支持程度并不是等價的,大數據能在一定程度上降低結論的或然性,提高相關因素之間的緊密聯系,在過程中越來越具有必然的傾向,但始終不是因果必然性,在其本質上仍然只是一種不可靠的或然結論。

另一方面,或然性是相關性推理而不是因果性推理,不能作為可靠的證實方法。相關性是事件A和事件B相互影響的程度,二者間沒有先后順序,而因果性有明確的先后順序,是事件A的發生導致事件B的發生。歸納法使得人們更關注現象間的相關性,如在ToM任務中,我們只需要知道ChatGPT是如何展現出心智理論的,而不需要深究是什么原因導致其能夠完成心智理論的任務。但模型能夠讀心的屬性是事物本質性的因果意向存在,通過歸納實驗結果而得到的或然性結論不是構成意義上的因果性結論,這種僅僅將知識的獲取建立在觀察的堆砌之上的方法,是無法獲知ChatGPT究竟能否讀心。這意味著這種或然性歸納,只能對“ChatGPT能讀心\"這一命題進行不斷地關聯確證,而不能在因果上徹底證實。

正是因為或然性與必然性不同,無法在因果層面上得出事物的本質屬性,所以它才不能作為科學命題的證實方法。顯然,或然性結論不能得到可靠的科學理論,其局限性使得它只能作為一種可能的路徑而存在,并不能證實\"ChatGPT能讀心”。

(二)概率性的演繹推理也是不可靠的

在與“ChatGPT能讀心\"有關的實驗中,通過對該模型生成概率的論證,我們發現Transformer架構、因果性原理等更本質的因素,可以在讀心能力上對其進行證偽。但就ChatGPT而言,作為一種大數據預訓練模型,這種概率性演繹無法避免機器學習所帶來的不足、誤導甚至偏見。因此,該模型仍在以下兩個維度中存在局限性,同樣是不可靠的。

其一,這種概率生成的演繹推理忽略了觀察本身的可錯性和實際檢驗情況的復雜性。理論證偽本質上與經驗證實一樣,都是從單稱陳述的真實性過渡到全稱陳述的真實性。當觀察和實驗所提供的單一命題證據與某個理論的陳述相沖突時,證偽過程便開始了,在這個過程中我們常用單一命題的真實性去反駁某理論的陳述。如厄爾曼的實驗中,當GPT-3.5無法高效完成變體任務時,就認為該模型不具備心智理論,而忽略了之前的所有實驗結果。但縱觀整個科學發展史,有時理論的陳述是正確的,錯誤的是我們用之證偽的那個觀察或實驗。也就是說,ToM任務本身不能作為具有讀心能力的理論,既不能用它來證實,也不能用它來證偽,即使可以用該任務來證偽,這種在概率上僅僅依靠否證的單稱陳述的積累,同樣是一種簡單化和零碎化的方法,無法徹底說明Chat-GPT就一定不能讀心。

其二,過度強調理論的確證度和逼真的有限性。就確證度而言,在波普爾那里,理論受經驗的檢驗而被確認的程度,這種可確認性同它的邏輯概率成反比,因為隨著理論的可確證性程度的增加,該理論為真理的概率就越低。過分強調的確認度不僅要求“ChatGPT能讀心\"這一理論要具有一定的可反駁性,還要能通過外部經驗的嚴格檢驗,只有在這兩種前提下,才能稱這一命題是科學的。也就是說,滿足二者的實驗越是提高了Chat-GPT能讀心的確證度,它被反駁的方法越多,在邏輯上為真的概率就越低,越不能成立。就逼真性而言,波普爾認為逼真性原則就是把理論的真理性和理論所包含的內容結合起來,理論一直處于不斷接近真理的循序漸進的過程中,但最大限度的逼真度只能通過一種不僅是真而且還是絕對全面真的理論才能達到。這種有限的逼真度就意味著只能通過實驗結果的概率來選擇逼真度更高的理論,“ChatGPT能讀心\"這一理論永遠處于不斷被否證的過程中,無法形成定論。

無論是忽略了觀察本身的可錯性和實際檢驗情況的復雜性,還是過度強調理論的確證度和逼真的有限性,都說明這種概率性的演繹推理只能是暫時的,而不是一勞永逸地確定理論的科學性。盡管科學知識始終處于一個動態發展的過程,這種概率性否證可以在一定程度上為“ChatGPT能讀心”提供暫時的否證證據,但這種否證不是推動該命題發展的根本動力,不能直接證明ChatGPT不能讀心,仍是有缺陷的。

結語

目前就“ChatGPT能否讀心\"這一爭論的實驗和研究結果呈現多元化和復雜化的傾向,尚無某個理論能夠被普遍接受,也沒有任何研究能夠明確證實或證偽ChatGPT能讀心。因此對這一假設的驗證是一個漫長的過程,面對部分實驗產生的“ChatGPT能部分讀心”的結果,我們仍需謹慎對待。或許目前的ChatGPT還做不到真正意義上的與人比肩,但真正的危險在于,我們的語言讓我們認為人工智能逐步向智能體邁進,但其本身一無所知,生成式AI的“花言巧語”會逐漸模糊人一機之間的主體地位和我們的辨別能力。面對強人工智能通過消解主體的自主權、加強人對物的依賴與構建虛假需求,從而瓦解了主體的否定與超越的維度,最終導致順從機制的生成的現象,我們必須抱有審視的態度,才能更全面地認識以Chat-GPT為代表的人工智能,為AI與人類的發展奠定堅實的基礎。

注釋:

① 此處引用Kosinski M.所發表的預印版論文:TheoryofMind May Have Spontaneously EmergedinLarge Language Models.arXiv preprint arXiv:230202083.2023.

② 此處引用ERICB,NATHAN V,PAULR.所發表的預印版論文:Canaconversational agent passtheory-of-mindtasks?A casestudyofChatGPTwith the Hinting,FalseBeliefs,andStrange Storiesparadigms.2023.hal-039915302v.

③ 此處引用ULLMANT.所發表的預印版論文:Large Language ModelsFailon TrivialAlterations to Theory-of-Mind Tasks. arXiv:2302.08399v5[cs.AI]14 Mar 2023.

④ 此處引用Dahlkemper,M.N.,Lahme,S.Z.,and Klein,P.所發表的預印版論文:(2023).How do physics students evaluate ChatGPTresponses oncomprehensionquestions?Astudyontheperceived scientificaccuracyand linguisticquality.arXiv. Epub aheadof preprint.1-20.Availableat:https://doi.org/10.48550/arXiv.2304.05906.

參考文獻:

[1]TangJ,LebelAJainS,etal.emanticreconstructionofontiuouslanguagefromnoninvasivebainrecordingsJ]ture neuroscience,2023,26(5): 858-866.

[2]理查德·道金斯.自私的基因[M].盧允中,等,譯.北京:中信出版社,2012.

[3]ElyosephZ,Hadar-ShovalDAsrafK,etal.ChatGPoutperformshumansinmotionalawarenesevaluations[J].Emotion Science Psychol.2023,14.https://Dol:10.3389/fpsyg.2023.1199058.

[4]KristinaS,arolineR,TmS.ExploringChatGPT'sEmpathicAbilities[C].11thInterationalConferenceonAectiveComputing and Intelligent Interaction (ACII),2023.

[5]趙朝陽,朱貴波,王金橋.ChatGPT給語言大模型帶來的啟示和多模態大模型新的發展思路[J].數據分析與知識發 現,2023,7(3):26-35.

[6]BenderEM,GebruT,McMilln-MajorA,etal.Onthdangersofstochasticparots:Canlanguagemodelsbetoobig?Proceedings of the2021ACConferenceonFaess,ccountability,ndTransparency[J]1:1-10.https:/oiorg/10.1145/3488. 3445922.

[7]VaswaniAShazerN.ParmarN,etal.AentionisallyouneedAdvancesinNeural InformationProcessingSystemsJ/OL]. https://proceedings.neurips.cc/paper/2017/hash/ab2bfae8f722f8b7f052963edec0d3f-Abstract.html.

[8]Searle JR.Minds,Brains,and Programs[J].Behavioral and Brain Sciences,198O,3(3):417-424.

[9] 黃夢瑤,頓新國.人工智能中計算主義的當前難題及轉進策略[J].自然辯證法研究,2023,39(11):55-61.

[10]康韋·勞埃德·摩根.動物的生命和智慧[M].羅奔,譯.天津:天津科學技術出版社,2018.

[11]尤洋,郭宇.ChatGPT與因果性[J].科學學研究,2023,41(12):2122-2130.

[12]VyshedskiyA.HawkinsJ.AThousandBrains:ANewTheoryofInteligenceJ].EvolutionaryStudiesinImaginativeCulture, 2022,6(1): 111-114.

[13]洪謙.邏輯經驗主義:上卷[M].北京:商務印書館,1982.

[14]CorbettBA,SchwartzmanJM,LibsackEJ,etal.CamouflaginginAutism:ExaminingSex-BasedandCompensatorydels in Social Cognition and Communication[J].Autism research ∵ official journal of the International Society for Autism Research,2020,14(1):127-142.

[15]歐祥威,董春雨.從大數據揭示因果機制的可能性[J].系統科學學報,2022,30(4):26-31.

[16]卡爾·波普爾.猜想與反駁[M].上海:上海譯文出版社,2005.

【責任編輯:王露】

猜你喜歡
人類理論語言
堅持理論創新
當代陜西(2022年5期)2022-04-19 12:10:18
神秘的混沌理論
人類能否一覺到未來?
理論創新 引領百年
相關于撓理論的Baer模
人類第一殺手
好孩子畫報(2020年5期)2020-06-27 14:08:05
語言是刀
文苑(2020年4期)2020-05-30 12:35:30
1100億個人類的清明
讓語言描寫搖曳多姿
累積動態分析下的同聲傳譯語言壓縮
主站蜘蛛池模板: 日韩高清中文字幕| 国产精品无码在线看| 婷婷丁香在线观看| 在线a视频免费观看| 免费Aⅴ片在线观看蜜芽Tⅴ | 中文字幕66页| 四虎国产成人免费观看| 欧美天堂久久| 大陆国产精品视频| 欧美综合成人| 天天色综网| 国产在线视频二区| 亚洲乱码在线播放| 国产美女一级毛片| 无码视频国产精品一区二区| 亚洲国产综合精品一区| 高潮毛片免费观看| 91亚洲精选| 另类综合视频| 欧美激情视频一区| 好吊妞欧美视频免费| 国产一区二区三区精品久久呦| 欧美第九页| 97一区二区在线播放| 欧美日韩在线亚洲国产人| 在线播放91| 99在线视频免费观看| 欧美日韩一区二区三| 中国一级特黄大片在线观看| 4虎影视国产在线观看精品| 久久99国产精品成人欧美| 亚洲精品少妇熟女| 自慰高潮喷白浆在线观看| 97视频免费在线观看| 亚洲天堂成人| 国产女人水多毛片18| 免费一极毛片| 欧美日韩精品综合在线一区| 在线视频亚洲色图| 白丝美女办公室高潮喷水视频| 久久综合九九亚洲一区| 乱人伦99久久| 久久精品人人做人人爽电影蜜月| 欧美色视频在线| 久久毛片网| 国产午夜人做人免费视频中文| 国产精品夜夜嗨视频免费视频| 亚洲色图欧美在线| 色综合中文| 青青操视频在线| 亚洲男人天堂2018| 欧美日韩国产在线播放| 国产麻豆福利av在线播放 | 国产成人综合亚洲欧洲色就色| 久久人妻xunleige无码| 国产福利在线免费观看| 亚洲无限乱码| 国产极品美女在线观看| 国产成人精品第一区二区| 少妇人妻无码首页| aⅴ免费在线观看| 2024av在线无码中文最新| 精品一区二区三区波多野结衣| 国产91精品最新在线播放| 成人在线观看不卡| 欧美午夜视频在线| 国产成年女人特黄特色毛片免| 日韩第一页在线| 九九热在线视频| 亚洲综合精品香蕉久久网| 18禁黄无遮挡网站| 亚洲综合在线最大成人| 国产伦精品一区二区三区视频优播| 欧美福利在线播放| 亚洲欧洲日产国产无码AV| 91福利免费| 久久精品国产亚洲AV忘忧草18| 成年女人a毛片免费视频| 国产精品视屏| 色综合天天操| 国内精品视频| 日韩福利视频导航|