近日的《自然——神經科學》上,來自得克薩斯大學的科學家們發表了一篇論文,文中提到他們在大型語言模型的助力下,開發出了一種現代“讀心機”,雖然它不能讓你直接“說真話”,但是可以將你的大腦活動轉換成清晰的圖像或語言直接表述出來。
那么,這款“讀心機”到底是如何做到的呢?
AI如何直接讀取思維
直接讀取思維,或者說是“思維解碼”,是指能夠直接從大腦中提取和解析思維的過程。這個過程涉及諸如神經元活動模式的識別,以及將這些模式與特定的思維或感知相關聯。
2023年5月1日,美國得克薩斯大學奧斯汀分校的研究人員在《自然——神經科學》期刊發表了研究論文。該研究開發了一種名為語義解碼器的新型人工智能系統,只需要分析功能磁共振成像(fMRI)數據,就可以以非侵人性的方式,將參與者大腦中所想的故事甚至圖像翻譯成連續的文本流。這一系統可能會幫助那些有精神意識但無法說話的人(例如中風患者、聾啞人)進行清晰的交流。
在訓練系統階段,科學家們讓志愿者躺在fMRI機器中,在接受fMRI掃描的同時,從耳機中聽取播客故事。在訓練階段,研究人員利用基于GPT-I的大型語言模型,將參與者fMRI數據顯示的大腦活動.與播客故事里的語言特征聯系起來。志愿者接收幾十個小時播客故事后,研究人員會讓志愿者聽一個全新的故事。這一次,他們要求解碼器根據志愿者的大腦活動,輸出語言來描述志愿者聽到的故事。
實驗結果顯示,這一系統能夠根據志愿者的fMRI數據,描述出志愿者聽到的故事,雖然達不到100%的準確度,但是它能夠讀出志愿者大腦中想到的故事大意。
這個系統還能解碼圖像內容。在實驗中,研究人員讓參與者觀看一小段沒有語音或文字的動畫視頻,然后解碼器可以根據參與者的大腦活動,輸出語言描述視頻中發生的事件。但這項研究也帶來了一個全新的隱私問題——一些不懷好意的人是否可以通過語義解碼器竊取他人大腦中的想法呢?
論文通訊作者Alexander Huth教授表示,語義解碼器是量身定做的,在使用前需要經過十幾個小時的訓練,志愿受試者需要保持完全靜止,并將精神集中在他們正在聽的故事,該系統才能真正發揮作用。研究團隊也在沒有接受過培訓的人身上測試了該系統,其解碼結果與實際相差甚遠。
目前的進展
盡管目前還遠未能完全解碼人類思維,但研究人員還是取得了一些關鍵的進步。例如,在今年3月份,來自日本京都大學的科學家們已經成功地使用AI解碼出了人們看到或在大腦中想象的圖像,甚至是他們正在聽的或想象的語言。
該研究論文發表在《生物雜志》網絡版上。作者說:“雖然我們的模型只接受自然圖像的訓練,但我們的方法成功地將重建過程推廣到人工形狀,這表明我們的模型確實‘重構或‘生成大腦活動的圖像,而不是簡單地匹配樣本?!?/p>
該項技術的核心在于當人在觀察一幅圖像時,會在腦海中復刻這張圖像;AI通過特定的算法將志愿者的fMRI信號和圖片的DNN(Deep Neural Networks深度神經網絡)特征關聯,繼而訓練可以讀取你思維的AI。
不過需要強調的是,目前的研究大多依賴于粗糙的大腦成像技術和有限的數據。因此能解碼的思維種類和精度都還有限。
除了準確度,延時也是一個有待解決的問題。儀器與人類的交互讀取處理信息等都需要時間,且不同的人大腦的活動方式也有差異,這對于系統的處理性能也是一個不小的挑戰。
此外,fMRI需要參與者躺在特定的機器里才能收集到可靠的數據,這種苛刻的條件要求會對未來的推廣帶來不小的阻礙。
未來的可能
未來,隨著大腦成像技術的進步和更多的數據可用,我們將有可能訓練出能夠解碼更復雜、更精細的思維的AI。這不僅可能使我們能夠更深入地理解大腦和思維,也可能開啟全新的交流方式,如幫助行動困難的人群直接用思維控制界面,或理解語言障礙人群的思維。
然而,能讀取思維的AI也帶來了一系列道德和倫理問題。例如,誰有權訪問我們的私人思維?我們應該如何保護思維隱私?這些都是在開發這項技術時必須面對和解決的問題。
目前,我們還暫時不用擔心該項技術會對人類隱私帶來什么威脅,因為每個實驗的成功進行都需要志愿者的高度配合。如果你不想被機器讀取到你的思維,可以通過走神來樹立無懈可擊的屏障。
總的來說,AI直接讀取人類思維是一個充滿挑戰和機遇的領域。它和其他所有的革新科技一樣,是一把雙刃劍,它可以為人類提供福祉,也可能剝奪人類的隱私,引起巨大的倫理問題。如何發展它,如何利用它,都是值得我們深入思考和探討的。