【摘要】人腦是語言的大腦,語言是記載知識的工具,可以說,語言使人類的歷史得以留存。人類認識可以劃分為物理對象、主觀意識和客觀知識三個世界,認知領域、物理領域和信息領域密切相關又存在著一定的差異。計算機互聯網絡是信息時代的第一次革命,自然語言處理是人工智能的核心技術;人工智能促進了認知科學與技術的發展,認知技術是互聯網信息時代的第二次革命,將改變我們的工作和生活方式。
【關鍵詞】語言? 人腦? 認知領域? 物理領域? 信息領域? 人工智能
【中圖分類號】R318/TP18? ? ? ? ? ? ? ? ? ? ? ? ? 【文獻標識碼】A
【DOI】10.16619/j.cnki.rmltxsqy.2023.11.003
引言
人腦與語言共同經過了漫長的進化,人腦進化為語言的大腦。動物沒有語言,因而沒有歷史。人類擁有語言,語言可以描述記載人類所積累的智慧結晶——知識,知識的積累帶來邏輯、思維和文化的進化,最終形成了文明智慧的人類社會,人工智能(artificial intelligence, AI)也由此誕生并迅速發展。
語言是一種形、音、義結合的詞匯和語法體系,是人類溝通交流的一種方式(江銘虎,2022)。語言雖變化無窮,但其語法類型有限,是可以歸類、分析、統計和學習的,因而可以通過計算機的訓練學習實現語言的自動理解與產生。蔡曙山指出,人類的心智與認知產生于腦的進化與分工,奠基于語言,發展于邏輯與思維,積淀為文化,構建了社會(蔡曙山,2021;蔡曙山、江銘虎,2016)。
認知科學和AI之間存在著密切的關系,認知是指人類的思維和知覺過程,包括知覺、記憶、思考和語言等方面。人腦雖然天生就存在著若干成型的特定功能腦區,但要充分挖掘出人腦中所蘊藏的巨大潛力、開發出更多的腦部功能,后天的學習和思維訓練是不可或缺的,其中語言就需要后天的訓練和學習。如果不了解大腦的運作和認知機制,就無法對人類的語言認知規律有深入的理解(江銘虎,2016)。AI研究中的許多概念和算法都借鑒了認知心理學的研究成果。例如,類腦計算模型在自然語言處理(natural language processing, NLP)和計算機視覺等領域都是在模擬人類的語言和視覺系統。反之,AI也對認知科學的發展產生了積極的影響。例如,AI的深度學習算法為認知神經科學的研究提供了新思路。
語言是記載知識的工具,語言使人類的歷史得以留存
人腦與語言共同經過了漫長的進化。從人類進化的角度來看,語言的發展是當今人類最獨特、最顯著的特征。王士元指出,沒有人類發達的大腦,就不可能有我們變化無窮的語言;同時,沒有語言來幫助我們組織思想以及累積幾百年的科學成果,我們也不可能了解大腦這個極為繁復精密的器官。顯然,大腦和語言息息相關、相互演化,語言與大腦是共同進化的(王士元,2011;2008)。就哺乳動物的大腦而言,人腦相對身體的比例是最大的,且是連接最復雜的,人腦的體積和復雜性在進化的過程中不斷增加,使得一些舊有的功能得以改進,一些新的功能(如語言、創造工具)得以涌現,這種現象豐富了人類的行為和認知技能,并且決定了他們在物種競爭中的優勢地位。
大腦器官如此復雜,人類智力的進化并不是剎那間發生的,其中語言的使用和發展起了決定性作用。表1展示了人類祖先進化的大致時間段與腦容量的關系。大約50萬年前,口語出現,人腦中操作口語的機能以及語音和對應的語義開始進化,神經系統自然而然地聯為一體,人腦表面積開始增加(江銘虎、王琳,2013;江銘虎,2019)。諾姆·喬姆斯基(Noam Chomsky)認為,語言出現于20萬~6萬年前,大致是13萬年前,即經歷了大約5,000~6,000代人的進化時間(Chomsky, 2008; 2014)。人類對語言的適應使其變得如此復雜又如此有效。一旦符號交流在早期的原始人類社會中變得稍微復雜,它獨特的代表功能和開放的靈活性意味著它可以被用于無數的目的,并產生同樣強大的再生結果。現存語言的多層結構和我們易于使用的語言,都只能被解釋為二次選擇的結果,這種二次選擇是由首次引入符號過程的社會功能所產生的。特倫斯·迪肯(Terrence Deacon)認為這可能有助于解釋為什么符號交流是像猿類這樣腦容量大、壽命長的生態物種才能進化出來的(Deacon, 1997)。因此,無論計算能力如何提高,大腦的絕對大小都可能在語言進化中扮演了一個重要的角色。多爾·希爾頓(Dor Shilton)等指出,人類進化的兩個重疊階段包括:在語言出現之前,涉及原始人類生活方式的最初發展階段,即狩獵和覓食、工具制造和異體養育;在語言出現之后,涉及情感和認知可塑性進一步提高的階段,這是通過語言來指導想象力的結果(Shilton et al., 2020)。
人腦是語言的大腦。語言是人類獨有的,其特點是能夠生成和處理具有層次結構的句法序列,這與非人類靈長類動物有所不同。語言的復雜性遠遠超過任何現存靈長類物種交流系統的復雜性,其工作機制遠比人們所想象的要復雜得多,而且語言功能的發展也建立在感知覺、運動等基本生理功能的基礎上。它的獨特之處不僅在于其結構的復雜性,還在于其與核心認知能力密不可分。交流是語言演化的重要動力,合作是語言演化的基礎。語言的古老源頭是初期的共享意圖,有了共享意圖,就有了合作。人類語言是我們的天性(即生物學和基因)和我們的后天培養(學習經驗和環境)之間持續而根深蒂固的相互依存關系的作用結果。語言依賴于我們與其他物種共享的許多機制,自然選擇改善人類的某些技能,其中腦容量的增加、發音聲道的進化、交流意圖的社會需求、復雜序列的學習能力等因素,所有的這些技能綜合起來使人類的語言成為可能。因此,發展好語言功能需要以豐富的感知覺、運動經驗為基礎。同時,參與語言處理的這些腦區并不是獨立工作的,而是相互組織起來,形成了用于處理語言的神經網絡。符號化的系統性表明,大腦內符號關聯的表示應分布在不同的腦區,而相似的詞匯共享神經共性。相關腦區組織成不同的信息處理網絡,來處理不同方面的語言信息,某一腦區既接受來自多個其他腦區的神經信號,也向多個腦區發送信號。信號的傳遞不是一次性完成的,也不是單向的,而是在不同腦區之間多次往返、多向交互的。語言與范圍廣泛的人腦神經集成在一起,并且不斷地相互作用共同進化。
馬丁·諾瓦克(Martin A. Nowak)指出,人類語言經過幾十萬年的進化,使我們實現個體間無限的非基因信息的傳遞,并推動了文化的進化(Nowak et al., 2002)。語言與這些核心認知過程相關聯,語言信號會反饋和影響我們對世界的認識和表示。習得人類語言需要掌握一個復雜的、多層次的符號系統,這個系統由語音、音位學、形態學、句法、語義和語用學等幾個成分交織在一起,從而實現對我們思想和文化的傳襲。這種語言與認知的聯系是學習和文化傳播的渠道。
語言本身基于符號來表示概念,概念符號系統位于這些腦區的“心理詞典”中。人類語言的一個決定性特征是其靈活表示和重組概念的能力。人類的基因組深深植根于我們的生物構成中,基因組通過建立能夠適應和重組以響應輸入的神經系統,為語言習得提供了平臺。人類語言的靈活性意味著我們可以用它來表示幾乎任何我們能想到的東西。手勢、聲音、面部五官以及相關特征共同進化,形成一個日益復雜、動態和多樣化的人類語言與非語言交流系統。當我們出生時,口語和聽力的神經生物學系統就已經配置完整,使我們能夠相對容易地掌握口語;而閱讀和寫作能力需要經過正規的指導,只有經過多年的接觸和經驗才能逐漸發展完善,學習閱讀和寫作會重新開發我們的大腦。
共同進化的觀點認為,語言的進化不是發生在大腦的內部或外部,而是發生在文化進化過程中影響生物進化過程的界面上(Deacon, 1997)。共同進化過程在塑造人腦和心智方面發揮了重要的作用。如果不承認人類解剖學、神經生物學和人類心理學都是由一種最能被描述為思想的東西所塑造的,即符號參照的思想,那么就不可能理解人類的思想。雖然符號思維可以完全是個人的,但符號參照本身在本質上是社會性的。也即是說,我們不僅通過與社會其他成員的互動獲得這種表達方式,而且符號本身也可以追溯其社會起源。從具體意義上說,人類獨特的思想是一種不尋常的再生挑戰產物,這種挑戰只有符號參照才能解決。人類語言復雜,但易于學習和使用,這依賴于有效的符號交流。長期的共同進化積淀不僅使符號交流變得更容易、更有效,而且呈現出越有效地獲取符號信息和越強大地運用符號交流的趨向。
語言的語法語義和社會屬性。人類語言從表面看只是符號串,而其實際是具有層次樹狀句法結構的。人類語言服從形式分析:所有的語言,無論是書面語還是口語,都是由小的元素分層遞歸地組合構建成較大的單元,它們具有聲學特征或人工特征,可以依次用來組成音節、詞語、短語和句子,再由此組成段落和篇章,這樣的組合規則不是任意的,每種語言都有具體的規則。句子中詞的組合方式是由該語法規則系統中的層次結構決定的,因此人類的語言具有處理層次構造序列的能力和處理遞歸結構的能力。
語言的生物過程理論認為,人類天生就有認知語法結構的能力,使他們能夠發展和理解語言(江銘虎,2022)。根據這一理論,這個語法結構系統嵌入到人類遺傳之中,并支撐著所有語言的基本語法。語言系統是一個復雜的系統,在自然科學中,通常將復雜的現象和系統分解為基本元素或操作,以便使用。這些基本元素一旦確定就可以進行整合,用于解釋一個復雜的系統。復雜語言系統的分解要素是詞素和句法規則。對于句法領域來說,這種方法效果很好,因為有一個清晰的語言學理論定義了一個最基本的規則,即整合。人類可以創建和理解全新的消息,新消息是通過混合、類比或轉換舊信息而自由創造的。語言的一個主要特征是,一個簡單、有限的音位項集合可以產生一個無限的詞匯系統,其中規則決定了每個詞項的形式,而意義則與形式密不可分,因此語音語法是現有語音單位的簡單組合。語言的另一個重要特征是詞法和句法,其中預先存在的單元被合并,從而產生了語義上新穎或截然不同的詞匯項(江銘虎,2022)。
語言是變化發展的,人類的創造力推動語法的變化,聽者必須具有豐富的想象力和創造力。語法化實質上是建立在隱喻的基礎上的。禁止隱喻的使用會阻止語法的發展,同樣也會排除所有表達抽象思想的可能性。語法化要求一種語言系統在一群講述者中經常使用,并從一群講述者傳遞到另一群講述者。提出問題的能力被認為是區分語言和非人類動物交流系統的能力。伊麗莎·紐波特(Elissa L. Newport)指出,人類習得其母語的機制,既需要先天條件又需要后天培養,也就是說該過程既包括學習者所接觸的語言環境,又包括學習者所具備的先天素質,還需要以特殊的方式來學習瞬時組織語言的模式(Newport and Aslin, 2004; Newport et al., 2004)。語言是一種溝通方式,是人類行為的重要部分和定義我們社會身份的一種文化載體。人類語言還有一個基本的特征使之能夠服從于形式分析:語言結構由根據一定規則組合起來的較小的單元組成,進入較大結構的小單元的組合順序在幾個不同的水平產生。音素形成音節和詞匯,詞匯形成詞組和語句,這樣的組合規則不是任意的,每種語言有具體的規則,由此產生有效或有意義的語言結構的具體規則。人類天生就能學習語言,喬姆斯基指出,語言是一個自由創造的過程,它的規律和原則是固定的,但是生成原則的使用方式是自由的,甚至單詞的解釋和使用都涉及一個自由創造的過程,喬姆斯基認為語言是一種“心理器官”,是一組有限的計算機制,它可以無限變化,允許我們產生無限的句子(Friederici and Chomsky, 2017; Smith, 2004; Berwick and Chomsky, 2016)。
語言是人類的基本特征,也是一種文化共性。與其他非人類動物有限交流的系統不同,人類的語言是開放的、發展的,通過組合有限數量的符號可以產生無限數量的意義。我們所說的幾乎每一個復雜的事情都可能是之前從未說過的。語言真正的奧秘在于我們如何使用極其精細復雜的詞匯和語法結構系統,實時地自由表達我們的意識和思想。外在化的語言不僅是一個認知層面的問題,還是一個社會層面的問題。將語言符號外在化,無論是在墻上的繪畫還是書寫的文字,在某種意義上來說都是社會層面的問題,社會文化領域中應有某些存在的環境來支持它。龜甲、獸骨上雕刻的甲骨文,以及語言形式的外在化符號的產生,需要的不僅僅是大腦中的某些東西,更需要一個復雜的社會環境來支持它,并讓它變得有價值。語言本身是集體的產物,而不是個人的產物,具有社會屬性。語言從一開始就具有系統性和社會性。語言是由基因決定的,是生物進化的結果,是社會互動和交流的結果,對于人類之間的交流以及統一民族、文化和種族群體的認同感至關重要。至少五千年前書寫系統的發明使語言得以保存在實物上,這是人類一項重大的技術進步。
當接觸到語言數據時,聽者-說者的大腦會將聲音和意義聯系起來。通常我們會根據上下文學習單詞,通過逐步習得來區分其含義,通過捕捉其細微差別、內涵以及它們與事物的匹配方式,來學習單詞的含義。思想是認知活動的產物,通過它,可對我們的內在和外在世界進行假設,使其概念化、結構化和戰略化。學習是由經驗和神經元重組介導的發展或成熟過程,學習結果是知識和技能的積累,以更好地理解經驗和思想并使其有意義。通過語言將想法概念化,我們開始了解一些東西,即通過語言中介的互動,在面對新的體驗時,建立一些東西(如一個詞或概念)與某些東西的意義之間的關系。通過敘事來使用語言及其與文化的緊密聯系是人類認知的核心。
人類對世界的認知及認知科學的發展
人類認識的三個世界劃分。諾貝爾醫學獎得主約翰·卡魯·埃克爾斯(John Carew Eccles)和哲學家卡爾·波普爾(Karl Popper)將心智問題分為三個世界(領域)的概念(Eccles and Poppe, 1984),認為人類經驗中的一切都可被歸入物理對象及狀態領域、意識狀態領域和客觀感知知識領域中的一個類別(如表2所示)。蔡曙山將人類認知分為五層級(蔡曙山,2021),將埃克爾斯和波普爾的人類經驗的劃分上升到理論的高度,認為人腦“進化奇跡”之處在于,其不僅僅是一個有血有肉的認知計算器官,還能夠產生神經認知、心理認知、語言認知、思維認知和文化認知五大非凡的現象(前兩項認知是動物也具有的低階認知,后三項認知是人類獨有的高階認知),這一奇跡的產生是語言使用的直接結果。
世界1是物理對象及狀態的世界,包括整個宇宙的物質和能量、所有的生物以及人類為編碼信息而制造的所有人工制品,如工具、機器、書籍和藝術品等,世界1是唯物主義者的全部世界;世界2是各種意識狀態和主觀認識的世界,我們感知的全部內容都在世界2里,包括外在感覺、內在意識和純我意識三個層次;世界3是客觀知識,是人類知識積累的結晶。這三個世界很容易界定,在人類認知的三個世界的分類中,沒有任何遺漏,它涉及存在的和我們所經歷的一切,即所有皆可歸類到三個世界當中(Eccles, 1973; 1970)。
人類具有兩種記憶(世界2):情景記憶(記住曾經發生過的特定事件)和程序性記憶(一種與技能學習有關的記憶)。一方面,語言使用程序性記憶,我們大部分的發音、語法處理和句子構造都是不需要多加考慮的技能,就像騎自行車、游泳一樣輕松;另一方面,我們可以使用程序存儲系統,它包含的符號可以自動地“訪問”大腦語義網絡,以及我們曾經的豐富的人生經歷。人腦可以使用一種記憶來聯想并組織另一種記憶,而其他物種則無法使用這種記憶。
語言是只有人類才能實現的一種獨特的交流形式,大腦在漫長的進化過程中進行了很多改變才使語言交流成為可能。客觀知識(世界3)用語言記載,是經驗(世界2)的先驅。當我們學習新信息并通過應用所學到的知識來修正行為時,我們就會創造出一種新的更豐富的體驗。因為情感是體驗的最終產物,所以我們有意采取的行動的結果是以一種新的情感產生一種新的體驗。當我們有意識地了解如何根據所學和所做的事情來創造新的體驗時,我們就擁有了智慧,智慧能夠有意識地理解我們如何創造經驗,并通過不斷進化最終形成世界3的客觀知識。因此,智慧的進化是指,基于我們已經學習、展示,然后體驗的知識,通過理解我們所創造的感受而獲得智慧的過程。學習知識是思考,運用知識是實踐和體驗。能夠用心去重復體驗,就是人類的智慧。
主觀認識(世界2)到客觀知識(世界3)的轉換是指一個人從自身主觀的認知和體驗,逐步理解和接受客觀存在的知識與事實的過程。這種轉換通常需要通過學習、實踐和反思等多種方式來實現,主觀認識到客觀知識的轉換是一個不斷學習、實踐、反思和調整的過程。而客觀知識的形成過程是一個經驗(世界2)和理性相結合的過程,需要通過觀察和實驗去發現事物的屬性和規律,收集數據和信息,經分析推導發現其中的規律和聯系,得出初步的結論,然后經檢驗和驗證、通過再次實驗、比較和重復觀察等方式以確保其正確性和可靠性。論證后的客觀知識可通過科教出版或工程應用等方式進行傳播,這個過程需要不斷地更新和完善,以適應不斷變化的世界和知識需求。
人類智慧是人類獨特的認知能力和智慧表現,具有以下特點:人類的抽象思維能力能夠將具體事物抽象成一般概念和規律,從而更好地理解和掌握事物的本質;人類的創造性思維能力能夠創造新的概念、思想、藝術和科技,推動社會的發展和進步;人類的自我反思能力能夠審視自己的思想、行為和價值觀,并不斷自我改進和完善;人類具有群體意識和合作精神,能夠合作解決問題、分享知識和經驗;人類的情感認知能力能夠感知和理解自己與他人的情感和情緒,從而更好地溝通和交流;人類的長期思考能力能夠預見未來的可能性并做長期規劃,從而更好地面對復雜的問題和挑戰。這些特點共同構成了人類的認知和智慧的本質特征。
人類智慧(世界2)和客觀知識(世界3)都是被用來解決問題、進行決策和推理的。客觀知識是基于科學實驗和研究得出的結論和事實,具有客觀性、可重復性、普遍適用性;而人類智慧則更多的是基于個人的經驗、觀察、洞察和直覺,具有主觀性和不確定性。人類智慧具備對世間萬物聲像圖文的多模態感知能力,將不同事物聯系起來的邏輯認知能力和對社會環境反饋信息的學習校準能力。人類智慧的進化和形成是一個漫長而復雜的歷史過程,是由多方面因素相互作用和影響的結果,它受到大腦結構、語言交流、工具使用、農業革命、工業革命、社會文化、學習教育等多個因素的影響和作用。這些因素的相互作用和影響推動著人類智慧的不斷進化與發展。
認知科學、物理科學和信息科學的關聯與區別。認知科學是一門研究人類思維、學習、記憶、感知和決策等方面的多學科領域,涉及神經科學、語言學、哲學、心理學、AI和教育學等學科,是研究我們如何思考、感知和下決定的。認知技術將這些學科與工程相結合,對人類認知、智能,以及模擬和增強認知能力的技術與應用進行開發,以增強人類能力進而改變我們的生活和工作方式。
認知與意識密切相關,本質上是主觀的,是由個人經歷、信仰和情感塑造的。認知過程相較于物理或信息過程更復雜和靈活,這一過程往往需要整合多種信息,運用邏輯推理和創造性思維。認知技術依賴于大數據和先進的算力來學習、推理,并與人類互動,類似于人腦,可學習和適應新情況、創造新的解決方案,具有靈活性、智能性、交互性和自主性。認知領域、物理領域和信息領域密切相關但又有所不同,如表3所示,三者雖都是人類活動和知識發展的重要領域,但各有其研究的特點和應用領域,這些應用領域之間也存在相互聯系和交叉應用,如信息技術在物理領域的實驗和計算中的應用,AI在認知領域的應用等。
認知領域又是一個快速發展的領域,涉及復雜的多學科相互作用。通過跨學科合作,認知領域匯集了不同學科的技能和專業知識來解決復雜問題。從數據科學和工程技術到認知心理學和神經科學,從認知計算到虛擬現實,從導航、自動駕駛、智慧城市、智慧金融到大數據醫療,理論與應用研究的不同領域專家能夠借鑒廣泛的學科見解和技術,促進開發過程中的多樣性和包容性,通力合作開發新技術和新應用,推動認知領域的創新發展。
信息時代的兩次革命。計算機互聯網的出現是信息時代的第一次革命,它徹底改變了人們獲取、傳播和共享信息的方式。計算機互聯網為信息時代帶來了重要變革。一方面,互聯網極大地提高了信息的傳播速度,通過電子郵件、即時通訊和社交媒體等工具,人們可以在幾秒鐘內將信息傳遞到世界的任何一個角落,實現了實時交流和全球信息共享;另一方面,人們獲取信息變得更加便捷,過去人們可能需要花費大量時間在圖書館或通過傳統媒體獲取信息,而現在通過搜索引擎和在線數據庫就可以實現,NLP和數據挖掘技術的快速發展更是加快了人們獲取自己所需內容和知識的效率。
認知技術作為信息時代的第二次革命,強調人類智能和認知能力在信息處理與應用中的重要性。一方面,基于AI特別是NLP技術,計算機能夠更好地理解、處理和分析大量的信息;另一方面,認知技術的發展將改變人機交互的方式,通過NLP和語音識別等技術,計算機可以更好地理解人類的意圖和需求,提供更人性化的用戶體驗。此外,通過分析和處理大數據,計算機可以提供更全面、準確的信息支持,輔助決策,這使得認知技術在醫療診斷、金融投資和戰略規劃等領域具有廣泛的應用前景。
AI技術促進了認知科學與技術的發展。人類認知的研究歷史悠久,認知心理學、認知語言學和認知神經科學等有影響力的理論模型為理解人類智力的本質及其背后的認知過程提供了框架。認知技術是一種利用AI技術模擬人類認知過程的技術,使機器能夠像人類一樣感知、理解、學習、推理和解決問題。AI是一項交叉研究,基于多學科融合,促進了我們對語言學的了解與認識,促進了語言學理論本身的發展。NLP是AI的核心技術之一,目標是讓機器像人類一樣具有理解語言的智能,縮小不同語種的人類交流和機器理解之間的差距。自然語言研究從傳統的挖掘具有理論價值的語言事實并給出解釋,到挖掘便于機器存取的結構化的語言大數據知識,實現了從大規模語料中統計出語言的用詞組句規律。
自然語言是人類最主要的交流工具,通過理解和生成人類語言,計算機可以與人類進行有效的交互。由于大量的數據是以自然語言的形式呈現的,通過NLP,計算機可以通過處理和分析這些文本大數據來理解和生成人類語言,并挖掘有價值的信息和知識來支持決策制定、輿情監控等任務。通過NLP技術可以構建和訓練大型語言模型,對語言規律和概率進行建模,對文本進行分析理解,并應用于文本分類、命名實體識別、自動文本摘要、機器翻譯、語音識別與合成、問答系統、人機對話系統等場景。搜索引擎可以理解用戶意圖并從海量數據中檢索相關信息,并提供準確的搜索結果,這為許多AI應用提供了理論基礎和技術支持。ChatGPT作為一種AI的大型語言模型,是認知技術的一種應用,它的底層邏輯是大數據的統計。當機器不能準確知悉事物的本質時,通過大數據的統計訓練來獲取經驗,通過迭代運算對未知狀態逐步逼近,從而判斷事物的本質屬性。這一過程能夠實現的前提是,人們使用正確語句的概率遠大于錯誤語句的概率,在此基礎上,只要語料規模足夠大,計算機就能夠統計出語言的組詞造句的規律性知識,用于自動語言理解和生成,其應用場景廣泛,將為人們提供更加智能化、便捷的服務和解決方案。
隨著更大規模的數據集和更強大的計算資源迅速增加,我們可以期待技術進一步實現更準確、更全面的語義理解能力,這將有助于提高機器對文本的深層理解,包括上下文推理、情感分析和邏輯推理等方面。隨著全球化的不斷推進,跨語言的交流和信息處理變得越來越重要。未來的NLP系統將更好地處理不同語言之間的語義差異、語法結構和文化背景的差異,提供更準確和自然的跨語言交流支持;同時,致力于提高對長文本的處理能力,加強對話系統的建模能力,這有助于實現更智能、更靈活的對話體驗,使機器能夠更好地理解和參與到復雜的人機對話中。就其在相關技術領域的應用來看,NLP技術結合計算機視覺可以實現圖像描述生成;結合知識圖譜和語義網絡可以實現更深層次的知識推理;結合增強學習可以實現更智能的對話代理。NLP技術的更廣泛應用將為人工智能的發展帶來新的機遇。
自然語言的句子無限,但句型有限,自然語言有很多歧義(其句子結構和含義可以有多種解釋),而通過一系列的算法和模型來解析語法結構、進行詞義分析,經上下文推斷、語境識別和語義角色標注等措施,技術可以消除自然語言的歧義。其中一種方法是根據預先定義的語法和規則來處理語言;另一種方法是使用統計模型,即通過分析大規模語料庫來學習語言規則和模式。當前使用的深度學習技術,如循環神經網絡(recurrent neural networks, RNN)和轉換器模型(transformer),就是通過大規模訓練來學習語言的表示和生成,并結合語法、語義和上下文信息,以生成準確和合理的語言表達。自然語言復雜多變,解決語言的歧義性、處理低資源語言,要繼續收集與標注大規模數據集、不斷改進和優化算法,持續推動跨學科的合作與研究。
AI的發展水平與社會的進步和人類的福祉密切相關,AI的飛速發展將在科技和文化領域引發巨大的變革,給我們的工作和生活帶來顯著的影響。認知技術可以幫助我們更準確和高效地處理大量的信息,提高我們的決策能力和工作效率,更好地應對日常生活和工作中的挑戰;基于認知技術的智能家居、智能物流和智能醫療等可以幫助企業開發更智能的產品和更人性化的服務,為我們帶來更加便捷和優質的生活和工作體驗;更重要的是,認知技術的發展有利于助推創新加速,這既可能引發許多學科的突破性進展,又能夠提高生產力,進而推動整個社會和經濟的發展。
認知技術將改變人們的工作和生活方式
認知技術是指與人類認知能力相關的技術,通過模仿、增強或擴展人類的認知過程來改變我們的工作和生活方式。人們越來越關注能夠以自然方式學習、推理和與人類互動的智能系統的發展。這得益于AI領域的突破,以及越來越多的大數據和計算能力的可用性,例如,預測和預防自然災害、防控群體性疾病等。隨著認知技術的發展,人們對邊緣計算能力的需求越來越大,邊緣計算能力可以支持分布式環境中數據的實時處理和分析,機器學習模型和其他智能系統也越來越需要其帶來的算法可解釋性和透明度。認知技術與物聯網的融合,為一系列行業的智能自動化和數據驅動決策創造了新的機遇。認知技術與物理系統的集成將帶來機器人、自動駕駛汽車和智能城市等領域新應用的發展。這些技術正在改變我們與機器的交互方式和彼此之間的交流模式,并有可能徹底改變我們的生活和工作方式。認知領域的關鍵優勢之一是它能夠進化與適應不斷變化的環境和新發現,為創新增長創造機遇。認知技術在未來幾年可能產生如下新的突破和應用。
企業發展。認知技術可通過更好地理解企業員工的思維過程來幫助制造業設計更加高效的生產流程,其理論可應用于培訓和教育,幫助企業更好地培訓和指導員工。通過理解學習者的認知過程和思維習慣,認知技術可以設計更有效的培訓課程和教育方案,提高員工的學習效果和工作表現;通過理解用戶的認知過程和習慣,認知技術可以設計更便于使用的產品、更符合用戶認知習慣的產品界面和操作方式,提高產品的易用性、用戶體驗和產品質量;通過理解人類的認知過程和決策原理,認知技術可以設計更智能、高效、安全和靈活的自動化生產系統,降低生產成本,更好地滿足市場需求;通過自動化的生產線、智能助手和機器學習算法,認知技術能夠洞察大數據中的隱藏模式,從而幫助企業提高生產效率、減少錯誤率和進行更明智的決策。
智慧城市建設。認知技術可通過理解人類的認知過程和行為習慣,幫助設計更符合人類需求、更人性化的城市環境,更智能化的城市管理和公共服務系統,包括交通設施、公共空間和建筑物等,提高城市的宜居性和用戶體驗,優化社區城市管理,完善醫療保健和教育等公共服務,提高居民的生活質量和幸福感。通過理解司機和乘客的認知過程和行為習慣,認知技術能夠設計更智能化的交通管理系統,提高交通效率和安全性,幫助優化城市交通流量,減少交通擁堵和事故;通過理解罪犯的認知過程和行為習慣,認知技術可以設計更具針對性的監控和預防犯罪系統,提高城市的安全性和治安水平。
智能金融研發。智能金融是結合AI技術和金融業務,實現智能化的金融服務。數據挖掘、機器學習和NLP等AI技術能夠對金融大數據進行分析和預測,幫助金融機構更準確、更智能地進行投資決策;區塊鏈技術可提高金融交易的透明度和安全性,并通過智能合約等技術實現金融服務的自動化和智能化;云計算和大數據技術可幫助金融機構存儲和處理金融大數據,提高數據的利用效率和系統的分析能力,降低金融機構的運營成本及風險。智能金融的研發為金融業帶來了更多的創新和發展機遇,智能金融與金融科技相結合,可以實現支付、借貸、保險等領域金融服務的創新和升級,更全面地保障金融安全和客戶權益。
大數據醫療發展。隨著醫療信息化的迅速推進,醫療數據的數量和種類迅速增加。大數據醫療對于推動醫療領域的發展和改善人民健康有著重要的作用。機器(深度)學習、數據挖掘等算法能夠通過分析和處理醫療大數據,發現潛在的規律和變化趨勢,預測疾病可能引發的風險,推斷患者在各病程階段的反應,協助醫生提升診斷疾病、制定治療決策的準確性,提高治療效果、減少醫療資源浪費;智能診斷、智能監測和遠程醫療等技術可以實現醫療服務的智能化,電子病歷、醫學影像和基因序列等大數據可以被應用于疾病的診斷、預測、治療和預防;通過收集和分析大量的患者數據,認知技術能夠優化醫療資源的配置,針對不同的患者制定不同的治療方案,從而提高醫療服務的效率和質量;個性化的健康管理和監護系統將幫助人們更好地管理健康和預防疾病,有效監測和管理患者的健康狀況,提供個性化的健康建議;通過挖掘臨床大數據,認知技術可以優化試驗設計和樣本選擇,加快新藥研發和上市進程;通過醫療保險大數據的采集與分析,認知技術能夠實現醫療保險賠付模式的升級,提高醫療保險服務的效率和質量;通過在本地計算設備上進行數據訓練和模型更新,認知技術可以全面保護數據的隱私性,促進數據使用方的平臺合作與協同發展。
導航與無人駕駛技術進步。導航是通過各種設備和技術來幫助人們確定當前位置并找到目標位置的過程,它不僅需要提供準確的位置和路線信息,還需要與用戶進行良好的人機交互,使得導航更智能化、人性化和便利化。傳感器數據、地圖數據和歷史數據等多源數據的融合技術,能夠提高導航的準確性、實時性和可靠性;多模式導航將多種交通方式集成在一起,如公共交通、出租車和共享單車等,為用戶提供更便捷、更全面、更省時的出行服務,實現多種交通方式的信息互通,實現車輛之間的信息交流、信息共享和路況實時監測的智能路網,為導航提供更準確和實時的路況信息和路線規劃,提高導航的效率和安全性。
無人駕駛技術是認知科學和AI技術在交通運輸領域的應用,其通過傳感器和控制系統來實現汽車的自主駕駛,大大提高交通的安全性和疏解效率,有利于車輛更好地感知和適應交通環境,改善交通流量管理,減少交通事故和交通堵塞。無人駕駛汽車的智能化和自適應能夠根據道路、交通和天氣等條件進行自主決策,提高汽車的駕駛安全性和穩定性。人機交互技術讓乘客與汽車之間更智能和自然地交互,實現更省時、便捷的出行體驗。無人駕駛汽車與智能路網相結合,能夠實現交通的自主調度和優化,從而改變人們的出行和生活方式,提高交通運輸的效率和安全性。
結語
認知技術的競爭實際是人才的競爭,我國政府一直高度重視人才的引進和培養。清華大學自2005年成立了教育部認知科學創新基地,北京大學和貴州民族大學等高校均建立了認知科學一級學科,可培養本、碩、博不同層次的認知科學理論與技術人才。騰訊、百度、阿里等科技公司近年來競相投入了大量的人力和物力進行組織攻關,通過一系列戰略重點部署和實踐來推進認知技術的研發,尋求認知技術的新突破。從政府層面來看,通過一系列的國家重點研發計劃、國家自然科學基金和國家社會科學基金等方式,國家不斷加大對腦機接口、認知科學、AI(特別是NLP)、類腦計算和社會計算等重基礎、寬應用研究的支持力度,積極模擬人類智能,進行類腦計算,構建人造大腦,挖掘大規模數據中的人類知識,促進了來自不同領域和不同背景的研究人員形成有凝聚力的研究團隊,為得到更具影響力的研究成果打下了堅實的基礎。
認知技術具有潛在的經濟、社會、教育和戰略效益。隨著認知技術變得越來越復雜,廣泛來源的數據激增,為認知技術的更深一步研發提供了新的機遇。AI是認知技術的關鍵推動者,深度學習、強化學習和NLP等領域的研究擴展了AI研究的邊界,為認知技術的新突破提供了支撐。認知技術將改善人機交互方式,使得計算機更好地理解和響應人類的需求、提供更智能、高效和個性化的解決方案,這將引發諸多行業領域的變革。
值得注意的是,在發展認知技術的同時,也應注重制定相應的技術監管框架和標準,以應對包括與隱私、偏見、公平、安全、道德和倫理相關的問題。例如,惡意行為者出于經濟利益或其他目的,濫用認知計算模型來產生大量垃圾郵件,或用來生成大量虛假和不良信息,將造成一系列不良影響。政府和科研機構組織應為這些技術的開發與部署制定相應的道德框架和指導方針,促進相關問題的國際合作,以確保負責任地使用技術并造福社會。
(本文系國家自然科學基金重點項目“語言理解的認知機理與計算機模型研究”和國家社會科學基金重大項目“語言、思維、文化層級的高階認知研究”的階段性成果,項目編號分別為:62036001、15ZDB017)
參考文獻
蔡曙山、江銘虎,2016,《人類的心智與認知》,北京:人民出版社。
蔡曙山,2021,《認知科學導論》,北京:人民出版社。
江銘虎、王琳,2013,《腦與語言認知》,北京:清華大學出版社。
江銘虎,2016,《語言信息處理》,北京:人民出版社。
江銘虎,2019,《語言的ERP腦電認知》,北京:清華大學出版社。
江銘虎,2022,《語言、腦進化與認知》,北京:清華大學出版社。
王士元,2008,《語言涌現:發展與演化》,中國臺北:中央研究院語言研究所。
王士元,2011,《語言、演化與大腦》,北京:商務印書館。
R. C. Berwick and N. Chomsky, 2016, Why Only Us Language and Evolution, MA: The MIT Press.
N. Chomsky, 2008, Language and Mind, Third Edition, Cambridge: Cambridge University Press.
N. Chomsky, 2014, The Minimalist Program, Cambridge: The MIT Press.
C. R. Darwin, 1871, The Descent of Man, and Selection in Relation to Sex, London: Jone Murray, Albemarle Street.
T. Deacon, 1997, The Symbolic Species: The Co-evolution of Language and the Brain, New York: W. W. Norton & Company, Inc.
J. C. Eccles, 1970, Facing Reality, London: Longman Publishers.
J. C. Eccles, 1973, The Understanding of the Brain, New York: McGraw-Hill.
J. C. Eccles and K. R. Poppe, 1984, The Self and Its Brain, Berlin, Heidelberg: Springer.
A. D. Friederici and N. Chomsky, 2017, Language in Our Brain, MA: The MIT Press.
M. A. Nowak et al., 2002, "Computational and Evolutionary Aspects of Language," Nature, 417(6889).
E. Newport and R. Aslin, 2004, "Learning at a Distance I. Statistical learning of Non-adjacent Dependencies," Cognitive Psychology, 48(2).
E. Newport et al., 2004, "Learning at a Distance II. Statistical Learning of Non-adjacent Dependencies in a Non-human Primate," Cognitive Psychology, 49(2).
D. Shilton et al., 2020, "Human Social Evolution: Self-Domestication or Self-Control?" Frontiers in Psychology, (11).
N. Smith, 2004, Chomsky: Ideas and Ideals, 2nd Edition, Cambridge: Cambridge University Press.
責 編∕李思琪