一、引言
全國毛澤東文藝思想研究會2025年學術年會于6月27—29日在延邊大學召開。此次會議有多個議題,其中之一為“數智時代的文藝創作與理論研究”,這是當下文藝界十分關注的熱門話題,也是文藝理論界全新的探索對象。早在2025年3月,學會老領導、北京大學中文系董學文教授就曾與筆者商討,希望筆者在會上談一談人工智能(AI)的發展同文藝理論研究的挑戰和關系問題。這對筆者而言同樣是全新的課題和挑戰。在認真研讀AI技術文獻和彌補統計學等基本知識后,筆者為會議撰寫了一個短文,算是一份“發言提綱”。在此基礎上,筆者與AI界專業人士就這一短文及設計的問題展開討論,最后由文理不同學科的多人共同向DeepSeek提問(提出的問題很多,筆者做了取舍),形成一篇長文?,F將短文與長文,包括提問部分,一并呈現在讀者面前,如此,大致可以了解AI技術目前對文論有何應用場景,以及在AI技術視閾下文論研究有何作為。
二、在全國毛澤東文藝思想研究會2025年學術年會上的發言提綱
人工智能(Artificial Intelligence,英文縮寫AI,以下簡稱AI),是研究、開發用于模擬、延伸和擴展人的智能的理論、方法、技術及應用系統的一門新技術科學。人工智能是計算機科學的一個分支,它企圖了解智能的實質,并生產出一種新的能以人類智能相似的方式作出反應的智能機器,該領域的研究包括機器人、語言識別、圖像識別、自然語言處理和專家系統等。早在上個世紀40年代后期,AI概念已經被學術界提出,從50年代后期的概念到今天的通用AI,特別是AlphaGo、AlphaFold、ChatGPT、Sora 等人工智能產品的問世,開啟了現代AI的新篇章。
AI發展需要有算法(軟件和數學支撐)算力(芯片等硬件)工程、數據、市場應用環境等主要要素,此外還需要強大的電力支撐。
算力指的是數據處理能力,是集信息計算力、網絡運載力、數據存儲力于一體的新型生產力,主要通過算力中心等算力基礎設施向社會提供服務,存在于手機、筆記本、超級計算機等各種智能硬件設備。算力的本義是表示某個設備或系統的計算性能,算力是推動數字經濟發展的核心力量,也是支撐數字經濟發展的堅實基礎,算力對推動科技進步、促進行業數字化轉型,以及支撐經濟社會發展發揮重要作用。算力如同農業時代的水利、工業時代的電力,已成為數字經濟發展的核心生產力,是國民經濟發展的重要基礎設施。
算法是指解題方案的準確而完整的描述,是一系列解決問題的清晰指令,算法代表著用系統的方法描述解決問題的策略機制。也就是說,能夠對一定規范的輸入,在有限時間內獲得所要求的輸出。如果一個算法有缺陷,或不適合于某個問題,執行這個算法將不會解決這個問題。不同的算法可能用不同的時間、空間或效率來完成同樣的任務。一個算法的優劣可以用空間復雜度與時間復雜度來衡量。
強化學習的成功主要體現在諸如棋類游戲這種具有明確規則的應用場景中,在其他領域應用落地一直難以推進。
統計學習是聯系機器學習和統計學的橋梁,是研究計算機視覺、自然語言處理和語音識別的主流方向。貝葉斯和頻率是統計學的兩個經典流派,遺憾的是在中國高校,貝葉斯派相對于頻率派發展滯后,受重視程度不高,但前者或將領跑下一輪AI基礎。更糟糕的是,在中國綜合性大學數學系,統計學本身不是主流,這個學科主要分布在財經院校與師范院校。
在日常生活中,人們往往進行常識推理,而這種推理通常是不準確的。例如,你看見一個頭發潮濕的人走進來,你認為外面下雨了,那你也許錯了;如果你在公園里看到一男一女帶著一個小孩,你認為他們是一家人,你可能也犯了錯誤。在工程中,我們也同樣需要進行科學合理的推理。但是,工程實際中的問題一般都比較復雜,而且存在著許多不確定性因素。這就給準確推理帶來了很大的困難。很早以前,不確定性推理就是人工智能的一個重要研究領域。盡管許多人工智能領域的研究人員引入其他非概率原理,但是他們也認為在常識推理的基礎上構建和使用概率方法也是可能的。為了提高推理的準確性,人們引入了概率理論。最早由JudeaPearl于1988年提出的貝葉斯網絡(BayesianNetwork)實質上就是一種基于概率的不確定性推理網絡。它是用來表示變量集合連接概率的圖形模型,提供了一種表示因果信息的方法,當時主要用于處理人工智能中的不確定性信息。隨后它逐步成為處理不確定性信息技術的主流,并且在計算機智能科學、工業控制、醫療診斷等領域的許多智能化系統中得到了重要的應用。
貝葉斯理論是處理不確定性信息的重要工具。作為一種基于概率的不確定性推理方法,貝葉斯網絡在處理不確定信息的智能化系統中已得到了重要的應用,已成功地用于醫療診斷、統計決策、專家系統、學習預測等領域。這些成功的應用,充分體現了貝葉斯網絡技術是一種強有力的不確定性推理方法。
算力的核心是硬件,如芯片,在這方面我們與美國有一定代差。隨著計算機的發展,算法在計算機方面已有廣泛的發展及應用,如用隨機森林算法來進行頭部姿勢的估計,用遺傳算法來解決彈藥裝載問題,使用信息加密算法進行網絡傳輸,使用并行算法進行數據挖掘,以及協同過濾算法在個性化推薦中的應用等。
海德格爾曾說:“語言是存在的家?!边@源自他對“言詞”的理解。言詞本身是關聯,它將物擁入存在,并保持在存在中。如果沒有言詞,事物整體、“世界”以及詩人的“我”將一同沉入晦暗之中。由此,海德格爾認為,語言是思維的存在方式。作為比人類“更善于學習”的AI,在當下的文論研究中更有能力做好文本分析,真正實現從細讀到遠讀的范式躍遷。此外AI在跨媒介研究領域、知識圖譜建構等許多研究領域和研究方向均可大顯身手。不過AI本質上是工程學科,認識了AI這一本質,回答AI技術視閾下文論研究有何作為就有了大致方向。從這個意義上看,AI可以取代文論研究的部分工作,如一些初步的文獻檢索、學術史綜述,乃至于某些程式化的論述,但AI不可能為文論研究“定調子”“定方向”,解決“怎樣論述”等問題,因為提出問題和解決問題的一定是人本身。打個比方:AI只能干體力活兒,而干不了腦力活兒。我們在一些AI的運用場景中經常需要“貼標簽”,以解決現實世界的倫理、道德,乃至于意識形態等復雜問題,而“貼標簽”的任務一定是由人去完成的,而且一定是由專業人士才能完成。文論研究必須由人去制定規則,有些規則又是在不斷變化之中的,如文藝政策,這些更是AI所無法揣摩的,這也決定了AI不可能完全取代人的創造性勞動。就自前AI發展的狀況看,但凡真正的藝術創造,AI都是無法勝任的。
《開啟智能新時代:2024年中國AI大模型產業發展報告》中提到,中國AI大模型產業發展源于多領域的廣泛需求,例如來自辦公、制造、金融、醫療、政務等場景中降本增效、生產自動化、降低風險、提高診斷準確率、提高政務服務效率等訴求。相關領域的創新和發展共同推動著中國AI大模型產業的蓬勃發展,預示著未來更廣闊的市場前景。截至2024年12月,中國有3.31億人表示自己聽說過生成式人工智能產品,占整體人口的 23.5% ;有2.49億人表示自己使用過生成式人工智能產品,占整體人口的 17.7% 。在生成式人工智能用戶中,利用生成式人工智能產品回答問題的用戶最為廣泛,占比達 77.6% ;將生成式人工智能產品作為辦公助手的用戶占比達 45.5% 。這都反應出AI在中國有廣闊的市場應用環境。再則,中國幾十年的高速發展,從根本上解決了電力供應短缺的問題,這又是AI算力發展的基本條件。
三、在發言提綱基礎上由DeepSeek生成的文本
馬馳、孫沛瑩:請從學術史角度,簡要介紹一下人工智能的發展歷史。
DeepSeek:人工智能的起源可以追溯到20世紀40年代。1943年,神經科學家麥卡洛克(WarrenMcCulloch)和數學家皮茨(WalterPitts)提出了首個神經網絡數學模型,為AI奠定了理論基礎。1949年,唐納德·赫布(DonaldHebb)提出“赫布學習規則”,解釋了神經元如何通過經驗調整連接強度。1950年,計算機科學先驅艾倫·圖靈(AlanTuring)發表了《計算機器與智能》,提出“圖靈測試”,探討機器是否能夠表現出與人類無異的智能行為。1956年,達特茅斯會議(DartmouthConference)正式確立了“人工智能”這一學科,約翰·麥卡錫(JohnMcCarthy)馬文·明斯基(MarvinMinsky)等學者提出了AI研究的核心目標,如自然語言處理、機器學習等。20世紀50—60年代,AI研究取得了一系列突破。1956年,艾倫·紐厄爾(Allen Newell)和赫伯特·西蒙(HerbertA.Simon)開發了“邏輯理論家”(LogicTheorist),能夠自動證明數學定理。1966年,約瑟夫·魏澤鮑姆(JosephWeizenbaum)創造了聊天機器人“ELIZA”,盡管功能簡單,但展示了人機交互的可能性。
馬馳、孫沛瑩:AI何時迎來發展機遇?
馬馳、孫沛瑩:請簡要介紹AI早期發展的技術瓶頸。
DeepSeek:由于計算能力有限、數據不足,AI的早期發展很快遇到瓶頸。1973年,英國數學家詹姆斯·萊特希爾(JamesLighthill)發布報告,批評AI未能實現預期目標,導致政府資助減少,AI進入第一次“寒冬”。80年代,AI研究轉向實用化,專家系統(ExpertSystems)成為主流。這類系統通過規則庫模擬人類專家的決策能力,在醫療診斷、金融分析等領域取得成功。例如,1980年,斯坦福大學開發的MYCIN系統能輔助診斷血液感染疾病。同時,機器學習開始發展。1986年,杰弗里·辛頓(GeoffreyHinton)等人提出“反向傳播算法”,使神經網絡訓練成為可能。1997年,IBM的“深藍”(DeepBlue)擊敗國際象棋世界冠軍卡斯帕羅夫,展示了AI在特定領域的強大能力。然而,專家系統依賴人工規則,難以適應復雜場景,加之計算資源仍然有限,AI在90年代末再次遭遇低谷。
DeepSeek:21世紀初,互聯網的普及帶來了海量數據,計算機算力大幅提升,AI迎來爆發式增長。2006年,辛頓提出“深度學習”概念,使神經網絡能夠高效訓練。2012年,AlexNet在ImageNet競賽中大幅領先傳統算法,證明了深度學習的潛力。2014年,生成對抗網絡(GAN)誕生,使AI能夠生成逼真圖像。2016年,AlphaGo擊敗圍棋冠軍李世石,標志著AI在復雜決策領域的突破。同時,自然語言處理(NLP)快速發展,2017年Google提出Transformer架構,為ChatGPT等大語言模型奠定基礎。2020年后,AI進入大規模應用階段。2022年,OpenAI發布ChatGPT,使AI的對話能力接近人類水平。2023年,GPT-4、MidJourney等模型在文本、圖像生成方面表現驚艷,AI開始深刻影響教育、醫療、藝術等行業。
然而,AI的快速發展也帶來倫理、就業、安全等挑戰。各國開始制定AI監管政策,研究如何平衡技術創新與社會風險。AI發展需要有算法(軟件和數學支撐)算力(芯片等硬件)工程、數據、市場應用環境等主要要素,此外還需要強大的電力支撐。
馬馳、孫沛瑩:請用非專業語言簡要介紹算力。
DeepSeek:算力(ComputingPower)是指計算機系統執行復雜計算任務的能力,尤其是處理機器學習、深度學習等AI算法所需的運算效能。AI算力的核心依賴于硬件加速和并行計算。AI計算的核心是矩陣運算(如矩陣乘法、卷積運算),這些操作需要極高的并行計算能力。傳統CPU(中央處理器)采用串行計算,效率較低,而AI專用硬件(如GPU、TPU)采用大規模并行架構,可同時處理數千個計算任務,大幅提升訓練和推理速度。其關鍵硬件要素有GPU(圖形處理器)、TPU(張量處理器)、FPGA(現場可編程門陣列)、ASIC(專用集成電路)存儲與互聯技術等。它的未來趨勢是Chiplet(小芯片)技術(將多個計算單元集成,提升算力密度)和光子計算/量子計算(探索更高效的AI計算方式)。
馬馳、孫沛瑩:請用非專業語言簡要介紹算法。
DeepSeek:算法(Algorithm)是指解題方案的準確而完整的描述,是一系列解決問題的清晰指令,算法代表著用系統的方法描述解決問題的策略機制。其核心原理是通過數學建模讓計算機從數據中學習規律,本質上構建的是從輸入到輸出的映射函數。這一過程主要建立在三大理論支柱之上:統計學原理用于發現數據的內在分布規律,優化理論通過梯度下降等方法調整模型參數,計算理論則確保算法的高效執行?,F代AI算法主要分為傳統機器學習(如決策樹、支持向量機等)深度學習(神經網絡)及強化學習(環境交互學習)三大類,每種類別針對不同的問題場景具有獨特優勢。
一個完整的AI算法工作流程通常包含六個關鍵階段。首先是問題定義階段,需要明確任務類型、評估指標和數據需求;接著進行數據處理,包括數據采集、清洗、特征工程和數據集劃分;然后進入模型構建階段,選擇合適的算法架構并初始化參數。在模型訓練過程中,系統會循環執行前向傳播、損失計算、反向傳播和參數更新等步驟。訓練完成后,需要通過驗證集測試、超參數調優等方式評估和優化模型性能,并采取正則化等措施防止過擬合。最后是部署應用階段,涉及模型轉換、接口封裝、性能監控和持續迭代更新,確保算法在實際場景中的穩定運行。
從具體應用來看,不同類別的AI算法各具特色。監督學習中的邏輯回歸適用于概率分類,隨機森林擅長集成決策;無監督學習的DBSCAN可用于密度聚類,PCA則專注于降維分析;而深度學習的CNN在圖像處理、RNN在時序預測、Transformer在自然語言處理等領域都展現出強大性能。隨著技術進步,現代AI算法正朝著更高效、更魯棒、更可解釋的方向發展,同時計算效率和能耗問題也成為研究者關注的重點方向,推動著這一領域的持續創新。
現代AI技術是通過機器學習及由其驅動而發展起來的計算機視覺、自然語言處理和語音識別技術來實現多模態數據融合的現實交互。因此算法層面目前主要涉及機器學習、計算機視覺、自然語言處理、語音識別等,后三者主要是應用場景驅動。機器學習對AI智能起關鍵作用的英語主要包括深度學習、強化學習、統計學習(這些方面機器一定比人強)。
自然語言遠比計算機視覺要復雜,而且語言具有特殊性,直接將英語開發語言模型應用到中文處理中不一定適宜。此外,由于自然語言處理市場潛力有限,使得中文語言數據標注沒有得到足夠重視,現在數據反而成為制約其發展的一個主要障礙。
好的算法需要好的工程實現才能發揮其最大效果,特別是AI技術基于深度學習和強化學習,且依賴大模型數據,所以工程實現變得尤為關鍵。深度學習在計算機視覺中以及強化學習在大語言模型中取得的成功都是算法和工程完美結合之作。算法是AI的核心,也是大國競爭的角力點。
好的算法需要好的工程實現才能發揮其最大效果。這一觀點在當今以人工智能為核心的技術浪潮中顯得尤為重要。特別是隨著深度學習和強化學習技術的快速發展,以及大模型、大數據成為AI領域的標配,工程實現的質量直接決定了算法能否從理論走向實踐,從實驗室走向產業應用。
馬馳、孫沛瑩:請詳細探討優秀工程實現的重要性,并以推薦系統為例,說明工程優化如何顯著提升AI模型的性能和用戶體驗。
DeepSeek:首先,優秀的工程實現是算法落地的基石。深度學習模型,尤其是像GPT-4、AlphaFold這樣的大模型,往往包含數十億甚至上千億的參數。訓練和部署這些模型需要高效的分布式計算框架、精細的內存管理和高速的數據流水線。例如,在訓練階段,工程團隊需要設計并行計算策略,合理分配GPU/TPU資源,避免計算瓶頸;在推理階段,則需要優化模型結構,減少延遲,提高吞吐量。沒有這些工程優化,再先進的算法也可能因為計算效率低下或資源消耗過大而無法實際應用。
其次,工程實現決定了算法的可擴展性和穩定性。AI系統通常需要處理海量數據,這就要求工程架構能夠支持數據的實時采集、存儲和處理。以自動駕駛為例,車輛每秒產生數GB的傳感器數據,工程團隊需要設計高效的數據管道,確保數據能夠快速傳輸到云端或邊緣設備進行處理。同時,系統還需具備容錯能力,在部分硬件故障時仍能穩定運行。這些非功能性的需求,往往需要通過精心的工程設計和嚴格的代碼規范來實現。
最后,優秀的工程實現能夠顯著降低AI系統的運營成本。大模型的訓練和推理消耗大量計算資源,成本高昂。通過模型壓縮(如量化、剪枝)緩存機制和智能調度等工程手段,可以大幅減少資源使用。例如,將FP32精度的模型量化為INT8,既能保持模型精度,又能減少 75% 的內存占用和計算開銷。在云計算按量付費的環境下,這種優化可以直接轉化為成本節約。
另一個典型案例是AlphaGo。其算法突破固然重要,但工程團隊開發的分布式訓練框架才是戰勝人類冠軍的關鍵。該系統能在多個TPU上高效并行訓練數千個棋局,每天完成數百方次自我對弈。沒有這種工程能力,蒙特卡洛樹搜索(MCTS)和深度強化學習算法的潛力將無法充分釋放。
由此可見,AI技術的發展已經進人“算法-工程雙驅動”的時代。優秀的算法提供理論上的可能性,而卓越的工程實現則將這種可能性轉化為現實價值。特別是在處理大規模、高并發的實際場景時,工程能力往往成為決定項目成敗的關鍵因素。因此,AI團隊需要在追求算法創新的同時,高度重視工程架構的設計與優化,才能真正發揮人工智能的潛力,創造業務價值。
馬馳、孫沛瑩:當下,強化學習的成功主要體現在哪些領域?
DeepSeek:強化學習的成功主要體現在諸如棋類游戲這種具有明確規則的應用場景中,在其他領域應用落地一直難以推進。強化學習的顯著成功案例高度集中在規則明確、邊界清晰的領域,尤以各類棋牌游戲為代表。從戰勝人類頂尖選手的AlphaGo,到精通多種棋類的AlphaZero,再到在復雜電子競技中合作的OpenAIFive,這些突破性成就的共同基石在于其環境的本質特征:規則完全且精確、狀態空間可完整觀測、可選行動離散有限、獎勵信號清晰且即時。在這種高度結構化的框架下,智能體能夠在低成本、可完美復現的模擬環境中進行海量試錯,精確學習狀態與最優行動之間的映射,從而逼近甚至超越人類專家的決策水平。模擬器對環境的精準復刻是此類成功不可或缺的條件。
馬馳、孫沛瑩:強化學習對人類思維的挑戰體現在哪里?
DeepSeek:當強化學習試圖走出規則封閉的“沙盒”,邁向規則模糊、動態開放且充滿不確定性的現實世界時,其應用落地便遭遇了顯著的瓶頸。核心挑戰在于三個方面:首先,環境建模與仿真極度困難。真實世界(如自動駕駛、機器人復雜交互、開放經濟系統)涉及難以窮盡的變量和隨機擾動,構建高保真度、覆蓋所有“長尾”情況的模擬器成本高昂甚至不切實際,而缺乏可靠仿真則使依賴試錯的強化學習在現實中風險巨大。其次,獎勵函數設計成為關鍵掣肘。
許多現實問題(如醫療決策優化、教育策略制定、客戶服務)缺乏像游戲勝負那樣清晰、客觀且可量化的終極獎勵標準。定義能長期、安全引導智能體行為的獎勵函數極其復雜,不當設計極易導致短視或有害行為。最后,樣本效率低下與探索成本高昂。深度強化學習通常需要大文數字般的交互數據,這在物理世界或涉及真實用戶的場景中,數據收集的成本、時間和潛在風險都構成了難以逾越的障礙。
因此,強化學習并非解決所有復雜問題的通用鑰匙。它在現實世界的大規模成功應用,嚴格受限于規則性強、可精確模擬或試錯成本可控的場景。突破其在更廣闊領域的瓶頸,仍需在算法魯棒性、獎勵設計理論、高效仿真技術,以及與領域知識的深度融合上取得實質性進展。
統計學習是聯系機器學習和統計學的橋梁,是研究計算機視覺、自然語言處理和語音識別的主流方向。貝葉斯和頻率是統計學的兩個經典流派,遺憾的是在中國高校,貝葉斯派相對于頻率派發展滯后,受重視程度不高,但前者或將領跑下一輪AI基礎。中國高校貝葉斯方法發展相對滯后的核心原因,在于學科傳統慣性與方法論認知偏見的交織。國內統計學教育長期根植于頻率派框架,教材體系與科研范式均以假設檢驗和抽樣理論為軸心,形成強大的路徑依賴。同時,學術評價體系更傾向追求“確定性結論”,使頻率派基于大樣本的漸近理論更易被工程領域接納,而貝葉斯方法依賴先驗設定的特質常被誤解為“主觀性短板”,與國內重實證、輕思辨的研究傳統存在張力。這種認知偏差進一步限制了貝葉斯思想在跨學科場景中的滲透與創新應用。更糟糕的是,在中國綜合性大學數學系,統計學本身不是主流,這個學科主要分布在財經院校與師范院校。
在日常生活中,人們往往進行常識推理,而這種推理通常是不準確的。例如,你看見一個頭發潮濕的人走進來,你認為外面下雨了,那你也許錯了;如果你在公園里看到一男一女帶著一個小孩,你認為他們是一家人,你可能也犯了錯誤。在工程中,我們也同樣需要進行科學合理的推理。但是,工程實際中的問題一般都比較復雜,而且存在著許多不確定性因素。這就給準確推理帶來了很大的困難。很早以前,不確定性推理就是人工智能的一個重要研究領域。盡管許多人工智能領域的研究人員引人其他非概率原理,但是他們也認為在常識推理的基礎上構建和使用概率方法也是可能的。為了提高推理的準確性,人們引入了概率理論。最早由JudeaPearl于1988年提出的貝葉斯網絡(BayesianNetwork)實質上就是一種基于概率的不確定性推理網絡。它是用來表示變量集合連接概率的圖形模型,提供了一種表示因果信息的方法,當時主要用于處理人工智能中的不確定性信息。隨后它逐步成為處理不確定性信息技術的主流,并且在計算機智能科學、工業控制、醫療診斷等領域的許多智能化系統中得到了重要的應用。
馬馳、孫沛瑩:請用最簡潔的語言介紹貝葉斯理論的重要性。
DeepSeek:貝葉斯理論是處理不確定性信息的重要工具。作為一種基于概率的不確定性推理方法,貝葉斯網絡在處理不確定信息的智能化系統中已得到了重要的應用,已成功地用于醫療診斷、統計決策、專家系統、學習預測等領域。這些成功的應用,充分體現了貝葉斯網絡技術是一種強有力的不確定性推理方法。
馬馳、孫沛瑩:請簡單分析一下中美在算力方面的差距。
DeepSeek:算力的核心是硬件,如芯片,在這方面我們與美國有代差。中美算力差距的核心在于規模、芯片、數據與創新投入的全面落差。規模上,中國智能算力規模不足美國1/10,且設施利用率偏低,而美國占據全球新增智能算力的 90% ,僅微軟2025年AI數據中心投入即達800億美元。芯片層面,受制于出口禁令,中國無法獲取尖端AI芯片,國產替代品(如昇騰)在性能與生態上存在代際差距。數據資源方面,中國可用訓練數據量不足美國1/10,且語言多樣性受限。創新投入上,美國企業年均AI基礎層投入超百億美元,匯聚全球 50% 以上頂尖人才,中國雖專利數量領先但高質量創新不足。值得關注的是,隨著國產化替代加速(中國計劃2025年總算力提升超50% )及模型性能差距顯著縮小(2025年中美頂級模型性能差縮至 0.3% ),中國正快速構建自主算力體系,但底層技術突破仍需時間。
馬馳、孫沛瑩:請簡單介紹一下算法領域的最新進展。
DeepSeek:隨著計算機的發展,算法在計算機方面已有廣泛的發展及應用,如用隨機森林算法來進行頭部姿勢的估計,用遺傳算法來解決彈藥裝載問題,使用信息加密算法進行網絡傳輸,使用并行算法進行數據挖掘,以及協同過濾算法在個性化推薦中的應用等。
馬馳、孫沛瑩:怎樣理解海德格爾所說的“語言是思維的存在方式”?
DeepSeek:海德格爾揭示了人類語言與思維的本體性關聯——語言是存在自身的顯現。而AI語言的存在方式本質是符號邏輯的拓撲重構:其根基是數學向量空間中的概率建模(如Transformer注意力機制),通過語料訓練形成統計關聯網絡。這種機制使AI語言剝離了存在論根基,成為純粹算法驅動的符號映射,本質上是對語言表象的擬合而非存在之思。AI語言與人類語言的核心差異在于存在論根基、符號系統性質與創造性維度:人類語言源于主體對世界的體驗性理解(如“疼痛”包含生理與情感現實),其能指與所指的關系具有社會約定性與歷史流動性;AI語言則是封閉的編碼系統,符號意義被訓練數據靜態凝固。人類通過隱喻(如“時間是一條河”)實現認知突破,本質是存在經驗的重新賦義;AI的“創新”僅是數據模式的跨域重組,無法超越訓練數據構建的本體論框架。
例如人類說“光年”,既包含天文尺度概念又喚起時空浩渺的詩意;AI輸出該詞時,僅激活詞嵌入向量中與其共現頻率高的“宇宙”“遙遠”節點,卻永遠無法體驗凡爾納筆下“用光年丈量孤獨”的存在主義震顫。AI語言終究是存在者的鏡像,而非存在的綻放。
馬馳、孫沛瑩:AI本質上是工程學科,AI工程方法如何深度革新人文社科研究范式?
DeepSeek:通過數據驅動與算法建模拓展傳統認知邊界:在計算人文領域,自然語言處理技術解析古籍文獻以量化歷史觀念變遷;社會科學中多智能體仿真模擬群體行為動態,結合因果推斷驗證政策干預效果;數字考古利用計算機視覺三維重建遺址,藝術研究則借風格遷移算法解碼流派演變規律;倫理決策領域更將道德哲學框架編碼為算法約束(如自動駕駛的倫理權衡模型)。AI本質是人文研究的顯微鏡而非大腦:它能放大社會文化現象中的隱藏模式,卻無法替代價值思辨,其核心價值在于為“厚數據”(thickdata)提供可驗證的新觀測維度,但始終需以人文精神校準技術航向。
認識了AI這一本質,回答AI技術視閾下文論研究有何作為就有了大致方向。從這個意義上看,AI可以取代文論研究的部分工作。
馬馳、孫沛瑩:請分析AI在文藝理論研究中的應用是如何推動方法論革命的?
DeepSeek:AI的核心價值在于拓展認知尺度、重構分析范式并激發跨學科創新,具體呈現為三大維度。一是從細讀到遠讀的范式躍遷。文本分析領域正經歷從細讀到遠讀的范式躍遷,其核心表現為三個層面:首先,概念譜系測繪利用NLP模型(如BERT、GPT)挖掘海量理論文本,量化核心概念的演變,例如通過分析“主體性”的上下文向量漂移,繪制其從現象學到后結構主義的嬗變軌跡。其次,理論風格解構借助風格遷移網絡解析文本修辭特征,如對比羅蘭·巴特與阿爾都塞的句法復雜度,揭示結構主義與后結構主義的表述策略差異。最后,爭議焦點探測運用對抗觀點聚類技術,從海量文獻中自動析出論爭焦點,例如識別后殖民理論中霍米·巴巴與斯皮瓦克觀點的根本張力點。斯坦福文學實驗室的案例頗具代表性:通過Transformer分析數十年比較文學論文,發現“世界文學”概念的討論重心已從歌德式普世主義轉向“不平等翻譯政治”,相關詞頻激增 320% 。
二是跨媒介研究:破除文本中心主義的認知枷鎖。跨媒介研究正致力于破除文本中心主義的認知枷鎖,具體通過:視聽理論驗證,如運用計算機視覺分析塔可夫斯基電影的鏡頭運動軌跡,量化驗證其“雕刻時光”理論(長鏡頭時長高出均值4.2倍且運動更趨混沌)。藝術流派關聯,借助風格遷移算法建立跨藝術形式聯系,例如將蒙德里安繪畫轉化為音樂序列,證實其與斯特拉文斯基作品共享“結構化變異”美學。表演理論實證,利用動作捕捉技術解碼身體符號,如記錄日本能劇演員的微表情,為“間”(ma)美學提供生物力學證據(靜止間隔占表演 63.7% ,遠超現實主義戲?。?。這些方法將分析對象拓展至視覺、聽覺與身體實踐,打破了傳統文本分析的局限。
三是知識圖譜:理論星叢的動態拓撲推動方法論革命。知識圖譜技術通過構建理論星叢的動態拓撲,深刻推動著方法論革命。這集中體現在:思想傳播可視化,如將本雅明著作的全球引用數據映射為熱力圖,清晰揭示其“機械復制”理論在數字藝術爆發期(2005—2015)被引量激增 478% 的傳播路徑??鐚W科概念橋接,利用超圖模型連接離散領域,追蹤“幽靈性”概念如何從德里達哲學經莫里森小說跳轉至虛擬現實藝術,并標記各階段的理論變異系數。理論漏洞預測,基于文獻增長悖離檢測發出預警,例如當“認知敘事學”的實證研究增速(年 +15.2% )遠超理論創新(年 +3.1% )時,系統提示其可能陷入方法論危機。這種動態、關聯的知識表征方式,為把握理論的宏觀結構與演化邏輯提供了革命性工具。
馬馳、孫沛瑩:將AI引入文藝理論研究會產生異化現象嗎?
DeepSeek:AI的應用始終需警惕三重異化:
語境剝離危機:詞向量將巴赫金“狂歡”簡化為節日符號,消解其對抗斯大林主義的歷史重量。
算法霸權隱憂:訓練數據過度傾向英語文獻導致后殖民理論呈現西方中心視角。
創造性幻覺:GPT生成“新批評細讀”實則拼接布魯克斯與燕卜蓀的現存論點。
本質而言,AI是文藝理論的哈勃望遠鏡——它使研究者觀測到思想星云的宏觀結構,但星系誕生的奧秘仍存在于人類獨有的批判性思辨中。當機器將“陌生化”理論關聯至2000部小說中的裝置描寫時,真正的理論突破恰始于學者追問:“為什么AI沒有發現第三世界作家用‘食物陌生化’解構殖民現代性?”這種對算法盲區的質詢,恰是人文精神不可自動化的核心價值。
不可否認的是,AI不可能為文論研究“定調子”,“定方向”,解決“怎樣論述”等問題,因為提出問題和解決問題的一定是人本身。打個比喻:AI只能干體力活兒,而干不了腦力活兒。我們在一些AI的運用場景中經常需要“貼標簽”,以解決現實世界的倫理、道德、乃至于意識形態等復雜問題,而“貼標簽”的任務一定是由人去完成的。
馬馳、孫沛瑩:請簡要介紹一下“貼標簽”。
DeepSeek:AI的“貼標簽”行為是指其將文學文本或理論概念固有的復雜性、模糊性和動態性,強行簡化為預設的、固定的、離散的類別標簽。這種做法雖能提供初步秩序感,卻往往嚴重扭曲或遮蔽了文學研究的核心對象一意義的豐富性和生成性。例如,在體裁分類上,AI可能依據關鍵詞或情節模式(如識別“死亡” Σ=Σ 悲劇)將《堂吉訶德》這類兼具悲喜劇特質的杰作強行歸入單一類別,忽視其顛覆傳統的混合本質。在流派識別上,AI依賴學習到的“特征包”(如浪漫主義 Σ=Σ 自然 + 情感),將受多重影響或處于過渡期的作品(如包含浪漫元素的現實主義文本)生硬地貼上單一流派標簽,不僅抹平了同一流派內部的巨大差異(如不同現代主義作家的獨特性),更無法識別對流派慣例的突破與創新。主題分析方面,AI通過高頻詞統計識別出“愛情”“戰爭”等主題標簽,或進行簡單“積極/消極”的情感判定,卻嚴重脫離語境,無法理解反諷(如表面歌頌實為批判)矛盾交織(如“自由”與“責任”的沖突),以及主題在整體文本結構中的深層意蘊,將多維度的意義平面化。
這種“貼標簽”的深層問題在于:它過度簡化復雜性,將連續光譜強行離散化;剝離語境,無視文本賴以生存的歷史、文化與互文背景;靜態化動態過程,將不斷演變的意義和理論論爭固化為靜止狀態;依賴表面特征,難以觸及隱喻、反諷、象征等深層修辭和整體結構;并可能陷入意圖謬誤,錯誤地將人物或敘述者觀點等同于作者意圖。因此,盡管AI在初步掃描文本、識別模式或整理文獻上可作為輔助工具,但其標簽化結果絕不能替代深度閱讀和批判性闡釋。文學理論與批評的價值,恰恰存在于那些抵抗簡單歸類、充滿張力與歧義的“邊緣與縫隙”之中,這是當前AI算法邏輯難以真正理解和進人的領域。研究者必須清醒認識其局限性,將AI輸出視為需深度人文審視的起點而非結論。
文論研究必須由人去制定規則,有些規則又是在不斷變化之中,如文藝政策,這些更是AI所無法揣摩的,這也決定了AI不可能完全取代人的創造性勞動。就目前AI發展的狀況來看,但凡真正的藝術創造,AI都是無法勝任的。
《開啟智能新時代:2024年中國AI大模型產業發展報告》中提到,中國AI大模型產業發展源于多領域的廣泛需求,例如來自辦公、制造、金融、醫療、政務等場景中降本增效、生產自動化、降低風險、提高診斷準確率、提高政務服務效率等訴求。相關領域的創新和發展共同推動著中國AI大模型產業的蓬勃發展,預示著未來更廣闊的市場前景。截至2024年12月,中國有3.31億人表示自已聽說過生成式人工智能產品,占整體人口的 23.5% ;有2.49億人表示自己使用過生成式人工智能產品,占整體人口的 17.7% 。在生成式人工智能用戶中,利用生成式人工智能產品回答問題的用戶最為廣泛,占比達 77.6% ;將生成式人工智能產品作為辦公助手的用戶占比達 45.5% 。這都反映出AI在中國有廣闊的市場應用環境。再者,中國幾十年的高速發展,從根本上解決了電力供應短缺的問題,這又是AI算力發展的基本條件。
本文部分內容由DeepSeek生成。
作者簡介:馬馳,上海社會科學院思想文化研究中心研究員;孫沛瑩,華東師范大學馬克思主義學院碩士生;DeepSeek。
(責任編輯劉艷妮)