
如今,生成式人工智能正以顛覆性的創新重塑人類與技術的交互方式。它通過深度學習和算法優化,以學習海量數據(如文本、圖像、音頻、視頻等),模擬人類的創造力,“理解”其中的模式和規律,然后生成形式多樣的內容。這項技術從最初的理論探索到如今落地千行百業,不僅展現了強大的創造力,更成為推動數字化轉型和產業升級的核心引擎。
1956 年的達特茅斯會議誕生了“人工智能”(Artificial"Intelligence,AI)一詞,被認為是這項技術發展的開端。但包括20世紀40年代沃倫·麥卡洛克等對人工神經網絡的探索、1950"年艾倫·圖靈提出的圖靈測試等也是這項技術雛形的重要事件。達特茅斯會議之后的數十年間,由于技術發展路線的不明確,同時受限于算力與數據,AI發展歷經沉浮。20"世紀"80 年代至"90 年代,專家系統、隱馬爾可夫模型等理論學習、機器學習的模型和系統相繼提出,為后續的人工智能的發展奠定了一定基礎。由于"70 年代時人工智能的發展并未取得預期中的進展,導致"AI 一詞飽受批評,因此在"20 世紀"80 年代至"90 年代該方面的研究一般冠以“知識工程”或“知識智能系統”等名稱。
21 世紀初,深度學習的興起為生成式"AI帶來突破契機。2014"年,伊恩·古德弗洛提出生成對抗網絡(GAN),通過對抗訓練實現圖像生成質的飛躍,標志著生成式"AI 進入技術覺醒期。2015"年,OpenAI"成立,開始全力推動生成式"AI 研究。2017"年,美國谷歌公司提出Transformer"架構(如"BERT、GPT),極大提升了自然語言處理(NLP)能力。在論文《Attentionis"All You Need》中,研究者提出了這種名為Transformer"的全新神經網絡架構,這一模型摒棄了傳統的循環神經網絡(RNN)和卷積神經網絡(CNN)的設計思路,轉而完全依賴于自注意力(self-attention)機制來處理序列數據。這一架構的提出不僅解決了長序列建模的瓶頸,還為后續大語言模型(LLM)的爆發奠定基礎。
過去十余年,生成式"AI 經歷了從單模態到多模態、從專用到通用、從學術研究到產業落地的高速發展,可簡要劃分為三個階段:
技術探索期(2014—2018"年)。"生"成對抗網絡成為圖像生成的主流技術,英偉達的StyleGAN"即是基于生成對抗網絡的深度學習模型,廣泛應用于人臉生成、圖像編輯等領域,其核心創新在于通過映射網絡和自適應實例歸一化技術實現多層級風格控制?。
模型規模化期(2019—2021"年)。2018年,OpenAI"發布了最早的一代大型模型GPT-1。GPT-1運用幾十億文本檔案的語言資料庫進行訓練,模型的參數量為"1.17 億個。一年后發布的GPT-2"首次展現了大語言模型的涌現能力—"一這個模型的參數規模突破"15 億,可以生成連貫的新聞文本。隨后,谷歌旗下的"DeepMind研發的"AlphaFold 人工智能系統通過"AI 預測蛋白質結構,解決了困擾生物學界"50 年的難題,展現了人工智能技術在生命科學研究和藥物開發進程中的顯著突破。2021"年,Stability"AI 發布"Stable Diffusion,將圖像生成的算力需求降低 90%",推動"AIGC(人工智能生成內容)普及。


多模態與通用化期(2022"年至今)。2022"年"可"謂"是"生"成"式"AI 的"爆"發"元"年。OpenAI"推"出"ChatGPT—— 基"于"GPT-3 的3.5"版本,以對話式交互顛覆人機交互范式,不僅能夠回答問題,還能創作文章、編程,甚至模仿人類的對話風格,其幾乎無所不能的回答能力使得人們對大語言模型的通用能力有了全新的認識。這一模型上線兩個月便實現了用戶破億。同時,谷歌發布圖像生成模型,Midjourney"等初步實現的文生視頻、3D"建模等,生成式"AI 開始融合文本、圖像、音頻、視頻等多種信息,向通用人工智能(AGI)邁進。
中國的人工智能探索可以追溯到改革開放初期,“科學技術是第一生產力”提出后,中國在包括人工智能在內的各方面技術研究開始向國際先進追趕。起初,受限于資源和專業人才的匱乏,中國的人工智能發展緩慢,相關研發成果明顯落后于西方水平。
近年來,隨著以美國科技企業為代表的生成式人工智能技術迅速發展,中國在該領域也全面發力并涌現出一批具有全球競爭力的企業和研究機構。從大語言模型到AI"繪畫、視頻生成,中國在技術研發、產業應用和政策支持方面均取得顯著進展。

自"2017 年"Transformer 架構提出并推動了全球生成式"AI 發展,中國學術界和產業界開始跟進。2018"年后,百度、阿里、騰訊等企業開始布局大模型,加速自研速度,紛紛發布了相關自研模型,如百度的“文心大模型”、阿里的“通義千問”、華為的“盤古大模型”等。隨著2022"年ChatGPT"引爆全球AInbsp;熱潮,中國科技公司也加快追趕步伐。2023"年,中國生成式AI"進入“百模大戰”,百度、阿里、騰訊、華為、字節跳動、科大訊飛、月之暗面、智譜"AI 等,推出了相關的模型產品,極大地豐富和活躍了中國生成式人工智能市場,推動了行業的發展與進步。2024"年,中國"AI 企業在多模態(文本+圖像+視頻)的生成式AI"上全面發力,字節跳動的“豆包”、百度的“文心一格”(AI"繪畫,現已整合至“文心一言”)等的推出,推動多模態"AI逐步成熟。
2025 年"1 月,深度求索(DeepSeek)最新"AI 模型的發布成為中國人工智能發展的關鍵節點。其開源模式、低訓練成本以及絲毫不遜色的成果表現,迅速引爆全球"AI 行業。這也標志著中國已成功構建起完整的人工智能生態,開始由技術追趕者變成改變全球"AI 格局的重要力量。
生成式"AI 技術作為涉及深度學習、自然語言處理、計算機視覺、強化學習和概率論等多個領域的復雜技術,其正在打破行業邊界、重構生產流程與交互體驗,逐步滲透到各行各業、方方面面。
內容創作是生成式"AI 的最基本、最成熟的應用之一。文生文的輔助寫作,包括文案生成、文章潤色乃至代碼編寫等,已成為許多人工作和業余創作的選擇。隨著圖像、音頻等多模態生成模型的發展,文生圖、文生視頻等快速成為當下的內容創作熱門方式。
智能交互也是生成式"AI 的重要應用。包括搜索引擎嵌入AI、AI"智能客服、AI"學習機、虛擬數字人等,基于生成式"AI 的智能交互融入人們工作、學習、生活日常。
生成式AI也顯著推動科研與生產效率提升。“碼農們”的代碼開發、咨詢公司的數據分析、機械制造的工業設計等,生成式"AI 強大的數據分析、內容識別和產出能力,為相關科研和生產提供了強大助力。
此外,在個性化教育和醫療輔助方面,生成定制化解題步驟、輔助早期癌癥篩查……生成式AI"正在不斷突破應用邊界,滲透到社會全行業。
隨著技術持續迭代,生成式"AI 將向更深層次、更廣領域拓展,呈現技術融合與能力躍升、應用場景深度滲透、挑戰與治理并進等發展趨勢。
可以預見,多模態深度融合,突破文本、圖像、視頻、音頻的邊界,實現全模態生成與交互將是生成式AI"下一步技術融合的重點。同時,具身智能的崛起——生成式"AI 與機器人技術結合,使物理實體具備環境感知與決策能力,也將成為其能力躍升的可能表現。
在應用場景深度滲透方面,醫療、法律、金融等專業性強的行業將出現行業定制化的專屬大模型,滿足專業性與合規性需求。AI"原生應用爆發、個性化服務升級也將持續滲透到各行業的深度應用場景中。
同時,生成式"AI 也面臨著問題和挑戰,技術發展的同時加強治理將成為保障其穩定推進的重要一環。數據安全與倫理將成為治理焦點,其中包括訓練數據的隱私保護、生成內容的真實性與版權歸屬、AI"生成虛假信息的治理等。此外,算力與能耗瓶頸也會影響其發展,需要加快算力供應和能源結構轉型,以保障其健康穩定發展。
生成式"AI 正在重塑世界,從藝術創作到科學研究,其潛力無限。這一技術的崛起,不僅是技術的突破,更是一場關乎人類創造力、生產方式與社會結構的深刻變革。如今,AI"變革已至,我們應積極擁抱"AI,探索技術賦能發展的無限可能。未來,隨著技術、倫理與治理體系的協同發展,生成式"AI 有望成為人類拓展認知邊界、創造美好生活的核心伙伴。這場由代碼驅動的創造力革命,已經來到,期望更遠。
編者按:在科技浪潮的席卷下,人工智能正快速融入經濟社會各行各業。人工智能賦能產業發展,成為推動經濟高質量增長的重要力量。本期策劃,我們從農業、工業、服務業(文旅)等產業角度,以廣西、廣東、浙江等地的實際案例,了解正在不斷拓展的人工智能應用場景,見證人工智能賦能產業發展的生動實踐。