蔡津津
人工智能技術自出現以來就致力于模仿人處理信息的方式來輔助提升人類記憶、思考、分析、識別、判斷的效率和準確度,這類人工智能屬于分析式人工智能(Analytical AI),自2020年5月美國公司OpenAI推出了第三代語言預測模型,人工智能用于生成和創作內容開始有了質的飛躍,生成式人工智能(Generative AI)首次被提出,迅速成為新的數字技術熱點,運用到圖片、文字、視頻等內容創作與生成的AIGC(AI Generated Content)技術受到的更多關注,到2022年底OpenAI公司開發的ChatGPT問世后達到了前所未有的高峰。至此AIGC形成了可以通過自然語言和圖文與人類進行對話交互來理解多類任務,并按要求創作或生成相關內容的能力,標志著人工智能從感知理解世界進入到生成創造世界的新階段,AIGC技術把內容創造和知識工作的邊際成本大幅降低,產生巨大的勞動生產率和經濟價值,催生了又一次生產力變革,可以預見人類將開啟第四次工業革命的時代。
對從事內容生產與傳播的傳媒行業來說,最先感知到AIGC帶來的沖擊,首先是數據成為人工智能感知現實世界的媒介,成為關鍵生產要素,其次算法模型從掌握內容傳播的權力進化到了掌握內容生產的權力。
數字技術變革對媒體生產和傳播的改變。在萬物皆媒的數字時代,以數據與算法為核心的數字技術變革在全媒體傳播體系中呈現了四大類發展趨勢:一是內容載體技術變革,內容形式如文字、圖像、音視頻通過虛擬人、3D建模、全景聲等方式不斷逼近對現實世界的描述,呈現高仿真趨勢;二是內容生產技術變革,多模態跨模態內容的處理、分析、翻譯、審核等技術不斷突破內容形式之間的隔閡,呈現一站式自動化生產趨勢;三是傳播技術的變革,從文字語音對話、手勢體態、數字分身等交互方式到機器人、多終端、VR/AR和腦機接口等交互入口,呈現類人類、擬人化趨勢;四是內容生態技術變革,在內容載體、生產和傳播技術的發展上疊加區塊鏈、智能合約、隱私計算等技術形成的web3.0和元宇宙內容協作生態,呈現出數實融合協同共創的趨勢。但這四個趨勢的發展一直面臨人與機器之間的溝通、交互、協作方式復雜而帶來的學習門檻、生產成本、創新速度方面的瓶頸,而以ChatGPT等為代表的AIGC技術突破了這一瓶頸,任何人都可以通過人類自然語言向人工智能發出指令,表達自己的創意和要求,人工智能會學習、理解并運用各種資源完成生產和創作,這一突破將大大顛覆傳統全媒傳播體系。

生成式多模態超大規模語言模型的特征。人工智能領域的生成式多模態超大規模語言模型,以ChatGPT依賴的大模型GPT-4為例,有以下三個特征。
一是通過三個“大”讓人工智能具備了遠超出人類個體的掌握總結全量知識的能力。即依托由超過4000臺高性能服務器30000張GPU計算芯片組成的大規模算力,通過由超過3000億單詞量1PB的百科、書籍、期刊、源代碼、網頁論壇和人類專家互動反饋數據組成的大規模數據集,訓練出了據推測由超過1.8萬億參數組成的大規模參數語言模型。因此,GPT-4在一系列與人類對話交互、知識測試、多模態內容理解和生成任務的評測中涌現出了學習與總結能力、理解與記憶能力、創作與生成能力、邏輯推理能力和通用常識能力。
二是通過和人類專家進行交互不斷調整優化和提升自己。大規模語言模型通過人類反饋強化學習的方式進行進一步訓練、優化和微調,使語言模型能夠生成更加真實準確的內容,有效減少信息和行為的生成和輸出,并且逐步與人類的意圖和偏好保持一致,更好地模仿人類、理解人類語言指令,產生連貫而有邏輯的內容。
三是可以記憶上下文信息,圍繞與人類的多輪語言互動,來調整、分析、處理和生成復雜信息與內容。GPT-4通過對大量開源程序代碼的學習獲得了思考聯想的能力,也就是思維鏈機制(Chain-of-Thought),結合上下文學習機制(In-context Learning)和提示工程(Prompt Engineering),隨著對話中給出的問題和信息不斷豐富,大模型能夠通過小樣本數據掌握新的知識和內容,并激發大模型不斷學習處理復雜任務和生成復雜內容。
生成式大規模語言模型的三大轉變。以上三個特征,我們可以看出ChatGPT在“大數據+大算力+強算法=大模型”路線基礎上探索出了“基礎大模型+指令微調”的人工智能新范式,讓生成式大規模語言模型產生三大轉變:一是從單一模型完成特定任務向一個通用模型完成多類任務的轉變,不僅生成人類可讀的內容,還可以生成機器和應用程序可執行的代碼;二是從通過全量訓練來升級模型向在任務執行和專業領域學習中讓模型不斷分化和進化的轉變;三是從模型被動學習向模型有潛力通過生成內容自主在網絡上尋找所需信息、調用各類應用來自動完成新任務的轉變。這三個轉變讓人工智能向通用人工智能發展邁進一大步。微軟在2023年3月24日發表論文稱對 GPT-4 進行了全面評測,認為“鑒于GPT-4 能力的廣度和深度,它應該被合理視作一個通用人工智能(AGI)系統的早期(但仍不完整)版本”。
這一突破使ChatGPT在短短不到兩個月的時間內構建起一個圍繞生成式大規模語言模型驅動的新的生產力生態。GPT-4在教育、金融、支付、文化傳承、零售消費、制造業等垂直領域開始廣泛應用合作,開啟了人工智能賦能全要素生產力率提升的時代;微軟將GPT-4接入Bing搜索和微軟辦公協同套件引發了人機協同生產方式的變革;ChatGPT推出接口服務、插件功能并接入上千種第三方插件,可以基于模型能力開發衍生應用,其中,網絡瀏覽器插件賦予大模型使用工具、聯網、運行計算的能力,知識庫檢索插件賦予大模型允許用戶接入垂直領域知識庫成為企業或個人的第二大腦,代碼解釋器插件賦予自行組織、生產和執行代碼與程序的能力,開啟了以人機對話為總入口、以內容為生產力載體的下一代智能互聯網時代,全媒體傳播體系與數字經濟進一步深度融合。

AIGC技術改變全媒體傳播體系。從ChatGPT商業模式和應用生態的發展趨勢中,可以感受到AIGC技術讓人工智能根據需求直接參與生產,并能充分補充和突破個人的知識與技能的短板,大大加速了數據、信息和知識運用到生產中的效率和進程,極大降低了現實世界進入數字世界的門檻與成本,將從如下幾個方面改變全媒體傳播體系。
第一,內容生產方式和供給結構發生變化。AIGC讓全媒體內容的創作門檻大幅降低,效率顯著提升,人只要擁有創意和想法,人工智能就可以根據語言指令快速生成文本、代碼、圖片甚至音視頻、3D建模等多模態內容,并可以理解多模態內容和人類進行互動;專業內容生產和創作技能的門檻降低,人工智能不僅僅是輔助人類生產的工具,更成為生產力的一份子參與到整個生產過程中;掌握和運用專業知識的速度與數量的門檻降低,人工智能大模型不僅可以學習全量人類知識還能夠持續擴充知識量,并運用到內容生產中,讓內容的知識價值和信息量顯著提高,甚至有可能超過人類個體專家的能力;發現新知識和新規律的能力門檻降低,人工智能大模型可以在海量數據和信息中發現和總結新知識和新規律,輔助人類在內容生產中迸發真知灼見。AIGC類應用與現在的互聯網社交化新媒體平臺結合,將不斷降低對專業人員技能和知識積累的依賴,提升普通人參與全媒內容生產的效能和質量,進一步挑戰傳統媒體機構和專業內容服務機構的優勢,加劇內容生產對數據資源、人工智能算法和算力的依賴。
第二,傳播交互方式和格局發生變化。用自然語言代替復雜的交互操作,并且可以與應用場景及工作流程深度融合,學習使用的成本極低;用戶專注于提問題、需求和創意,就可以快速地擴展知識視野、尋求解決方案、運用高階內容生產技能;并且AIGC處理、分析、生成內容的效率遠高于人類,可以大幅簡化工作流程,同時不斷積累數據和信息形成高價值的知識資本,這樣低成本高收益的內容生產方式具備極大的吸引力。這些特征讓ChatGPT僅用2個月就創造了用戶過億的新紀錄,呈現顯著的“流量虹吸效應”。而高度個性化的對話式交互方式,讓傳播從廣播式的開源傳播逐步轉變到以人工智能算法為中心的點對點閉源傳播,內容生產、傳播、應用、反饋的鏈條難以跟蹤和收集分析,呈現出顯著的“知識虹吸效應”。因此,全媒生產傳播體系從UGC、PGC向AIGC的發展,讓互聯網平臺的流量分配和內容價值分配面臨重新洗牌,形成“斷代式”的升級轉型,受眾將通過“用腳投票”催生新的超級平臺,淘汰缺乏AIGC技術支撐驅動的傳統平臺。
第三,內容應用和輿論影響發生變化。AIGC技術來臨之前,內容以人為主生產并服務于人,人接受了內容之后影響認知和行為進而影響現實世界的運行。而隨著AIGC技術的不斷成熟,人工智能不僅可以生產內容,內容的服務對象也從人擴充到了應用程序、機器人、生產設備,可以越過人類行為而直接在現實世界中形成生產力和影響力。ChatGPT的GPT-4大模型驅動的最新實驗性產品AutoGPT便展示了這樣的能力,其可以根據一個目標要求,自行拆解任務、尋找資源、自問自答,自動執行并完成任務。因此,內容工具化的趨勢,讓全媒內容傳播體系不僅僅是面向人類精神和知識需求的傳播,更進化到了面向機器和物質生產需求的傳播。因此,全媒內容傳播與人的生產生活融合更加緊密,對人類行為和認知的影響更為深刻,而AIGC內容可以富有邏輯性且有效擴展用戶的知識面,運用合理得當可以消除偏激情緒讓輿論回歸理性,更具多樣性和包容性,但因其擬人化和高仿真特點,會使AIGC內容真實性的判斷難度加大,若成為不法分子生成和傳播有害信息的工具,則會導致虛假信息、有害內容空前泛濫,內容生產能力與智能化內容分發技術和社交機器人賬號集群等相結合,可多賬號、跨平臺、大規模發布內容,更加便捷地操控輿論。

第四,內容生產協作和利益分配發生變化。人工智能成為內容創作和知識工作生產工具甚至是生產力的一份子后,存儲、計算、分析、學習和生產的能力效率遠超過人類個體,過度依賴AIGC內容會改變目前開源互聯網上的內容構成,人類原創內容和知識發現會逐步減少,據國際新聞媒體協會預測,到2030年將有超過一半的在線內容由人工智能生產,其中絕大多數不會來自主流媒體或權威機構;人類專業技能、思維能力、思考方式會受到人工智能的深刻影響,會配合AIGC生成內容的模式而發生改變。比如,提示工程——如何適應AIGC原理并通過精準的自然語言描述與人工智能進行對話和提示,逐步成為原畫設計師、應用程序開發者需要掌握的技能;大模型的訓練依賴大量人類原創內容和知識以及來自人生產生活中產生的數據,此前人類免費共享在互聯網上的內容和數據通過流量廣告和知識付費等幾種方式進行變現和利益分配,AIGC技術的快速商業化將深刻改變這一方式,大模型的訓練利用了大量人類以往的知識積累和創作成果。一是擠占了人類開展內容生產的工作機會和收益空間,二是缺乏有效的確權技術和合理的利益分配機制,會引發版權、數據權益和隱私保護的問題,三是打擊人們協作、共享和原創的積極性,長期可能引發內容創意的荒漠化。

筑牢自身優勢,面向大模型提升競爭實力。主流媒體和傳統知識內容生產機構具備人工智能不可替代的直接面向現實世界進行內容采集、原創、探究、觸達的能力優勢,在數據密集型和知識密集型產業里,憑借權威主流全媒體內容原創生產能力處于AIGC時代內容生產傳播新格局的上游,處于現實世界數字化內容生產源頭的有利地位。應融合數字化技術不斷加強議題發現與策劃能力、調查研究能力、垂直領域專業知識與高質量原創內容供給能力、優質可信內容的甄別與判斷能力。
加強基礎建設,擴大技術創新源頭供給。為確保主流媒體與國外同行、商業平臺同臺競爭的“核心競爭力”,迫切需要面向主流大模型加強基礎研究與建設,從源頭和底層把握關鍵技術,解決應用基礎領域的“卡脖子”問題。一是在關鍵領域進一步整合權威、優質、可信的數據資源,形成面向大模型的高標準、安全、可控的訓練數據供給;二是形成AI導師機制,集中主流媒體和權威內容機構專家形成大模型人類專家訓練團隊,為AIGC大模型人類反饋強化學習和審查提供協同工作機制;三是聚焦思想宣傳、文化教育、科技創新三大關鍵領域形成代表我國主流價值觀和意識形態的自主可控的大模型及AIGC生態。
建立安全防線,構建全媒體傳播內容安全管理體系。對AIGC形成價值觀和意識形態認知的技術邏輯和應用邏輯開展研究,在技術手段與管理機制方面發力:一是在關鍵領域加強AIGC內容的甄別與鑒偽技術手段;二是加強內容追溯技術的研究,面向全媒體內容生產傳播各環節完善以人為主體的內容終審負責制度;三是建立面向大模型的訓練數據集生產管理標準,研發數據集安全審核技術和評估標準;四是研究面向大模型訓練、調優、動態學習全過程的安全審核技術,建立全流程安全評估管理體系;五是加強對海外大模型應用的管理,豐富安全監測與干預手段,尋求面向海外大模型加強我國主流內容供給和傳播影響力的渠道。
探索權益機制,形成人機協同可持續發展的內容生態。人工智能成為新的內容生產力后,對新的生產關系與權益分配機制構建提出了迫切需求,OpenAI在聲明中說:“我們希望就三個關鍵問題進行全球對話:如何管理這些系統,如何公平分配它們產生的利益,以及如何公平分享使用權。”形成融合AIGC、UGC、PGC等模式的新型生產協同與利益分配的流程和管理方式,是發展可信安全可控人工智能的前提條件。探索權益機制,應從以下幾方面入手:一是更新內容行業人才能力體系,提升人工智能運用能力和數字化素養,強化發現需求、發現問題、綜合判斷和調查研究能力;二是優化內容生產技術流程和管理機制,以AIGC技術的上游和下游的特點來分別設計責任和權益機制,以面向人類受眾和面向機器或算法的兩類內容生產類型進行新型全媒傳播體系的構建;三是加強全媒體生產對數據資源的挖掘利用,充分發揮合成數據作為人工智能融合基礎載體的巨大價值,壯大我國發展人工智能的數據要素優勢;四是加強AIGC內容識別審核鑒定技術、面向大模型的合成數據生產和隱私計算技術、數據與模型算法相融合的確權、知識產權保護與收益分配技術和機制的研究與探索,形成人機共融、共創、共生的全媒體生產傳播格局。
綜上所述,人工智能為代表的數字技術的發展是一把雙刃劍,對全媒體生產傳播體系服務人類社會的進步與發展不僅帶來積極的作用,更需要關注的是新生產力變革若沒有相應新型生產關系和制度配套,可能引發的社會風險和對人類文明發展的威脅,面向智能化時代的來臨,更需要秉持我國以人為本的發展理念,堅持如下四個原則:一是以實為本、數實融合原則。要防止形式大于內容信息價值,防止內容信息偏離現實世界,防止數字生產力脫離實體經濟生產力。二是以和為本、凝聚共識原則。防止信息繭房、思維繭房操控認知與意識形態,防止片面信息放大引發焦慮矛盾與撕裂,防止垃圾信息泛濫增加治理與決策成本。三是以人為本、人機共生原則。防止人類創造能力發展被壓制導致文化與內容荒漠化,防止用戶隱私泄露導致的安全風險,防止用戶多渠道交互違規行為更加隱蔽讓監管難度不斷加大。四是以可持續發展為本,安全共創原則。防止數據濫用導致數字資產流失,防止確權與溯源缺失導致知識產權難以有效保護,防止沒有合理價值分配導致內容生態無法可持續發展。
面對AIGC的影響和挑戰,我們要抓緊布局以權威安全可信的數據資源、大規模預訓練模型和大規模超級算力構成的數字中國戰略性公共基礎設施,為AIGC時代全媒體生產傳播體系建設和智能互聯網經濟發展提供土壤,擁抱有中國特色的人工智能新時代。
作者系新華社媒體融合生產技術與系統國家重點實驗室5G融媒體事業部副主任
【編輯:沈金萍】