

摘要:ChatGPT、Sora等大模型的推出,標志著生成式人工智能已成為AI研究領域的前沿熱點。AIGC在傳媒行業的應用涵蓋內容生成、信息推薦、信息審核等多個媒體傳播環節。文章在分析AIGC模型基礎網絡——包括Transformer模型、GAN模型、擴散模型及混合專家模型——的基礎上,介紹了當前具有典型代表性的若干系列大語言模型。進一步結合傳媒行業的典型應用場景,探討了AIGC在相關領域的應用及其對傳媒行業的影響。最后,分析了AIGC給傳媒行業帶來的挑戰,并展望了未來的發展方向。
關鍵詞:生成式人工智能;大語言模型;傳媒行業;多模態;機遇與挑戰
中圖分類號:TP399文獻標識碼:A
文章編號:1009-3044(2025)15-0016-04
0引言
生成式人工智能(AIGC)是一種以生成新內容為核心的人工智能技術[1],正逐漸改變內容生產的方式。與專業生成內容(PGC)和用戶生成內容(UGC)相比,AIGC為媒體內容生產提供了新的可能性,并與之互補[2-3]。大型預訓練語言模型,特別是多模態學習與大型語言模型(LLM)的結合,推動了AIGC的快速發展[4-8]。AIGC技術已廣泛應用于傳媒行業的各個環節,深刻影響傳媒行業的多個方面[9]。文獻[10]以ChatGPT為切入點,研究了生成式AI對傳媒行業的影響;文獻[11-12]則以Sora為切入點,探討視頻類生成AI對新聞專業意識、新聞創作及新聞創新的影響。本文將深入分析AIGC技術基礎,并探討其在傳媒行業的應用、影響及未來發展趨勢。
1AIGC技術與大語言模型
其是深度學習算法的進步AIGC技術的快速發展得益于人工智能算法。不同的神經網絡結構構,尤成了深度學習算法的基礎。研究人員基于這些基礎模型架構,結合海量數據訓練出多種預訓練大語言模型,應用領域的專家則根據具體需求進行調整,構建相應的應用服務。
如圖1所示,AIGC在傳媒行業的應用涉及基礎模型架構、大語言模型、應用服務及模型應用等多個層次。AIGC的基礎模型架構包括CNN、RNN、GAN、Transformer架構和擴散模型等,以及綜合這些模型的MoE架構。大語言模型層以基礎模型為基礎,通過通用數據訓練,具備解決通用應用領域問題的能力。但針對具體應用領域問題,需要通過領域微調或指令微調滿足特定需求,同時提供相應的領域功能服務。領域應用則綜合多種功能服務以滿足客戶的終端需求。
1.1AIGC的基礎網絡架構
型包括AIGCTransformer基礎網絡架構種類繁多、擴散模型、生成對抗網絡等,典型的生成式模。
Transformer[13]架構由谷歌于2017年提出,該模型通過引入自注意力和交叉注意力機制,實現了在無監督環境下的自學習,重點學習輸入序列內部、輸入序列與輸出序列之間以及輸出序列內部token間的相關性,并通過多頭注意力機制準確捕捉單詞間的多重關系和細微差別。
DiffusionModel[14]是一種基于熵增原理的生成模型,分為正向擴散過程和反向逆擴散過程。正向擴散過程是向圖像逐步添加噪聲的過程,即從無到有,直到生成純噪聲圖像;反向逆擴散過程則通過學習如何從噪聲圖像恢復到原始圖像。
生成對抗網絡(GAN)[15]是一種基于生成器與判別器之間對抗博弈進行訓練的深度學習模型,由IanGoodfellow于2014年提出。生成器負責生成新的數據樣本以欺騙判別器,判別器則負責區分樣本是來自訓練數據還是生成器產生。
MOE[16](MixtureofExperts,混合專家架構)實現了對多個專家系統的稀疏連接。大型語言模型通過添加MOE層,結合多個專家模型的結果,以提升模型性能。MOE層由多個專家模型和一個門控(gate)網絡組成。
各種生成架構各具優缺點,詳見表1。
1.2預訓練大語言模型
預訓練大語言模型是基于一種或多種網絡架構,利用海量數據集經過預訓練而獲得的具備內容生成能力的模型。此類模型通常以對話形式生成用戶所需內容,適用于多種任務。各大語言模型比較如表2所示。在傳媒領域,應用較為廣泛的主要模型包括以下幾種。
1)GPT系列。由OpenAI推出的生成式語言模型系列,目前影響力最大,包含多個版本:GPT-1、GPT-2、GPT-3及GPT-4等。
2)LLaMA系列。MetaAI公司發布的系列大型語言模型。2023年7月發布了開源版Llama2,2024年4月19日推出了MetaLlama3系列。
3)Gemini。GoogleDeepMind于2023年12月6日發布的多模態大模型,能同時接受文本、圖像、音頻、視頻和代碼五種類型輸入,具備理解并生成主流編程語言(如Python、Java、C++)高質量代碼的能力,并配備全面的安全性評估機制。
4)Sora。由OpenAI開發的基于文本描述生成視頻的語言模型。Sora利用GPT的文本生成能力,將用戶簡短提示轉化成更詳細的標題,指導視頻生成過程,實現對用戶指示的精確跟隨,產出高質量視頻內容。
5)文心,核心技術為創新的知識增強技術(ERNIE)。百度自主研發的產業級知識增。文心經歷了從單模態到跨模態、從通用基礎大模型到跨領域、跨行業的持續創新突破。
6)GLM大模型。由清華大學KEG實驗室推出的預訓練模型,融合了BERT和GPT的優勢,采用基于自回歸的空白填充策略改進GPT模型,兼具多種預訓練方式的優點。
2AIGC與傳媒行業
2.1AIGC在傳媒行業中的應用
AIGC的應用涉及傳媒行業的各個方面,可以輔助進行主題策劃、內容采寫等;可以與數字虛擬人技術、智能語音合成技術組合,形成人機自然交互的應用;可以與AIGC的繪圖、視頻、編劇等技術結合,形成內容創作的新方法;也可以根據用戶交互記錄,完成內容推薦;還可以根據相關的法律法規對內容進行安全性審核。AIGC在傳媒行業的不同子領域中均得到了廣泛應用。
2.1.1AIGC在新聞媒體中的應用
在新聞媒體中,AIGC通過由用戶給定特殊的提示詞來形成特定的新聞視角,根據預設的新聞模板和實時的網絡數據自動生成新聞稿件。AIGC的圖像生成能力及多模態下的文本轉圖像技術可以自動地為新聞稿件配上相關插圖,從而豐富整個新聞內容。此外,AIGC能夠基于數據分析自動生成社交媒體內容,包括發帖和互動回復,從而實時響應用戶需求,提高用戶參與度。AIGC還可以為視頻內容實時生成字幕,并提供多語言翻譯,使得跨語言傳播更便捷。
上海廣播電視臺的智媒魔方Scube是較早的AIGC應用,集成了多模態素材識別,支持自動生成稿件、視頻自動剪輯等AI能力。在2024年全國兩會報道中,該系統所提供的現場實況內容整理、新媒體端內容制作播出、新聞稿件生成、現場實況內容翻譯、指定視頻片段提取、視頻字幕生成等全套新聞制播服務能力,節約了新聞報道的前后期團隊搜集處理素材所需的時間和制作成本。中國移動北京公司與人民日報合作建設的“AIGC編輯部”于2024年兩會前夕上線,也為快速的兩會報道提供支持。
AIGC技術在新聞內容審核方面同樣發揮著重要作用。例如,通過語音識別和語義理解技術,AIGC技術可以檢測和識別多模態內容中的敏感信息和暴力內容,從而對違規的文本、圖片以及視頻進行標記和刪除。人民日報社的AIGC-X是我國首個AIGC內容檢測工具,具備檢測AI技術生成的假新聞、內容抄襲以及垃圾郵件的能力。騰訊云的AI審核系統被廣泛應用于騰訊旗下的新聞媒體及其他內容平臺。
2.1.2AIGC在影視制作中的應用
從影視工業化的視角來看,AIGC確實能夠憑借強大的內容生產效率為影視工業帶來“質變級”的降本增效。在劇本創作和故事生成階段,AIGC主要運用其文本生成功能,生成具有一定參考價值的劇本段落甚至完整劇本,特別是在情節演進和角色對話生成方面為創作者提供一定便利。據報道,漫威在制作《洛基》第二季時,利用AIGC工具輔助編劇團隊進行創意啟發。在內容創作階段,AIGC可以完成從劇本到分鏡的自動拆解與生成,從而縮短劇集的籌備周期。《三星堆:未來啟示錄》是由博納影業聯合抖音出品的短劇,該短劇是通過借助即夢AI平臺,利用其文生圖、文生視頻、圖生視頻等功能創作完成的。在角色生成階段,AIGC可以根據數據和大量訓練,依據給定的文本描述、圖片和視頻等智能地生成包括角色動作、場景布置和特效效果等的畫面。在《指環王》系列重制過程中,特效團隊利用AIGC來輔助生成一些宏大場景的特效草圖。比如對于剛鐸城的戰爭場景,AIGC根據已有的建筑模型、地形數據和戰爭元素(如士兵、攻城器械等),生成了特效場景的初步框架。
AIGC還可以幫助簡化電影和視頻游戲的音軌制作過程。它會利用AI生成算法,在用戶的提示下,幫助用戶創作各種音樂流派的音樂。在電影《星際穿越》的配樂制作過程中,AIGC幫助作曲家確定音樂風格。制作團隊將電影的主題、場景特點等信息輸入AIGC,AIGC會生成一些音樂風格建議,如在穿越蟲洞時應該使用宏大、帶有科幻感的管弦樂風格,在主角回憶家人時可以采用抒情、帶有弦樂和鋼琴交織的風格。這些建議為作曲家漢斯·季默提供了靈感,幫助他更好地把握音樂與電影情節的契合度,創作出令人震撼的配樂。
2.1.3AIGC在廣播電視中的應用
近兩年,虛擬主播成為廣電領域的熱門話題。AIGC技術通過對大量人類主播的視頻和音頻數據進行標注、分析與學習,生成具有相同音色語音及流暢動作的虛擬主播,展現可替代真人主播的信息傳達效果。虛擬主播可以隨時隨地出現在直播、電視節目等各種媒體中,不受時間和空間限制,為人們提供有趣、實用、便捷的新型媒體形象。較為成熟的虛擬主播包括中央廣播電視總臺的“小小撒”和“AI王冠”,北京廣播電視臺的“時間小妮”、東方衛視的“申雅”、浙江衛視的“谷小雨”等。虛擬人主播能夠實時進行新聞播報和信息傳遞,24小時不間斷工作,在重大新聞事件和緊急報道中發揮重要作用。
奈飛(Netflix)等流媒體平臺廣泛收集用戶的觀看歷史、評分、瀏覽行為等數據,并應用AIGC技術進行個性化推薦。喜馬拉雅等音頻廣播平臺同樣通過分析用戶收聽的廣播節目類型(如歷史故事、有聲小說等)、收聽時長、收聽時間段等數據,利用AIGC技術進行廣播節目推薦。
2.2AIGC對傳媒行業的影響
2.2.1AIGC顛覆產品創新基本模式
就內容生產方式而言,AIGC是繼PGC(專業生產內容)、UGC(用戶生產內容)和PUGC(專業用戶生產內容)之后的一種全新方式。AIGC在提示詞指導下,融合上下文語義理解,能生成更加符合人類需求甚至更具創意的內容。人工智能正在將軟件從信息檢索、集成與呈現的工具,轉變為內容的合作創造者甚至獨立創造者,形成信息整合、知識生產和內容創作的新模式。AIGC使非專業創作者或缺乏特定技能的人員也能進行內容創作。如B站部分UP主利用AIGC生成視頻腳本、創意點子,甚至輔助制作特效,使更多人有機會參與內容創作。
相關內容并進行作答AIGC可以基于相關主題,加速將不同時空的信息堆疊,即時連接、搜索、整合,通過構筑新的上下文關系呈現在新的時空中,打破傳統新聞生產的線性模式,改變新聞的中心化生產方式。AIGC還可幫助內容生產者快速收集和整理信息,例如通過分析和篩選大量新聞源,提供有價值的線索和選題,大幅提升媒體生產效率。
2.2.2AIGC升級信息獲取主要方式
以關鍵詞為基礎的搜索引擎長期以來是用戶獲取信息的主要手段。以ChatGPT為代表的生成式大模型徹底顛覆了這一信息獲取方式。生成式大模型將大量知識存儲于參數化模型中,能夠直接根據用戶的問題或提示詞生成答案,更便捷地滿足用戶信息需求,但因返回信息為模型生成,可能存在虛假、陳舊或錯誤信息。
基于AIGC技術的即時互動功能,用戶可與AI進行對話,實時獲取所需信息。這種互動式信息獲取方式不僅提升了信息獲取速度,還增強了用戶與信息的互動性。精準推送相關內容AIGC技術還可以通過深度挖掘用戶行為數據。媒體平臺通過AI算法將用戶的,瀏覽歷史、閱讀習慣、點贊評論等行為數據與興趣偏好相關聯,從而推薦最符合用戶需求的內容。
2.2.3AIGC重構傳媒業底層運行邏輯
傳媒內容生產中“人”的主體性被弱化,人與技術形成共生關系,對人的能動性提出更高要求。人需主動在人機連接和交互過程中強化對技術的控制。AIGC的發展促使媒體內容價值需要重新評估。其能夠快速挖掘、分析和整合海量數據和信息,提取有價值的內容與知識,為傳媒行業提供更豐富的素材和更深入的見解。例如,財經媒體可利用AIGC分析大量財經數據和市場信息,生成專業的財經報道與投資建議。AIGC通過學習和模仿大量優秀作品,生成高質量內容,同時融入創新元素,推動內容創新和發展。
媒體內容生成在與人交互過程中,依據人需求和反饋即時完成并實時播報,不受其他主體限制,直接面向個體用戶進行信息傳播。該過程取消中介環節,大大縮短傳統媒體傳播層級,將信息傳播從中心輻射式、圈層式轉變為多節點網絡式傳播,實現去中心化傳播。
傳播AIGC,因此媒體的真實性和可靠性尤為重要使人人可參與媒體生產,并通過社交網絡。媒體從業人員將從傳統內容生產者逐步轉變為“內容審核者”,以保證媒體內容的準確性和質量。
2.2.4AIGC改變了傳媒從業人員需求
AIGC技術應用推動傳媒行業對技術人才需求大幅增加,為從業人員職業發展提供更多可能性和選擇。在AIGC時代,傳媒行業需要既懂傳媒業務又懂技術的復合型人才。傳媒從業人員需了解AIGC算法和模型,結合傳統傳媒業務支持,借助AIGC拓展創作領域,從而完成整個傳媒業務。
另一方面,隨著AIGC技術普及與應用,傳媒行業競爭愈發激烈。因AIGC使用成本持續降低,傳媒行業底層重復性工作將逐步由AIGC替代,人員必須不斷學習并掌握新技術和知識,以適應行業快速變化。能快速適應AIGC技術變革、不斷創新突破的人員將脫穎而出,獲得更多職業發展機會和更高薪酬待遇。
3AIGC帶來的挑戰
AIGC本身是一把“雙刃劍”。在生成大量高質量內容的同時,也帶來了大量虛假信息。大量研究正試圖通過LLM的自我糾錯機制來解決大模型的“幻覺”。但迄今為止,大模型仍無法保證其生成內容的正確性與真實性。另外,AIGC技術的普及可能導致內容生產門檻降低,市場上內容數量激增,但質量參差不齊,容易出現內容同質化現象。這將加劇市場競爭,影響內容的傳播效果和商業價值。而技術自身的局限與使用者的私利訴求產生“合謀”,可能污染輿論生態,對個體認知和社會輿論造成負面影響。
LLM背后是越來越多的數據為模型預訓練提供支持。人工智能模型對數據的日益依賴,導致人們擔憂:未來幾代計算機科學家將耗盡數據,無法進一步擴大和改進系統。同時,AIGC模型訓練數據中存在的偏見可能導致模型生成帶有偏見和歧視的內容。
此外,類似ChatGPT之類的聊天機器人在與人交互過程中收集大量隱私數據,AIGC在利用這些數據為用戶提供精準推送的同時,也可能用這些數據“綁架”用戶需求。如何保證數據安全,防止數據濫用,是AIGC面臨的另一個重要問題。現有法律法規可能無法完全適應AIGC技術發展,導致在內容生成、版權保護、數據隱私等方面存在法律空白或模糊地帶。這需要政府和相關部門加快立法進程,完善相關法律法規。
最后,模型開發人員很少公布其人工智能系統的能源開銷,導致研究人員對此過于樂觀估計。實際上,大模型的訓練和使用都需要消耗大量能源,而且不論從哪個角度看,AIGC中大模型訓練造成的能源開銷邊際效應已越來越小。
4結束語
面對洶涌而來的AIGC技術,我們需要理解并掌握技術本身,學會更好地駕馭和利用AIGC服務傳媒行業,同時盡量避免AIGC帶來的各種不利影響。LLM與Agent、RAG等相關技術的集成,將有助于解決復雜問題和領域特有的實時更新內容,成為未來該領域的重點發展方向之一。
生成式人工智能正在不斷影響并改變我們的生活,傳媒行業所關注的媒體生產、傳播、審核以及評估等諸多環節受到的影響尤為顯著,AIGC正從根本上改變傳媒行業的底層邏輯。AIGC媒體應用標準聯盟等組織將推動AIGC應用標準的制定與推廣,確保AIGC技術在傳媒行業的廣泛應用和規范化發展。
隨著AIGC技術的應用,數據安全問題將更加突出。行業將加強對數據安全的保護,防止數據泄露和濫用,維護社會穩定和公共安全。數據將成為傳媒新質生產力的核心要素,政策將推動數據資產化與產品化進程,拓展數字文化消費與應用場景,為傳媒產業升級注入新動能。
參考文獻:
[1]WUJY,GANWS,CHENZF,etal.AI-generatedcontent(AIGC):asurvey[EB/OL].[2024-05-30].https://arxiv.org/abs/2304.06632v1.
[2]TUZZ,WANGYL,BIRKBECKN,etal.UGC-VQA:bench?markingblindvideoqualityassessmentforusergeneratedcon?tent[J].IEEETransactionsonImageProcessing,2021(30):4449-4464.
[3]SUNW,MINXK,LUW,etal.AdeeplearningbasedNo referencequalityassessmentmodelforUGCvideos[C]//Pro?ceedingsofthe30thACMInternationalConferenceonMulti?media.Lisboa,Portugal:ACM,2022:856-865.
[4]HEYQ,LIUZY,CHENJY,etal.LLMsmeetmultimodalgenerationandediting:asurvey[EB/OL].[2024-05-30].https://arxiv.org/abs/2405.19334v2.
[5]ZHANGCS,ZHANGCN,ZHANGMC,etal.Text-to-imagediffusionmodelsingenerativeAI:asurvey[EB/OL].[2024-05-30].https://arxiv.org/abs/2303.07909v3.
[6]CROITORUFA,HONDRUV,IONESCURT,etal.Diffusionmodelsinvision:asurvey[J].IEEETransactionsonPatternAnalysisandMachineIntelligence,2023,45(9):10850-10869.
[7]SHIZF,PENGSD,XUYH,etal.Deepgenerativemodelson3Drepresentations:asurvey[EB/OL].[2024-05-30].https://arxiv.org/abs/2210.15663v3.
[8]ZHANGCS,ZHANGCN,ZHENGS,etal.Asurveyonaudiodiffusionmodels:texttospeechsynthesisandenhancementingenerativeAI[EB/OL].[2024-05-30].https://arxiv.org/abs/2303.13336v2.
[9]MASLEJN,FATTORINIL,PERRAULTR,etal.TheAIIndex2024AnnualReport[R].Stanford,CA:AIIndexSteeringCom?mittee,InstituteforHuman-CenteredAI,StanfordUniversity,2024.
[10]張銳,劉靖晗.以ChatGPT看生成式人工智能對傳媒業的影響[J].聲屏世界,2023(10):5-8.
[11]陳力丹,榮雪燕.從ChatGPT到Sora:生成式AI浪潮下強化新聞專業意識的再思考[J].新聞愛好者,2024(4):4-8.
[12]陳昌鳳.生成式人工智能與新聞傳播:實務賦能、理念挑戰與角色重塑[J].新聞界,2023(6):4-12.
[13]VASWANIA,SHAZEERN,PARMARN,etal.Attentionisallyouneed[J].AdvancesinNeuralInformationProcessingSystems,2017(30):5998-6008.
[14]HOJ,JAINA,ABBEELP.Denoisingdiffusionprobabilisticmodels[J].AdvancesinNeuralInformationProcessingSys?tems,2020(33):6840-6851.
[15]GOODFELLOWIJ,POUGET-ABADIEJ,MIRZAM,etal.Generativeadversarialnetworks[EB/OL].[2024-05-30].https://arxiv.org/abs/1406.2661v1.
[16]SHAZEERN,MIRHOSEINIA,MAZIARZK,etal.Outra?geouslylargeneuralnetworks:thesparsely-gatedmixture-of expertslayer[EB/OL].[2024-05-30].https://arxiv.org/abs/1701.06538v1.
【通聯編輯:唐一東】