【關鍵詞】圖像生成;廣告創意;自然語言處理
在數字化浪潮席卷全球的當下,廣告行業作為商業信息傳播的關鍵樞紐,正經歷著前所未有的深刻變革[1]。隨著市場競爭的日益白熱化,消費者每天接觸到海量的廣告信息,傳統廣告創意的吸引力逐漸減弱,廣告行業面臨著創意枯竭與效率瓶頸的雙重挑戰[2]。如何在短時間內產出新穎、吸睛且精準觸達目標受眾的廣告創意,成為廣告從業者亟待解決的難題。
傳統廣告創意的生成主要依賴于創意團隊的經驗和靈感,這種創作模式不僅耗時費力,而且難以保證創意的質量和效果。當前也出現了一些基于人工智能(Artificial Intelligence,AI)技術的廣告創意輔助工具,如智能文案生成器、圖像設計軟件等。然而,這些工具大多只能實現單一功能[3],難以滿足消費者和廣告主對廣告的多樣性和個性化需求。NLP與文本生成圖像技術在廣告行業的應用為廣告創意提供了新的契機。
NLP技術能夠理解和分析人類語言,實現文本的分類、情感分析、機器翻譯等功能,幫助廣告工作者編寫廣告文案。文本生成圖像技術則可以根據輸入的文本描述生成相應的圖像,大幅降低廣告創意的成本。本研究將這兩種技術有機融合構建智能廣告創意輔助系統,幫助廣告從業者快速理解客戶需求,生成多樣化的創意方案,并通過數據分析和用戶反饋不斷優化創意,從而提高廣告的傳播效果和商業價值。系統有效提升廣告創意的生產效率和質量,實現從廣告需求解析到創意生成的全流程自動化。
研究基于NLP與圖像生成技術設計了智能廣告創意輔助系統。系統包括廣告需求分析模塊和廣告創意生成模塊,主要構建了廣告需求解析器、廣告創意知識圖譜、可控文本生成模型和語義引導圖像合成網絡等功能模塊。
廣告需求解析器對輸入的廣告需求文本進行分詞、詞性標注、命名實體識別等預處理操作,將文本轉化為適合模型處理的格式后,導入到領域增強的BERT(Bidirectional Encoder Representations from Transformers)模型中,進行廣告需求的深度理解和精確標注,最終輸出每個維度的語義標注結果;廣告創意知識圖譜采用了實體抽取、關系抽取、語義標注等技術,對多源數據進行整合和標準化處理。圖譜包含廣告學理論、消費者行為數據、圖像風格特征等多方面知識,實現廣告需求與創意之間的智能映射;可控文本生成模型基于GPT4o進行改進,模型根據廣告需求解析模塊輸出的語義標注結果,確定廣告文案的主題、風格和目標受眾,實現多維度文案生成;語義引導圖像合成網絡根據廣告需求解析器處理后的信息合成廣告圖像,滿足廣告用戶個性化要求。
系統架構主要分為數據層、數據庫層、技術支撐層和應用層,具體架構如圖1所示。

廣告需求分析模塊包括廣告需求解析器和廣告創意知識圖譜。廣告需求解析器將識別輸入文本,經人工智能模型處理后輸出每個維度的語義標注結果。廣告創意知識圖譜涵蓋廣告創意領域的概念、關系和屬性等多方面知識,為系統提供信息支持。
(一)廣告需求解析器
廣告需求解析器對輸入的廣告需求文本進行分詞、詞性標注、命名實體識別等預處理操作,將文本轉化為適合模型處理的格式。然后,將預處理后的文本輸入到領域增強的BERT模型中,對廣告需求進行深度理解和精確標注[4]。廣告需求涵蓋品牌定位、產品賣點、目標人群、傳播渠道、廣告風格、預算限制、時間要求等關鍵維度,每個維度都蘊含著豐富的語義信息。這些信息經過領域增強的BERT模型處理后,輸出每個維度的語義標注結果。標注結果以向量的形式表示,內含豐富的語義信息,為創意生成系統提供準確的需求描述和數據支持。
廣告需求解析器引入大量廣告領域的專業語料庫,包括行業報告、經典廣告案例、市場調研報告等,對預訓練的BERT模型進行微調,使其能夠更好地捕捉廣告領域的專業術語和語義特征。領域增強的BERT模型還引入了注意力機制,使得廣告需求解析器在處理文本時,自動聚焦于這些關鍵詞匯及其上下文,挖掘它們之間的語義關聯,從而更準確地理解客戶的創意意圖。模型通過注意力機制,將文本關鍵信息緊密聯系起來,為后續的創意生成提供準確的語義指導。
(二)廣告創意動態知識圖譜
為了實現廣告需求與創意之間的智能映射,本研究整合多源數據,構建了一個龐大而復雜的廣告創意知識圖譜。該知識圖譜采用了實體抽取、關系抽取、語義標注等技術,對多源數據進行整合和標準化處理。實體抽取技術能夠從文本和圖像數據中提取出品牌、產品、消費者群體、廣告風格等實體;關系抽取技術則能夠識別實體之間的語義關系;語義標注技術可以為實體和關系賦予明確的語義標簽,使其能夠被計算機理解和處理。該廣告創意知識圖譜包含廣告學理論、消費者行為數據、圖像風格特征等多方面知識,涵蓋了廣告創意領域的各種概念、關系和屬性。
廣告學理論:AIDA(AttentionInterestDesireAction)模型作為經典的廣告效果模型。在知識圖譜中,AIDA描述了消費者從注意廣告到產生購買行為的心理過程。模型的各個階段被抽象為實體節點,并與相關的廣告策略、創意元素建立起關聯。通過這種方式,知識圖譜能夠為廣告創意的生成提供理論指導,確保創意符合廣告學的基本原理。
消費者行為數據:廣告創意動態知識圖譜整合了消費者的年齡、性別、地域、消費偏好、購買行為等多維度信息。通過對這些數據的分析和挖掘,能夠建立起消費者特征與廣告創意之間的關聯。這些關聯信息被融入知識圖譜中,使得智能廣告創意輔助系統能夠根據目標人群的特征生成廣告創意。
圖像風格特征:廣告創意動態知識圖譜通過卷積神經網絡提取圖像的風格特征,將其轉化為特征向量,并與知識圖譜中的其他實體節點建立關聯。當系統接收到特定的廣告風格需求時,能夠通過知識圖譜快速檢索到對應的圖像風格特征,為語義引導圖像合成提供風格參考。
廣告創意生成模塊主要包括可控文本生成模型和語義引導圖像合成網絡。可控文本生成模型能夠根據語義標注結果生成多維度文案,語義引導圖像合成網絡可以提取廣告的關鍵信息合成符合用戶需求的廣告圖案。
(一)可控文本生成模型
智能廣告創意輔助系統在GPT4o的基礎上改進可控文本生成模型,以提高模型在廣告文案生成任務中的可控性和適應性。可控文本生成模型引入了廣告文案評估指標作為生成約束,這些指標涵蓋情感傾向、記憶點強度、合規性檢測等多個維度。其中,情感傾向指標用于確保廣告文案能夠傳達出積極、正面的情感,與品牌形象和目標受眾的心理需求相契合;記憶點強度指標通過評估文案的獨特性、簡潔性和易記性,確保廣告文案能夠在消費者心中留下深刻印象;合規性檢測指標則用于確保廣告文案符合相關法律法規和行業規范,避免出現虛假宣傳、侵權等問題[5]。
在廣告創意生成過程中,可控文本生成模型根據廣告需求解析模塊輸出的語義標注結果,確定廣告文案的主題、風格和目標受眾。然后,將這些信息作為條件輸入到改進后的可控文本生成模型中,模型在生成文本時,會根據預設的評估指標進行自我約束和優化,最終實現“標題+正文+標語”的多維度文案生成[6]。
(二)語義引導圖像合成網絡
語義引導圖像合成網絡主要包括風格遷移適配器、元素智能布局功能和動態光影引擎。用戶在系統中輸入廣告需求文本,廣告需求分析模塊將對文本進行分析,提取出廣告的主題、產品信息、目標受眾和風格要求等關鍵信息。這些信息將被輸入語義引導圖像合成網絡,網絡根據輸入信息,通過風格遷移適配器選擇合適的廣告風格,利用元素智能布局功能和動態光影引擎優化廣告元素的構圖,生成逼真的光影效果,最終合成出符合用戶需求的高質量廣告圖像,滿足廣告用戶個性化要求[7]。
風格遷移適配器:基于深度學習的圖像風格遷移算法,通過提取源圖像的風格特征,并將其遷移到生成的廣告圖像中,實現圖像風格的轉換。語義引導圖像合成網絡包含極簡風、賽博朋克、國潮等常見的廣告風格,廣告用戶可根據需求一鍵切換圖像風格[8]。
元素智能布局功能:基于對象檢測算法和Transformer的序列生成算法,實現了廣告圖像中各種元素的智能布局。對象檢測算法能夠快速準確地檢測出廣告文本、產品圖片、裝飾元素等對象,并提取它們的位置、大小和類別信息;Transformer則根據這些信息,通過序列生成的方式優化廣告元素的布局。
動態光影引擎:動態光影引擎結合了物理光照模型和藝術渲染風格,為廣告圖像生成逼真的光影效果和獨特的藝術風格。物理光照模型基于光學原理,模擬光線在物體表面的反射、折射和散射等現象,使生成的圖像具有真實的光影效果。藝術渲染風格則借鑒了繪畫、攝影等藝術領域的表現手法,為圖像添加獨特的色彩、紋理和質感,增強圖像的藝術感染力。
在電商領域,商品詳情頁的廣告素材對產品銷售起著至關重要的作用。本研究設計的智能廣告創意輔助系統針對電商廣告的特點和需求,實現了廣告素材的自動化生成,大幅提升了創意產出效率。
系統能夠自動分析產品的詳細信息,包括產品特征、功能優勢、使用場景等,結合市場調研數據和目標受眾的消費偏好,生成包含產品特征標注、場景化配圖、促銷信息的多版本廣告素材。在產品特征標注方面,系統運用NLP將產品的技術參數和功能特點轉化為通俗易懂、富有吸引力的文案描述,使消費者能夠快速了解產品的價值。
智能廣告創意輔助系統能夠通過語義引導圖像合成技術,根據產品的使用場景描述,生成與之匹配的逼真圖像。例如,對于一款戶外運動鞋,系統會生成運動員在跑步、登山、徒步等不同戶外場景中穿著該款運動鞋的圖片,讓消費者能夠直觀感受到產品的實際使用效果。同時,系統將實時關注市場動態和競爭對手的促銷活動,結合商家的促銷策略,生成具有吸引力的促銷文案和視覺元素,實現商品的智能廣告文案、圖片生成便捷化。
在當今數字化浪潮席卷各行業的大背景下,廣告行業也面臨著前所未有的轉型需求。本研究聚焦于傳統廣告創意過程中效率低下、創意質量參差不齊等難題,基于NLP與圖像生成技術設計了智能廣告創意輔助系統。系統通過對自然語言表達的廣告需求進行精準解析,利用NLP算法挖掘其中的關鍵要素與潛在邏輯,進而借助圖像生成技術,將抽象的創意概念轉化為直觀、生動的視覺圖像。基于NLP與圖像生成技術的智能廣告創意輔助系統能夠在短時間內為廣告策劃者提供豐富多樣的創意方案,為廣告行業的數字化轉型提供了強有力的技術支撐。
隨著人工智能技術的發展和相關法律法規的完善,廣告創意生成也面臨著版權歸屬、責任界定等法律問題。研究接下來將聚焦于以上問題,明確人工智能生成的廣告文案和圖像的版權歸屬于模型的開發者、使用該模型的廣告公司還是客戶,幫助用戶在出現侵權糾紛時明確各方的責任界定,避免法律風險,為廣告行業的創新發展提供法律保障。
參考文獻:
[1] 姚元嘯.基于自然語言處理(NLP)大數據分析的用戶人工智能廣告態度研究[D].上海:上海外國語大學,2024.
[2] 加央措赤.人工智能與大數據在廣電內容生產與傳播中的應用研究[J].廣播電視網絡,2024(S1):2325.
[3] 蘇東明.AIGC技術發展及在傳媒領域應用[J].廣播電視網絡,2024,31(11):3234.
[4] 秦文鍇.基于BERT模型與序貫三支決策的軟性廣告判別模型[D].上海:上海師范大學,2024.
[5] 倪亞暉.基于音視頻NLP識別技術、網絡存證技術的廣告智慧監管系統運用.南京:江蘇省質量技術監督信息中心,20220121.
[6] 曾海文.大數據背景下的電商產品數據分析探討[J].現代企業文化,2024(08):4951.
[7] 孟瑞軍.基于Spark的實時廣告推薦系統研究[J].信息與電腦(理論版),2023,35(09):6062.
[8] 柴林麟.大數據時代下互聯網廣告及計算廣告學的應用研究[J].信息與電腦(理論版),2015(16):2931+56.