孫 暢
(山西應用科技學院,山西 太原 030062)
人工智能(Artificial Intelligence,AI)是當今數字時代的關鍵驅動力之一,其在新聞制播領域的應用正日益引起廣泛關注。AI 技術提高了新聞生產效率,為媒體行業帶來了個性化內容推送和創新的可能性[1]。本文旨在深入研究人工智能在新聞領域的應用,探討自動化寫作、自然語言處理、AI 語音合成以及深度遷移學習等技術如何改變新聞傳播方式,為未來的媒體發展提供有益的見解。
人工智能是計算機科學領域的分支,旨在使計算機系統具備類似人類智能的能力。其基本概念包括機器學習(即計算機通過數據學習改進執行任務的能力)和深度學習(一種模擬人類大腦神經網絡的技術)[2]。人工智能技術誕生于1956 年。直到20 世紀末,隨著計算能力的增強和大數據的普及,人工智能技術才取得顯著的進展。深度學習、卷積神經網絡及循環神經網絡等技術的崛起,推動了人工智能技術的快速發展,使其在自然語言處理、計算機視覺及自動化駕駛等領域取得了突破。今天人工智能技術已經廣泛應用于醫療保健、金融、交通及媒體等各個領域,成為現代科技和社會發展的關鍵推動力。
人工智能的關鍵技術包括深度學習(Deep Learning,DL)、人工智能生產內容(Artificial Intelligence Generated Content,AIGC)、自然語言處理以及AI 語言合成等[3]。深度學習技術模仿人類大腦的神經網絡結構,用于訓練計算機從大量數據中學習和提取模式。目前,深度學習技術已進入升級優化階段,圖像分類、機器翻譯等多類感知任務準確率大幅度提升,強化學習、遷移學習等新學習方法發展迅速。基于深度學習理論的優化技術發展迅速。GPT-3 等模型的發展,推動視覺處理、閱讀理解等任務處理能力提升。虛擬助手、多語種翻譯等智能應用進入規模化應用階段。隨著人工智能越來越多地被應用于內容創作領域,人工智能生產內容的概念悄然興起。從技術和實現功能角度來看,AIGC 可分為智能數字內容孿生、智能數字內容編輯及智能內容數字創作3 個方面。AIGC 被廣泛應用于三維重構、音頻修復、語音合成、視覺描述、摘要生成、數字人、智能作畫及短片創作等領域。自然語言處理(Natural Language Processing,NLP)是計算機科學、人工智能、語言學關注計算機與人類(自然)語言之間相互作用的領域,支持聊天機器人、語義分析及情感分析等應用。AI 語言合成技術使計算機能夠將文本轉化為逼真的語音,廣泛用于語音助手、有聲讀物等領域。
人工智能生產內容與傳媒行業的融合應用不斷升級,AIGC 作為全新的內容生產方式,全面賦能傳媒行業的內容生產,推動新聞行業的制作升級[4]。比如,寫稿機器人、采訪助手、視頻字幕生產、語音播報、視頻集錦及人工智能合成主播等,助力新聞采集、編輯、播報的轉型升級。
在新聞采編環節,通過語音識別技術,可將錄音語音轉換成文字,提升新聞編輯的時效性。例如,2022 年冬奧會期間,科大訊飛智能錄音筆助力新聞記者進行跨語種語音轉寫,提升了新聞記者的采訪效率。人工智能基于算法自動編寫新聞,能夠實現智能新聞寫作。以騰訊寫作機器人Dreamwriter 為例,它是一套基于數據和算法的智能寫作輔助系統,每年可生產30 萬篇作品,助力新聞生產,通過視頻字幕生成、視頻錦集、視頻拆條及視頻超分等實現視頻智能化剪輯。2020 年全國兩會期間,人民日報社通過智能云剪輯師完成新聞節目的制作工作,如自動匹配字幕、人物實時追蹤、畫面抖動修復及橫屏轉豎屏等技術,實現了兩會新聞視頻的快速生成。
在新聞傳播環節,AIGC 主要應用于AI 合成主播新聞播報。AI 合成主播實現了實時新聞語言與人物動畫的完美融合,輸入新聞文本內容,可自動生成AI合成主播新聞視頻,并實現AI合成主播表情、動作的高度擬人化。當前,AI 合成主播的應用領域不斷拓展,新華社、中央廣播電視總臺、人民日報、央視頻等紛紛推出AI 合成主播,如新小微、新小浩、小C 及王冠等。AI 合成主播在常規新聞播報領域的應用逐漸成熟,并不斷拓展新的應用領域,如多語種新聞播報和手語播報[5]。2022 年冬奧會期間,央視頻AI 手語主播“聆語”亮相冬奧會,憑借手語準確、清晰易懂等優點深受大家喜愛。“聆語”具備唇動、面部表情、肢體動作及手指動作等內容生產功能,是2D 形象向3D 形象的重要轉變,在冬奧會期間完成手語手勢2 000 個,服務人次超216 萬次。
自然語言處理(NLP)在新聞制播領域的應用范圍廣泛,利用計算機算法和語言學知識,使計算機能夠理解、處理和生成人類語言的文本[6]。超大預訓練模型的發展,推動了NLP 技術的新發展。自2020 年OpenAI 公司推出GPT-3 之后,谷歌、華為、百度、中科院及阿里巴巴等紛紛推出超大規模預訓練模型,如Switch Transformer、MT-NLG、盤古及悟道2.0 等,在參數數量與訓練數據規模方面有顯著提升。超大預訓練模型從早期的學習文本數據向文本、圖像、語音3 種模態發展。自然語言處理在新聞制播中的具體應用如下。
(1)文本分析和信息提取。理解數字內容是對其編輯和修改的前提。計算機視覺中的圖片、視頻剪輯和自然語言處理中的生成,都需要語義理解技術。基于生成模型的可解耦語義學習技術能夠很好解決這一問題。在新聞制播領域,NLP 技術用于從大量文本數據中提取關鍵信息,幫助記者和編輯快速獲取新聞線索。例如,新聞機構使用NLP 算法來自動識別和提取關于特定主題或事件的關鍵詞和短語。
(2)情感分析。情感分析是一種NLP 應用,用于分析文本中的情感和情緒。在新聞制播中,情感分析可以幫助了解公眾對某個事件或話題的情感反應。例如,新聞網站使用情感分析應用來監測社交媒體上對其新聞報道的用戶反饋,以了解觀眾的情感傾向。
(3)文本生成。自動化文本生成是NLP 的一個重要應用,用于生成新聞摘要、報道和新聞稿。以2023 年6 月拓爾思發布的“拓天大模型”為例,其主要功能是內容生產智能助手,基于拓爾思自有的超1 000億互聯網媒體資訊數據、超100億官媒數據、14 大類知識標引規范、12 000 多條知識標引規則作為專業訓練數據,具有內容生成、多輪對話、語義理解、跨模態交互、知識型搜索、邏輯推理、安全合規、數學計算、編程能力以及插件擴展十大基礎能力。其在新聞制播領域的應用,能夠極大提升新聞的生產效率。
AI 語言合成技術在新聞制播中的應用是將文本內容自動轉化為逼真的語音,提供聲音新聞、播報和實時信息。為新聞機構創造有聲新聞、播音員以及語音助手,改善用戶體驗。新聞應用和網站使用AI 語言合成技術來為用戶提供新聞文章的語音版本,使用戶可以在駕車、鍛煉或處理多任務時方便地獲取新聞信息。AI 語言合成技術還可用于創建個性化的語音新聞播報,根據用戶的興趣和時間表定制播報內容,提供更個性化的新聞服務。在新聞制播領域,AI 語言合成技術的典型應用是5G 智慧電臺AI 主播,通過語音合成和深度學習等技術,克隆出媲美真人主播播報能力的AI 主播,能夠智能抓取主流官方媒體新聞內容,并依托AI 語音合成技術將新聞文字內容轉換成音頻。5G 智慧電臺已有多位AI 新聞主播,如AI 主播慧琳、AI 主播智文、AI 主播慧嘉、AI 主播智云、AI 主播慧蕓及AI主播智凱等。
深度遷移學習在新聞制播中的應用涉及將已經訓練好的神經網絡模型遷移到新的任務或領域,以提高模型的性能。在新聞制播中,這項技術用于改進新聞推薦系統。通過將先前訓練好的模型用于用戶行為分析、內容推薦和個性化新聞策劃,新聞機構可以更準確地理解用戶興趣,提供相關、有針對性的新聞內容,提高用戶滿意度。這有助于增加用戶的參與度,提高新聞機構的品牌忠誠度,同時為廣告定位提供更有效的平臺。以黑龍江廣播電視臺“基于深度遷移學習的新聞個性化推薦系統”為例,該系統通過分析用戶的歷史行為數據,利用深度遷移學習技術學習用戶的興趣模式,從而為用戶精準推薦他們可能感興趣的新聞內容。系統運用自然語言處理技術,對新聞內容進行深度的語義分析,以更準確地把握用戶的興趣所在,有效地提高新聞傳播的效果,滿足用戶個性化的新聞需求。
本文探討了人工智能技術在新聞制播領域的應用,重點介紹了人工智能生產內容、自然語言處理、AI 語言合成技術及深度遷移學習等方面。通過研究發現,人工智能技術的應用可以提高新聞制播的效率和質量,同時能為用戶提供更加個性化的新聞服務,實現新聞制播的更高質量和更廣泛的影響。