封 寒
(江蘇省廣播電視總臺,江蘇 南京 210009)
當前,人工智能日益成為引領新一輪科技革命和產業變革的核心技術,在各個領域的應用場景不斷創新、落地,尤其ChatGPT 在2022 年11 月正式上線后火速出圈,GPT-4 在2023 年3 月上線再次引發全世界的關注。毋庸置疑,人工智能正在極大地改變人們既有的生產生活方式。
近年來,隨著智能語音、自然語言理解、大數據、人工智能(Artificial Intelligence,AI)算法等技術的不斷升級與日益成熟,廣播媒體與人工智能的深度融合助力內容生產流程的改革,為廣播媒體重塑了生產力、提高了工作效率。同時,廣播媒體各方面業務、產業也積極與人工智能多維互動、融合滲透,助力廣播媒體孕育更具智慧的新場景、新業態、新模式。而正在到來的人工智能生成內容(Artificial Intelligence Generated Content,AIGC)將成為新的生產力引擎,給媒體行業帶來新一輪的內容革命。
隨著媒體使用場景的改變和新技術的應用,當前社會已經悄然經歷了多種內容生產形式的迭代,如專業生產內容(Professional Generated Content,PGC)、用戶生產內容(User Generated Content,UGC)以及人工智能輔助內容生產(Artificial Intelligence User Generated Content,AIUGC)。人工智能正在參與內容生產的各個環節。人工智能技術的應用助力內容生產流程的升級改造,在使內容生產更加標準化的同時,極大地提升了內容生產效率。
在選題策劃階段,通過大數據的收集、分析與比對,可以幫助編輯快速判斷選題、確定輿論熱點,進行相關的內容策劃。在采訪與音頻資料的使用方面,語音識別技術尤其是語音聽寫和語音轉寫技術給音頻文件的處理帶來的極大便利。記者可邊采訪邊實時返回文本數據,對大型的音頻文件可實現文本快速轉換。
在內容編輯生產階段,一些智能化的應用可實現輔助內容生產的作用。2017 年,江蘇省廣播電視總臺(以下簡稱江蘇廣電)運用人工智能技術研發了一套AI 內容編譯系統,通過整合第三方語音識別技術和Unix 開源人工智能引擎,打造出符合廣播節目生產的人工智能系統。
智能語音技術在廣播行業運用較早,其智能語音合成技術可將文字轉化為自然流暢的人聲。語音克隆是語音合成技術的一個分支,通過采集需要的人聲語音數據,將其訓練成為一個語音合成的模型,就可以克隆出一個聲音。此技術可廣泛地用于聽書閱讀、新聞播報、語音導航等領域。2023 年,中央廣播電視總臺(以下簡稱中央臺)的云聽App 聯合中國之聲,組成“兩會報道融媒聯盟”,推出AI 主播團體IP“云小天團”創新兩會報道;2023 年,江蘇廣電大藍鯨App 與江蘇交通廣播網聯合推出了“鷹眼出行”融媒產品,其中路況智能語音播報是產品的一大特色,便于開車人在駕駛狀態直接收聽路況信息。
AI 虛擬人技術則更為復雜,在AI 技術的運用上涉及語音合成、語音識別、語意理解、圖像處理及虛擬形象驅動等技術,在呈現效果上也有更高的要求。廣東廣播電視臺粵聽App 針對大灣區Z 時代用戶布局元宇宙,在2022 年推出全球第一個粵語虛擬偶像“悅小滿”,并在粵聽App 開設虛擬電臺和直播節目。
廣播媒體對內容的審核要求是非常嚴格的。除了常態的廣播節目內容,還有大量的新媒體內容的產出。對于如此海量的內容,利用人工審核,需要花費很多的時間。人工智能技術的自然語言處理、圖像識別、聲紋識別等技術已經廣泛應用到內容審核中來。在人工智能技術的幫助下,經過深度學習的智能審核系統可實現對文本、圖片、語音及視頻中有問題的內容進行提示,再經過人工核準,使審核工作變得精準高效。遼寧廣播電視集團的北斗融媒客戶端,在其后端的全媒體制播云平臺云的AI智能化模塊中增加了智能審校等功能,極大地提高了內容審核的效率。
內容分發傳播運營的初期主要是由人工運營決定。隨著內容生產能力的提升,優質內容越來越多,用戶在面對海量的內容時,需要快速尋找自己可能感興趣的內容。在這一場景下,通過記錄用戶行為數據,以此為基礎構建用戶畫像特征,通過模型測算出用戶的興趣與偏好,從而把個性化內容智能分發給用戶,可呈現千人千面的效果。
智慧廣播是廣播與智慧化技術綜合運用的產物。智慧化技術包括人工智能、大數據、云計算、5G、區塊鏈等新技術,通過對傳統媒體采、編、播、審、存等業務流程場景的智慧化升級,實現廣播從內容生產到安全播出,從內容創新到產業轉型,從流程再造到資源重組的全方位的智能化戰略轉型,使廣播在內容、安全、傳播、服務及效率等方面實現全面提升。
以云聽App 為例,其以構建5G+4K/8K+AI 的戰略格局,打造“云聽AI 廣播”。該系統以AI 智能技術為基礎,以云聽海量的優質內容為支撐,將智能化的廣播播出系統與高品質的音頻內容結合,通過智能抓取、智能播報、智能編排、智能審核、AI 智能主持以及內容智能管理,可一鍵生成24 h 電臺節目,并實現用戶的區域化個性推送。
一些有條件的省級臺和地方臺也在一定程度上進行了智慧電臺的探索。2020 年,湖南廣播電視臺推出iMango 5G 智慧電臺項目,其利用大數據、云計算、人工智能、區塊鏈等技術作為其核心技術,人工智能在采編播所有環節都發揮作用,包括智能編排、智能審核及AI 虛擬主播等[1]。湖南廣播電視臺還建立了湖南第一個廣電行業地方標準《5G 智慧電臺系統技術要求》。2023 年,深圳廣播電臺首個5G智慧電臺在深愛聽App上線,全天24 h滾動播出,AI 主播全新上線,AI 智能系統實現數據信息的自動抓取、智能編排、智能審核、智能分發及智能播報,一鍵式自動化生成。
廣播媒體一直以來非常注重與聽眾的互動,從最早的書信往來到熱線電話再到短信、QQ、微信互動等,互動的媒介和形式在不斷變化。而現在,時間資源被各種應用爭搶和擠占,廣播互動要緊緊抓住廣播聲音特色,與語音聽寫、語音搜索、語音喚醒及語音合成等技術相結合,提升用戶的智能化互動體驗。
江蘇廣電大藍鯨App 在全國首創“大藍鯨live互動”功能,搭建了微播云系統管理平臺對互動數據進行管理。系統支持圖文音視頻全媒體形態的互動傳播,尤其創新智能語音互動模式,用戶發布語音在微播云系統通過語音識別技術將語音智能翻譯為文字,極大地提高了導播的審核效率。在互動語音的發布環節,系統實現了多渠道智能化發布。一方面,微播云管理后臺與廣播的制播系統實現打通,語音在審核通過后,篩選出的精華語音可直接發布到廣播節目中播放。另一方面,微播云管理后臺也將大藍鯨App 和江蘇廣電官方微信的后臺數據和參與通道打通,所有語音數據在審核后均可實現在兩端的同步發布。
北京廣播電視臺音頻客戶端聽聽FM 研發了“你好,小聽”廣播直播智能語音互動系統,通過“你好,小聽”語音喚醒,觸發用戶與傳統廣播之間的連接。用戶可使用自然語言與節目互動[2]。
隨著虛擬現實(Virtual Reality,VR)、AI 和5G 技術的發展和普及,廣播媒體正在通過融合傳播手段迎接“可視化廣播”時代的到來。“可視化廣播”不是做電視化的廣播,而是對原有廣播形態的擴展和補充,具有以下意義。首先,廣播為了提升影響力,需要不斷擴展傳播生態,要積極擁抱各類傳播平臺,而廣播媒體天生的直播屬性與大流量的視頻直播平臺可相融通;其次,廣播在產業和營銷上的擴展,也需要不斷創新業務模式,可視化廣播將互動與營銷深度捆綁,助力實現經營增量;再次,智能化的拍攝與導播設備也使廣播可視化更為輕量。新技術降低了可視化廣播的建設門檻。
中央臺中國之聲和經濟之聲等廣播頻率開設的視頻直播間配備多通路高清攝像頭,實現“多條分軌視窗”+“多屏自由拼選”的5G 時代廣播可視體驗。受眾可通過留言、點贊等方式與主持人展開互動。
江蘇廣電大藍鯨App 也在“可視化廣播”領域積極探索,創新廣播直播間輕量級視頻直播方案,引入AI 攝像頭設備與AI 導播軟件系統,一人便可操作整場直播。該方案于2023 年在音樂廣播30 周年直播活動中上線試水,連續12 h的直播安全穩定,為大藍鯨App 的live 互動直播間改造升級做好了技術準備。
根據賽立信媒介研究公司的數據統計,廣播音頻傳播平臺呈現多元化的傳播特點。2022 年,廣播媒體傳統收聽出現略微下滑,但是廣播音頻智能終端用戶規模突破4 億人,同比增幅達10.8%。除了智能手機仍是音頻收聽的主要陣地外,智能語音技術為內容傳播開辟了新市場,吸引了越來越多的廣播媒體與智能車載、智能平臺等智能終端相連,以觸達到更多的用戶[3]。
江蘇廣電大藍鯨App 自2022 年開始進軍車載應用領域,為用戶提供豐富的出行體驗,先后上線了蘋果Carplay 和華為HiCar 車機應用,用戶在駕駛中可通過車機收聽江蘇廣電十大頻率在線廣播,回聽海量精品音頻節目,并且在技術上智能同步收聽歷史,將功能操作與方向盤完美融合,讓駕駛用戶的收聽更享受、更安全。
北京廣播電視臺聽聽FM 利用新技術賦能傳統廣播,與華為、阿里、騰訊、科大訊飛、小米等頭部互聯網企業開展智能生態合作業務,不斷擴展智能化生態。在車載領域努力觸達更多的預裝車機應用終端,依托阿里斑馬、騰訊隨行、華為等系統,構建出行場景車載輕應用生態。
人工智能技術的類型是非常廣泛的。隨著各類技術的成熟,人工智能技術通過不同的應用層切入,為廣播提供各種業務智能化的解決方案。在技術底層架構層面,有智能化的系統構架;在系統應用層面,有智能化的資源庫;在智能語音技術方面,有聲紋識別、語音測評、情感化語音交互等技術;在智能圖片處理方面,有AI 人臉融合、AI 作畫等技術[4]。相關智能化產品也趨向多元化和綜合化的應用形態。
貴州廣播電視臺動靜App 以自主研發的系統分析與設計(System Analysis and Design,SAD)框架為基本架構,在此基礎上構建了AI 個性化內容推薦、智能語音播報、全格式視頻流直播流播放、電商、內容推送、微信端互通等多種立足于智能化App 的技術架構和功能體系。
上海廣電集團阿基米德App 構筑了以人工智能和大數據為核心的專業智媒技術體系,包括自動化圖文音視的內容重構能力,可以實現對音頻的自動拆條、標簽、摘要,自動聚合;具有領先行業的語音合成、語音識別及廣告監播能力等。
2022 年以來,ChatGPT 展現了強大的技術實力,AIGC 以其強大的生成能力帶給人們極大的震撼。AIGC 基于AI 技術在生成算法、預訓練模型、多模態技術等方面的突破創新,勢必迎來更大的發展。AIGC 作為新的生產力引擎,開啟了新一輪的內容生產革命。人工智能將逐步成為創作內容的生產者之一。AIGC 在新技術的支持下,對內容生產力依賴程度較高的行業如媒體業會率先受到影響并落地,而“AIGC+傳統廣播”將有望帶來一場自動化內容生產與內容交互的變革,在生產方式和生產結構上會發生重大改變[5]。
AIGC 內容資訊的生產可分為兩種類型:一種是應用型文本生產,另一種是創作型文本生產。目前,應用型文本寫作發展相對超前,一些大的媒體機構已經嘗試了人工智能協助生產內容,尤其是對新聞稿件的撰寫、固定格式文本的撰寫以及風格改寫等,相信在不久的將來能實現量產。對于創作型文本的生產,如劇情寫作、營銷方案寫作等,由于其算法和模型的復雜性,還有很大的提升空間。
AIGC 對音視頻內容的生產將建立全新的生產模式,將對目前已經相當成熟的從文本到語音(Text To Speech,TTS)場景進行升級迭代,在有聲內容的規模化制作、聲音資源IP 產業化、視頻智能剪輯制作以及虛擬人場景化直播等方面將迅速發展。
AIGC 跨模態內容綜合生產能力實現了圖片、文本、音頻和視頻之間的交叉流轉,如文本生成音頻、圖像生成音頻、視頻生成音頻等。知識體系的跨域流通,使得內容創作的門檻進一步降低。AIGC能夠高效、快速地提供高度定制化、個性化的各類內容,使內容生產適合全媒體傳播。
ChatGPT 的火爆為人們展示了AI 大模型技術是當下最流行的新技術。新技術催生新內容。傳統媒體也相繼開始搶占新賽道,提前布局擁抱新技術。希望新技術能夠引領廣電媒體技術產業的變革與升級。截至2023 年2 月17 日,全國累計有161 家媒體官宣接入百度“文心一言”,成為其首批生態合作伙伴,給傳統媒體的未來帶來巨大的想象空間。
AIGC 的到來,正在推動互聯網、數據媒體乃至傳統行業的全面改造和升級,以及生產力的全面變革。AIGC 模型的通用化水平和工業化能力的持續提升,將極大降低內容生產和交互的門檻和成本。當具備與人類同等智慧或者超越人類智慧的人工智能AGI(強人工智能)技術出現,與眾多學科和領域交叉、融合之后,將顛覆所有人的想象。未來,“AIGC+”必將深度賦能各行各業高質量發展,為世界創造無限可能。