用人工智能重構廣播生態

2018-01-22 11:37:50牛嵩峰鄺瑤

中國廣播 2018年11期

牛嵩峰鄺瑤

【摘要】技術驅動正在照亮內容生產者的前行之路。如何通過人工智能在策劃、采訪、生產、分發、反饋等全節目生產鏈上賦能廣播媒體？本文詳盡分析了湖南電臺推進的“AI+ 移動音頻”新生態系統建設：用AI 重構廣播內容生產和廣播資源，未來廣播將是打造基于人工智能技術的內容驅動型音頻產品。

【關鍵詞】大數據人工智能廣播生態

【中圖分類號】G221 【文獻標識碼】A

隨著大數據和人工智能（AI）技術的興起及廣泛運用，傳播技術更新迭代的速度明顯加快，涌現了以算法和聚合技術為驅動的“今日頭條”等網絡平臺。在2018年全國兩會上，政府工作報告再次提及“加強新一代人工智能研發應用，在醫療、養老、教育、文化、體育等多領域推進‘互聯網+”。這也就意味著人工智能已經成為國家戰略層面的基礎設施建設。

如何去探索一條適合廣播媒體發展的“人工智能+”的媒體融合之路，湖南廣播電視臺廣播傳媒中心（以下簡稱“湖南電臺”）一直在思考。我們期望用技術來破解媒體融合發展瓶頸，通過大數據及人工智能技術，為包括湖南電臺在內的廣播媒體提供內容采集、編輯、存儲、分發、反饋等全生產鏈的專有智能技術，探索適應大數據、人工智能時代的媒介形態和傳播方式。根據湖南廣播電視臺（以下簡稱湖南廣電）黨委關于建設新型主流媒體的要求，湖南電臺全速推進“AI+移動音頻”新生態系統建設，整合運營以湖南廣電IP為基礎的優質音頻資源，基于智能編輯系統、大數據、AI語音交互技術支持，建構起“馬欄山聲態圈”，與湖南衛視、芒果TV等完成芒果生態“一云多屏”全覆蓋，提高黨媒在音頻領域的新聞輿論傳播力、引導力、影響力、公信力。

一、AI+廣播新技術聯合實驗室：用AI重構廣播內容生產

目前音頻的滲透率遠遠不及視頻，其背后的原因有很多，優質的音頻內容不能海量生產無疑是其中一個重要因素。這樣的行業痛點如何解決？2017年12月18日，湖南電臺與國內領先的語音智能公司科大訊飛股份有限公司簽約，共建國內首家AI+廣播新技術聯合實驗室——聽說，研發面向音頻平臺的科學算法、音頻聚合、內容組發、語音集成等基礎體系，合作探索運營新模式。目前聽說實驗室已經上線試用的兩個產品，分別是中文語音文本智能編輯系統和虛擬主播系統。

（一）中文語音文本智能編輯系統

傳統廣播電視臺的語言類音頻內容編輯，主要是利用通用的音頻編輯軟件Cooledit Pro、Audition等，此類軟件本身沒有同步文本編輯窗口，需要完全依靠人耳的聽覺控制來進行人工剪切和修飾，效率及準確率不高。如需對應音頻的文字內容，則需要人工監聽音頻內容、通過人腦記憶逐字逐句地進行聽寫和校對，導致編輯工作繁瑣而枯燥，同時耗費大量工作時間。

然而，人類最熟悉、最簡單的編輯對象，不是波形圖，而是文字。考慮到廣播電臺、電視臺、電影制作公司音頻產品生產的高效率剪輯需求，聽說實驗室研發團隊大膽設想，充分利用AI語音自動翻譯以及語義識別功能技術成果，生產了一套高效率的中文語音文本智能編輯系統，顛覆了非線性編輯。在音頻內容生產流程中實現了在文本編輯基礎上的音頻一鍵合成（如圖1所示），能夠大大提高編輯記者的工作效率，解放生產力。

使用該系統，音頻編輯不再需要逐字逐句地進行音頻監聽，而是通過音頻一鍵轉寫文字，直接在文稿編輯窗里進行文字剪輯，再通過文稿時間戳子系統在文字窗口和對應的音頻窗口位同時打上剪輯標記，交由人工智能對整篇文字進行語義識別，在剪輯點位以及語義的轉換點自動進行降噪、延時和淡入淡出等語音信號技術處理（如圖2所示）。這樣處理后的初稿大量減輕了編輯人員在語音翻譯和信號處理上的工作量，讓編輯能夠集中精力處理關鍵點位，提高音頻作品的美感和可聽性。

在傳統的音頻編輯系統中，當受訪者說錯了某個字或者某個詞，采訪音頻中也沒有相應的詞語或者相同意思的句子替代時，很多時候只能選擇放棄這部分同期聲；如果同期聲所要表達的內容確實不能舍棄，只能采用由記者轉述的方式來代替，這使得作品的情景感大打折扣；由專業音頻制作人員后期合成，不但成本高，而且操作有違新聞的真實性原則。為了解決這一問題，經過反復實踐，探知采用人工智能的維特比優化算法以及梅爾頻率倒譜系數（Mel-Frequency Cepstral Coefficients，簡稱MFCC）技術，可以提取原受訪者人聲特征，建立最新的中文音頻文本同步編輯系統。利用聲紋識別技術來合成語音，模擬原受訪者的語氣和語感，以達到逼真的效果。

（二）虛擬主播系統

傳統廣播節目大都需要通過播音員或主持人運用有聲語言來傳遞信息。播音員或主持人是廣播媒介傳播活動中有著不可或缺的環節。當人工智能產品具備了識稿、備稿、有節奏的發聲及擬人形象后，可以通過語音識別和模擬技術制作仿真個性化虛擬主播，針對不同場景、不同內容的要求，提供不同的虛擬聲音，實現媲美真人的語音合成效果，滿足用戶對主播的定制需求。

聽說實驗室研發的“AI新聞主播系統”，在2018年全國兩會上推出《AI主播報兩會》產品。由人工智能虛擬主播播報的新聞在湖南電臺《全省新聞聯播》中首次發聲，用更為生動的方式解讀政府工作報告，這種創新兩會報道的方式受到各界好評。該系統基于科大訊飛的智能語音技術，結合廣播行業新聞播報的特色與標準，編輯只需在系統中輸入新聞文本，便可一鍵生成音頻。AI主播聲音素材采自湖南電臺首席播音員和資深主播，經過編輯處理的語音合成效果在真實感、表現力上均大幅提升。

此前湖南電臺文藝頻率摩登音樂廣播成功打造的全國首個虛擬主持人——“嘻芮”，憑借在《“嘻芮”秀》《完美假期》《完美的“嘻芮”》等節目中的機智表現，以日均吸粉2萬余人的加速度，成為湖南上空的“吸粉女神”。與網紅虛擬主持人“嘻芮”不同的是，“AI新聞主播系統”完全采樣于真人，系統通過大量學習、算法優化，并結合新聞播報專業規則，誕生了最擬人化產品，彌補了當前機器播報音色和音長過于機械化的缺陷，在停連、重音、語氣、節奏上越來越像專業主播一樣控制自如。目前“AI新聞主播系統”正在儲備涵蓋男女聲、高中低音、不同聲音特質的主播庫，未來能夠滿足根據不同場景、不同題材提供不同音質的虛擬主播，并根據新聞情境調節語調和語速，在真實感、表現力上實現媲美真人主播的語音合成效果。

（三）人工智能釋放廣播生產效能的應用策略

現階段正處于人工智能技術的新興階段，技術將走向何方、將產生怎樣的媒體形態還難以預測，但技術發展的趨勢不會逆轉，未來媒體的競爭優勢不在于使用人工智能，而在于怎樣用好人工智能。聽說實驗室成立以來，被賦予了改變廣播傳統生產模式的使命，針對廣播內容生產者的實際場景，融合大數據、人工智能、云計算、物聯網等多項技術，讓廣播內容生產更為智能化，在節目生產、節目審核、媒資存儲、節目分發等環節都體現出了長尾效應。

在內容生產環節，“中文語音文本智能編輯系統”為記者、編輯的“耳朵”賦能，省去大量簡單重復勞動，讓記者、編輯投入更多精力專注于內容創作本身；“AI新聞主播系統”可將審定的文本一鍵合成音頻節目，主播配音制作的過程也得以優化。在節目審核環節，通過“中文語音文本智能編輯系統”使后續的編輯、審核環節更為順暢，通過對文字的判斷甄別同步對應到相應的音頻時間戳，大大提高監聽效能。在媒資存儲環節，廣播直播流通過“中文語音文本智能編輯系統”實現基于語義的自動拆條存儲，并通過智能內容管理平臺，實現精準分發，在充分考慮用戶愛好的基礎上，推薦內容讓用戶產生依賴感和信任感。

二、廣播融媒體大數據智能實驗室：用人工智能重構廣播資源

有學者把未來媒體內容生產的圖景概括為“在未來媒體世界，全息交互延伸用戶感知，現實世界和虛擬世界將實現無縫對接；全知數據解讀用戶的每一種需求，多終端實時提供個性化服務，所想即所得式的媒體服務滲透各個場景”。這也就意味著，傳播的流程在技術驅動背景下，用戶的實時數據分析將真正進入信息的集成及反饋體系中，生產流程將得到實質性優化。

（一）大數據建模勾勒廣播用戶畫像

湖南電臺下轄8套廣播頻率，每年生產420萬分鐘的精品節目，服務湖南省7000余萬聽眾。賽立信第三方數據顯示，2017年，湖南廣播在長沙市場收聽份額高達77.3%。如何將大量的聽眾數據在新媒體時代變成服務聽眾、提升產品價值的加速器？如何為廣播用戶打造個性化“檔案”？2018年3月28日，湖南電臺與電子科技大學合作共建國內首家廣播融媒體大數據智能實驗室——據說實驗室。實驗室實行課題制，基于科學的數據分析和受眾研究，并結合廣播媒體特質，以垂直領域的優勢內容屬性建立數據模型。雙方第一階段的開發重點是廣播聽眾及微信粉絲數據分析、目標市場受眾數據分析、新平臺用戶分析等工作。

（二）矩陣化運營搭建粉絲聚合平臺

湖南電臺新媒體系統今年5月上線運營，服務、管理、運營中心旗下所有頻率和部門參與自媒體分發，滿足新媒體所需的數據挖掘及分析應用，滿足廣播升級的互動營銷、整合營銷需求。

建設微信、微博矩陣解決了湖南電臺各頻率運營微信的痛點，如互動功能開發不夠、數據留存和分析能力較弱、新媒體營銷手段不足等。主要實現了以下兩方面的功能提升：

1.提升用戶互動體驗

在矩陣搭建之前，與受眾的互動更多的是依靠熱線電話以及微信公眾號留言，湖南電臺旗下部分頻率采用了自建或者第三方提供的技術服務來實現喊紅包、活動報名等互動功能。新媒體矩陣建立后，受眾的互動方式更加多元、互動體驗更加完善，包括但并不限于抽獎、調查問卷、問答、競猜、投票、海選、活動等各種玩法，豐富了各微信公眾號、官方微博的互動手段，吸引了更多的受眾，并對用戶互動留言進行留存與篩選等。

以湖南電臺交通頻率《718聽購節》節目為例，設定專屬時段喊出“買買買”的語音口令，秒殺的商品通常是在3～5秒內一掃而空（見圖3）。

通過新媒體矩陣，建立了多向的互動，讓電臺、節目、主持人、受眾、商家有機地聯系起來。互動與節目緊密配合，可以貫穿節目播前、播中、播后，由主持人隨時把控，并能夠即刻接收到反饋，受眾通過極其簡單的操作就可以參與，參與門檻更低。在活動、廣告、微信商城、主播打賞等方面，支持受眾經營與新媒體收入模式，達到廣告客戶、商家、電臺、節目、受眾的多贏。

2.實現粉絲數據聚合

對傳統廣播來說，受眾研究一直是短板。在矩陣搭建之前，對受眾的研究主要依賴第三方數據公司提供的收聽率調查以及各個微信微博后臺、移動音頻平臺相關數據等。通過矩陣管理，能夠打通各微信、微博及熱線電話用戶數據，做到用戶數據的統一，實現同一個用戶不同數據記錄的合并管理，能夠對受眾進行統一身份識別，全面收集、篩選、描述、分析受眾數據，形成用戶畫像，并為精準廣告、活動推廣等提供數據支撐。同時，在矩陣建設中，堅持以數據獨立為基礎，將受眾數據牢牢掌握在自己手里，確保了數據安全和運營安全（見圖4）。

三、未來廣播：打造基于人工智能技術的內容驅動型音頻產品

對于傳媒業而言，互聯網技術的發展不僅僅在檢驗傳媒業的數字化進程，而且在整個媒體生態中正逐步引領一場巨大的變革。2017年12月26日，新華社在成都發布中國第一個媒體人工智能平臺——媒體大腦，生產了第一條機器生產內容（MGC）視頻新聞——《新華社發布國內首條MGC視頻新聞，媒體大腦來了！》；2018年南方財經全媒體集團聯手科大訊飛，通過語音合成技術模仿真實主持人的聲音，推出人工智能虛擬主持人，并將其應用于財經新聞播報。在媒體行業，包括文本、音頻、圖像、視頻和交互等各個方面，“AI+”的模式正在全面擴展。

總而言之，以人為本的傳播才是傳媒業的生存之道。廣播是現存媒體中唯一一個解放人類雙眼的媒介形式，在視覺消費超飽和的狀態下，電視、報紙、雜志甚至是以互聯網為依托的各類新媒體，都是以視覺為主的媒介形態，彼此正面交鋒、拼殺激烈，只有廣播“以聲為媒”，專注于經營人們的耳朵，這是廣播得天獨厚的優勢。在私家車保有量逐漸提高的今天，廣播的最優排他選擇就是應用好聲音，并占領聲音高地。

以湖南電臺為例，就是要依托湖南廣電IP內容資源優勢，打造基于人工智能技術的內容驅動型音頻產品，以智能語音交互為特色，依據用戶畫像，針對每一位用戶精準提供場景化內容，使每個用戶都能收聽到由其選擇的主播為其送達的符合個性需求的節目、路況、服務、廣告。場景化內容還可適應多系統、多平臺使用，可廣泛適用于智能音箱、智能手機、可穿戴設備、智能家居等，使用戶在多個場景下消費所提供的內容和服務。我們期待廣播行業乃至更為廣泛的音視頻行業，利用人工智能趨勢下的下一代廣播電視新技術，引領音視頻內容生產進入到一個真正人工智能的、海量內容生產的革命時代。

參考文獻

1.牛嵩峰、唐煒：《基于人工智能的中文語音文本智能編輯系統設計》，《廣播與電視技術》，2018年第4期。

2.湯天甜、翟玉珠：《理解AI：媒體的延伸》，《青年記者》， 2018年第5期。

3.陳昌鳳、王宇琦：《新聞聚合語境下新聞生產、分發渠道與內容消費的變革》，《中國出版》，2017年第12期。

4.喻國明、蘭美娜、李瑋：《智能化：未來傳播模式創新的核心邏輯——兼論“人工智能+媒體”的基本運作范式》，《新聞與寫作》，2017年第3期。

5.強月新、陳志鵬：《未來媒體的內容生產與敘事變革》，《新聞與寫作》，2017年第4期。

（本文編輯：李靜）