王晨 陳栓緊
摘要:隨著新技術的成熟,全球首個AI主播于2018年誕生。AI主播有哪些優勢能為傳媒業所用?未來AI主播又會何去何從?這些問題都值得研究。文章基于國內外AI主播的研究現狀,梳理了AI主播的發展階段及特征,試論AI主播產生的影響,并就AI主播的應用場景提出建議。
關鍵詞:AI主播;新聞媒體;應用場景
中圖分類號:G210.7 文獻標志碼:A 文章編號:1674-8883(2021)22-0007-03
一、引言
2017年,人工智能寫入國務院政府工作報告;2019年,中央全面深化改革委員會第七次會議審議通過《關于促進人工智能和實體經濟深度融合的指導意見》。此后,人工智能逐步與經濟社會各領域“擁抱”,孕育出不少卓越成果。根據微軟和永安、清科數據測算,至2022年,中國人工智能市場規模預計將超過千億元。在此背景下,2018年,新華社推出首個AI主播,開創了新聞領域實時音頻與AI真人形象合成的先河。它在為傳統媒體與人工智能的深度融合提供又一典型范例的同時,也促使人們思考AI主播與傳統主播的優劣及其未來的應用場景。
二、AI主播的特征
AI主播可定義為基于“自然交互+知識計算”智能理念,結合語音及形象合成技術,向觀眾展現出生動逼真傳達效果的主播,它主要有三個特征。
(一)極具擬人化傳播效果
AI主播大多脫胎于真人主播,他們是對真實主播形象的“復制”,通過對真人主播進行技術性建模得到極具擬人化的軀體和聲音。例如新華社AI主播“新小微”,她是以新華社記者趙琬微為原型生成的,可以根據不同的新聞內容和場景,利用AI算法實時驅動自身形態、面部表情,變換服飾、發型等。逼真的外形、真實的擬人動作,讓AI主播具象性與真人感并存,對觀眾來說,有效營造出了新聞播報的現場氛圍。另外,AI主播減少了人為控制的因素。新聞編輯人員只需將要播報的文本數據輸入AI主播對應的程序中,它就能基于自身的數據庫輸出語音、視頻,方便快捷,且有效避免了傳統新聞主播在新聞播報過程中出現的漏字、錯字、別字等問題,或是打哈欠、打噴嚏等不可控的突發生理問題,為人們提供更及時、更廣泛的服務和更客觀的新聞。
(二)24小時待命實時傳遞信息
AI主播全天候在崗,可隨時為網絡平臺播報新聞,即使在凌晨,依然能以飽滿的狀態傳遞信息,有效緩解了真人主播的播報壓力,分擔了一定的工作任務。如在新華社客戶端中,AI主播曾在凌晨0點52分播報新聞,其工作狀態依舊良好,這有效增強了新聞畫面的可觀賞性,提高了新聞的時效性。再如,科大訊飛推出的多語種AI主播“小晴”,在全國兩會期間,第一時間運用中、英、日、韓等語言播報會議最新動態,有效加快了中國媒體國際傳播的步伐,壓縮了對外發聲的時間差,也為中國媒體走向世界贏得了新的機遇與條件。
(三)智能數據處理減少制作成本
馬歇爾·麥克盧漢在《理解媒介:論人的延伸》中提到一種觀點——“媒介是人的延伸”[1]。AI主播依托數據存在,它的背后有特定的行業數據庫。AI主播不僅能夠播報新聞,而且能從數據庫中調取優質且精確的內容,進行數字化處理,總結出內在邏輯、規律。目前,實時的交通、天氣、體育賽事等節目都需要提前開展大量的數據采集和組織工作,AI主播能充分發揮自身優勢,保證數據采集和集成的效率。隨著技術的不斷改進,AI主播依靠其強大的數據庫,不斷挑戰真人主播的位置。如在央視網絡春晚的舞臺上,以節目主持人撒貝寧為模板的AI機器人“小小撒”登場,他不僅能夠對話,還能夠背誦詩詞,進行簡單互動。新華社AI主播上崗以來,已實現量產,參與了互聯網大會、進博會、春運、春節等重要新聞報道,通過新華社客戶端、新華網、短視頻平臺播放,引發國內外媒體的廣泛關注。
三、AI主播的發展歷程
AI主播的合成,需要強大的技術支持,根據技術呈現效果的差異,可將AI主播的發展歷程分為兩個階段。
(一)起步階段
在這一階段,AI主播大多以三維虛擬形象出現,表情及動作較為僵硬,且耗時耗力,制作成本較高。2001年,世界上第一個人工智能虛擬主持人阿娜諾娃(Ananova)出現,CNN將其描述為一個堪比真實的有血有肉的主播。隨后,日本、韓國等國家都推出了自己的人工智能主持人。2004年,CCTV—6頻道推出了國內首位虛擬電視節目主持人—小龍。他采用3D形象設計,將金城武、劉德華、梁朝偉的面部優勢吸收再重塑,負責主持《光影周刊》欄目。雖然在形式上有了重大突破,但事實上,起步階段的AI主播播報一期節目的成本甚至超過傳統主播。制作團隊需要對聲音、形象進行單獨制作,將其嵌入合并,再進行三維程序制作,過程復雜煩瑣。
(二)探索階段
隨著科技發展,技術的成熟,AI主播逐漸趨于真實。2016年,科大訊飛、百度等相關科技企業,在發布會上表示其人工智能的語音識別率已高達97%。人工智能語音識別技術的精確性,在一定程度上助推了AI主播進入市場的進程。2018年5月,AI主播“康小輝”亮相,這位AI主持人是由科大訊飛打造,與央視主持人康輝外形相似。“康小輝”相比以往的AI主播,最大的不同在于不再需要高昂成本,只需簡單設備便可播報新聞。2018年11月8日,第五屆全球互聯網大會上,搜狗與人工智能合作的AI主播“新小浩”面世,“新小浩”幾近完美地克隆了新華社男主播邱浩,從形象到聲音,從唇形到動作,幾乎是邱浩的“翻版”。2019年2月,“新小浩”由坐式變為站立式,表現形式更加豐富。隨后“新小萌”“麗莎”等AI主播紛紛亮相。
在探索階段,我們能清晰地感受到AI主播越來越接近真實人類,服飾、性別等方面也做到了切換自如,制作成本越來越低,時間越來越短,技術不斷升級迭代。
四、AI主播與傳統主播的對比分析
(一)價值取向對比
由技術創造出的物品都有一定的價值取向。技術帶來的價值取向通常表現在這種技術的使用途徑和方式上。對比來看,AI主播盡管實現了量產,但其作用依然是模仿、替代。他不是憑空創造出來的仿真數字人像,而是通過綜合描繪某一真實主播的身體特征、身份信息而產生的。通過數據的調動和記錄,盡力去“克隆”傳統主播,實現信息輸出的目標。
但信息的傳播往往不是一個單向循環的簡單過程,而是不斷突破、再創造的行為。在傳媒業,判斷一個主播是否優秀,播音時長、出現頻次都不是關鍵所在,更重要的是對新聞稿件進行有思想力的表現,更可以表達為對新聞的再加工創造。傳統主播可以合理運用自身情感營造新聞浸入感,而且傳統主播在多次實踐播音后能夠從中提煉技巧,升華自身技藝,從而得到“1+1>2”的創新效果,但AI主播在當前的技術條件下,多次播音后,依然只能機械地念稿,盡力去模仿、還原傳統主播,并不能自我提升,得到的是“1+1=2”的效果。
(二)播出效果對比
播音的效果方面,不得不說,AI主播比傳統主播更加穩定。因為AI主播是由數據計算合成的3D數字人,不會存在像傳統主播一樣的生理問題、情緒波動等,遇到突發狀況時,AI主播也能毫無波瀾地完成新聞播報工作。反觀傳統主播,人們時常會在社交網絡或短視頻平臺刷到傳統主播的失誤合集,有的是流鼻涕、打哈欠、補妝等,有的是大笑、忘詞等,這在一定程度上都影響了節目播出的效果。那么AI主播在播音效果上絕對優異嗎?當然不是,因為人工智能機器人是靠數據發出聲音,而非聲帶發聲,這就導致他們播音時存在兩個問題。
第一是表達機械化,缺乏語流音變。人們在用普通話交流時,時常會出現兒化音、變調、多音字、輕聲等,而AI主播是多音節連續輸出,不能掌握全面的音變規律,導致播音時的機械性較強。如AI主播“新小浩”在一次兩會新聞播報中,讀到“什么東西最難攜帶?”中的“西”字時依然用陰平方式發聲,并未音變為輕聲,這容易讓人混淆。第二是停頓不當,導致新聞邏輯不明。面對播報中的長句子,AI主播很容易停頓不當,導致語義邏輯不順。
綜上所述,在播音效果方面,傳統主播和AI主播各有優劣,不能一概而論。
(三)情感互動對比
莎士比亞曾言,“一千個人眼中有一千個哈姆雷特”,這正是人類情感各異、思想存在差別的表現。人工智能作為一項技術,可以讓虛擬主播利用后臺程序的數據表達理解情感,但無法真正感受情感。面對相同的稿件,不同的傳統主播會有不同的表達方式,會有不同的場景創設,更有不同的理解。而AI主播只能根據程序的設定程式化地回應,進而表達,缺乏深層內涵,不能做到言志傳神。缺乏情感的表達,是AI主播的劣勢。互動方面,AI主播目前主要應用于新聞播報中,不需要與觀眾互動交流。但AI主播的應用范圍不僅僅在新聞播報領域,還會在采訪、綜藝節目中出現,面對這樣的場景,AI主播很難招架。如在采訪中,傳統主播能夠根據嘉賓的回答延伸,現場隨機變換問題,讓主播和嘉賓形成良性互動。在綜藝節目中,主播需要把控觀眾情緒,又要照顧舞臺效果,這樣一來,主播不再只是見字發聲的機器,而是更需互動、以人為本的高素質主持人。
這樣來看,AI主播與傳統主播對比,缺少情感表達,缺乏互動性。
五、AI主播帶來的影響
(一)對傳統主播的影響
AI主播出現之后,是否能替代傳統主播呢?有不少學者對此進行了研究。各方文章認為AI主播的出現對傳統主播產生了三點影響。
一是迫使傳統主播不斷提高業務水平。在數據較多的財政股票、新聞類節目中可以看出,AI主播處理新聞時的精確度和標準度是傳統主播無法比擬的,傳統主播主持節目時很難保證沒有意外發生,但是AI主播可以100%避免這些失誤,這在無形中敦促傳統主播不斷提高自身業務水平。
二是倒逼傳統主播尋求職業上的轉型升級。AI主播已經在媒體平臺量產播稿,他們通過文本的輸入就能實現仿真式的播音,自動合成音、視頻,高效且便捷。傳統主播隊伍中存在個別缺乏特色且不上進的主播,AI主播的出現一定程度上會讓這些主播面臨失業危機,倒逼其創新進步,不斷提高理論修養、自身素質。
三是有利于形成良性競爭的環境。
(二)對傳媒業態的影響
傳媒業處在變革時期,AI主播是順勢而生的創新產物。最直接的影響是AI主播直接提高了新聞的收視率,但收視率的提高并非因為內容,更多是因為形式。正如保羅·萊文森“媒介演進三階段(玩具—鏡子—藝術)”理論所言,新技術在初期被當作“玩具”,人們新奇于它的形式。當到達“鏡子”階段后,人們開始逐步關注媒介表達的內容,最終上升為后現實“藝術”[2]。所以AI主播在短期內會增加新聞的閱讀量,但人們把它當作“技術玩具”,當人們適應甚至是厭倦了這樣一種播音模式,傳媒業又會恢復常態。傳統的傳媒業重心在采、編、播。現下,這三項工作有了人工智能的輔助,變得更加輕松,傳媒業的工作重心將會逐漸偏向于把關。技術雖然讓傳媒業態變得高效快捷,但我們不能因此失去對新聞的掌控力。任何時候,當人失去對技術的控制,后果將不堪設想。在人工智能給新聞業態提供了極大便利的情況下,我們更加需要對新聞生產進行把關,明確信息的真實性,維護傳媒業的公信力。
(三)對社會發展的影響
彭蘭教授認為新媒體具有三大特征,即萬物皆媒、自我進化、人機共生,這預示著傳媒業與智能技術交互協作將是大勢所趨[3]。
可以預見的是,未來傳媒業要把人工智能當作輔助工具,使新聞生產更快捷、新聞信息傳遞更準確、表現形式更生動,一步步推動傳媒業轉型升級。
放眼世界,發達國家高度重視人工智能技術的發展,我國也將人工智能作為產業驅動力。AI主播的發展,能夠進一步優化國家外部環境,推動國家制定相關法律政策、完善倫理規范、引導社會風向,讓技術與經濟更加深入地融合,營造良好數字生態,建設數字中國。
不得不說,AI主播的出現也在一定程度上提升了我國的傳媒影響力,當全球第一個AI主播在中國上崗時,不僅在國內,在國際上也引發不小的轟動,美國、英國、印度權威媒體紛紛感慨主播“栩栩如生”,贊嘆中國在人工智能技術方面的實力。這無疑向世界展示了“中國創造”的力量,推動產業創新升級,創造社會價值,為國家高質量發展注入新的動力。
六、結語
目前,AI主播已能對模式化的信息進行播報,這在一定程度上解放了人力資源,但卻不能完全取代傳統主播。因為人是因思想差異而獨特,人工智能終究是數字機器,無法理解情感,也不能自生思想。在不斷創新和變革的工業4.0時代,傳媒業應該抓住技術日益成熟的機遇,讓人工智能技術更加成熟,探索高質高效的人機合作,實現人類和技術的互補。
參考文獻:
[1] 麥克盧漢.理解媒介[M].何道寬,譯.北京:商務印書館,2000:57.
[2] 胡嶸.新媒體視閾下電視新聞主播業務素質的研究[J].記者觀察,2019(2):27.
[3] 彭蘭.智媒化:未來媒體浪潮:新媒體發展趨勢報告(2016)[J].國際新聞界,2016,38(11):6-24.
作者簡介 王晨,碩士,研究方向:新聞與傳播。陳栓緊,碩士,研究方向:電影學。