摘要:智媒時代,AI合成主播的誕生放大了媒體從業者的職業焦慮,引發了關于“AI合成主播是否會替代真人主播”的探討。厘清AI合成主播的現狀與不足,有助于智能媒體深度融合發展。本文將在歸納總結AI合成主播的進階演化、優勢特點的基礎上,對其進行技術反思,并提出發展建議。本文認為,由于AI合成主播在情感、個性、思想上存在局限性,加之受制于技術發展的制約,因而“離身”無法真正代替“具身”完成傳播實踐。
關鍵詞:AI合成主播;人工智能;智能媒體;身體傳播
中圖分類號:G210.7 文獻標志碼:A 文章編號:1674-8883(2021)18-0015-04
如今,隨著人工智能、算法、機器學習等大數據技術的快速發展,AI合成主播憑借智能化、全時空、場景化等優勢,正以“離身”的方式逐漸代替人類“具身”進行新聞實踐,被廣泛應用于新聞播報、賽事報道。
在傳播學理論中,“具身”強調人類身體知覺具有主動性,認為身體是人類知覺與環境互動的中介[1-2],強調心智、身體以及環境三者的一體化[3]。相比于“具身認知”認為身體是認知及相關活動的基礎,“離身認知”則強調人類認知可以脫離人的身體而獨立存在,人的認知可以被計算。
進入人工智能時代后,算法技術驅動下的虛擬身體完成了和傳統身體的脫離,以一種全新的仿真模態嵌入信息傳播環節。AI合成主播的出現使得物理意義上的身體被消解,利用技術打造出的“分身”模型實現了身體敘事和圖像建構。
不過,人工智能技術帶來的信息革命在為人們提供便利的同時,也引發了新聞傳播學界、業界新的職業焦慮,即AI合成主播的虛擬在場能否真正代替人類身體在場;AI合成主播是否會隨著技術發展而變得越來越真人化,甚至超越人類本身;面對AI合成主播的誕生,真人主播又該何去何從。
面對這些爭議,本文在總結AI合成主播進階演化階段和優勢特點的基礎上,探討完成“離身”的AI合成主播能否代替人類“具身”,以虛擬身體代替身體在場進行新聞實踐。本文認為,由于當前人工智能技術還不夠成熟,存在一定局限性,AI合成主播尚不具備威脅、替代真人主播地位的能力,這主要體現為AI合成主播在情感、個性、思想等方面存在不足。但值得注意的是,任何技術的發展都不可能毫無風險,我們應該始終抱有審慎的態度,時刻反思技術可能帶來的風險,學會駕馭算法、擁抱算法,才能保證技術真正為人類社會服務。
一、AI合成主播的進階演化
AI合成主播是在人工智能技術中的語音合成技術和人臉合成技術的基礎上,結合語音、圖像等多模態信息進行聯合建模訓練后,生成的人工智能分身模型[4]。近年來,隨著人工智能技術的快速發展,AI合成主播逐漸走進大眾視野,參與首屆進博會、全國兩會等重要會議活動報道,成為主流媒體新聞內容生產的重要力量。根據不同時期的功能和技術特點,AI合成主播大致經歷了三大發展階段。
(一)AI合成主播1.0階段:一問一答的“語音助手”
這一階段是人工智能技術在新聞傳播領域的初步應用。從外觀看,該階段的AI合成主播通常以虛擬造型或實體機器人造型出現,不具備真人形態;從技術邏輯看,通過前期預先輸入大量數據,AI合成主播在收到指令并進行語音、語義識別后,從數據庫中匹配合適的內容,調取現成的相關信息;從表達輸出看,早期AI合成主播雖有一定互動性,但多停留在機械化的“一問一答”的層面,表達較為生硬,主要輔助人類完成稿件播報等基礎性工作。如2015年12月,美國微軟公司旗下的人工智能機器人“微軟小冰”首次登陸中國電視熒屏,在上海東方衛視擔任天氣預報員;2017年,機器人“石榴娃”走進西安廣播電視臺《西安新聞》的直播間,在硬科技創新大會上進行智能播報。
(二)AI合成主播2.0階段:真人原型的“人類分身”
這一階段的AI合成主播經過深度學習,可以模擬真人主播原型,表情更加生動自然,聲音更富情感,語音語調模仿人類口吻,可以與人形成更深層的交互對話。如2018年11月,新華社聯合搜狗公司在第五屆世界互聯網大會上發布以主播邱浩為原型的AI合成主播“邱小浩”,只需要輸入文本,AI合成主播就能用和真人一樣的聲音、表情、唇形進行新聞播報。再如,2019年3月,新華社聯合搜狗公司以新華社主播屈萌為原型,發布全球首個AI合成女主播“新小萌”,在全國兩會期間亮相,其不僅能24小時無休工作,還掌握多國語言。
(三)AI合成主播3.0階段:自然交互的“新聞智人”
AI合成主播進入3.0階段后,不僅外表更加逼真,具有和真人一般細膩自然的微表情和微動作,同時在人機交互行為上體現出更強的邏輯性、互動性和智能化水平。如2020年11月,韓國MBN電視臺推出韓國首位AI女主播“金柱夏”,該虛擬主播基于人工智能、深度學習、卷積神經網絡等技術研發,可以逼真還原真人說話的樣態,讓不少網友感慨“以假亂真”。2020年全國兩會期間,百度智能云與央視網共同推出AI主播“小智”,其外形基于3D高精度仿真人像技術,可以模擬出人類面部肌肉組織,反應迅速,對話流暢,在新聞報道中支持自動抓取關鍵信息,具備語音處理、智能對話、情緒感知等多種功能。
隨著人工智能技術的不斷升級應用,未來機器將具備強大的自主學習能力,提升對新聞事件的深度解讀和分析理解的能力,解決深度學習、場景理解、情感識別等更復雜的計算機技術問題,由“人工智能”轉型為“新聞智人”[5],或將真正達到“想你所想”的智能化程度。
二、AI合成主播的優勢特點
與傳統新聞報道節目真人主持人相比,技術導向下的AI合成主播具有智能化、全時空、場景化的優勢特點。
(一)智能化
AI合成主播是智媒時代下技術發展的產物,其最大的特點首先在于智能化。
從播報主體看,AI合成主播對原型主播進行海量數據采集,通過語音合成、表情合成、情感遷移、深度學習等技術,可以模擬訓練出具備和真人主播一樣的主持播報能力,無論是聲音還是樣貌,都較為接近真人形象。
從播報內容看,與真人主播相比,AI合成主播在播報語速、文本精確度、語言翻譯功能等方面更加準確完善。AI合成主播擁有自己的智能語料庫,利用語音識別、圖像識別、自然語言處理、AI算法等技術不斷進行機器學習,實現“自我進化”。
從播報流程看,在訓練和建立AI主播的語義網的基礎上,只需要將相應的內容文本輸入機器,AI合成主播就可以進行自動化、智能化播報,并根據文本內容配合相應的面部表情和肢體動作。由此,AI合成主播將節約大量人力、時間和費用成本,更加高效地完成播報任務,從而減輕媒體從業者的負擔,使其有更多時間、精力投入新聞內容質量的提升與優化。
(二)全時空
相較真人主播,AI合成主播在工作時長、工作效率、播報時效性等方面更加科學、智能、高效,具備兩大技術優勢。一是全時性,AI主播作為一款機器智能產品,可以突破人體機能的限制,達到24小時持續工作。特別是在重大會議等長期新聞活動或需要不斷跟進關注的災害新聞中,AI合成主播可以保持長時間、無間斷地持續報道。并且,當突發事件等緊急情況來臨時,AI合成主播可以快速反應,即時投入新聞播報工作。二是全場性,在算法和數據驅動下,AI合成主播可以制造出無數個“分身”,同時出現在多個主持現場。在一些真人主播難以到達現場的緊急情況下,AI合成主播能夠突破空間、場地的限制,實現多場合同步播報。
(三)場景化
AI合成主播的場景化呈現主要體現為適應性和延伸性兩方面。一方面,相比真人主播,AI合成主播對場景的適應性更強,可以避免主持現場的光線、聲音等要素的影響;另一方面,AI合成主播實現了新聞播報多場景的延伸。結合3D虛擬場景、AR、VR、MR等技術,AI合成主播可以走出實體演播廳,在虛擬場景中進行新聞播報。通過對新聞發生地進行現場還原和場景模擬,AI合成主播的主持場景不斷延伸,從視覺技術上實現新聞的臨場感,更好地滿足新聞呈現的多樣化需求。
三、AI合成主播的技術反思
人格化、人際性是構成主持傳播的本質與關鍵,也是主持傳播的特點和優勢[6]。有溫度、有靈魂、充滿人文關懷的傳播是主持傳播的核心。相比真人主播,AI合成主播雖有一定的技術優勢,但在情感、個性、思想上存在局限性。
(一)去情感化:情感態度匱乏
首先,人工智能不具備人類的情感與意識,會使新聞失去應有的溫度。有聲語言的表達是建立在情、聲、氣結合基礎上的,而情感是人類獨有的特質,這也是其區別于其他生物和智能事物的獨特體現[7]。雖然新聞強調客觀中立,但一定的情感態度依然是新聞主持過程中必不可少的重要因素。倘若失去了情感和情緒的支撐,新聞播報就會失去靈魂,缺乏感染力,而AI合成主播最終就容易演變為冰冷的播報機器。
目前,人工智能技術在我國傳媒領域的應用仍停留在起步階段,人工智能合成主播也還只是停留在對文字的再現層面,能夠對語義、句法、邏輯的關系進行學習判斷,并不能做到對文字深層次的情感理解。AI合成主播雖然能借助機器學習、情感分析等模擬人類的表情和動作,揣摩播報內容的情感色彩,并預測聽眾的情感情緒,機械式地做出相應情緒反應,但其本質上依然是算法邏輯下的一場程序游戲,缺失了對情感的感悟能力和對社會的關懷能力,少了一份人情味。 縱使AI主播有強大的信息處理和播報能力,但其給予公眾的感情體驗是冰冷的,新鮮感一過,熱度自然會降低。
此外,也正是由于具象化情感表達的不足,AI合成主播播報的領域容易受到限制。在面對疫情、地震等災難報道或人物事跡報道時,AI合成主播無法與人做到情感共通,無法感受人類的喜怒哀樂,自然無法傳遞真正有溫度和情感的信息。因此,AI合成主播的工作內容多以信息發布型的客觀報道為主。
(二)去個性化:個性風格缺失
AI合成主播不具備人的個性,很難打造新聞節目報道的個性化風格。個性化的主持風格是節目主持人在長期主持實踐中形成的、受到觀眾認可的創作個性和藝術特色,也是真人主持個體內在的精神氣質外化于行的表現。鮮明的個性化風格能豐富媒體節目內涵,增強節目表現力和感染力。在現實的媒體主持人隊伍中,我們不難發現,每個新聞主持人和報道記者都有自己獨特的風格,他們都能結合自身特色經驗和生活感悟對傳播的信息進行再加工,最終形成極具特色和風格的個性化信息傳播。
相比之下,AI合成主播則主要依靠算法學習和現成的語料庫,在主持風格和主持特點上容易千篇一律,過于機械化的報道模式缺乏人的靈動與魅力,可能帶來用戶審美疲勞。
(三)去思想化:思想智慧不足
AI合成主播缺乏人獨特的思考和智慧,沒有個體的自主思維,因而無法賦予新聞深刻的思想和內涵。新聞傳播的意義在于揭示事實的真相,反映重大社會事件和社會問題,傳遞正確的價值觀。如今,大眾對傳媒節目的藝術審美、價值取向、思想深度等方面都提出了更高要求,優秀的主持人能夠憑借其突出的人格魅力和深厚的知識積累吸引受眾的關注。AI合成主播雖有全天候工作的能力,卻缺乏真人主播的決策、思維和應變能力,缺乏對新聞內容的消化和理解力[8]。尤其是在面對一些突發情況時,主持人的臨場反應深刻考驗著新聞主播的專業能力,一些“高情商”的回答往往能給受眾留下深刻印象。AI合成主播由于思想性不足,無法做到察言觀色,缺乏對現實環境、社會環境的高度理解,通常只能完成既定內容的表達,且難以準確拿捏所獲信息的態度、情感。簡單地說,具有內涵的節目是人與人思想的碰撞。人工智能無法通過言辭細節去挖掘新聞背后的溫度,無法一針見血、犀利睿智地評論新聞時事,表達觀點,這種獨立思考的能力,正是人與機器最根本的區別。
此外,人工智能與人類的思考方式是完全不同的。在看待事物時,人類會根據自己的認知、社會經歷、文化教育水平作出判斷,而人工智能則是依賴于海量數據來計算出結論。換言之,人類的大腦、心靈和計算機有著本質差別,人的心智是一種比計算機更深層和更高級的智能活動,是無法被計算窮盡的。雖然計算機程序可以按照語法規則定義,但其本身不足以確保語義的微妙呈現和心的意向性[9]。當前,人工智能在技術層面還存在著算法訓練時間過長、需要人工選擇算法模型等弱點,缺少和人類一樣的自主決策能力和自我意識。
因此,從根本上看,AI合成主播終究無法像人類一樣充分理解語言的深層內涵和思想,缺少對價值的理解和判斷。只能照本宣科地報道新聞文本,無法進行深入思考和價值輸出,怎可能與受眾共情?
四、智媒時代AI合成主播的發展進路
(一)堅守人在傳播中的主體地位
AI合成主播作為人工智能技術在新聞傳播領域的最新成果,正在重塑著新聞業的形態和格局。AI+5G、AI+AR、VR、MR等應用豐富了新聞報道的形式,加速了媒體的數字化轉型,推動著傳媒向智媒轉變。但傳播是人的活動,人是傳播的參與主體,人在情感、意識、思想、人格等各方面都有著不可替代性,因此無論技術如何發展,都不應該抹殺人的主體意識和主體地位。技術發展雖然給傳媒業帶來了便利、高效的新聞生產方式,但也使真人主播面臨職業焦慮和價值迷失的風險與挑戰。如若讓人類屈從于數據計算和生產機器,讓技術規則和技術理性構建人類生活的基本方式,那么人的主體性地位將受到威脅,人將成為技術的附屬品,失去對新聞的控制能力。
同時,我們應清晰地認識到,人工智能并不是萬能,不可能完全取代人類所有的工作。從AI合成主播的發展現狀來看,目前的人工智能技術尚不成熟,只能進行一些簡單、基礎的信息播報工作,無法完成復雜的半文本、無文本的創作表達。AI合成主播和智能語音助手、機器人寫稿等,都是在植入人工算法的機器人中,根據編輯設置的既定程序,用機器取代簡單重復的勞動,最終經過人工檢測,符合要求才對外發布的。在此過程中,人依然是主導者和“把關人”。
(二)引導科技向善,警惕不當競爭
麥克盧漢認為,媒介是人體的延伸。事實上,人工智能技術在新聞傳播領域的應用也可看作是一種人體的延伸,它既是對人類肢體、感官的延伸,也是對人類精神活動和思維過程的延伸。
人工智能在應用初期主要作為輔助新聞生成的手段,但隨著技術更新迭代,算法正逐漸滲透進社會價值層面,技術這把雙刃劍所帶來的迷思導致向善變得愈發撲朔迷離。梅塞尼在《技術與社會》中提出技術中性論,即技術本身并沒有善惡之分,而是使用技術的人使技術具有善或惡的屬性。新聞傳播主持工作本身就是對新聞內容再加工、再創造的過程,或者說是一個藝術創作的過程[10],需要依靠人的情感智慧和經驗積累作為支撐與沉淀,技術只能作為一種輔助人類的工具。然而,目前人工智能技術在新聞傳媒領域的應用,給新聞業務帶來了去個性化、去情感化、去思想化的問題,這無疑是一種反人格化的行為。
隨著人工智能、物聯網、生物技術等新興技術的發展,機器學習不斷深化,人工智能的最高層次是機器出現自主意識,和人一樣出現自主判斷和決策能力,甚至擁有人的自我意識和情感情緒等[11]。倘若有天AI合成主播發展成為擁有海量數據知識的仿真人,那么一旦人類失去對技術的駕馭能力,技術與人類之間就可能形成不當競爭,人類將面臨技術失控的風險。而科技向善問題的本質是技術與文化的關系問題,技術與文化的博弈始終應堅守人類社會共同價值之“善”[12],實現“人機交往”和“人機共生”,而不是讓技術凌駕于人類主體之上。
總之,我們應該利用技術造福自身,因勢利導,趨利避害,讓技術在傳媒業中發揮出正向效應。
(三)新聞從業者須創造不可替代性
新聞播音主持是一個傳播與藝術交叉的行業,只有兼具思想智慧和藝術性,才能達到良好的傳播效果。縱觀現在的媒體行業,很多真人主播只做到了見字出聲,流利順暢,缺少對稿件內容的理解、對情緒的感知,以及對觀點的把握。這也正是為何在AI合成主播出現之際,一些業務能力不達標的主播面臨被市場淘汰的風險。
目前,AI合成主播還沒有發展到能完全取代真人主播的地步,對現階段的人類而言,重要的是在工作中尋找自我驅動力,借助技術手段進一步激發創造力。新聞從業者應順應時代發展潮流,善用網絡和新媒體技術的優勢,以AI技術、5G、大數據、云計算等技術為輔助,豐富新聞內容生產力。未來,要讓計算機逐步代替人力資源從事重復性的簡單勞動,讓作為新聞生產主體的新聞從業者抽離出新聞勞動,重點把關新聞的價值觀,從而讓智力資本充分發揮,提供創造性的復雜勞動以及價值輸出功能。同時,新聞從業者還應不斷提升專業實力,形成個性風格,創造不可替代性,創造“人無我有,人有我優”的獨特優勢。尤其是在媒體融合時代,更須強化自身數據技術,優化職業結構,在人機互嵌中實現人與新興技術的共同進化。
五、結語
雖然AI合成主播展現出許多進步性,但依舊遠未能達到能夠代替人類的程度,作為身體實體性延伸的“離身”互動還難以徹底替代“具身”傳播。人類的情感、個性、智慧與思考是新聞媒體行業長久發展且必不可少的重要支撐,也是AI合成主播難以與人類相匹敵之處。
盡管如此,面對新技術的快速發展,我們依然應抱有審慎的態度。對傳媒從業者而言,既應發揮身體在場的優勢,強化自身業務實力,同時也應明確認識到,智能媒體技術的發展不是為了和人類“搶飯碗”,而是為了更好地實現萬物互聯,實現共享共建智慧社會生態。在智能化信息技術流行的“人機博弈”時代,不盲目歌頌技術帶來的便利,而要堅守自己的價值,及時反思技術存在的弊端和局限性,學會趨利避害,以更加合理科學的方式駕馭算法、擁抱算法,讓人機關系從博弈走向共贏,實現取長補短、協同合作,讓技術真正為人類社會服務。
參考文獻:
[1] 殷樂,高慧敏.具身互動:智能傳播時代人機關系的一種經驗性詮釋[J].新聞與寫作,2020(11):28-36.
[2] 芮必峰,孫爽.從離身到具身——媒介技術的生存論轉向[J].國際新聞界,2020,42(5):7-17.
[3] 劉海龍,束開榮.具身性與傳播研究的身體觀念——知覺現象學與認知科學的視角[J].蘭州大學學報(社會科學版),2019,47(2):80-89.
[4] 郭琳.“AI主播”技術挑戰下新聞主播傳播角色重構與策略優化研究[J].新聞愛好者,2019(8):30-33.
[5] 曾潤喜,潘穎.媒體融合時代的計算新聞成熟度評價研究[J].福建師范大學學報(哲學社會科學版),2021(4):123-134,171-172.
[6] 高貴武,楊航. AI主播與主持傳播中的人格進化[J].青年記者,2019(22):51-52.
[7] 崔曉靜. AI時代的“去主持人化”爭議[J].青年記者,2019(26):4-5.
[8] 萬艷,王雪梅.智媒時代AI主播的生成與啟示[J].青年記者,2019(26):8-9.
[9] 於春.傳播中的離身與具身:人工智能新聞主播的認知交互[J].國際新聞界,2020,42(5):35-50.
[10] 孔令強.模仿、創新與新聞黑箱——對“AI合成主播”的技術反思[J].傳媒,2020(17):47-49.
[11] 何哲.人工智能時代的政府適應與轉型[J].行政管理改革,2016(8):53-59.
[12] 伏志強,孫偉平.科技向“善”:人工智能發展的價值遵循[J].甘肅社會科學,2021(2):97-103.
作者簡介:潘穎(1997—),女,湖北宜昌人,碩士,研究方向:媒體融合。