張一帆 姜卓群
(作者單位:1.南昌航空大學;2.河北美術學院)
早在2001年英國就推出了世界上第一個虛擬主持人——阿娜諾娃(ANANOVA),由此開啟了虛擬主持人的旋風,并在全球掀起了虛擬熱潮,中國、日本、韓國等都進行了嘗試。處于萌芽時期的虛擬主持人呈現出語言機械、形態僵硬、計算機動畫(Computer Graphics,CG)技術不成熟等缺陷,此后十余年虛擬主播的發展也并未激起科技界的轟動。直到2018年,虛擬主播正式開啟真人原型的“分身”,由新華社聯合搜狗發布的全球首個人工智能(Artificial Intelligence,AI)合成主播“新小浩”于第五屆世界互聯網大會問世[1]。次年2月,全球首個站立式“AI合成主播”——“新小萌”問世,其聲音和形象都優于之前的“新小浩”。此時AI合成主播與早年間的虛擬主播相比已經發生了極大的變化,尤其是2020年推出的全球首個“3D AI 合成主播”“新小微”硬核上線,這是AI領域和新聞生產深度融合的飛躍性成果。高度智能化的“新小微”,在交互能力和場景切換應用層面較之前取得了很大進步,且實現了單一景深機位到可全方位視角呈現的跳躍式進步,立體感和逼真性明顯增強[2]。除此之外,“非對稱式互信息估計器”保證了音視頻轉換過程中損耗值盡量最小,轉換的映照盡可能準確。
從“AI合成主播”的誕生、更新換代,到全球首個“3D AI 合成主播”的正式亮相,新型主流媒體與AI技術達成了深度融合。AI主播近幾年發展突飛猛進,“3D AI 合成主播”的加入,除了給人帶來新奇感之外,新聞工作者存在的意義將重新定義。AI的出現掀起了一波科技改革的浪潮,而“3D AI合成主播”的出現更是引發不少新聞播音人士的焦慮。的確,“3D AI 合成主播”為新聞節目制作和呈現帶來了更多選擇,但是AI合成主播未來是否具有人腦一樣的思考力還未可知。關于人機協同如何發展,學界和業界還需進一步探討,尋求二者的平衡點。
作為真人主播的“鏡像”,“3D AI 合成主播”可進行信息資訊的海量收集,全天候大容量播報。與真人主播相比,在新聞播報語速把控、相關信息快速提取、信息無紕漏輸出等方面都更勝一籌。內容生產層面,虛擬主播根據文本便可自動生成報道視頻,如新華社媒體大腦“MAGIC”可最快在6秒內自動生成短視頻。原始視頻剪輯中一幀畫面的差池便要重新合成、導出,幾十秒的短視頻整套流程下來要花費幾個小時。在新聞挑選層面,平臺自動識別出具有較高新聞價值的訊息,幫助記者在海量信息中及時完成報道,提高新聞的時效性。虛擬主播在達成高效率的同時具有優質的性價比。24小時無間斷運行,高強度體能在線,實現零失誤、無紕漏輸出,一定意義上解放了傳媒業的生產力。
“3D AI 合成主播”作為一種媒介視覺呈現,從形象載動信息的角度來說,與前幾代相比,“新小微”最大的進步就是高度復原了真人的外形特征。媒介形象作為信息傳達的中介,造型上的接近性會帶來心理上的接近性?!靶滦∥ⅰ备叻抡嫘缘耐庑稳〔挠谛氯A社記者趙琬微,本土化的外形更易帶來文化認同感。個人形象是視覺范疇的第一要素,譬如早期的比爾·鄧,不論是外形還是名字都具有西方化的特征,體現在聲畫造型上就是聲音機械化、行為舉止遲鈍,觀感不佳。中國觀眾對于比爾·鄧的視覺導入認可度極低,而“新小微”的形象診斷和形象定位都符合中國審美,外形與氣質具有親和力,造型本土化的應用上頗為用心。
多種語言加持,助力文化對外輸出。AI合成主播可切換至任何國家的語言播報,起到溝通中國和世界的橋梁作用。2019年,AI虛擬主播“小晴”在科大訊飛新品發布會上首次使用全球多語種,實現中、英、日、韓等七國語言,以及兩種民族語言——維吾爾語、藏語同時進行直播[3],還表演了變聲技術,實現聲音的模仿,助力中國文化輸出。2020年,阿里AI完成全球首個多語言實時翻譯的電商直播,直播過程無懼嘈雜的環境,讓機器聽清、聽懂,實現了中文直播內容精準翻譯成多國語言的目的,幫助人類跨越語言障礙,助力中國文化對外輸出。
算法驅動下,“AI合成主播”穿梭于不同直播間,在真人主播難以到達現場的情況下,幻化成不同的分身,打破時空情景,成為真人主播的替補上場完成任務。2020年,真人主播迫于空間限制信息傳播量減少或傳播不及時,一時間信息“供需不平衡”,AI主播分化到各個平臺,發生緊急情況時及時向受眾播報新聞,保證信息及時、準確供應,避免謠言的滋生,保障了公眾的知情權。
“真人分身”實現了多場景轉化,增強現實(Augmented Reality,AR)、 虛 擬 現 實(Virtual Reality,VR)等技術賦能,再現新聞事件現場,將報道場景延伸至虛擬演播廳完成新聞播報。從視覺上看,AI主播還原了新聞的現場感,能更好地滿足受眾對現場多樣化呈現的需求。相比而言,真人主播的創作場景較單一,無法打造視覺奇觀,某種程度來說無法滿足觀眾對新鮮感的需求。
“情感”是藝術作品的核心,是主持人有聲語言外化的基石。播音員主持人作為有聲語言的傳遞者,“情景再現、內在語及對象感”等內部技巧均是塑造播音主持作品的要素?!?D AI主播”高度還原了真人主播的發音、樣貌,但是外部技巧的豐盈也難抵內部技巧的缺失,只有與客觀世界發生真實存在的聯系才能獲取對現實世界的真實感受,尤其是主持人與被訪者面對面交流的過程中,表情、語氣、語調等非語言符號發揮的作用甚至超越了語言符號,而人工智能主播無法傳遞副語言。日本機器人科學家森政弘曾提出,對于高仿真的機器人,人們會產生恐怖感,原因之一“源于高仿真形態下真假的不確定會給人帶來的不安”[4],這種不安直接導致AI主播與人的交流感消失殆盡,交流感是中樞神經系統的延伸,它超越了任何一種媒介,只有人類言語本身才能與之匹配,源于此,AI主播將一直存在于交流失效的循環怪圈。
文字是規定性的,語言是創造性的。對于一般的信息內容,客觀事實信息占據主體的位置,但在面對傳染性疾病時,媒體的喉舌作用最先體現的是關注“生命體”。情緒和情感的支撐是新聞報道的靈魂,也是播音員主持人進行“二度創作”的過程。面對復雜的情況,主持人會依據自己的社會經驗、文化教育、情感體驗等對生活的感悟提前預判觀眾的情緒變化?;谒惴ㄟ壿嬒碌腁I合成主播只不過是程序游戲下的產物,盡管AI主播可以依據機器學習,模擬人類表情、揣摩人類心理活動并機械地作出預判,但究其根本是依據數據庫被賦予的學習能力,而缺少人文情懷和共情能力,人類心智的解讀仍然是AI主播永遠難以跨越的鴻溝。
主持人是一個節目最有影響力的品牌,是廣播電視新聞風格和頻道形象的構成要素。媒介融合趨勢加快了主持人IP化塑造的步伐,催生了“粉絲經濟”,康輝、撒貝寧、尼格買提、朱廣權四位主持人組成的“央視boys”最為明顯,他們擁有高水平的專業能力,且各具特色,收獲了大量“粉絲”。康輝作為新聞聯播的主持人,以往都是以嚴肅、端莊的形象出現,隨著短視頻的興起,中央電視臺開通了“主播說聯播”賬號,讓受眾了解到康輝作為主持人生活化的一面,拉近了與受眾的距離;再譬如撒貝寧,《今日說法》中的嚴謹認真,《你好,生活》中的詼諧幽默,《開講啦》中推己及人的同理心,以及《經典詠流傳》中超強的控場能力等,贏得大批粉絲的關注。
主持人在不同的節目呈現出不同的風格,通過個性化的語言樹立標簽,形成節目的品牌效應。品牌效應是受眾對節目產生深度黏著的關鍵,“粉絲經濟”就是很好的印證。在“粉絲經濟”里,商品的符號價值遠遠大于商品的實際使用價值,情感上的傾向性帶來心理上的滿足,受眾對節目的信任度和忠誠度在很大程度上源于主持人的感染力和感召力。粉絲的黏性越強,信任度越高。真人主播的感受是多樣的,他們將自身置于過往所見所得所感之中,播報的每一個字符都是基于生活的沉淀,如此傳達的信息才能令受眾感同身受。而AI合成主播只是機械的符號,沒有個人風格,無法營造情感氛圍,受眾的消費也只是停留在“資訊消費”的階段?!胺缕浔黼y以仿其里”是AI主播的一大缺陷,算法操控下機械化的符號難以傳達個性化的傳播特征,受眾容易產生審美疲勞,節目的主流價值導向作用無法發揮。
唐·伊德在吸收莫里斯·梅洛-龐蒂“知覺現象”的基礎上,提出了“具身性”,具身強調心智、身體和環境的一體化。而身體是人和社會之間進行溝通交流的本質條件,是參與社會最基本的方式。人們利用神經系統、視覺器官等去認知主體,在這個過程中,“身體”被放置在一個最顯現的位置上[5]。身體與環境的交互性和融合性直接決定了新聞報道的傳播效果。行為主義心理學提出的“刺激反應論”提到,身體通常作為接受外界刺激的效應器來處理,是視覺、聽覺、味覺等接受外界環境刺激后引發有機體作出相應反應的渠道從而發揮作用。主持人依據自身所處的環境、經驗閱歷進行信息加工處理,同時考慮受眾的人口學特征,這個過程直接決定了傳播效果的好壞。而人工智能主播是人類構造的符號現實,這些符號對社會現實進行再生產,主體仍然是個體,而非個體的產物?!?D AI合成主播”現有的導入都是基于人類過去的經驗和現有的認知,人類社會的發展必然帶來技術的更迭,這一切都依賴于人類思維的進步,其看上去是技術驅動自身,但實際上技術應用的第一推動力依舊是人。人工智能主播只是在盡可能地營造出一個逼真的虛擬空間,一旦脫離身體,主持人就無法在其所處的環境中進行信息加工。
AI合成主播依據大數據建模而成,沒有自主思維,無法賦予新聞報道深刻的內涵,譬如“深度調查節目、人物訪談或者突發事件的現場報道”具有高度的自發性和不可預測性,主持人的臨場反應能力正是新聞專業能力的體現,虛擬主播無法察言觀色,難以準確拿捏所獲信息的準度和精度,沒有獨立應對突發事件的能力,發揮不出價值導向的作用,新聞背后的溫度更是難以企及。
“人機博弈”的時代,實現“人機共生”才是可持續發展的道路。
媒介融合背景下,基于算法和大數據的人工智能正在改變行業結構,更新傳播方式,改革傳播模式。AI主播可以發揮高效率、全天候、高精度的功能,幫助真人主播從超負荷的工作中解放出來,令他們專心投入創造性的新聞活動。融媒體時代,受眾的需求不僅僅是知曉權,而且在信息量、權威性和可看性等方面也提出了較高的要求,更要注重的是情感的溝通交流。虛擬主播剛剛問世的時候依靠新鮮感確實可以吸引受眾觀看,要想加深節目對受眾的深度黏著,樹立品牌形象,彰顯頻道意識,還要依靠真人主播來完成。的確,智能主播在精確傳達信息、自動核查信息、快速搜索信息等方面無法超越,人類主播則在深度調查、觀點導向、情感交流、應變能力等方面發揮自身優勢[6]。基于此,對于人工智能是否會取代人類這一問題,答案不言自明。人類是情感表達的本體,自主能力和決策能力使人類仍然處于主體地位。盡管如此,人們仍需抱著謹慎的態度,發揮具身優勢,同時認識到技術本無善惡,決定技術善惡的是使用技術的人。
倘若未來人工智能發展到可以自行思考的階段,必定會展開一場“新論戰”。那么,新聞工作者就應進一步提升自身的專業技能和職業素養[7],發揮自身的創造力。從思維意識和外部技巧同時進行調整,扮演“把關人”的角色來重構自身價值,突出媒介意識體現者、價值導向者的獨特身份,掌握輿論主導權,主動并積極應對人工智能化浪潮帶來的挑戰。