段華 陶玉潔 秦暢
摘要:人工智能技術的支撐,打開了媒體行業發展新格局。當前,這一發展成果被應用到傳播領域,人工智能主播出現在大眾視野。文章通過分析人工智能主播建設的戰略格局及其所呈現出來的功能局限,評估其未來發展的可行性,旨在拓展人工智能主播研究新視角、延伸人工智能主播應用新思路,進而推動傳媒產業、人工智能主播產業的發展。文章結合北京人民廣播電臺真人數字人“時間小妮”、湖南衛視數字主持人“小漾”以及新華社數字記者、全球首位數字航天員“小諍”的應用情況,借鑒和參考中國播音學、傳播學、計算機科學以及人工智能等相關學科的知識,針對人工智能主播在廣播領域的發展現狀,探析如何挖掘人工智能主播的潛力與價值,得出人工智能主播雖然在信息傳遞、娛樂和其他領域中發揮著重要作用,但在語音合成、情感模擬、信息質量和人際互動等方面存在一系列功能局限的結論。文章指出,受眾對人工智能主播的接受度與其功能水平密切相關,需要更多的技術創新和用戶體驗優化來推動其進一步發展。未來,人工智能主播將凸顯其在信息傳播和用戶互動方面的潛在價值,朝著定制化、情感化、智慧化的方向發展,通過人工智能技術為受眾精準畫像并進行個性化分析,推送個性化內容,提高受眾的依賴度。
關鍵詞:人工智能主播;應用現狀;功能局限;發展路徑;未來方向
中圖分類號:G222.2;TP18 文獻標志碼:A 文章編號:1674-8883(2024)03-0005-03
課題項目:本論文為2022年度廣東省本科高校在線開放課程指導委員會研究課題“關于在線開放課程驅動高校混合教學變革研究——以普通話語音課程為例”成果,項目編號:2022ZXKC267
目前,我國的人工智能主播建設普遍呈現以“主流媒體引導、互聯網公司技術支持”為特點的戰略格局。在實際應用方面,人工智能主播的進化發展呈現出從聲音文本到智能語音對話的轉化[1],再到多模態交互的“三步走”戰略,研究進度走在世界前列。
在2018年第五屆世界互聯網大會上,新華社聯合搜狗公司推出世界首個全仿真智能主持人“新小浩”。該智能主播以主持人邱浩為原型,可以根據實際需要選擇漢語或英語播報,實現了“聲音的文本轉化”初步設想[2]。但由于當時技術有限,所以首個全仿真智能主持人只能“坐播”,無法添加相關聯的肢體動作[3]。
2019年,新華社與搜狗公司聯合發布全新升級的站立式、女性人工智能主播“新小萌”,并投入當年有關全國兩會的新聞報道中。這標志著中國人工智能主播技術迅速成熟,具有實際應用意義。站立式女主播可以根據相應播報內容展示肢體動作,聲音更具有親和力[4]。
2020年,新華社聯合搜狗推出3D人工智能合成主播“新小微”,在視覺上還原了真人發膚,在立體感、靈活度、可塑性、交互能力等多個方面的設計上進行了全方位的優化[5],增加了播報內容時真人情感的肢體和表情外露。
除了新華社,以央視、新京報為代表的主流媒體也在積極研究推進人工智能主播技術發展。2018年5月2日,在CCTV13的特別報道《直播長江》中,虛擬主持人“康曉輝”與記者在現場進行對話互動、表演繞口令,聲音和形象都栩栩如生[6]。從新聞畫面里可以了解到,虛擬主持人“康曉輝”并不是提前制作好的動畫,而是實時操控的畫面[7]。此外,央視與百度公司合作推出的人工智能手語主播在2022年北京冬奧會中投入使用,服務世界聽力障礙人士,彰顯人文關懷。
北京廣播電視臺充分利用臺內資源,挖掘傳統廣播電視臺的轉型路徑,將臺內當家主持人春妮的形象轉化為數字化形象,發布中國首個廣播級智能交互真人數字人“時間小妮”,處于業內的“第一梯隊”。央視在對其的評價中提到,“以往,其他主流媒體生產的數字人產品多集中在人工智能主播領域,而‘時間小妮則側重于用戶服務功能,以人工智能和情景對話的形式為用戶奉上貼心服務”[8]。
湖南衛視數字主持人“小漾”取名靈感源于英文單詞“Young”,寓意與湖南衛視立臺理念“年輕與青春”相符。“小漾”與當代20歲左右的年輕人一樣,對事物充滿激情和熱愛,同時又自信、陽光。她現在的定位是實習主持人,后續她將在湖南衛視的各類綜藝、晚會中完成輔助人類主持人溝通節目環節、活躍現場氣氛等工作。
2021年6月17日,神舟十二號載人飛船發射圓滿成功,中國空間站迎來了新華社數字記者、全球首位數字航天員“小諍”,它承擔著載人航天工程、探月工程、深空探測工程等國家重大航天項目的現場報道任務[9]。近段時間,“小諍”主要駐扎在中國空間站天和核心艙,并“游歷”于國際空間站、和平號空間站,講述有趣的航空航天知識。
人工智能主播雖然在信息傳播、娛樂和其他領域中發揮著重要作用,但其在語音合成、情感模擬、信息質量和人際互動等方面仍存在一系列功能局限。
(一)語音合成的局限
當前人工智能主播的語音在自然度和流利度方面,雖然語音合成技術不斷改進,但人工智能主播的語音仍然難以與人類語音的自然度和流利度媲美。有時,人工智能主播的語音可能顯得機械或生硬,難以模擬真實人類的表達和情感。
在口音和方言方面,語音合成技術在處理多種口音和方言時可能面臨困難。人工智能主播的語音可能無法準確模擬特定地區或群體的語音特征,導致觀眾難以理解或認同。
(二)情感模擬的局限
人工智能主播通常是基于預先編程的腳本和算法運行的,缺乏人類的創造性和情感深度,通常無法提供與人類一樣的情感深度和情感互動,尤其是在復雜的情境下。其情感模擬的準確性依賴情感識別技術[10]。雖然已經有了不少進展,但情感識別仍然不夠精確,可能導致人工智能主播錯誤地理解或回應用戶的情感。并且,它們難以真實地理解和回應用戶的情感需求,導致在某些情境下顯得冷漠或不夠體貼。
(三)信息質量和可靠性的局限
缺乏判斷能力。人工智能主播通常是基于預先編程的算法運行的,缺乏人類的判斷和驗證能力。因此,難以準確識別和過濾虛假信息,容易傳播不準確或誤導性的信息。
信息源的可信性。人工智能主播獲取的信息往往來自各種渠道,難以評估信息源的可信性,因此可能傳播未經驗證的信息。
信息失真和誤解。雖然自然語言處理技術不斷改進,但人工智能主播仍然存在對語義和上下文的理解挑戰。這可能導致信息的失真和誤解,使其與原意相去甚遠。
多義性問題。人工智能主播難以準確理解和解釋多義性的語言表達,這可能導致信息誤解。
專業領域知識限制。人工智能主播通常不具備特定領域的專業知識,只能提供基本的信息和答案,難以解決復雜問題或提供有深度的見解,因此在特定領域的信息傳遞中可能出現局限。
(四)人際互動的局限
人工智能主播無法完全替代真正的人際互動[11]。人類之間的情感聯系和復雜互動不僅依賴語音和圖像模擬,還包括非語言溝通和情感互動。預先編程的腳本和算法運行限制了人工智能主播在實時互動中的表現,其難以應對實時互動和復雜對話,特別是在需要迅速適應情境的情況下。
此外,人工智能主播難以進行非語言溝通,如肢體語言、面部表情和眼神交流,這限制了其在建立深刻的情感聯系方面的能力[12]。
隨著技術的不斷進步,人工智能主播功能局限正在逐漸減弱,Google的WaveNet和OpenAI的GPT-3聲音合成模型可以生成逼真的人類聲音。而Deepfake技術的顯著進展,能夠使人工智能主播以令人難以分辨的方式模擬人的臉部表情。
據國際數據公司(IDC)的統計,計算機視覺市場預計在未來五年內以每年20%的復合年增長率增長,這些技術進步都為人工智能主播在未來的發展和應用提供了更多機會。
(一)個性化和定制化
未來的人工智能主播可以通過為受眾精準畫像,根據受眾的需求和喜好進行個性化和定制化,以提供更具吸引力的用戶體驗,包括調整語音特點、情感回應以及提供特定領域的信息和建議。
由此可見,客戶發展的需求促使定制化的人工智能主播產生。例如,市場需要播報體育賽事信息的人工智能主播,可根據體育賽事觀眾信息了解需求進行人工智能主播設計,使其達到體育賽事播報的資格要求。
同時,隨著相關技術的成熟,人工智能主播或能實時將手機屏幕文字轉換成語音,并支持用戶根據個人喜好挑選語音包,擁有自己的專屬主播。顯而易見的是,這項技術將為社會中的視障用戶群體提供極大便利[13]。
(二)情感化發展,貼合溫度
人工智能主播的情感化發展首要目標是提高情感識別和模擬能力。這包括更好的語音情感分析和情感識別技術,使人工智能主播能夠感知用戶的情感狀態,并以相應的方式互動。情感模擬將包括更自然的情感表達和聲音情感合成,使人工智能主播的語音和表情更貼近真實[14]。
未來,人工智能主播將能夠提供更個性化的情感回應,能根據用戶的個性、偏好和情感需求,調整情感表達和互動方式[15],以更好地滿足用戶的需求。這些調整有助于提供情感支持和心理健康方面的應用。人工智能主播可以成為孤獨人群的情感伴侶,提供更富有情感的互動體驗,也可以用于心理治療、情感識別和干預。
(三)智慧化升級,貼合智能高度
一直以來,人工智能領域朝著貼合人性智慧發展需求演化,由于傳媒行業是面向社會受眾的,所以其對主持人綜合能力和知識儲備的檢驗也是全方位的。人工智能主持人需要不斷完善社會知識儲備與增加人情味,不僅僅是語言,還有肢體、表情管理與智能的聯動配合,如此才能更好地滿足社會受眾的需求。
此外,傳媒行業需要與社會保持密切聯系,特別是對社會的熱點新聞需要及時捕捉,這樣才能更好地實現與公眾的互動,更好地開展工作。為此,人工智能主播必須不斷豐富知識儲備,以滿足社會發展的需求。
人工智能主播是一個備受矚目的技術領域,雖然其在功能上存在一些局限,但未來仍有巨大的發展潛力。隨著技術的不斷進步,人工智能主播的語音和表情模擬能力將得到優化提升,情感模擬將更加深入,應用領域將得到擴展,倫理和法律框架將逐漸完善。人工智能主播有望在未來成為更普遍的工具,為人們提供娛樂、信息和服務。但在發展過程中需謹慎處理倫理和法律問題,以確保其使用的合法性。
參考文獻:
[1] 王鶴.人工智能時代職業主持人應有的堅守與變革[J].互聯網周刊,2022(22):67-69.
[2] 孫昊.人工智能技術在媒體信息生產與傳播中的應用研究[J].信息與電腦(理論版),2022,34(5):153-155.
[3] 陳峰.賽博空間虛擬偶像的亞文化構建與迷群崇拜研究[D].長春:吉林大學,2023.
[4] 劉萍.媒體融合背景下主流媒體語態變革的守正創新[D].長春:長春工業大學,2023.
[5] 陶一萍.以技術創新打造精品融媒體產品:新華社智能化編輯部兩會報道的實踐與思考[J].中國傳媒科技,2020(6):11-13.
[6] 賈軍.媒體智能化背景下的新聞生產研究[D].武漢:武漢大學,2020.
[7] 白秀梅,徐世民.虛擬主播在應急氣象影視節目制作中的應用探討[J].黑龍江氣象,2020,37(2):31-32.
[8] 李偉良.廣播電視和網絡視聽行業“次元偶像”現況探究[J].廣播電視信息,2022,29(5):18-20.
[9] 綜合.虛擬數字人“走進”生活[J].現代班組,2022(3):16.
[10] 劉大誠.人工智能情緒識別應用研究[J].中國高新科技,2019(13):59-62.
[11] 任秋璇.從主持傳播角度淺析人工智能背景下主持人被替代的可能性:以新華社“AI合成主播”為例[J].視聽,2019(12):146-147.
[12] 衛艷菲.人工智能技術下視頻新聞的新嬗變[J].傳播與版權,2021(5):4-6,9.
[13] 戴偉. AI主播的人性化傳播實踐與探索[J].視聽,2023(2):140-143.
[14] 王十. AI主播的擬態話語研究[D].天津:天津師范大學,2023.
[15] 呂欣,許倩.萬物互聯與人機共生:新冠肺炎疫情期間的網絡傳播實踐與思考[J].傳媒,2021(4):23-25.
作者簡介 段華,副教授,研究方向:播音主持業務、大型賽事體育展示、新媒體傳播。陶玉潔,研究方向:新媒體傳播。秦暢,研究方向:新媒體傳播。