席驍 劉娜
摘要:《創新中國》是由中央電視臺聯合深圳市委宣傳部于2018年1月22日推出的一部紀錄片。該片用鮮活的故事記錄當今中國偉大的創新實踐,并在宏大的國際視野中探討中國的創新成長及由此引領的世界影響。該片的最大亮點是在制作中沒有采用真人解說,而是開創性地使用了語音合成技術,再現了已故著名配音大師李易的聲音,完成了世界首部采用人工智能解說的大型紀錄片。文章從《創新中國》人工智能解說創作的突破與困境的角度進行分析,并對未來紀錄片人工智能解說做以大膽展望,以期拋磚引玉,引起人們對紀錄片人工智能解說的關注和思考。
關鍵詞:人工智能 紀錄片解說 李易 創新中國
近年來,隨著“真實記錄”逐漸成為電視節目的發展趨勢,一批高品質紀錄片涌現,《創新中國》即其中之一。《創新中國》由中央電視臺聯合深圳市委宣傳部于2018年1月22日推出,該片開創性地使用了語音合成技術,再現了已故著名配音大師李易的聲音,完成了世界首部采用人工智能解說的大型紀錄片。本文將從《創新中國》人工智能解說創作的突破與困境角度分析,以期引起人們對紀錄片人工智能解說的關注和思考。以下將“人工智能解說”簡稱為“AI解說”。
紀錄片AI解說的新突破
根據紀錄片總導演史巖描述,紀錄片《創新中國》對于解說聲音的要求是“平緩敘事”,在配音員反復試音無果的同時,一個大膽的設想出現。是否可使用AI語音的創作方法,再現李易的聲音。《創新中國》主創團隊與科大訊飛合作,精選出李易老師以往17小時的音頻素材,采用AI語音合成技術進行人工智能配音,從而“復活”了已故配音大師李易的聲音。
音色模仿的逼真。紀錄片解說的聲音選擇非常重要,好的選擇能夠起到整合素材、凸顯整體創作風格的作用。北京臺《環球影視》制片人楊愛華曾這樣評價李易,“李易在中國堪稱最高水平播音員,我們都覺得稿子被他一念就成了佳作”。可見一部紀錄片的成敗與解說息息相關。
“音色”包含“語音音色”和“嗓音音色”密不可分的兩重概念。在“語音音色”方面,畢業于北京廣播學院的李易,發音清晰、語句工整。配音演員趙可說,“李易的配音,既標準又自然,莊重而不呆板、活潑而不浮躁”。紀錄片《創新中國》的解說,借助于AI語音技術,吐字歸音工整規范,音節之間銜接得當。特別是對于李易句尾音節獨特共鳴的復刻,余音繞梁不絕于耳。在“嗓音音色”方面,李易的音色寬厚自然,多運用虛實聲,聲帶基音與多重泛音共鳴配比和諧。在《創新中國》的解說創作中,正是借助李易獨有的嗓音質感進行AI語音的生成,充滿紀實魅力,引發觀眾的審美愉悅。
語言表達的準確。張頌教授所講“有稿播音錦上添花”。紀錄片解說屬于有稿播音創作,要在一片“錦繡”之上運籌帷幄、接續創作,就要在紀錄片解說創作中錘煉語言表達,發揮深化主題、細節描述、思路引導等重要作用。
語言表達過程可分類為對于“邏輯”表達和“情緒”表達兩種傾向。當解說內容側重于說理時,李易的重音多集中在邏輯主干,語速穩健、多停少連,呈現出一絲不茍的信息傳遞。當解說內容側重于“情緒表達”時,重音多停留在修飾成分中,停連節奏變化會更豐富。李易的紀錄片解說,凸顯對解說內容的宏觀把握,通篇布局的語流變化精妙得當。在氣息支持下用“虛實聲”推動,語調隨之提升,點明文字主旨,表達效果極具張力。《創新中國》的AI解說在“邏輯”的表達時重音清楚、邏輯明晰,在播講“重音”的選擇上與李易呈現出相似特征。同時,在“情緒”表達時,同樣也會凸顯語流的變化來進行抒情,但不足是起伏較快、停留時間較短、缺乏整體把握。輔之,紀錄片的墊樂分擔了部分情緒渲染任務。
紀錄片導演史巖表示,“我們的宗旨,并非完全復原,而是創造一個我們心目中的人,這個人從李易老師演化而來,帶有一部分語感特點,但所有的斷句、重音、字頭、字腹、字尾、動程,都是在現有語音合成技術上重新設計的。”
創作途徑的新穎。AI創作是一種新穎的形式,如今人工智能技術成為新一輪科技革命和產業變革的聚焦點。在藝術創作領域,人工智能早已有作品問世,例如微軟小冰的詩集《陽光失了玻璃窗》。國內在媒體領域也早有AI智能的身影,例如新華社財經欄目的機器人記者“快筆小新”。
AI解說屬于新穎創作途徑,目前AI作為播報工具發揮著重要作用,進而AI如何表達情感則是一個新的挑戰。科大訊飛主管江源表示,運用人工智能技術為紀錄片配音,這對他們來說也是一次優化算法、提升人工智能水準的機會。AI解說也創造了一種新的可能性,李易是平實解說風格的開創者,用AI技術還原再現李易的解說,給創作者提出了一個新的思路。
紀錄片AI解說的困境
目前,AI人工智能技術還處于初級階段。有聲語言創作充分融入創作者的主觀能動性,具有人格化,符號交流過程飽含著情感態度。紀錄片的解說具有情感要求,成了AI解說的難題。
觀點態度表達困難。紀錄片的解說是一種接受美學創作,解說者觀點態度影響著觀眾對于紀錄片內容的思考。觀點態度更多是內心層面的思維活動,借助外部表達技巧實現。現有不足是AI解說主要對于語言外部技巧進行模擬,難以深入語言的內在意蘊,止步于信息傳遞,無法達到觀點態度的表達。
語流語氣運用生澀。語氣通過語流呈現,是情感表達的關鍵。吐字歸音是“唇形、舌位、口腔、音調”的變化過程,字詞寓于語流之中,相鄰的音節也會產生音變。紀錄片的語言表達往往具有“一氣呵成”的創作美感,音節與音節之間的銜接恰如其分、自然流暢。相比之下的AI解說,有聲波堆疊的痕跡,語流略顯生澀。播音主持創作反對見字出聲,即對于語流作用的重視。AI解說時,語流變化幅度較小也不具有大跨度的語流分析能力,語氣表達略顯生澀。
創作風格依賴模仿。風格屬于美學范疇,由創作者自身因素和外部因素所決定。現階段,AI播音員主持人往往具有真實原型,觀眾因為惟妙惟肖的模仿而產生新鮮感,并不是AI播音員主持人其自身生命力。紀錄片解說有著豐富的審美創作要求,李易的紀錄片解說將情感融入有聲語言創作,實現與觀眾的心聲交流,這一過程充滿了審美趣味。所以,如何讓AI具有“人性”,進而創作出具有獨立風格的作品,還是一個技術難題。
紀錄片AI解說的未來展望
計算機科學之父“圖靈”為人類打開了一扇人工智能的大門,如今人工智能技術在“藝術創作”和“情感陪伴”領域均有實踐,人們可展望隨著人工智能技術的提升,必然會繼續催生新的變革。
藝術創作是人類思維的碩果,AI技術的涌入拓展了創作的思路。對于紀錄片AI解說來說,專題紀錄片市場廣大,再加上新媒體帶來的大量快銷作品的創作需求,AI智能語音的準確度、穩定品質和創作高效率低成本,將會成為亮點,成為解說創作的新選擇。
腦機融合創作的思路。人腦擁有創作“意識”,AI智能語音擁有語音生成能力,提高紀錄片的情感表達,也許人機合作完成便是一種途徑。在《創新中國》的創作中,技術人員首先進行原聲素材采樣,運用AI技術生成紀錄片解說的聲音初稿,此時已具有了較高的完整度。剩下的問題語句和情感表達關鍵點則由主創團隊和技術人員共同完成。由主創團隊在文稿上重點標注之后再由技術人員利用語音“實驗室”級的技術,實現重音、停連、節奏的人工調整,一段解說詞生成出不同的表達版本以供備選,再由主創團隊放入紀錄片畫面進行適配確定。再經過多人多輪的審聽最終定稿,用主創者的說法即改掉了配音中的硬傷,使整體質量達到了平均水平。
這是讓AI語音賦予情感的初次嘗試,也許創作過程艱辛,但也證明了人機結合方式的重要性。隨著腦機融合技術的發展,也許在紀錄片AI解說領域,即可出現腦波干預下的AI語音技術,人類解說員的細膩情緒變化可通過傳感器融入AI解說創作,給機器賦予“靈性”,從而生成出真正的情感表達,值得人們思考。
人工智能情感技術的發展。人工智能情感技術是基于大數據、云計算、人工智能、深度神經網絡等智能技術的融合。也許借此程序擁有人類感情可真正實現,微軟的人工智能機器人“小冰”已在中國完成了300億次用戶對話,同時也提供了人類情感反應模式的海量數據。在未來,人們與AI智能進行交流時,會和人類交流無差別。日本石黑浩教授在描述人工智能未來發展時,第一個詞是“意識”。展望未來,如果人們能夠更好地認知人類思維的形成機理,機器人便可能真正擁有“意識”“想象力”和“創新力”,從而具有情感魅力的紀錄片AI解說,便不再是“巧婦難為無米之炊”。
結語
紀錄片《創新中國》記述了現實中國的創新壯舉,讓國人為之興奮和驕傲。與此同時,主創團隊推動AI智能技術在紀錄片解說領域邁進,世界首創。AI紀錄片解說是人類“藝術”與“技術”的兩大實踐的相會,迸發出創新火花。人工智能的運用,讓人們更加深刻地認識了人類思維與情感的本質,人工智能技術也將繼續推動紀錄片AI解說向未來邁進,紀錄永駐,創新不止。(作者單位:江西應用科技學院)
參考文獻:
1.姚喜雙:《播音主持藝術》,北京,北京廣播學院出版社,1997年版。
2.蔡自興,徐光祐:《人工智能及其應用》(第五版),北京,清華大學出版社,2016年版。
3.翁佳:《智能語音技術對播音主持專業與行業影響探究》,《電視研究》,2017(12)。
4.程粟:《〈創新中國〉:新時代科技紀錄片的精品之作》,《當代電視》,2018(11)。