文/李粵
2018年1月22日,世界首部利用人工模擬人聲的紀錄片《創新中國》在中央電視臺的紀錄片頻道播出。這部名為《創新中國》的紀錄片最特別的部分在于解說詞部分全程運用人工智能配音,“重現”了已故配音大師李易的聲音。由于以前和李易老師有過多次廣告合作,對李易老師的聲音非常熟悉。這次聽到人工智能合成的李易老師的解說詞,只能用震驚來形容,不但那雄渾深沉的音色完全就是李易老師本人,而且每個呼吸,口氣都那么自然,眼前立刻再現了李易老師在話筒前娓娓道來的畫面。前幾年還生硬的一個一個蹦字的語音合成技術短短這么幾年就達到了幾乎以假亂真的效果,不得不感嘆科學技術的發展真是日新月異,同時又不禁思考這幾乎以假亂真的語音合成技術對以聲音為主要傳播方式的廣播電臺又會帶來什么影響呢?
首先簡單介紹一下語音合成技術。語音合成技術又叫文語轉換(TEXT-TO-SPEECH)j簡稱TTS技術。隸屬于語音合成,它是將計算機自己產生的、或外部輸入的文字信息轉變為可以聽得懂的、流利的口語輸出的技術。我們最熟悉的高德地圖導航里的林志玲的聲音,就是通過語音合成技術生成的。首先,科大訊飛采集一些林志玲的音頻,然后輸入文本并按照詞典規則對文本進行語言處理,模擬人對自然語言的理解過程,如文本規整,詞的切分,語法和語義分析,使得計算機可以對輸入的文本完全理解,并給出后續步驟的各種發音提示。然后就是韻律的處理,就是找到林志玲發音的特點。如音高、音色、音強、音長等,使合成的語音能正確表達語音,聽起來更加的自然。兩部分結合處理后輸出合成語音,實現了從文本到語音的實時轉換。隨著計算機深度學習的飛速發展,從文本轉換為實時語音變成越來越快速容易的一件事,采集任意喜歡的播音人的聲音,僅僅讓系統訓練學習幾個小時候就能完成這套轉換。
在語音領域還有另一項同樣給生活帶來翻天覆地變化的語音識別技術。語音識別技術,也被稱為自動語音識別Automatic Speech Recognition,(ASR),其目標是將人類的語音中的詞匯內容轉換為計算機可讀的輸入,例如按鍵、二進制編碼或者字符序列。
在新興媒體對傳統傳媒行業產生劇烈沖擊的業態下,紙媒倒下了,電視媒體也出現了斷崖式的下跌。唯一在行業寒冬種逆勢增長的媒體就是廣播媒體,是什么原因讓廣播媒體成為了一枝獨秀。我們來分析一下廣播媒體的特性。廣播媒體作為一個純聽覺媒體,是伴隨性的。很多聽廣播的場景都是這樣的:一邊開車一邊聽廣播,一邊健身一邊聽廣播,一邊寫作業一邊聽廣播,一邊做家務一邊聽廣播......聽廣播可以和生活中的很多事情并行。而像看電視,看新聞等視覺媒體必須要受眾的精力幾乎全部投入才能和媒體的輸出同步,獲得完整信息。在生活節奏異常快的今天,人們每天都會接觸到海量的信息,接觸媒體的方式也在碎片化,投入大量的時間和注意力在視覺媒體上都是很奢侈的事。同時隨著私家車擁有量的快速攀升,廣播這一擁有新媒體屬性的伴隨性特性,不獨占受眾精力的媒體能逆勢上揚也是必然的結果。但如果語音識別技術和語音合成技術發展到非常成熟的階段會產生什么樣的情況呢?我們再來分析一下廣播媒體和網絡媒體的不同之處。
廣播媒體的特性
1.廣播媒體是時間性媒體,它的傳播是一過性的,信息稍縱即逝,無法保存。
2.廣播的播出方式是線性的,聽眾無法獲知下一秒的信息是什么,只能被動的接受而無法自主選擇。
3.無法精確定位搜索所需信息,包括客戶音頻端,從音頻信息中搜索想要的內容十分困難。
4.聽眾所接受到的信息都是經過編輯記者精心選擇過的,是一個封閉的信息源,無法主動獲知更多的其他信息。
5.聽眾和媒體間,聽眾和其他聽眾間互動不易。
網絡媒體(以門戶網站為例)的特性
1.存儲性,隨時可查。
2.多種標簽,可根據多個關鍵字組合自主查找。
3.可隨時,隨地,隨意選擇用戶想了解的信息。
4.分布式結構,開放式平臺,無限連接,提供多種服務,可聽,可讀,可看,可用,可玩。
5.互動性。
我們以前總是喜歡說瀏覽網頁,看新聞。隨著語音識別技術越來越成熟,越來越多的智能語音設備進駐了家庭,私家車里,解放了人的雙手。試想一下,在私家車里,司機一邊開車一邊用語音控制設備。“我想聽海淀區升學的最新消息,請給我播放今日頭條,我想知道最新的國際新聞......”智能設備利用強大的搜索功能找到相關的消息,進行播報。隨著語音合成技術的飛速發展,甚至可以想像用戶還有自主選擇播音員的權利“我想聽朱亞文播報天氣預報,我想聽郭德綱播報國內經濟新聞……用戶擁有了完全自主的選擇權,還會選擇被動的廣播媒體嗎?等到無人駕駛全面實現的時候,又會發生什么新的變革呢?
我認為首先被沖擊的是讀書,小說評書聯播等節目。因為語音識別技術和語音合成技術的技術壁壘并不高,實現比較容易,只要可以獲得文本信息,用戶可以最低成本的選擇自己喜歡的任意書籍,選擇最喜歡的播講人來定制自己的語音圖書或評書節目。普通時政新聞,經濟新聞類,同質化嚴重。各個網站可以短時間內互相轉載,用戶自然不會守著收音機去隨機的獲取信息,而是根據自己的時間,隨時通過媒體端去自主的選擇自己希望知道的信息,甚至可以像上文描述的場景一樣,搜索文本信息自動實時的轉化為個人喜歡的專屬語音播報。
廣播媒體面對語音技術的沖擊該如何應對呢?以下是本人的幾點想法,很多想法還很不成熟,但也許能拋磚引玉引來更多的思考。
根據邁克爾·波特在《競爭戰略》中提到的三個基本策略中的差異化和專業化策略,廣播媒體要做到什么是人無我有的,人弱我強的。以我臺來分析,中央人民廣播電臺有競爭力的競爭點是什么?
1.中央人民廣播電臺作為國家電臺,廣播行業的龍頭,必然受到國家的一些政策支持及傾斜,一些重大的新聞事件,政策發布享有優先權,這是其他網絡媒體所不具有的。
2.中央人民廣播電臺的嘉賓都是政府和行業的重量級人物,還有一大批各領域的專家進行分析點評,使得中央臺的公信力、權威性、影響力毋庸置疑。而網絡上的很多信息真假難辨,無法得到信任。
3.中央人民廣播電臺擁有覆蓋全國的記者站40家,駐軍記者站18家,在臺灣地區也擁有駐點記者,這遍布各地的記者站構成巨大的信息網絡。除了能快速的得到第一手的信息,更能深入發掘新聞背后的真相。
4.中國人民廣播電臺擁于一流的技術、設備、專業人才。其中的新聞采編,節目制作方面屢獲大獎。尤其在新聞采編方面,幾十年的積累養成的新聞素養,使得國家電臺的專業性,廣度,深度、輿論引導能力是一般網絡媒體無法企及的。
5.數量眾多的優秀主持人和積累了70年多年的聲音資料構成中央臺龐大的音頻資料庫,其中更有很多極其寶貴的音頻資料是外界所沒有的。
6.中央人民廣播電臺除了17套廣播覆蓋到全國各地外,還有央廣網,數字廣播、數字電視頻道,手機電視、新聞客戶端、平面媒體等多媒體應用。此外還發起成立了擁有全國140多家電臺的中國廣播聯盟,并攜手世界各大華語廣播機構建立了全球華語廣播網,與全球大多數國家和地區的知名傳媒機構建立了廣泛的業務合作關系。這些跨媒體、跨行業、跨區域的聯合,實現了媒介融合,達到了各媒介的互為補充及延伸。了解了我臺的競爭點,就要考慮如何把這些競爭點轉化為競爭力及實實在在的盈利能力。
1.內容為王:媒體總說“內容為王”,這對于同質化越來越嚴重的新聞來說是破局的關鍵,尤其在網絡間互相轉載成風的業態下,有獨家的別人沒有的內容是獲得注意力的關鍵點。新聞剛發生的時候,各大媒體的內容基本都雷同,但隨著事件的推進,各家媒體的新聞水平,追根溯源的能力就始見真章了。利用我臺強大的信息網絡,利用國家媒體的政策優勢,依靠我臺新聞記者優秀的專業素養,追尋新聞背后的真相,深度報道。同時利用先進的語音識別技術,同步把廣播音頻轉化為文字(或同步新聞編輯稿件),在央廣網第一時間呈現。在央廣網站同時提供截取廣播音頻以對應文字。此外網站再根據語音合成的技術,可以讓瀏覽或搜索網頁信息的用戶選擇語音播報選項,實現用戶的私人定制,實現信息的二次傳播。
2.音頻資料庫的開發利用:中央臺從建臺到現在無數優秀的主持人都是寶貴的聲音資源。第一步要做好聲音版權的保護。第二步就是這些聲音資源的開發利用。比如在線教育領域,普及普通話方向。
3.媒介平臺的互動性:最近湖南臺的綜藝節目“聲臨其境”受到廣大觀眾的喜愛,這就可以反映出僅僅只是聲音也是很有魅力的。而我臺的強項正是聲音,如果把這個強項做大做強值得研究。僅通過廣播單一媒介不好互動,但隨著媒介融合的展開,互動就輕而易舉了。比如可以在文藝類欄目中開放小單元《挑戰主持人》,由聽眾隨機選擇聲音比賽項目和主持人PK。在央廣網或手機端設立游戲互動端或APP,對一些經典配音段落,詩詞等,電影片段進行挑戰,打分等定期還可以把優秀的挑戰者匯聚一起組織配音大賽,從線上到線下全面打通,還可以從大賽中挖掘優秀的主持人才進行人才儲備。
4.地域性競爭:中央人民廣播電臺實現全國覆蓋即可以說是優勢也可以說是劣勢。俗語說”眾口難調“,在大眾傳媒的時代,信息是供小于求的,全國覆蓋是優勢。但在分眾傳媒時代,海量的信息遠遠供大于求,人們更愿意選擇自己感興趣的內容,人群區隔越來越窄,地方臺的用戶更關心本地的信息,全國覆蓋就是劣勢了,這也是雖然中央臺在全國覆蓋人數總量很大,但具體在某一個城市,遠遠趕不上地方臺的原因了。近來發現地方方言的節目特別受地方用戶的歡迎,雖然我們的廣播節目無法轉換為各地的方言廣播,但是有了央廣網的二次傳播和語音合成技術的飛速發展,全國覆蓋變為各區域特色的傳播成為可能。在央廣網設立各地方方言和民族語言選項,讓用戶可以利用語音識別技術發起內容點播,利用語音合成技術完成文本信息到各種方言的轉換,讓人倍感親切。
4.降低廣告成本:央廣廣告的制作量巨大,很多次錄制廣告都要邀請演員到錄音棚進行現場錄制,時間成本和演員成本都很高。隨著聲音合成技術的日趨成熟,只要實現采集好不同演員的聲音信息,構建聲音資料庫。以后只要有了廣告文案就可以隨時從資料庫里選擇演員,生成廣告音頻,極大的節約人力成本和時間成本。
我們相信,隨著各種語音技術的發展成熟,將會對廣播音頻產生巨大的沖擊,但只要我們努力接受新技術,接受新挑戰,提前布局,積極創新,也許對我們更是新的機遇。
[1]呂夢.首部AI配音紀錄片播出,央視已故播音員屏幕前“原音重現”微信公眾號[J].AI星球,2018-1-22.
[2]譚天.媒介平臺論[J].2016-7-1.
[3]JOHN.語音合成新技術,可復制任何人的語音微信公眾號[J].intelligentThings,2017-4-29.