何苑 張洪忠 張爾坤
摘要:當前,自然語言處理(NLP)在傳媒領域已得到廣泛應用,成為媒體融合轉型的一項重要人工智能技術。本文梳理了近一年來該技術在智能傳播領域的應用現狀,并從智能信息采集與輸出、視覺內容生成與修復、語音內容合成與還原、AI虛擬主播四大應用場景出發,對與之相伴而生的問題風險和風控措施進行分析。進一步提出在NLP全方位向傳媒領域滲透的大趨勢下,新聞傳播從業者既要積極提升自身對新技術的駕馭能力,也要防范技術應用帶來的問題,以促進智能傳播的健康發展。
關鍵詞:智能傳播 自然語言處理 人工智能 技術風控
自然語言處理(Natural Language Processing,NLP)主要研究如何用計算機來理解人類語言的各種理論和方法,是語言學、人工智能和計算機科學的重要分支。NLP主要在海量輸入數據基礎上,通過計算框架來構建表現語言能力(Linguistic Competence)和語言應用(Linguistic Performance)的模型,并不斷提出優化方法,設計出各種實用的系統和系統評測技術。NLP技術涉及語義分析、知識圖譜、機器翻譯、信息檢索和過濾、語音識別和情感分析等不同方面。
當前NLP技術已在智能傳播領域中得到廣泛應用。一方面,NLP的行業應用表現出多技術融合、集成化創新發展特征,全方位推動傳媒業的數字化、智能化轉型;另一方面,正如《2021年斯坦福人工智能指數報告》中指出的,當前NLP技術的發展速度已經遠超過了對其進行理解和評估的標準制定速度。然而,該技術在實踐中也暴露出技術濫用、算法倫理、數據安全、個人隱私泄露等方面的風險問題,引發行業、監管部門和普通用戶的擔憂。
由此,筆者一方面嘗試對NLP近年來取得的關鍵性技術進步及其在智能傳播領域的應用現狀進行梳理,尤其是最近一年來在智能信息采集與輸出、視覺內容生成與修復、智能語音內容合成與還原、AI虛擬主播等場景中的應用拓展;另一方面嘗試對NLP存在的問題風險和現行風控措施進行分析,以期為人們正確看待技術創新與行業發展的關系提供參考。
2021年來,NLP技術在實時信息采集、轉化和語言處理等領域取得突破性進展。在國外,Meta AI(原Facebook AI)發布的多語言模型XLS-R可以在英語和其他21種語言之間完成翻譯,使機器翻譯的結果更接近人工翻譯。英偉達的GauGAN2模型可以按照用戶輸入的簡短關鍵詞迅速生成相應圖像,并根據文本內容的調整來進行優化,實現從自然語言向圖像的智能轉換。谷歌也發布了適用于開放對話情境的LaMDA語言模型,可以更好地理解對話語境,并在未經訓練的情況下進入新的對話,突破了以往AI應用只能執行預設的狹義路徑、無法理解情感語義且內容重復率高的局限。
在國內,NLP技術與業務場景進一步融合,從信息采集、編輯輸出到審核等各個環節推動新聞媒體從機器寫作向智能化內容生產的實踐升級。首先,智能輔助工具向多功能一體化發展??拼笥嶏w公司的“訊飛智能辦公本X2”在2021年兩會期間為新華社記者采訪提供了有力支撐。該設備不但可以錄音,還可以自動將記者提問和代表作答進行分區,并提取關鍵內容,提升記者輸出稿件的速度。其次,智能一體化平臺推動“人機協同”的內容采編模式成熟。人民日報智慧媒體研究院推出的“智能創作機器人”在兩會期間支持記者獨立完成采訪、拍攝、新聞素材分析和富媒體內容創作等工作,并可根據實時熱點分析突出新聞的亮點。在短視頻、直播領域,快手基于實時流式ASR技術,在大規模直播和短視頻場景中無縫嵌入了低延遲智能語音輸入法、語音助手、相機實時字幕等功能,既簡化了平臺主播的操作,又提升了受眾的參與感和“臨場感”。
智能內容生成技術在提升信息采集、輸出效率的同時,也給網絡原創內容的著作權保護帶來了新的風險與挑戰,尤其在自媒體的內容生產中催生出一條利用NLP技術手段“洗稿”的灰色產業鏈。部分互聯網企業利用AI洗稿軟件大量抓取網絡優質原創內容,在經過同義替換、文本改寫后迅速形成新的文章發布出來。隨著NLP技術的不斷進步,這種侵權行為已從文本范疇升級到了短視頻領域。此類技術濫用行為不僅侵害了原創作者的合法權益,還擾亂了正常的網絡內容創作生態,更增加了對人工智能編創行為進行認定的難度。對此,業界已嘗試引入智能侵權檢測算法作為預防和解決著作權糾紛的輔助機制,如YouTube的自動化著作侵權檢測和處理系統、中國版權協會版權監測中心采用的版權內容指紋特征比對技術等。NLP技術在信息采集與輸出上相對比較成熟,應用也較多,如何在規制層面出臺有針對性的智能內容生成工具使用的法律法規和管理制度還有待進一步加強。
在影視行業,以Deepfake為代表的人臉視頻深度偽造技術、AI渲染上色等智能視覺技術的突破也不斷催生出新的業態。在國外,Deepfake技術與AI配音技術的融合在影視制作領域獲得了新的應用賽道,成為新冠肺炎疫情大流行背景下行業“破局”的重要抓手。2021年,英國公司Flawless針對多語言譯制片中角色唇形不同步的問題推出了可視化工具TrueSync。該應用通過AI學習演員頭部3D模型來調整其面部微表情畫面,解決了傳統影視換臉特效鏡頭資金消耗量大、人力時間成本投入高的問題。加拿大創業公司Jali Research通過Deepfake技術和AI配音工具為科幻角色扮演游戲《賽博朋克2077》提供多達10種語言的本地化支持。該應用將不同語言的音素準確映射到角色的嘴型上,令游戲角色在語言模式切換后仍能呈現出自然的表情和對話效果,極大地推動了《賽博朋克2077》的海外銷售。
在國內,AI渲染上色技術、智能超分算法等計算機視覺技術開始應用在老視頻和圖片修復中。中央廣播電視總臺央視頻5G新媒體平臺與中國電影資料館綜合采用人機交互式AI上色技術和傳統影片修復手法對經典電影《永不消逝的電波》進行了黑白轉彩色4K修復。在對原片超過16萬幀的黑白影像進行逐幀修復后,該片于2021年國慶期間成功登陸院線,令廣大觀眾得以重溫經典。西瓜視頻也聯合火山引擎,運用智能處理AI算法對《哪吒傳奇》、《黑貓警長》等百余部經典影片進行了4K修復。
智能視覺生成技術在降低行業成本投入、提升用戶視覺體驗的同時,也引發了技術倫理和法律層面的爭議。對Deepfake等技術的濫用和惡意使用會產生網絡低俗、色情內容;為滿足大規模數據集訓練而進行的人臉識別、表情識別等方法可能在無形中對公民的肖像權、名譽權等造成侵害;經過惡意偽造的內容甚至可能對企業信譽和媒體公信力等造成不良影響,嚴重時可能導致社會信任、媒體公信力、社會公共安全受到威脅。法律層面,智能偽造視頻/圖像向司法領域的滲透嚴重挑戰了案件事實認定的準確性和裁判結果的公正性。在國外,許多基于AI換臉技術的軟件應用都成了抹黑公眾人物、激化社會矛盾甚至操縱輿論的技術推手。在我國,也發生了網站UP主擅用明星肖像進行AI換臉和視頻二次創作的侵權事件。這些現象引發了各界對人工智能技術濫用個人生物識別信息、威脅社會秩序和安全的擔憂。

對此,各國政府相繼出臺了相關的監管制度,如美國眾議院提出的《深度偽造責任法案》、歐盟的《通用數據保護條例》等。在我國,2021年3月,國家互聯網信息辦公室和公安部牽頭,就部分語音社交軟件的涉“深度偽造”技術應用未履行安全評估程序的問題,對11家企業進行依法約談,以督促其認真開展安全評估和完善風險防控機制和措施。同時,針對“深度偽造”合成內容進行識別、監測和反向還原的人工智能工具、平臺等陸續問世,如美國國防部高級研究計劃局設立的“媒體鑒證”項目、谷歌公司發布的深度偽造視頻識別數據集、香港科技公司Sense Time聯合南洋理工大學設計的人臉偽造測試基準、北京大學與微軟亞洲研究院聯合推出的深度偽造識別工具Face X-Ray等。上述政策法規和應用均為遏制和防范“深度偽造”技術的大規模濫用提供了有力支撐??梢灶A見,未來與自然語言處理等人工智能技術相關的數據安全和個人信息安全問題還將繼續受到重視,相關法律法規也將進一步出臺和完善。
2021年,基于NLP的高保真AI合成音效技術取得突破性進展,賦予了智能語音應用更加類人的“聯想能力”和“推理能力”。在國外,硅谷公司Deepdub嘗試在AI翻譯中使用影視演員的原聲。該公司基于深度學習、信號處理、特征建模、神經風格遷移等技術,讓系統對音軌資料中的演員聲音特征進行記錄和學習,以便在新臺詞的多語言翻譯中獲得自然的配音效果。目前,該技術已經應用在影片《Every Time I Die》的拉丁美洲西班牙語和葡萄牙語翻譯中,翻譯后的作品將由Netflix面向美洲觀眾播出。
在國內,小冰公司也發布了全新的超自然語音技術,使人工智能語音效果可媲美真人聲音。該技術還突破了人工智能交互主體的單一場景應用限制,在2021年9月發布的社交平臺APP“小冰島”當中,支持不同角色的人物在對話、唱歌等不同場景中進行高度擬人交互。QQ瀏覽器在深度挖掘真人語音中的節奏、語調、韻律感等特征后,用StyleTTS合成框架生成了更貼近真人音效的語音內容,并應用在自帶的“聽書”功能中。喜馬拉雅也對評書表演藝術大師單田芳的聲音進行了還原和應用。
智能語音合成技術賦予了影視創作和社交機器人等應用更生動、逼真的效果,但從法律角度來看,也對社會安全、法律法規的健全完善和執行等帶來了新的挑戰。例如,“語音偽造”向司法領域的滲透正成為一種新的安全威脅。英國媒體2020年就報道了一起妻子企圖利用軟件篡改音頻內容,捏造丈夫“暴力”形象以爭取兒童監護權的案件。同時,“聲紋”作為個人重要的生物識別信息之一,其在數字技術條件下的可復制性、可獲得性和可冒用/盜用性也加劇了各界對公民“身份盜竊”風險的擔憂。
在對智能語音合成內容的潛在風險應對和規制上,美國主要依據的是針對深度偽造技術制定的系列法案(如前文提及的《深度偽造責任法案》、《惡意偽造禁令法案》、《深度偽造報告法案》等);而歐盟則主要借助《通用數據保護條例》等現有法律規范,來針對個人生物識別信息的濫用問題進行回應和規制。在我國,2021年國家網信部門起草的《網絡數據安全管理條例(征求意見稿)》也針對數據處理者收集、處理、利用聲紋等個人生物特征的情況提出了新的要求和規定。網信、公安、反詐中心等監管和執法部門也聯合國內頭部人工智能技術企業、高校和科研機構,商討推出對智能語音合成技術濫用有關問題風險的應對之策,如發展偽造語音檢測技術、舉辦語音偽造競賽、開展科普活動等。未來,如何從技術、法律和行政管理等各個方面“齊頭并進”,在促進智能語音技術創新和應用的同時,加快推進公民聲紋信息等隱私信息保護的立法和實施,加強對涉智能語音類應用和服務的監管和規制仍會是學界、業界和監管部門持續關注的重要議題。
AI虛擬主播是在人類形象基礎上,利用虛擬圖像、語音識別、深度學習等人工技術捕捉海量數據形成的合成形象,可以根據給定的數據進行擬人化的視頻內容演繹。AI虛擬主播是最近兩年媒體邁向人工智能的一個熱點應用。
AI虛擬主播多以“數字人”的身份出現在動畫、影視、游戲和文娛虛擬偶像等場景中。2021年,AI虛擬歌手FN Meka在TikTok發布的新單曲《Speed Demon》熱度超過真人明星,吸引了超過900萬的粉絲觀看。FN Meka被賦予了個性、獨立、平權等嘻哈文化特征。他還活躍在各大社交平臺上,積極向用戶分享自己的“業余生活”。

在我國,AI虛擬主播在社會場景中的應用也不斷深化。首先,各大主流媒體和科技公司進一步加大研發投入。新華社媒體融合生產技術與系統國家重點實驗室聯合騰訊互娛NExT Studios打造的數字人“小諍”就在神州十二號載人飛船發射期間同時扮演了記者和航天員的角色。在剛剛結束的2022年北京冬奧會中,央視新聞與百度智能云推出的AI手語主播已全面投入使用,在語音識別、機器翻譯等NLP技術的支持下為聽障用戶提供手語賽事資訊。其次,AI虛擬主播也被投入到“電商直播帶貨”的商業場景中,如創壹視頻推出的虛擬美妝達人IP“柳夜熙”、燃麥科技推出的“超寫實數字人”AYAYI等。截至2021年11月,我國已有10家虛擬偶像技術供應商和運營公司先后獲得資本投資。
一方面,AI虛擬主播的技術還是以單向信息傳播為主,雖然可以順利執行新聞播報等任務,但在網絡中的雙向信息傳播還有很大缺陷,即不能進行多輪對話和基于語境對話;另一方面,AI虛擬主播在直播帶貨、演藝代言等領域的應用也催生了行為主體身份難以界定、監管措施無從開展和法律歸責難以認定等一系列新的問題。而在行業積極利用新技術逐利的背景下,現行的法律法規和市場監管機制卻仍停留在探索真人主播權責問題的階段,學界對這一現象的研究也存在較大的空白,或偏向技術哲學視角。這種“實踐應用先行,政策相對滯后,理論有待深化”的現狀亟待引起重視。
首先,自然語言處理技術在傳媒領域的應用還處于初級階段。作為人工智能研究領域的關鍵技術,NLP正從信息采集與輸出、數據整合、語言識別、生產要素創新等不同方面帶動著傳媒業的數字化轉型。但當前NLP技術在智能傳播領域的應用還處于“初級產業化階段”,即只調動了部分運算智能來解決具體問題。據《2020人工智能中國專利技術分析報告》顯示,“我國自然語言處理技術領域專利技術布局正處于活躍時期,是創新主體關注的重點”。也就是說,傳媒業為NLP技術提供了大量的使用場景,NLP技術與傳媒的結合將在未來一段時間里是我國新技術的創新突破點。
其次,對NLP技術在傳媒領域中的應用,有擁抱技術與擔憂技術兩種矛盾心態,我們該如何看待這兩種形態?
其一,NLP是人工智能在傳媒領域應用最為深入的技術之一,已經成為傳媒業轉型的一項重要構成內容,并加速度推進著傳媒生態的變革,這個趨勢是不可逆的。社交機器人、智能語音助手、虛擬主播等已經在傳媒業中廣泛應用,與圖形圖像結合的應用也大量出現,對于傳媒業來說,不擁抱NLP等新技術就意味著要承擔被擠出信息場的風險。5G時代,在計算機算力大幅提升和云計算、物聯網等關鍵性技術保障持續發展進步的背景下,基于NLP的智能傳播也將繼續開拓更多的想象空間,如將視覺問答、視覺扎根對話、圖像字幕等創新技術融入智能出行、智能家居、數字健康、藝術創作等更加廣泛的應用場景當中,推動社會生活的數字化、智能化轉型。
其二,NLP技術的飛速發展在帶動行業創新的同時,也引發了一系列的問題與風險,如何防范NLP技術應用帶來的問題也非常重要,如虛假信息、侵害著作權、泄露隱私、妨礙司法等問題。對此,社會各界的態度不一。但僅僅因為技術存在兩面性和潛在風險便對其報以質疑、恐慌甚至全盤否定的態度并不可取。對傳媒行業來說,應當在充分接觸和了解的基礎上進行應用,從規范性、道德倫理和社會責任等方面著眼,提升自身對新技術的駕馭能力和數字治理能力。技術是一把雙刃劍,在享受技術便利的同時,如何看待技術對原有生活方式的改變?如何看待技術帶來的負面效應?這些問題是社會發展永恒的問題,對NLP技術也一樣,這是硬幣的兩面,不能因噎廢食。
最后,面對NLP技術全方位向傳媒領域滲透,新聞傳播行業從業者如何應對?一是要積極擁抱新技術,不能“談新色變”或產生畏難心理。二是定位清楚新聞傳播從業者是使用技術的,不是開發技術的,就好比人們只需要及時學會不同汽車的駕駛技術做運輸,不需要為如何造車擔憂一樣。三是在具體工作中需要及時把握技術動向,促進技術邏輯與業務邏輯的融合,全面推進行業的數字化、智能化轉型,善于嘗試新技術新手段才能有創新和跟上智能傳播的步伐。
作者單位 何苑 河北大學新聞傳播學院
張洪忠 北京師范大學新聞傳播學院
張爾坤 英國格拉斯哥大學
參考文獻
[1]Manaris B.Natural Language Processing:A Human-Computer Interaction Perspective[J].Advances in Computers,1998(08).
[2]廖秉宜,姚金銘,余夢莎.智能媒體的倫理風險與規制路徑創新[J].中國編輯,2021(02).
[3]劉建.論智能侵權檢測算法在著作權保護中的應用[J].中國出版,2021(19).
[4]周文柏,張衛明,俞能海,等.人臉視頻深度偽造與防御技術綜述[EB/OL].(2021-10-06)[2022-01-06].http://kns.cnki.net/ kcms/detail/11.2406.TN.20210930.1358.010.html.
[5]李蓉,黃小龍.深度偽造司法滲透的法治風險及應對策略[J].青海民族大學學報(社會科學版),2021(04).
[6]李懷勝.濫用個人生物識別信息的刑事制裁思路——以人工智能“深度偽造”為例[J].政法論壇,2020(04).
[7]騰訊網.“元宇宙”成新熱潮,10家虛擬偶像公司獲得投資[EB/OL].(2021-11-01)[2022-01-06].https://xw.qq.com/ amphtml/20211101A0CPTB00.
[8]俞金香,呂東岳.網絡直播營銷廣告代言人侵權責任的再配置[J].中國政法大學學報,2021(05).
[9]馬立德,程怡,李韜.平臺型媒體對傳播權力的重構與治理之道[J].青年記者,2021(03).
【編輯:沈金萍】