□ 新華社“人工智能時代媒體變革與發展”課題組
技術的指數級增長意味著人工智能的無限可能。當前,人工智能與媒體各業務環節深度融合,實現了提質增效,但在智媒化發展進程中,仍面臨不少問題與挑戰。對于媒體而言,觀念認知水平滯后于智能化發展趨勢、傳統媒體體制機制不能有效適應變革、技術基因先天不足等問題在國內外傳媒界普遍存在。與此同時,每項科學技術的饋贈都有其黑暗面。早在上世紀,有專家就預測了數字化生存對知識產權、隱私權的侵犯,以及數據使用、文化破壞等問題。今天,隨著人工智能技術的發展,其雙刃劍效應愈加明顯,特別是當人工智能技術越來越多介入新聞生產和傳播實踐,失序失范現象頻現,一系列新問題新挑戰接踵而至。
有效推動人工智能技術應用與媒體創新變革,理念必須先行。新華社“人工智能時代的媒體變革與發展”課題組問卷調查結果顯示,59.7%的受訪者認為,推進媒體智能化發展,首要的是全員刷新觀念、提高認識水平。沒有充分的思想認識和正確的思想觀念,就難以有科學的發展戰略和創新策略。目前,媒體應用人工智能最常見的觀念和認知誤區表現在三方面:
一是對運用人工智能加速媒體融合“霧里看花”,認識不充分、不到位。作為媒體深度融合發展的重要驅動力量,人工智能究竟會對傳媒業態產生什么樣的影響,應當如何運用人工智能加速媒體融合,不少傳媒從業者對此認識還不夠清晰,亟待認清形勢、轉變觀念。有觀點過于夸大人工智能的功能、作用,認為勢必給傳統媒體從業人員帶來生存危機;有觀點無視人工智能時代已經產生的媒體變革,認為智能技術的應用還很遙遠……諸如此類的“人工智能萬能論”“人工智能威脅論”“人工智能泡沫論”等,反映出人們對于人工智能助推融合發展前景的認識是分化的、模糊的。
二是對人工智能技術在新聞生產領域具體環節的應用效果,還存在“看不見”“看不起”“看不懂”的情況。人工智能技術有其自身特有的發展規律與創新路徑,現階段,技術本身及應用方式尚不成熟,“弱人工智能”不具備推理和解決問題的能力,不具備強人工智能那樣的人類情感和思維方式。調研中我們了解到,不少媒體從業者僅看到技術的短期效果,而忽視其長期效果,強調目前人工智能在傳媒業的落地應用體現不出“智能”,更多依賴于“人工”,以求全責備的態度看待人工智能技術和應用成果,忽視了技術發展的客觀規律和潛能。
三是一些媒體機構不能與時俱進,對于人工智能重視程度不夠。對于人工智能技術特征與發展趨勢,不少媒體決策層強調媒體行業的特殊性,否認技術的普遍性和通用性,對人工智能技術漸進性的顛覆不重視、少行動。還有些媒體從業人員對人工智能的認識僅停留在技術發展表面和淺層次,認為人工智能就是機器人寫作、語音識別,而不知人工智能技術在媒體行業有著很寬的適用面、多種多樣的應用場景,忽視了媒體智能化的無限發展空間。這些滯后的觀念認識影響人工智能發展決策的謀劃和實施。
一是傳統組織架構、業務流程的不適應。課題組問卷調查顯示,63.9%的受訪者認為,媒體應對人工智能的挑戰必須注重改造傳統采編發業務流程。近年來,一些媒體敢于先行先試,正在逐步探索改變原有的編輯部辦公模式,在空間意義上完成了平臺架構和新舊媒體融合,但更多僅僅停留在外部形態改造。傳統的新聞生產主要在編輯部內部展開,是一個相對閉環的生產過程,所有生產環節依靠組織內部的力量即可完成,而在智能化新聞生產模式下,跨部門、跨行業、跨領域的開放共享、大規模協作成為必然,這就要求在實際生產運作中進一步理順生產關系、重構新聞生產流程。
二是資金制約。對人工智能投入產出比的討論是國內外傳媒業熱議的共同話題。人工智能相關軟硬件的引進開發及數據庫構建管理等,都需要較高資金實力。但在這樣的成本之下,“機器人寫稿、審稿是否真的有更高的準確率?”“把訓練機器、更新數據庫的成本用來聘用更多員工,會不會更劃算?”……實踐中存在不少類似疑問。特別是在當前傳統媒體整體業績下滑背景下,不少省市級媒體表示“有心無力”“沒錢投入”。
三是人才隊伍建設面臨新課題。面對人工智能時代技術變革的新趨勢,一些傳統媒體人員隊伍能力跟不上媒體智能化發展要求,不能熟練運用新技術、新手段,存在“本領恐慌”。與此同時,缺乏媒體智能化發展所需的復合型人才、創新性人才,特別是在技術、運營等部門,領軍人才少之又少。傳統媒體由于體制機制掣肘,大多存在人才“用不好”“留不住”“招不來”的難題,亟待優化考核激勵機制,盤活人才資源,打造適應現代傳播規律的選人用人新機制。
技術是媒體發展變革的第一生產力。從全球范圍看,當前,不少傳統媒體積極擁抱人工智能技術,努力轉換角色,從內容生產者向平臺運營者轉化。然而,如何科學合理地研發、運用智能化技術,提高人工智能技術的本土化水平,開發滿足市場需求的新場景、新模式,確保應用水平與技術本身的發展水平相匹配,始終是媒體智能化轉型面臨的一大挑戰。調查顯示,75.3%的受訪者認為,應對人工智能挑戰,媒體要高度重視增強采編隊伍的技術儲備和創新能力。技術基因缺乏是影響傳統媒體人工智能應用程度與應用效果的重要因素,主要體現在三方面:
首先是技術基礎設施不足。智媒化發展對于媒體裝備要求越來越高,加之新技術新設備的更新換代周期不斷縮短,給傳統媒體的技術基礎設施配備更新帶來壓力。調研中,不少媒體從業者認為所在媒體機構的智能化硬件投入有限、設施缺乏,對許多人工智能設備及應用“聽說過,沒見過”。
其次是核心技術團隊力量不足。人工智能在具體應用場景的落地,需要具備一定的本土化開發能力。結合媒體行業自身的痛點難點提出需求,把技術轉變為符合媒體特色的應用才是關鍵。在世界范圍內,多數新聞機構的人工智能技術應用仍然相對滯后。美國國際記者中心的調研發現,新聞編輯室中技術人員比例仍然偏低,只有5%的職員有技術背景,2%的新聞編輯室會雇用技術人員。據調研,國內媒體當中,互聯網技術人員占比也普遍不高,往往只發揮著運行維護作用,不具備創新研發能力。
第三,人工智能技術應用水平與創新能力有限。調查中,超四成的受訪者認為目前國內傳媒業對人工智能技術的應用程度一般。媒體行業運用人工智能,一方面必須依托核心技術,一方面則要充分考慮與傳統媒體業務相結合,開發滿足市場需求的新場景、新模式,確保應用水平與技術本身的發展水平相匹配。對于如何更好實現人工智能技術在媒體機構的落地應用,83.1%的受訪者認為,媒體機構有必要與外部科技企業及機構合作研發人工智能技術;58.6%的受訪者認為,媒體機構有必要自主研發人工智能技術。當前,底層人工智能技術大多由科技企業和研究機構掌握,無論是基于開源程序自主開發智能新聞生產技術工具,還是與第三方智能技術公司合作開發,媒體機構需根據各自資源稟賦選擇適合的技術發展路徑。
媒體機構與技術公司的合作當中也產生了一些待解的難題。人工智能的核心技術多由科技企業提供,媒體機構難以實現技術主導和自我迭代開發。此外,不少大型媒體機構依托自身數據資源,與科技公司合作培育出了具有較強可用性、適配性,符合媒體行業特定需求的智能化工具,經科技公司打造成熟后卻廣泛應用于其它市場,往往帶來知識產權方面的問題。
數據是人工智能發展的基礎。以“深度學習+大規模數據訓練”為主要模式的人工智能系統,需要足量數據、足夠的運算資源,才能不斷優化性能,具備更加顯著的問題解決能力,產生有意義的結果。數據的不完整直接影響算法準確性,因此,提高人工智能的應用水平,大規模、高質量的數據積累必不可少。這意味著人工智能在傳媒業的發展水平與媒體機構的數據化程度密切相關,需要整個傳媒行業乃至全社會達到一定的數據化水平,構建及維護海量內容的數據庫,形成較大規模的數據支撐系統。
媒體機構在內容生產、用戶服務的過程中會產生海量的新聞素材數據及用戶行為數據,但大量的數據資源并不能直接用于人工智能的算法訓練。對于人工智能來說,大部分是對于實際業務毫無意義的“臟數據”(Dirty data),必須要經過“清洗”,發現并糾正數據文件中可識別的錯誤,才能應用于算法訓練。
“人工智能時代的媒體變革與發展”課題組調查數據顯示,59.5%的受訪者認為,面對人工智能的挑戰,要高度重視內容數據化。目前,國內不少媒體已在這方面展開積極嘗試,但海量的新聞稿、歷史圖片、視頻數據等數據資源,需要事先進行“數據清洗”(Data cleaning)以及標框工作,才能生成高質量的信息化數據,而數據的清洗整理、加注標引、入庫管理需要大量的人力及財力物力支撐。因此,對于大多數媒體而言,從“數字化”時代進入“數據化”時代,還有很長的路要走,媒體機構在布局人工智能戰略之初,就必須注意到數據的重要性,著力構建完備的數據庫、打造處理龐大數據系統的能力。
算法技術在新聞業的應用,無疑具有很大實用價值。當前,推薦算法是國內外大多數新聞APP 和社交媒體平臺使用的主流,提升了新聞生產個性化和新聞推送準確率,帶來優質用戶體驗,也拓展移動新聞資訊平臺的渠道價值,改變著產業格局。然而,個性化推薦技術的深度介入與算法過濾,在將人從復雜的信息傳播活動中解放出來的同時,也在一步步弱化傳統媒體“把關人”的作用。曾經是編輯記者綜合“想讓你知道的”和“你可能想知道的”去篩選編排信息,如今,隨著算法分發機制廣泛應用,算法新聞平臺上的日活量越來越大,許多媒體機構的新聞生產和分發模式嚴重依賴新媒體平臺對用戶相關數據的采集,通過機器學習,抓取和分析用戶的年齡、性別、職業、文化水平、收入水平等個人信息,以及閱讀時的接觸時長、接觸頻率、接觸動機等行為信息,實現對用戶的精準畫像,篩選推送“你想知道”的信息。
智能推薦基于用戶精準畫像篩選推送用戶喜歡的內容,雖然內容符合個人偏好,卻往往不是對客觀世界真實完整的描述。這就使得用戶陷入長期接收同質化信息的環境之中,不愿或難以獲得多元化的信息,導致“信息窄化”,形成“信息孤島”。長此以往,對整個社會而言,在智能生產、智能排序和智能推薦影響下,會減少不同聲音之間的碰撞、不同觀點之間的交鋒,輿論趨于分化、極化、碎片化,導致形成社會共識、增強社會凝聚力的難度加大。
隨著人工智能技術的發展,技術濫用誤用成本不斷降低,虛假文本及音視頻成為“新型謠言”,并逐漸進入低成本、低技術知識階段?;谏疃葘W習、虛擬現實等的換臉技術、語音合成技術、視頻生成技術大大發展,大量難辨真偽的信息出現。調查結果顯示,半數以上(54.5%)受訪者認為,假新聞的識別難度加大,是影響人工智能發展的重要問題。傳統假新聞尚可通過多種渠道驗證真偽,但在人工智能技術“黑箱化”趨勢下,信息來源和真偽的判斷難度加大。
“眼見為實”在幾乎以假亂真的換臉技術面前變得不可靠,公眾很容易認為換臉、變聲后的虛假內容是真實的,從而造成謠言傳播、誤解產生、沖突加劇。2017年,美國社交網站Reddit開發的可以視頻換臉的“深偽(Deep fake)”技術可以對被模仿者的面部建模,將一個人的臉嫁接到另一個人的身體上,來合成天衣無縫的偽造視頻,利用這一技術,普通人經過簡單的學習也能制作出真假難辨的換臉視頻。在國內,2019年9月,一款名為“ZAO逢臉造戲”的應用軟件將換臉技術的使用門檻大大降低,用戶只需下載安裝App,上傳一張照片,就可以在視頻模板中一鍵“換臉”,便捷地得到以任何人為主角的小視頻。同時,“虛假視頻+虛假音頻”的融合對于目前的音視頻鑒定技術也將是更大的考驗。
基于廣泛數據分析的人工智能技術大大增加了公民隱私受侵犯的風險,公共數據的開放能夠促進內容生產與傳播的便捷性,卻也導致個人隱私信息得不到保障。2018年3月,美國社交巨頭“臉書”(Facebook)爆發用戶數據泄露事件,引發全球對信息安全的關注。由于人為操作,超5000萬用戶的資料數據被非法用于大數據心理分析,甚至被使用到政治活動中。“一切被記錄,一切被分析”的數據化時代,在相關技術和設備支持下,數據的采集范圍日漸廣泛,采集方式日漸隱蔽,個人行為數據被實時采集儲存,數據記錄功能可以將個人的身份信息、行為信息、位置信息甚至信仰、觀念、情感與社交關系等隱私信息永久記錄、保存和呈現,對個人信息的非法使用和采集,對數據來源缺乏安全有效保護,易于造成隱私泄露,出現信息安全問題。
課題組問卷調查結果顯示,半數受訪者認為隱私保護難度加大,已成為人工智能在傳媒業運用中存在的重要問題。在媒體智能化發展進程中,用戶在與媒介接觸的過程中生成了海量數據,在基于用戶個人資料、行為數據提供更精準更優質服務的同時,保障數據安全、尊重用戶隱私十分重要,必須時刻關注在保護用戶數據方面是否存在漏洞,加強用戶隱私保護,落實相應的數據安全策略。