□ 文/秦 軍
內容提要 人工智能對媒體的發展到底能起到多大作用?在人工智能助力媒體發展過程中,還有哪些需要注意和改進的地方?作者結合新華社“媒體大腦”的使用體會,談了自己的看法。
“媒體大腦”初次為人所知是在2017年12月,浙江烏鎮的世界互聯網大會。作為中國首個通過數據賦能媒體,從而洞察世界的媒體人工智能平臺,“媒體大腦”提供基于云計算、物聯網、大數據、人工智能等技術的八大功能,覆蓋報道線索、策劃、采訪、生產、分發、反饋等全新聞鏈路。
2018年兩會期間,新華社“媒體大腦”開始發力,僅用15秒鐘,就自動生成發布了全球首條關于兩會內容的MGC(機器生產內容)視頻新聞,瞬間引爆媒體圈。在學習李克強總理所作的政府工作報告時,“媒體大腦”也發現了諸多看點:“習近平新時代中國特色社會主義思想”被提及4次;“提高個人所得稅起征點”首次寫入政府工作報告;“發展”一詞被提及142次,排名第二的“改革”提及97次,“創新”被提及55次。由“媒體大腦”抓取、分析、生成的稿件成為熱門內容。
此后,在2018年夏的俄羅斯世界杯報道中,“媒體大腦”也有不俗表現。在31天比賽中,“媒體大腦”共生產短視頻新聞37581條,實時生成169枚進球視頻,平均用時50.7秒,其中最快的一條僅耗時6秒,全網實現了1.16億次播放,受到用戶熱烈歡迎。
與新華社“媒體大腦”相仿,世界范圍內,人工智能寫作也已成為傳媒領域熱點。2014年,英國《衛報》使用人工智能統計社交媒體上的內容和熱點,然后進行篩選、編輯,直接生成一份報紙;2015年,美聯社將AI寫稿擴展到棒球比賽;2017年,韓國某通訊社也測試使用人工智能進行足球比賽報道,幾秒種就可以生成稿件上線。
而在國內,人工智能機器寫作也層出不窮。2018年,九寨溝發生7.0級地震,人工智能機器人僅用了25秒,就完成了540字的文章,并配了4張圖進行發布,令世人震驚。當人類記者面對突發事件還處在驚愕中時,機器人已經迅速完成了數據挖掘、數據分析、自動寫稿的全過程。
事實上,除了會寫,人工智能機器人還可以從事編輯的工作。
《衛報》《紐約時報》和路透社利用人工智能對新聞編輯流程進行了嘗試,取得了不小的收獲。 2013 年,英國《衛報》和人工智能機器人合作發行了一份名為 The Long Good Read 的新報紙,讓人工智能機器人開發的一款在線頁面布局工具嘗試進行自動排版。次年,《衛報》又推出了一份名為“#Open001”的紙質報紙,報紙內容幾乎完全由算法生成。
《紐時時報》數字部門的科學團隊研發的機器人 Blossomblot能通過對社交平臺上推送的海量文章進行大數據分析,預測哪些內容更具有社交推廣效應,并幫編輯挑選出適合推送的文章和內容,該智能機器人甚至可以獨立制作標題、摘要文案、配圖等。虛擬編輯Blossomblot 上線后,《紐約時報》內部統計數據顯示,經過 Blossomblot 篩選后自動推薦的文章的點擊量是普通文章的38 倍。
除了新聞生產和編輯,人工智能機器人還學會了審核和通過大數據推送。
2017年12月30日,在北京隆重舉行的“2017中國經濟高峰論壇暨第十五屆中國經濟人物年會”上,評選出了一批2017“中國經濟新領軍企業”,獲獎名單上,一家專注于“人工智能+新媒體”領域的創新型企業赫然在列——央視國際網絡無錫有限公司。該公司借助AI技術優化“內容審核服務”,依托圖片識別、語音識別、人臉識別、視頻基因比對、語義分析等AI技術,能智能識別各類新媒體平臺的色情、涉政、涉暴、廣告等非法內容,對圖片和視頻進行文字、語音等多維度智能分析,從而大幅提升了團隊審核效率、降低了成本,極大地為短視頻和直播平臺解決了審核難題,為廣大網民營造了一個風清氣正的網絡空間。
新聞的推薦發送同樣如此。
在大眾媒體時期,內容分發主要依靠職業編輯人員的判斷,依靠發行人員的手工操作來完成。在互聯網產生初期,新聞網站和門戶網站開始研發智能推薦模式,但智能推薦并未成為主流的內容分發方式,直到進入移動互聯網時代,智能推薦分發才成為主流內容分發方式。這是因為:第一,移動互聯網時期智能推薦的數據維度更加豐富,使用場景、社交關系等多維數據都被移動互聯網記錄,從而能更好地分析和刻畫出用戶的偏好。因此,由于用戶內容消費數據的豐富,智能推薦集合了網絡編輯分發、搜索引擎分發、社交分發等分發方式的優點,可以更好地滿足用戶的個性化和個人化需求,從而增強用戶對智能推薦平臺的黏性,使得智能推薦成為主流的內容分發方式。
分析國內外媒體人工智能實踐會發現,現階段人工智能的所有新聞實踐背后都離不開人,無論是簡單的模板內容填充還是海量數據抓取、新聞自動化核查還是聊天機器人互動,其背后都需要人類設計智能系統和人工訓練機器人。在未來很長一段時間里,人工智能與新聞業的結合更多地將是交互式的結合。
另一方面,目前移動互聯網平臺的算法技術存在取值標準過度傾向“趣味性”而忽略“重要性”的問題。目前運用算法推薦技術的網絡信息服務主體多是商業平臺,它們不具備內容原創的資質和能力,為了最大規模占有內容資源,往往不加甄別地擴充“自媒體”內容生產者規模,以至于“供給側”里的內容數據魚目混珠、泥沙俱下,虛假和低俗信息乘虛而入;其次,由于移動終端的個人化特性,在基于移動終端的信息接觸中,獵奇和低俗內容往往熱度較高,而算法及數據取值的單一性會在客觀上助推不良內容的擴散;第三,平臺以商業利益為主要導向的考核機制,對獵奇和低俗內容的生產和傳播具有“激勵”作用。這些因素造成了平臺分發的信息質量“下降的螺旋”。
通過對目前推薦算法的深入分析,就會發現,從整體到群體再到個體的需求數據都只反映了用戶對特定信息感興趣的程度,而忽略了信息對用戶和社會的真正價值。在新聞學理論中,新聞信息的價值判斷通常包括五個方面:及時性、接近性、顯著性、趣味性和重要性;在取值方式上,前三項可以通過文本和環境的特征標簽得到體現,趣味性則被用戶需求取值放大了權重,而重要性被忽略。現有推薦系統對信息價值的取值偏差由此形成。
目前,算法推薦技術的缺失已衍生為虛假和低俗信息泛濫的社會問題。因此,主流媒體在信息分發環節的智能化發展,不僅需要吸收現有推薦引擎的技術經驗,還需要建構恰當反映信息價值,特別是能反映特定信息對社會成員個人的社會化水平的影響的算法體系及其取值方法。
那么,在當前互聯網數據裂變發展階段和大數據、人工智能大背景下,傳統媒體如何與新媒體融合,積極地向新的智慧媒體時代邁進?
一是要持續深化和拓展對人工智能技術的理解,用更開放的心態擁抱智能化變革。其次,努力發揮技術對創新的支撐和引領作用,加大人工智能技術的儲備和研發。應針對傳媒業生態的關鍵維度——用戶平臺、新聞生產系統、新聞分發平臺及信息終端等,加大智能技術,如語義識別和分析、VR/AR、機器算法、深度學習、大數據、物聯網等新技術集群的研發和滲透,為媒體內容生產與呈現開拓想象空間。再次,要重視智媒人才的培養,用創新和激勵機制不斷提升團隊的綜合能力。改變傳統媒體招聘重采編輕技術的現狀,加大智能技術人才的選聘力度。同時加強傳統采編人員的智能技術培訓,提升采編人員之間,以及人機之間的協同創新能力。