徐常亮

相比于擁有數百年歷史的媒體行業,人工智能是一個嶄新的概念。這項復雜的技術基于一個簡單的理念:讓機器來認知世界,通過人類難以企及的計算能力來解決問題和完成復雜的工作。2011年,Google首先提出了谷歌大腦的概念,一年后他們就做出了一個標志性的成果:讓計算機識別貓臉。這個項目利用互聯網數據來訓練,更多地是在打造一種底層平臺。這意味著人工智能第一個階段的開端:讓機器來認知世界。
2016年以來,發源于互聯網行業的人工智能,開始向互聯網以外的行業延伸,觸達傳統行業,甚至在一些特定領域引起了顛覆性的革新和質變。谷歌旗下的Deepmind研發的AlphaGo在圍棋這一細分領域擊敗了人類棋手,讓大眾開始認識和了解人工智能這一概念。幾乎同一時間段,阿里云推出城市大腦,讓人工智能開始應對交通和城市管理的問題。人工智能第二個階段的探索開始了:讓人工智能來解決問題和完成工作。
媒體大腦是媒體與人工智能融合的產物。從報紙到廣播、電視,再到互聯網和智能手機,技術一直是驅動媒體變革和發展的力量之源,現在無疑又到了一個媒體需要變革的時代,有一系列的問題亟待解決:新聞的核心生產力靠什么技術?影響力靠什么提升?未來的新聞資源在哪里?下一代媒體到底長什么樣?
2017年12月26日在成都舉行的第五屆中國新興媒體產業融合發展大會上,新華社發布中國第一個媒體人工智能平臺——“媒體大腦”(mp.shuwen.com)和第一條MGC(Machine Generated Content,機器生產內容)視頻新聞,向海內外媒體提供2410(智能媒體生產平臺)、采蜜、新聞分發、版權監測、人臉核查、用戶畫像、智能會話、語音合成等8個模塊的服務,探索人工智能時代媒介形態和傳播方式的未來。
2018年1月,新華社社長蔡名照指出:“今年,新華社將整合全社人工智能資源,升級“現場云”資源聚合平臺,利用“媒體大腦”平臺的智能采集、用戶分析、圖像識別、語音合成等功能,推進在策劃、采集、編輯、加工、分發、反饋等全流程應用,探索智能化編輯部的標準和范式,搶占融合發展制高點。”

今年兩會期間,“媒體大腦”在新華社微信上推出了MGC報道,呈現如兩會工作報告中關鍵詞、高頻詞的趨勢變化等,背后已經是一條智能化新聞生產流水線:由記者和編輯來定義產品設計模型,然后讓機器批量生產內容。
負責“媒體大腦”研發和落地的是新華智云,其slogan是:“憑計算之力,求數據洞察,賦萬物為媒,迎智能時代。”“媒體大腦”實際上是新華智云對這條slogan的實踐,它的核心要素包含在四個詞匯中:計算、數據、萬物、智能。計算聯結數據,智能賦予萬物。
孤立的數據無法產生價值,大數據對“量”這一指標的需求是空前的,數據的聯結靠的是計算。媒體行業百十年來累積下了巨量的數據資源,是有待挖掘的寶地和礦藏。
互聯網公司內有這樣一種思維:“一切業務數據化,一切數據業務化。”這很像毛澤東提出的“從群眾中來,到群眾中去”的工作方法,只不過需要提煉和系統化的對象變成了一項項具體的業務。媒體同樣是業務的一種,而人工智能的快速發展,則讓媒體看到了這一工作方法的現實可行途徑。
業務數據化,首先要做到的是讓線下數據走向線上,讓過去的數據產生價值。在機器識別貓這一過程中,人工智能首先得到了幾百萬幀的靜態視頻資料;AlphaGo在剛剛起步時,同樣搜羅了巨量的人類棋譜來學習。這是讓既有的信息記錄,變成人工智能管理下的數據資源。通過強大的計算力,人工智能可以在圖片間、棋譜間找到關聯,進而得到“識別貓”“下圍棋”等具體的能力。
數據業務化,為人工智能的工作找到一個出口,并進一步接收反饋。AlphaGo通過自我對弈和與人類高手的較量,不斷調整自己的棋路以及對勝負的預期,最終獲得了人類難以企及的棋力;城市大腦根據城市攝像頭數據對紅綠燈的放行策略進行優化調整,具體的調整結果又會反饋到城市大腦中,成為進一步完善調整策略的重要參考。過往成功的人工智能案例在這一步上所做的,是讓數據的使用和反饋成為一個閉環,而這也是媒體和人工智能融合過程中的一條必經之路。
新聞記錄的是歷史,沉淀的是數據。路透社流傳著一句話,“在新聞成為新聞之前,都在路透社存著”,而在新華智云看來,“Before it’s news,it’s data;After it’s news,it’s data”。也就是說新聞即數據,數據即新聞。媒體大腦的第一項工作,就是去建立一個全球最大的新聞資訊庫,這包括了文字、圖片、音頻和視頻等各種媒介形式,也包括了主流媒體和自媒體乃至UGC(用戶生產內容)等各類信息來源。搜羅信息僅僅是一個開端,讓信息結構化、標簽化才是“一切業務數據化”的關鍵,而這個過程中必不可少的就是算力。隨著云計算業務的發展,媒體大腦可以調用的計算資源在近幾年間得到了巨幅提升,這對媒體而言是前所未有的一次機遇,也是“媒體大腦”得以成立和發展的重要基礎。
在收集反饋、形成閉環方面上,人工智能的發展早已走在了前面。隨著互聯網和智能手機的快速普及,新聞受眾對于信息的反饋早已不再是慢悠悠的“讀編往來”,人工智能的一個小分支——推薦算法,近幾年來已經形成了一種行之有效的商業模式。對于媒體來說,收集受眾的反饋本該比過去任何一個時代更簡單。但在實際工作中,很多媒體卻受限于工作思路或媒介形式,缺乏相應的信息溝通渠道。匯總了全媒體信息和數據的“媒體大腦”,提供的正是這樣一種一站式的解決方案。它收集的反饋一方面使媒體受惠,另一方面還能為人工智能的自我進化提供數據支持,讓媒體和人工智能間達到互利共贏的效果,這也是媒體和人工智能融合的價值和意義所在。

▲2410(智能生產平臺)
人工智能并不獨立存在,它需要依托于作為“物”的計算機和智能設備才可以工作。而反過來說,人工智能也可以賦能給各種各樣的設備,讓它們具有感知世界、向世界發聲的能力——這是人類能力的延伸。隨著人工智能的發展,我們也將目睹一個萬物為媒的進化過程。
媒體大腦2410(智能媒體生產平臺)目前運用人工智能技術、大數據技術、物聯網技術、云計算技術,由MGC覆蓋突發事件、程序性報道、輿情報道。其生產過程是:首先通過攝像頭、傳感器、無人機等方式獲取視頻和數據,然后經由圖像識別、視頻識別等技術讓機器進行內容理解和新聞價值判斷,選取報道角度,將新理解的內容與已有知識圖譜進行關聯,對語義進行檢索,并配合接入天氣、交通、地理等數據,經過視頻編輯、語音合成、數據可視化等一系列過程,最終生成一條富媒體內容(文字、視頻、圖譜、音頻、可視化)。這條素材和線索,可以在不同的平臺上展示,如移動端、智能音箱。由于人工智能的牽線搭橋,萬物成為了廣義上媒體的一部分。
新華社提出的MGC新聞這一概念,與廣為人知的UGC形成了對應。在新聞領域,MGC和UGC的共性是在第一時間、從第一現場搜集第一手的新聞素材,但MGC的潛力顯然更勝一籌:它的感知設備是可復制的,將來覆蓋的時間、空間和信息收集的類別都將遠超于人類。機器收集的素材也不存在主觀判斷問題,它是一個更加真實、全面,也更加結構化、數據化的新聞資源。MGC今后的產量將是UGC的3倍或者三次方以上,借助機器,人們可以更高效地生產專業內容。
在可預見的未來,MGC的發展將與智能設備的發展緊密聯系在一起,信息渠道的多寡決定了MGC的覆蓋面和進步速度。這包括了行車記錄儀、無人機、智能家居等各類攝像和傳感設備,以智能音箱、智能電視為代表的各類信息輸出設備,還包括潛在的VR(虛擬現實)/AR(增強現實)設備,甚至是未來可能無所不包的機器人。人工智能將全面賦能給這些設備,并從中獲取自己成長所需的養分。
在人工智能領域,有一個長久以來被爭論的問題:人工智能是否會取代人類?具體到媒體領域,人工智能有沒有可能取代記者、編輯?MGC新聞是否會替代人類的報道?2013年,牛津大學的Carl Benedikt Frey和Michael A. Osborne發表了一篇論文,對702種職業被人工智能取代的可能性做出了分析。具體到記者這個職業,論文中認為人工智能可以取而代之的概率只有11%。兩位學者提到了難以被人工智能取代職業的三個特征:幫助和關切他人、思考和創意內容、社交和談判能力。截至2017年末,這篇論文已經被引用超過1500次。
可以看到,媒體人在日常工作中,恰恰對這三個特征都有一定程度的需求,而這其實就對應著我們評價新聞報道時常說的有溫度、有態度、有深度。如果新聞欠缺這些要素,那它確實可能被機器所取代,但這顯然不應成為媒體人對自己的要求。人工智能的發展和MGC新聞的出現,其實為媒體人展示的是另一條路徑:讓機器做機器擅長的事情,去成為人類的千里眼、順風耳,去承擔低價值的重復、枯燥的勞動,而內容工作者將由此得到生產力上的解放。
過去和現在的記者都需要花費巨量的時間在搜集、整理新聞相關的資料和素材上,這件事未來就可以讓機器來做,而且很可能比人類做得更加有條理、有效率;以往記者收集自己作品的反饋費時費力,未來這同樣可以由機器代勞。媒體與人工智能的融合會在新聞生產流程中提高效率,而節約出來的時間就可以讓記者去做更有價值、更有觀點、更有溫度的深度報道。“媒體大腦”所推動的,正是這樣一次新聞生產流程的重塑,進而改變媒體由內到外的整體生態環境。(見圖1)

圖1 “媒體大腦”賦能的記者工作場景模擬
未來優秀的媒體人不必是人工智能專家,但他/她一定知道怎樣利用人工智能來更好地為自己的工作服務。“媒體大腦”和MGC視頻新聞的出現,不是要取代記者和編輯,而是在更高層面上,把人與物的延伸連接起來,更快、更準、更智能地獲得新聞線索和新聞素材,賦能記者和編輯,幫助媒體提高生產力。在媒體和人工智能的融合之路上,“媒體大腦”將與媒體攜手前行。