文/傅丕毅 商艷青 張寧寧
習近平總書記在中央政治局第十二次集體學習時提出媒體需要探索將人工智能運用在新聞采集、生產、分發、接收、反饋中,全面提高輿論引導能力。“媒體大腦”的發布上線,正是對習總書記這一指示精神的貫徹落實。
過去幾年,人工智能在內容分發、算法推薦等領域有了大量應用,但生產環節仍相對傳統,缺少核心技術支撐和變革。2017年12月26日,中國第一個媒體人工智能平臺“媒體大腦”對外發布,旨在用智能技術賦能媒體,探索和實踐個性化生產、可視化呈現、互動化傳播。“媒體大腦”由新華智云科技有限公司自主研發完成,新華智云是由新華社和阿里巴巴合資成立的一家媒體人工智能科技公司。
隨著社交平臺崛起和網速升級,內容消費尤其是視頻消費已成為現代人大眾化、高頻次的剛需。然而內容“紅海”競爭日益激烈,傳統媒體機構面臨用戶流失和影響力下降的挑戰。對媒體機構來說如何推進媒體融合,快速、高產、高效地提供優質內容吸引用戶,做大做強影響力,對技術的需求日益凸顯。
為應對媒體需求,2018年12月27日,“媒體大腦”發布新版本“MAGIC短視頻智能生產平臺”(magic.shuwen.com),MAGIC的名字由MGC(機器生產內容)和AI(人工智能)組成,平臺集納了自然語言處理、計算機視覺、音頻語義理解等多項人工智能技術,將人工智能引入新聞全鏈路,著力采集、生產、分發端創新,幫助用戶高效完成短視頻內容創作。目前MAGIC平臺已在2018世界杯、亞運會、世界人工智能大會、進博會等重大活動的內容生產中取得了一定成績,正在為眾多媒體機構的日常內容生產提供技術支持和服務。
海量新聞資源是智媒時代最有價值的數據。數據即信息內容,信息內容不斷地被拆解、細分,接近無窮小的單位,機器智能挖掘分析,讓信息產生價值。信息需要標記,只有可標記,才能被檢索,只有可檢索,信息才能被重新組織和組合,這一新的有機調用形式會呈現指數級增長。
新聞內容以文本、圖片、視頻為主,具有非結構化的特點,難以被機器所理解,無法滿足內容生產者高效使用數據的需求。此外,不同媒介形態對信息的壓縮程度不同,在信息量上文本<圖片<視頻,而在結構化的難度上視頻>圖片>文本,舉例而言,用戶在計算機上可以對一篇文章通過對關鍵詞快速檢索,而視頻必須看完才能知道內容。
MAGIC平臺結合對媒體場景的深度理解,利用大數據處理、人臉識別、語音識別等智能技術,對非結構化的文本、圖片、視頻等媒資數據進行處理,建立高度智能化、標簽化的媒資平臺。以MAGIC2018世界杯時生產的《圓滿!本屆世界杯1-23號球員都進球了》視頻為例,視頻將世界杯1號到23號球員的進球片段進行聚合,制作這樣一個視頻,傳統模式下編輯至少要花費數小時尋找素材剪輯,而在MAGIC平臺只需鼠標幾步搜索整合包裝即可完成。
數據是算法發揮價值的基礎原料,有了數據后需要更多“智力”對原材料進行加工。為此媒體大腦推出“AI洞見”系列方案,用新聞算法計算新聞數據。
“AI洞見”的實踐源自2018世界杯,初衷是利用人工智能技術智能地理解內容,實時捕捉球場上的精彩瞬間,為受眾提供有人工智能增強現實的實時回放體驗。在世界杯期間,“AI洞見”近實時全自動識別并提取射門鏡頭,通過可視化效果剖析球場態勢,大幅提高球場高光視頻的制作效率和質量。
在球場上最具新聞價值和時效性的的高光時刻是射門瞬間,而在其他內容領域具有新聞性的內容又各有不同,比如突發新聞中是爆炸或者火災搶救現場,會議新聞中是發言人的金句時刻。隨著MAGIC平臺應用場景的增加,在橫向上“AI洞見”以體育領域為基礎,將相關技術遷移、擴展至突發新聞、會議新聞、時尚娛樂等多個場景;在縱向上,“AI洞見”優化特定場景下模型的學習能力。通過對視覺、聲音、文字等多維度分析,幫助內容生產者更好地獲取、處理新聞資源,更快發現新聞角度和線索。
MAGIC平臺通過智能化技術將生產流水線引入內容生產行業,力爭成為智能時代內容行業的基礎設施,推動媒體機構內容生產供給側改革。目前平臺通過人機結合和機器自動化進行短視頻生產,覆蓋體育、金融、時事、社會、數據可視化、娛樂、時尚等眾多領域。以下是MAGIC平臺部分應用案例。
體育高光視頻。2018年6月13日,MAGIC平臺上線內測,世界杯期間共生產世界杯短視頻37581條,實現全網1.2億次播放。賽事期間,MAGIC平臺通過接入電視直播流信號,對比賽視頻實時標注,自動追蹤運動員和足球每秒25次。通過計算機視覺、自然語言分析等多模態結合,在比賽中自動識別包括進球、犯規等關鍵動作,封裝成可供移動端分發的視頻。
MAGIC平臺生產的最快進球視頻《俄羅斯2∶0領先埃及》耗時6秒完成,6秒內機器完成了對進球自動識別、片段剪切和封面封尾剪輯,并對優酷等多個平臺進行推送,成為全網最快進球視頻。
此外,“AI洞見”實時識別高光時刻中人眼難以實時處理標注的信息點,在射門瞬間判斷、場上攻防判斷、球和球員的檢測跟蹤、畫面配準、2D坐標構建、跑動軌跡生成等方面有了較成熟的應用,能夠為用戶提供近實時、多維度的高光回放體驗。
MAGIC平臺在體育領域目前覆蓋足球、籃球等團隊協作性強的大球項目,并在進一步擴大應用范圍。
會議視頻報道。大型會議活動一般設置多個分論壇,記者分身乏術難以全部覆蓋。MAGIC平臺結合會議報道場景,通過接入大會實時直播流信號,對大會鏡頭畫面、現場聲音、發言人話術規律等進行分析和視頻封裝,提供智能化的會議報道解決方案。MAGIC編輯器的語音轉字幕功能,允許一鍵添加字幕,編輯只需做簡單的審核,節約了同期聲轉寫的時間。
2018世界人工智能大會期間,MAGIC平臺通過人機協作,4名編輯覆蓋大會38場論壇,累計處理超過100小時的視頻素材,開幕會首日生產40條視頻新聞,兩條稿件相隔不到1分鐘,生產內容覆蓋演講高光時刻和行業解讀數據分析。
MAGIC平臺作為世界人工智能大會的AI新聞官24小時在線,秒級處理大量生成會議視頻。
第六屆中國新興媒體產業融合發展大會上,MAGIC平臺現場實時演示短視頻智能生產過程,3個小時生產186條大會會議短視頻,其中97條機器生產,89條為人機協作生產。
突發新聞和暖新聞。MAGIC平臺通過深度學習,對媒資進行分類和標簽化處理,判斷新聞類別,對突發事件等具有高時效性的媒資高亮,提醒用戶優先處理;同時對長視頻片段中的突發畫面進行定位,方便用戶進行快速審閱編輯;對正能量新聞、暖新聞進行機器識別分析和判斷。
以新華社現場云全國服務平臺為例,現場云平臺聯合3100多家媒體,平臺內逾70%的現場新聞報道有視頻直播流,短視頻占比超過30%,圖片占比超過60%,其中既有高時效性的突發新聞,也有正能量、打動人心的暖新聞,MAGIC平臺對媒資進行高亮和推薦,提升現場云編輯處理新聞的效率。
數據可視化新聞。數據可視化是數據新聞的重要形式之一,尤其是帶有動態效果的可視化視頻,相比靜態圖表提供了更豐富的數據維度和更強的表現力。然而數據可視化視頻門檻比較高,往往需要設計或者代碼知識。MAGIC平臺為內容生產者提供了專業的數據可視化模板,涵蓋餅圖、柱狀圖、折線圖等多種圖表形態,搭配流暢的動畫效果,零基礎編輯只需幾步就能制作出一個數據可視化視頻。
在2019地方兩會期間,山東章丘新聞中心的編輯利用MAGIC平臺簡單快速生成了關于本地的數據新聞,取得了良好的傳播效果。
金融短視頻。金融業務本身具有大量結構化數據,MAGIC平臺通過對金融數據進行提煉,將相關金融業務能力以短視頻為載體呈現和傳播。目前MAGIC平臺實時監測3500多支股票漲幅變化情況,覆蓋盤前、盤中、盤后數據分析。如果某支股票5分鐘內行情波動超過5%將自動觸發生產一條該股行情的可視化短視頻。基于MAGIC平臺底層的極速渲染引擎和可視化模板,實現金融短視頻的海量生產,秒級生成,受眾喜歡,讓金融數據價值發揮到最大。
對話機器人。為滿足用戶獲取內容的個性化需求,強化交互性,MAGIC平臺推出對話機器人服務,用戶可以像與人聊天一樣,與機器進行問答,從而獲取最感興趣的內容信息。
2018世界杯期間MAGIC推出“MAGIC進球機器人”入駐新華社公眾號,為用戶提供世界杯進球視頻,用戶點擊菜單欄的“進球機器人”,提問如“我想看梅西的最新進球”,機器人將自動回復相關視頻。亞運會期間,對話機器人升級為微信小程序“金牌MAGIC”,結合新華社前方體育記者照片和實時金牌榜,提供最全金牌推送信息。
“媒體大腦”MAGIC平臺是人工智能技術首次在媒體領域集成化、產品化、商業化的應用,為個性化生產、可視化呈現、互動化傳播開辟了新渠道。同時,MAGIC平臺還在不斷升級迭代,在算法、數據、工程、產品、設計、內容、運營等多個部門協同下,填補多項技術空白。在智媒時代,無論是媒體機構還是互聯網公司都缺少成熟的經驗去借鑒,正因如此我們才有空間去開拓創新。
隨著內容行業競爭進入下半場,將更多智能化技術引入內容生產已是大勢所趨。許多人問人工智能是否會取代人類記者,我們認為答案是否定的。MAGIC平臺的本質是人的智慧和機器的智能相結合,形成一種相互協作的關系,而不是相互替代的關系。
我們通過人工智能技術將更多創新的手段和工具引入內容生產,進行流程再塑造,幫助媒體融合轉型為智媒,幫助媒體打造核心競爭力,持續產出優質內容,提升影響力和收獲經濟效益。
我們相信,只有加強AI技術與內容行業的創新融合,才能迎來行業更持久的共振。