文_鄭 偉

今天在此分享北大方正對媒體融合中的大數據以及人工智能應用的思考與實踐。
第一,從“數字化”到“新數智化”的轉型。“新”指“從新媒體出發重組生態”,一是以移動新媒體為核心,以移動新媒體為主陣地;二是新技術驅動,云計算、大數據、人工智能這些新興技術是媒體融合最重要的驅動力,起到支撐作用;三是媒體的定位和過去不一樣,要通過新產品、新服務來構建、重組一個新生態。“數”指大數據重建連接。媒體提供適合于C端或B端用戶的產品,通過大數據把這些產品精準推送到用戶手中,這就是大數據建立的新連接。“智”指人工智能,重塑邊界。比如智能化采集生產,過去以圖文為主,現在視頻等新產品都需要智能化的生產工具來快速完成,一場足球賽在結束后的短短幾秒鐘內即可完成適合新媒體發布的內容采集、生成。智能交互技術帶來新變化、新體驗、新媒介,包括圖象識別、人臉識別、智能語音等,萬物互聯使每個物體成為新媒介,人工智能技術重塑媒體邊界。“化”指流程化再造。技術的應用必然會改變生產方式、生產流程,實現組織變革,打破傳統紙媒、網站、新媒體的邊界,通過流程優化與再造,實現共融互通。從數字化到新數智化,以新媒體為核心,運用大數據、人工智能技術來實現流程以及生產方式的再造。
第二,與應用場景緊密結合是用好大數據和人工智能技術的關鍵。業務訴求是什么?過去有什么樣的困難?生產效率可以在哪些地方得到提高?傳播如何更加精準有效?媒體需要把大數據和人工智能應用在指揮策劃、新聞創作、音視頻生產、內容審核、智能分發等各個環節。我們以兩個例子來看如何跟應用場景緊密結合。新聞事件演化過程當中會出現新的分支和新的話題,海量數據使得整個事件的脈絡難以依賴人工梳理,而對一個事件的演化做分析是媒體做深度報道必不可少的環節。
仝卓事件,明星高考作假,帶來一系列反應。下圖是人工智能自動生成的脈絡,隱含幾個約束性條件,一是連貫性,整個事件提取的關鍵節點一定要關聯,話題之間是相關的;二是結構性,整個故事線覆蓋度較廣;三是覆蓋面,體現新聞的多樣性,來自于官方媒體、傳統媒體、社交媒體、自媒體。首先,采集海量的大數據是基礎條件,只有采集到豐富的數據才能對事件作出自動化抽取。其次,事件檢測,在海量內容中檢測一個個話題,因為事件是發展變化的。第三,數據預處理,對每個檢測到的話題提取特征向量,把垃圾數據過濾掉,在時間軸里選擇代表事件發展的關鍵節點,根據發布量快速增長和變化來判斷時間節點是否為關鍵節點。還有子話題檢測,有的子話題有價值,有的子話題沒有價值,通過大數據技術和智能分析自動生成故事線和事件脈絡。

傳統媒體積累了大量圖文資料,如何用新方式表達?AI帶來全新的表達方式,比如孟晚舟事件,基于豐富的圖文資料,快速把文字和圖片自動生成更具表現力的短視頻。
第三,中臺戰略和中臺技術推動媒體技術架構的演進。中臺是什么?中臺戰略的目標不是為了解決單點問題,而是提供可復用的“基礎服務和能力”的整合平臺,為上層業務賦能。中臺是新數智化的基礎理念,是新的系統架構思路和系統建設模式。
長期持續的中臺能力建設,可以快速構建支撐新業務拓展的業務系統。過去我們做一個新業務要從系統架構開始,從數據庫開始,從流程開始,未來的建設方式是從中臺去調取,利用數據中臺和AI中臺提供的基礎能力,快速搭建一個全新應用。大數據和人工智能技術是基礎性的資源、服務和能力。中臺是大數據和AI能力的最佳構建方式,也推動了媒體整體技術架構的轉型和演進。通過中臺不僅為當前業務賦能,也為新業務的快速構建打下基礎。數據中臺和AI中臺的架構會帶來極大的開放性,各種AI組件、數據產品都可以整合在超融合中臺中,它是一個開放的平臺。未來的智慧媒體要通過數據中臺和AI提供架構上的支撐。
(摘自鄭偉在2020中國[杭州]傳媒技術生態高峰論壇上的主題演講)