王艷瑩 朱珍珍 譚景瑜
(央視國際網絡有限公司,北京 100142)
從全球范圍看,媒體智能化進入快速發展階段。2019 年1 月25 日,習近平總書記在主持中央政治局第十二次集體學習時強調:“要運用信息革命成果,推動媒體融合向縱深發展”。[1]作為中央廣播電視總臺主辦的中央重點新聞網站,央視網深入貫徹落實習近平總書記關于推動媒體融合向縱深發展的重要論述,在總臺“5G+4K/8K+AI”戰略格局下,積極布局“云、數、智”技術體系,著力建設“人工智能編輯部”并發布系列創新產品,打造引領主流媒體“智慧+”變革的新引擎。
央視網以“人工智能編輯部”建設為核心,充分發揮“內容為王+平臺致勝+技術領先”的核心競爭力,致力于將人工智能大規模應用于新聞生產傳播實踐,并通過開放合作,形成多元參與、開放融合、對外共享的智媒生態,進一步鞏固宣傳思想文化陣地、壯大主流思想輿論,以科技創新塑造媒體發展新優勢。
央視網“人工智能編輯部”立足科技前沿,結合自身業務特色,探索將人工智能應用在視頻生產、制作、編目、搜索以及運營等全流程,構建全媒體生產傳播體系的“智慧中樞”。
“人工智能編輯部”主要由三部分構成:一是基于已建成的主流媒體大數據平臺和具備千萬級并發支撐能力的視頻平臺,建設主流媒體視聽內容AI 處理加工共享平臺;二是圍繞生產傳播全流程,開發涵蓋智能創作、智能采集、智能生產、智能審核、智能運營等環節的智能編輯“工具庫”;三是將人工智能技術廣泛應用于時政和重大主題宣傳報道,打造獨具總臺“智造”特色的智能創新應用產品。

圖1 人工智能編輯部整體框架
視聽內容AI 處理加工共享平臺,簡稱AI 中臺,是人工智能編輯部的能力基座。AI 中臺構建了多種AI原子能力,包括人臉識別、圖像識別、物體識別、字幕識別等視頻分析能力,自動化視頻內容審核能力,多模態檢索能力,語音合成能力等,實現了音視頻全鏈路需求的通用化處理能力。
其中視頻分析能力對媒資庫中存儲的海量視頻資源進行高效的語音、文字、人臉、實體、場景、圖像等多維度分析,對視頻內容做細顆粒度拆解,實現視頻自動分類、打標簽、智能提取封面等自動生成數據信息,智能化豐富視頻編目,并對輸出的數據分析結果通過NLP(Natural Language Processing 自然語言處理)技術進行深度理解,實現對海量媒資素材數據的精細化、結構化整理,為智能創作、智能推薦、智能搜索等應用場景提供數據基礎。

圖2 視頻分析能力應用示意圖
AI 中臺充分發揮央視網的視頻內容優勢,以AI技術挖掘視頻價值,推動視頻生產傳播方式變革,同時構建媒體行業知識圖譜,完善主流媒體算法倉庫,強化對時政報道的智能決策和預測能力,提升主流媒體對用戶的正向影響力。
智能編輯工具庫將AI 中臺的能力全面應用在媒體生產傳播全流程中,其中以智能審核、智能創作、智能用戶服務引擎為代表。
智能視聽審核引擎可供不同技術平臺或產品調用智能審核能力。依托各類AI 識別能力及視頻指紋技術,對視頻內容進行涉黃、涉恐、涉政等方面的實時智能化審核,從而大幅提升審核效率。此外,對歷史視頻進行定期全方位掃描,確保媒資庫內容安全,提升新媒體的網絡監管質量,發揮主流媒體的社會責任。
智能化創作工具基于直播流或長視頻媒資,結合AI 分析技術,融合畫面、音頻、文字的推理算法,借助AI 視頻剪輯引擎,提升視頻素材數量,后期僅需人工設定標簽和時長作為腳本,即可自動或半自動化生成符合內容及展示要求的視頻集錦,并實現多平臺同時分發,使新聞節目的生產更快、集錦節目的創編更準、編輯工作的效率更高。此外,該工具可一鍵自動生成時政類海報,基于智能制圖技術,結合時政圖解應用場景,實現時政圖片自動風格化處理、語義理解自動配圖等功能。
智能用戶服務引擎包括智能問答、多模檢索、智能推薦等多項功能。通過調用語音識別,語義理解、知識圖譜、對話管理(算法庫)、答案生成、語音合成等多項AI 基礎能力,為媒體報道定制專業、可控、穩定的問答系統,同時支持多種接入方式,滿足春晚等重大活動應用場景中的需求,如節目智能查找、節目智能推薦等。在內容推薦時,植入含引導因子的主流媒體算法,在為用戶提供所需內容的同時,以其喜聞樂見的方式進行主流價值觀引導。
依托AI 中臺和智能工具庫,人工智能編輯部圍繞業務線打造了40 多個創新應用,本文簡要介紹三個有技術特色的產品。
國內首個智能時政數據庫“I 學習”[2],以時政知識圖譜為核心優勢,完全實現了時政新聞的知識結構化和圖譜可視化,應用多種人工智能、大數據技術創新打造時政知識圖譜、學習原話、學習百科、學習思想、學習問答等一系列特色模塊,為編輯團隊提供了時政選題策劃、時政素材搜集、時政稿件核查、時政事件統計等功能,有效輔助時政內容創作的策劃選題、拓展思路、提取數據等,大幅提升生產效率。

圖3 “I 學習”時政知識圖譜
數字人生產運營一體化平臺是國內主流媒體首個一體化超寫實3D 數字人服務平臺,對直播、點播、形象等全鏈條管理,系統化解決低成本、高效率應用難題,快速生成具有實時交互能力的3D 高精度數字人。
智慧思政云平臺集智慧思政數據庫與智能備課工具于一體,充分發揮央視網海量數字媒資優勢,通過綜合運用大數據分析、人工智能等先進技術,實現對海量視頻圖文媒資中蘊含的思政知識元素的智能分析提取,思政知識體系的智能化構建,思政教學課件的快捷化創作。
央視網“人工智能編輯部”通過構建先進的AI 平臺,創新AIGC 技術體系,研發智能化標簽、時政知識圖譜、3D 超寫實數字人虛實結合直播等新媒體技術,將AI 技術全面應用于業務全鏈條,推動視聽媒體內容生產和運營方式發生深刻變革。
平臺采用松耦合式的系統架構,集成50 多種AI原子能力,支持視音頻內容分析、視音頻內容審核、多模態檢索、語音識別、語音合成等AI 能力的統一集成,以平臺化的方式提供能力和服務,在具備私有化AI 能力的同時,也可支持外部系統快速接入調用。AI中臺平均響應時間小于500 毫秒,日處理視頻能力超過3000 小時,并可隨需擴容。
通過優化NLP 模型,構建國內首個中文時政領域大型知識圖譜,填補了時政領域因文本抽取難度高而造成的知識結構化空白。在實體屬性抽取和關系抽取上,將篇章級事件文本轉化為句子級別事件,通過優化BIO 序列標注模型,降低模型訓練難度,并解決多標簽問題,同時創新性采用細、粗粒度實體識別兩階段模型,結合時政類專有名詞的預標注,抽取中文時政新聞文本內容的實體、關系、屬性等,生成時政知識圖譜。

圖4 特殊BIO 標注方式示意圖
使用基于超寫實數字人的虛實融合直播技術,創新實現將虛擬人與虛擬演播室相結合的虛實融合直播。運用多階段頂點流解算算法和傳感器融合技術,精準捕捉數字人的細微表情和抖動,運用光線-物理技術提高路徑采樣效率,優化組件達到渲染平衡,結合虛擬網格箱跟蹤式色鍵摳像技術實現虛實畫面的一鍵合成,在虛實融合直播中達到了低延時交互、高幀率渲染、高質量摳像。

圖5 數字人數據采集解算及虛實畫面合成示意圖
采用容器化微服務管理,實現視音頻AI 能力的規模化管理和標準化使用,支持微應用集成、服務治理和容量線性擴展。兩地三中心的跨地域多活混合云架構具有高可用性和擴展性,避免單點故障對系統的影響,確保7×24 小時不間斷運行。同時,AI 能力均通過服務總線對外暴露,總線具有良好的第三方兼容性,并支持跨集群調度。
綜合利用業內領先的新媒體信息處理算法,基于視頻動態標簽提取技術,依托自建標簽體系及知識圖譜,對海量媒體資源進行高效的語音、文字、人臉、實體、場景、圖像等多維度分析,構建符合主流媒體特征的智能化生成標簽算法,快速實現視頻結構化。智能化標簽總量已超過2180 萬,并拓展至內容創作、內容審核、智能問答等多應用場景。
央視網“人工智能編輯部”項目自正式上線以來,積極向內外部用戶推廣應用,將人工智能技術大規模應用于新聞“采集、生產、分發、接收、反饋”全鏈條業務,推進“思想+藝術+技術”融合創新,并融入“新聞+政務服務商務”,賦能媒體創新,推動媒體融合不斷向縱深發展。
央視網把人工智能技術應用于新聞宣傳,不斷改進表達方式、創新表現形式,讓新思想宣傳闡釋更加春風化雨,讓重大主題報道更加有聲有色。央視網依托“I 學習”智能化時政數據庫,結合應用人工智能、大數據等新技術推出《中南海月刊》等產品,提升“新媒體頭條工程”傳播實效。同時,在“人工智能編輯部”智能創作工具庫的有力支撐下,央視網在編輯隊伍規模不增加的前提下,實現了2022 年全網置頂通發稿件數超1000 條,全網置頂通發稿件數量連續多年蟬聯全國新聞網站首位。從2021 年的遠程連線采訪節目《兩會C+真探》、2022 年的虛實融合直播節目《兩會C+時刻》,到2023年的全國兩會先鋒談話XR直播節目《中國神氣局》,央視網數字主播“小C”已連續3 年在兩會報道中亮相,為兩會報道注入科技“創新力”。

圖6 《中南海月刊》2023 年9 月部分截圖
央視網不斷深化“思想+藝術+技術”融合創新。總臺2023 網絡春晚強化“年輕態”和“科技范”,開創多個“首次”:“虛擬人樂隊”首登網晚舞臺;首次推出“開新灶物”數字藏品;首次構建“賽博國風”元宇宙分會場,用技術賦能提升觀看體驗。建設運營中央廣播電視總臺“央博”數字文化藝術博物館,并先后推出“央博新春云廟會”“何以文明—中華文明探源工程成果數字藝術大展”等。

圖7 “何以文明——中華文明探源工程成果數字藝術大展”
央視網依托“人工智能編輯部”核心能力,實施“智能傳播工程”,建設視頻中臺、數據中臺、AI 中臺和業務中臺,貫通“大屏+中屏+小屏+賬號”、各平臺全球覆蓋用戶總數超21 億的全媒體傳播矩陣,不斷強化用戶連接、提升傳播效能,讓黨的聲音和主流價值“無處不在”“觸手可及”。
央視網多終端直播播控平臺,是“人工智能編輯部”視頻中臺的重要組成部分,支撐服務于多終端直播業務運營,具備600+路直播頻道、單頻道5 路多碼流自適應、8 大核心節點、多CDN 實時調度、1000 萬以上用戶同時在線并發播放支撐能力,廣泛應用于總臺新媒體主題主線報道、國內外大型賽事以及原創內容產品的智能化播出,并服務眾多行業客戶。特別是在黨的二十大宣傳報道中首次通過自研矩陣以及智能源站實現對DRM 加密流輸出的無縫穩定調度切換,為安全播出保駕護航。
“人工智能編輯部”利用視聽內容AI 處理加工共享平臺積累的人物標簽、知識圖譜等能力,輔助媒體內容審核,已在總臺人工智能能力開放平臺多人臉識別系統中推廣使用,大幅提升內容安全水平和生產運營效率,有效助力總臺人工智能創新基地建設。通過私有化建設和云服務開放AI 視聽支撐能力等方式,為廣電媒體行業提供智能化運營支撐服務,應用效果顯著。
通過數字化、智能化賦能,不斷創新媒體服務場景,不斷升維媒體服務能力,從“媒體+服務”升級到“智媒+服務”,央視網“人工智能編輯部”產品矩陣已成功應用在政府機構、電信運營商、融媒體中心等的數智化轉型升級。集智慧思政素材數據庫與智能備課工具于一體的“智慧思政云平臺”在今年正式上線并對外提供服務,助力各級各類院校思政育人模式的數智化創新。一體化數字人服務平臺實現了低成本、高效率生成具有實時交互能力的3D高精度數字人,服務地方文旅和品牌傳播。今年3 月,央視網全程參與策劃并承辦綿陽市文化和旅游發展大會暨李白故里文化旅游節,發布了全球首款“少年李白數字人”,并讓其化身為“江油市文化推廣大使”,用數字技術帶來李白文化的全新藝術體驗。

圖8 少年李白數字人弘揚中國傳統文化
科技深刻改變了傳媒格局、傳播生態,也為媒體創新發展提供了強大動力。總臺央視網將始終堅持科技創新主旋律,持續深化“人工智能編輯部”建設,以科技創新塑造發展新動能、融合新優勢,為提升新聞輿論傳播力、引導力、影響力、公信力貢獻更大力量。