龔 坤,趙 時
(1.成都索貝數碼科技股份有限公司,四川 成都 610000;2.湖北省新聞出版廣電監管中心,湖北 武漢 430000)
2020年,中共中央宣傳部等九部委聯合印發《全國有線電視網絡整合發展實施方案》,明確指出要加快推動全國有線電視網絡整合,實現全國一網。廣電網絡生態在不斷升級的同時,其管理、工作方法也在受到互聯網的沖擊。例如,海量制作素材難以篩選,播出內容大量增加,這都給制作人員和審核人員帶來了巨大的壓力[1]。人工智能(Artificial Intelligence,AI)作為新一代信息技術,已被廣泛應用到交通、能源、醫療及工業生產等多個領域,并取得了不錯的效果,能有效提升生產效率、減少人力成本。AI技術在廣電行業的發展趨勢,必將是以AI來代替大量繁雜的重復性人力勞動,研制出更為豐富的、針對廣電場景的專用AI模型,推動AI在廣電行業的專業化應用。因此,研究AI適用于廣電領域的哪些具體應用場景,如何與廣電業務系統對接實現應用落地,具有重要的價值。
選題策劃的痛點在于如何搜集各渠道信息并確定熱點,快速策劃出滿足各類群體并能引導正能量內容的節目、掌握輿論制高點。對此,利用AI和數字挖掘技術,能夠對微博、抖音、快手等各渠道進行信息搜集,并就輿情熱點、用戶喜好等關鍵因素進行分析,通過人臉識別、OCR字符識別、語音識別、鏡頭聚類、模糊對齊等技術手段解讀新聞;根據分析結果推薦節目制作的話題和方向,自動撰寫策劃文稿,幫助節目制作人員快速策劃出滿足用戶需求的節目。
媒資管理的痛點在于大規模、多模態的數字媒體如何快速檢索、編目。利用語音識別、圖像識別、視頻識別等智能識別技術,可對視音頻內的內容進行提取;通過自然語言理解、圖像語義分析、視頻語義分析等智能理解技術,能將視音頻內的人物、機構等重要因素進行智能標簽,可實現智能化編目和智能化檢索,充分挖掘媒體資源的價值。
生產制作的痛點在于傳統媒體素材如何提升畫面質量以及如何快速制作稿件。利用圖像、視頻超分辨率重建、去交錯等AI技術,可將視頻清晰度增強、變換視頻采樣格式,并通過對抗學習對畫面進行修復。此外,利用圖像識別、OCR識別、視頻語義分析、自然語言理解等技術,能根據輸入標簽精準提煉畫面、文字,形成專業多媒體稿,可有效提升生產效率,并且增強生產內容的表現力與感染力。
分發傳輸的痛點在于傳播渠道的格式多影響傳播速度以及如何將合適的內容傳播給需要的觀眾。一方面,利用自然語言理解、語義分析、圖像識別、OCR識別等技術,可實現智能格式修改,提升內容傳播速度,掌握宣傳主動權;另一方面,通過分析用戶行為特征和業務偏好,基于海量內容和用戶數據,建立流行度管理和預測方法,利用用戶畫像等技術,可進行內容推薦,提升內容的傳播力和影響力。
廣播電視內容安全關乎國家政治安全、文化信息安全以及意識形態安全。目前,內容審核多采用人工方式進行,但是新聞類和訪談類節目中往往包含大量各級領導干部的影像、聲音、姓名等信息,審核人員難以辨識所有人物的身份和背景,同時,面對互聯網產出的大量內容,人工的低審核效率、長時間工作導致的狀態下降等問題愈發突出,播出事故頻頻發生[2]。利用智能識別技術,可對敏感內容和人物進行標記,從而有效輔助人工對視頻中的內容進行高效、全面的判斷,避免冗長的無效信息帶來的人力成本浪費。
從上述分析可知,選題策劃、媒資管理、生產制作、分發運輸以及內容審核等廣電場景,都對AI有需求,且AI能夠有效地提升這些場景下的工作效率和效果。然而,這些場景通常要求多種AI原子能力組合應用以解決問題,而AI原子能力由計算資源、訓練數據、算法技術組合得到,因此,需要一個平臺來綜合提供這些底層資源和技術,從而形成多個AI原子能力,進而面向廣電場景實現應用。
面向廣電場景的AI平臺,應該具有知識庫、大數據治理、AI管理等核心組件,同時需要規劃平臺的資源層、技術層、服務層等各層級模塊以及相互之間的關系,為未來進行平臺落地建設提供新的思路和指導方案。
以湖北省新聞出版廣電監管中心的AI平臺實際建設方案為例,平臺的資源層、技術層、服務層等各層級模塊以及相互之間的關系如圖1所示。

圖1 湖北省新聞出版廣電監管中心面向廣電場景的AI平臺
資源層由計算服務器、網絡設備、存儲設備以及廣電場景目前逐漸應用較多的移動終端等設備組成。考慮到在全國一網的背景下,廣電領域有著海量的素材和復雜的應用場景,對計算能力、精度及可擴展性等性能要求很高,因此,資源由云服務提供商提供,以應對突發情況下資源不足的問題。同時,由于云服務具備彈性資源供給的特性,可以避免采購過多設備帶來的浪費問題。
平臺核心組件包括知識庫組件、大數據治理組件以及AI管理組件。知識庫組件根據多年從業人員的輸入存儲了大量業務經驗和知識,能支撐場景化AI原子能力的訓練。比如,在智能導播算法的設計中,需要導播提供鏡頭語言、鏡頭切換時機、運鏡方法等知識;在敏感內容識別中,需要有監管人員界定涉黃、涉暴等內容的相關邊界。除了專家的業務經驗之外,知識庫還可利用知識圖譜和數據治理相關技術對歷史生產數據進行抽取,有助于收集易被忽視的信息,同時可以分析知識間的關系,明確不同知識在業務場景中的重要性[3]。
大數據治理組件具有可對用戶使用數據和內部生產數據進行采集的渠道,利用分布式數據庫、分布式計算引擎來構成數據集成系統、數據資源池、數據服務系統以及數據共享系統,并結合數據挖掘技術進行數據管理和數據治理[4]。利用大數據治理組件,可以對用戶數據和歷史生產數據進行有效管理和價值挖掘,并有助于知識庫進行知識抽取,還能提供大量數據訓練具有高泛化性的AI原子能力。
AI管理組件由大數據治理組件提供存儲資源,計算服務器提供CPU、GPU等計算資源進行模型訓練。通過分布式資源調度框架來調度各計算服務器的計算資源,以支持模型的分布式訓練,并且可通過容器化的方式支撐多個AI框架,以保證AI原子能力之間互不沖突[5]。此外,還有能力庫可對各種訓練好的AI原子能力進行管理。基于AI管理組件,能夠有效利用各平臺資源來訓練基礎和場景化的AI原子能力,可方便、快捷、高效地形成面向廣電行業的各項智能服務。
統一的接口規范定義了與AI平臺其他系統進行數據交換的數據規范和報文規范。建立統一的接口規范,對各廠商AI能力進行封裝,平臺只需要關注AI算法本身,對于各種應用場景,無需再重復開發接口,能夠節約人力、時間成本。
平臺的算法技術層分為基礎算法和面向廣電業務場景的算法。基礎算法包括人臉識別、語音識別、自然語言處理、推薦算法以及知識圖譜構建。在這些基礎算法上,通過融合推理,推出面向廣電業務場景的智能算法,包括鏡頭語言識別、智能剪輯技術以及視頻增強技術等。其中,視頻增強技術包括視頻超分、色彩變換及圖像修復等。
平臺的服務層主要是基于各項面向廣電業務場景的算法,為電視臺等廣電機構提供智能編片、智能編目、智能拆條、智能審片、智能唱詞、智能抹標、智能配音、智能修復、內容推薦以及數據分析等智能服務。
本文詳細闡述了湖北省新聞出版廣電監管中心建設面向廣電場景AI平臺的實踐中,人工智能可應用于廣播電視行業的多個具體應用場景。針對面向廣電場景的AI平臺進行了探索和應用,給出了平臺架構和核心組件,有助于全國各級電視臺等廣電機構建立自己的AI平臺,以推進智慧廣電服務,滿足城市圈用戶多元化需求,全面增強媒體影響力。