高尚清
(浙江廣播電視集團,浙江 杭州 310005)
近年來,浙江廣播電視集團(以下簡稱浙江廣電)致力于推動媒體融合縱深發展,加快將人工智能等新興技術應用于信息采集、生產、傳播等各環節[1]。傳統的媒體節目制作流程中,三級四審制度主要依靠人力完成。近年來,新媒體行業興起,大小屏聯動發展,傳播內容愈加繁多。依托傳統模式審核效率低,且難以對現有媒資通過智能化標簽等條件進行檢索。為應對愈加繁重的媒體內容審核、內容價值挖掘任務,研發、建設一套智能審核分析系統,輔助提高內容審核與分析效率,尤為重要。
智能審核分析系統,依托浙江廣電莫干山路數據中心,利用原子能力打造媒體新型內容審核、分析流程;利用中心現有的計算資源與轉碼、遷移等基礎組件實現對各類節目素材與成片的審核分析結果在線預覽。系統包括業務監控、智能審核分析、系統管理等模塊,支持配額管理與用量統計,便于后續計費和數據分析。本項目的實施,優化了傳統節目審核方式,助力內容分析以及智能化檢索,提高了媒體制作效率,滿足新時代廣電行業生產需要。
智能審核分析系統依托“浙江廣電莫干山路數據中心”基礎設施即服務(Infrastructure as a Service,IaaS)資源池,包含對象存儲、數據庫實例、K8S 容器管理平臺等服務,實現系統的高可用性;依托中心轉碼等平臺即服務(Platform as a Service,PaaS)層服務,對媒體內容進行轉碼,統一生成低碼率文件組,方便用戶預覽以及后續流程調用;通過預設個性化模板,驅動后臺流程,取得對應的審核分析結果;支持多站點模式,每個站點及站點內用戶數據隔離,可對每個站點及用戶單獨設置智能處理的類型以及配額,并對其用量進行統計;對接中國藍云平臺、Z 視介等業務平臺,支持以單點登錄、應用程序編程接口(Application Programming Interface,API)調用等多種方式進行接入,便于現有業務及其他業務系統便捷對接[2]。系統總體結構如圖1 所示,主要包括業務監控、系統管理、基礎組件以及智能審核分析四大功能模塊。

圖1 智能審核分析系統架構圖
業務監控模塊主要負責提供各類對外API、內部接口轉發、模板配置以及三方對接。用戶可按實際需求配置智能審核、分析模板;流程驅動后返回給應用系統的內容根據模板進行匹配,顯示模板已勾選的類型以及高于閾值的相應內容?!爸袊{云平臺”、重大文化傳播平臺的核心載體“Z 視介”現已通過單點登錄、接口調用等方式正式接入使用。
系統管理模塊包含租戶管理、用戶管理、權限管理以及配額管理四大功能。智能審核分析系統按需進行租戶化部署,各個站點共享基礎組件以及業務監控功能,用戶及業務數據相互隔離。用戶管理提供用戶的注冊、編輯、權限分配和配額等功能。權限管理可通過設置不同角色對應多重權限需求,便于管理及保障流程、數據安全。配額管理支持首先給各個租戶站點分配一定的智能能力使用額度,其次該站點下所有用戶可用的總額不超過該站點本身配額;同時支持配額軟性閾值設置,即此模式下超過設定配額限制,系統可提醒該租戶管理員相關情況但不限制用戶繼續使用,有利于適配不同用戶、不同場景的管理模式。
基礎組件包含了K8S 集群、對象存儲、數據庫實例及緩存服務等。智能審核分析系統的各個服務通過容器化方式部署,各個容器相互獨立,進程不會互相影響,具備可擴展、自動化的特點,可通過設置策略實現服務的彈性擴縮容,在不浪費底層資源的前提下保障系統穩定運行[3]。上述資源面向系統各個租戶、用戶開放,具備可擴展性同時便于優化升級。
智能審核分析涵蓋多媒體內容分析、內容審核、特征庫以及統計分析四大功能。系統支持用戶通過手動創建或者接口請求方式根據模板發起任務流程,支持視頻、音頻、圖片和文字多種形式的媒體內容,同時支持新建人臉庫、機構庫和Logo 庫等自定義特征庫。用戶可將創建的特征庫與流程模板進行綁定關聯,實現對特定人物、圖像的審核分析需求。系統支持按照用戶、租戶維度進行資源使用情況分類統計,同時具備配置計費規則,基于額度用量進行計費,豐富系統運營能力。
本系統的設計目標是開發一套智能審核分析系統,保持對新技術的戰略主動;通過對新技術的深入研究與主動跟進,推進媒體深度融合發展,為節目內容制作和審核提供支持[4]。
系統基于浙江廣電莫干山路數據中心的容器服務、云數據庫等統一設計,采用restapi、插件化方式進行數據交互;采用云轉碼、對象存儲(Object Storage Service,OSS)和服務器負載均衡(Server Load Balancer,SLB)等先進的技術和產品,符合廣電行業發展趨勢。智能審核分析系統上線后,助力現有業務及用戶內容安全審核和媒體內容生產參考,滿足先進性要求;依托本地化部署的阿里云平臺,包含Web 應用防火墻(Web Application Firewall,WAF)、云監控(Cloud Monitoring Service,CMS)、高速通道等功能和資源,保障媒體內容安全傳輸,滿足高安全性要求。
智能審核分析服務支持對視頻、音頻、圖片和文本等類型文件發起審核或分析任務流程。對應的文件上傳方式包含Web 上傳、Http 文件識別、存儲掃描(包含nas、oss、ftp);同時支持任務進度可視化呈現,實時進度查看。智能處理完成后,最終各數據結果進行聚合,回調給業務系統進行展示。系統還具備任務流程狀態消息通知能力,可以將任務的每一個步驟更新后的信息和最終結果以結構化數據的形式回調給用戶。具備相應權限的用戶根據實際情況,如當任務失敗時,可對已發起任務進行批量取消、刪除和重置操作。具體流程步驟如圖2 所示,詳細介紹如下。

圖2 智能審核分析流程圖
(1)用戶上傳視音頻等素材,選擇任務類型和模板或傳遞相應參數,通過接口發起任務;
(2)系統會對收到的任務中帶有的鑒權信息進行校驗,通過后抽取元數據信息;如果是視頻類型,對原視頻進行轉碼、抽幀,提取封面和音頻,再下發給智能算子進行處理;
(3)算子結果經過數據聚合,回調給業務系統進行展示;
(4)在系統頁面中,可根據任務名稱、任務狀態、使用模板、創建時間和任務最后更新時間進行查詢。
2.2.1 智能分析
智能分析功能支持對視頻、圖片和文本等媒體內容發起任務。用戶可對完成的任務進行在線預覽視頻、圖片內容;智能分析功能可以根據模板提取出視頻、圖片中的標簽信息、人臉信息、語音文字信息及Logo 信息等。
標簽信息首先會根據收到的結構化數據進行標簽分類,如地名、機構組織、場景、人物等進行展示,然后再將相應結果呈現至各個分類中。人臉信息中,可查看系統識別出的人物,包括人物姓名,人物出現的關鍵幀、時碼和置信度等信息,并支持點擊時碼在預覽窗口中跳轉至相應的視頻內容處,幫助用戶快速定位[5]。語音文字信息處理方面,通過對媒體內容進行音頻提取、語音轉文字和OCR 處理,系統按時間順序展示識別出的文字信息,可通過輸入關鍵詞方式進行檢索查詢,并支持以srt 或excel 形式導出,方便用戶進行二次加工處理。Logo信息模塊中可識別出媒體內容中的Logo、水印等信息并進行呈現。
2.2.2 智能審核
智能審核服務對用戶發起的視頻、圖片、語音和文本進行審核。審核結果通過智能處理結果的置信度與相應模板匹配后,以人工智能(Artificial Intelligence,AI)確認結果、AI 疑似結果方式呈現。用戶可在模板中勾選涉黃、暴恐、涉政、違禁、廣告和低質等六大一級分類,每個一級分類下又細分為二級分類以及對應的三級分類。以暴恐為例,下有二級分類如暴力事件,暴力事件又可分化出槍械、刀具、血腥等三級分類。
用戶可勾選所需分類并對每一個三級分類設置確認閾值和疑似閾值。當發起的智能審核任務出現對應的三級分類內容,且結果的置信度高于模板設置確認閾值時,可以在AI 確認結果模塊中的對應分類下查看具體結果,含有名稱、出現的關鍵幀、時碼和置信度等信息,支持快速定位。當結果的置信度處于確認閾值和疑似閾值之間時,同理,可在AI 疑似結果模塊中查看。當結果置信度低于用戶設置的疑似置信度時,系統將過濾相應信息,不在可視化頁面展示。
為確保媒體內容安全制作播出,智能審核模塊可對完成的智能審核任務進行人工復審修訂。用戶可反饋遺漏違規點,新建詞條、分類及片段。
上述人臉、Logo 和文本等內容模塊均支持任務模板與自定義特征庫相關聯。以Logo 為例,通常情況下,本系統可審核、分析、識別出媒體內容中出現的較知名或違規Logo。當用戶需要審核特定Logo 時,可新建Logo 特征庫,將特定Logo 以圖片、名稱方式上傳,經站點管理員審核認可后入庫至該特征庫。具體流程步驟如圖3 所示。

圖3 特征庫新建數據流程圖
添加數據成功后,用戶可將該特征庫與模板中的指定分類進行關聯,后續發起的任務即可識別此Logo 并可視化展示。
系統對租戶站點以及單個用戶按智能能力類型以及對應額度、任務類型進行分類統計,便于對單個站點的使用特點進行分析。同時,系統管理員可見所有租戶站點分配以及已使用額度的總體情況,為底層智能處理能力類型及數量資源規劃提供決策依據[6]。系統界面如圖4 所示。

圖4 統計分析展示圖
隨著高新技術發展與媒體行業的不斷變革,節目的制作已不完全局限于以往的純人工模式,智能審核分析系統應運而生,協助現有業務興利除弊。此外,系統優化了審核流程,降低出錯風險,同時通過智能標簽化信息提取等方式,對已有內容歸納溯源,在為打造全新作品提供輔助參考等方面發揮了重要作用。