賈玉升,崔 雨
(北京廣播電視臺,北京 100000)
北京廣播電視臺冬奧紀實4K超高清頻道2020年12月30日正式開播,這是我國首個上星播出的省級4K超高清頻道,也是國內惟一的標清、高清和超高清同播頻道[1]。4K超高清已成為未來視頻發展的必然趨勢。相較于高清頻道,4K超高清頻道的圖像清晰度更加細膩,色彩亮度的表現更加豐富,可達到電影水平,4K聲音效果也與影院相當,三維聲的音響效果甚至可以超過影院,觀眾可以在家體驗到影院的視聽感受[2]。
北京電視臺嚴格執行國家廣播電視總局的相關安全播出要求,同時利用人工智能技術針對目前的監錄監播系統進行升級改造。實現針對北京電視臺4K超高清頻道、1080P高清頻道、標清頻道的實時錄制、監測、智能報警功能,確保安全播出工作無漏洞、無死角、無隱患。
北京電視臺所有頻道采用TS封裝,其中4K超高清頻道(3840*2160 50fps)視頻編碼采用AVS2、H265,音頻編碼采用Dolby AC3;1080P高清頻道(1920*1080 25fps)視頻編碼采用AVS+、H264、MPEG-2、音頻編碼采用Dolby AC3;標清頻道(720*57625fps)視頻編碼采用AVS+、H264、MPEG-2,音頻編碼采用MP2;廣播節目音頻編碼為MP2。智能監播監錄系統建設需要具備以下能力:智能收錄、智能解碼、智能編碼、智能報警、智能存儲等能力。
系統運用面向服務架構設計方法、“模塊化”設計理念,使系統應用構建在模塊化的基礎平臺之上,從而實現易于擴展、可重用、標準化、可分布部署的應用系統。整個系統可分為四層結構:采集接入層、數據處理層、業務匯聚層和應用展示層。
系統應采用全IP化設計,位于信號接入層的各類監測板卡將音視頻信號數據IP化之后送入監測分析層的數據分析模塊、轉碼處理單元和收錄單元。
系統建設聚焦基本監播監錄功能實現,重點部署信號采集、轉碼收錄、多畫面監看、監錄管理等軟硬件設備。其余功能模塊通過預留接口為未來功能拓展、升級完善做好技術準備。

圖1 系統業務邏輯架構圖
采集接入層完成信號的采集、分析、監測、TS over IP轉發,將分析數據和節目數據通過統一網絡協議接口送至后級設備。
信號采集監測模塊采用無中心嵌入式設計,采集模塊除支持ASI、SDI信號格式外,兼容IP/IPTV/HLS/RTMP、模擬音頻、AES/EBU、模擬RF等信號格式,對信號進行實時監測,實時傳送監測結果到數據庫服務器記錄并在大屏頁面上顯示。
數據處理層由數據分析、錄制控制和轉碼處理三部分組成。
數據分析針對采集層傳送過來的數據進行分析,結合應用層預設的參數,實時對碼流中的各種表格作出解析,判斷碼流是否符合傳輸標準,并將結果報給業務匯聚層以便于應用層使用。數據分析是整個系統的核心部分,對播出信號的碼流層的監測處理,以及對監測內容的故障信息報警,都集中在該模塊完成。系統具備圖形報警、語音報警、文字報警等多種直觀報警手段,同時具備遠程報警功能,可以向相關部門和領導進行報警,如電話和短信等形式。
轉碼處理是針對采集層傳送的視音頻數據進行,對高清,超高清節目碼流進行壓縮,在保障音視頻質量的基礎上降低碼率。以便壓縮后的播后節目流媒體能夠在應用層的交互界面上流暢回放。轉碼模塊為軟硬結合方式,服務器負責解碼,轉碼卡負責再編碼打包封裝。轉碼模塊支持GPU加速引擎技術、支持優化視頻編碼算法、支持視頻增強技術,支持H.265編碼格式,實現高密度、高質量視頻編轉碼。轉碼模塊支持H.264、H.265等視頻編碼算法,音頻支持杜比5.1/7.1聲道自動混音頻輸入;轉碼模塊支持多封裝協議輸出技術,滿足多種輸出要求。
錄制控制是整個系統數據的樞紐,主要由網絡設備與存儲設備構成。網絡設備主要用于實現網絡交換過程中高數據量、高效率的數據包轉發;存儲設備主要用于實現系統各類數據的存儲,是系統各類應用的內容提供中心。
業務匯聚層是整個系統應用的支撐基礎,匯聚了所有操作日志以及全部任務的調度。系統提供全程收錄、故障收錄、任務調度、轉碼、多畫面監測、系統檢測、流媒體點播、統一認證、消息服務、策略管理、網絡管理、任務注冊、任務編排等公共Web管理;數據采集、分析、匯總、事件統計、各類方式展現等應用管理;從系統底層更加科學地解決管理上可能遇到的繁雜問題,通過后臺服務器支撐平臺向應用前端提供快速數據反應。
應用表示層是所有可操作以及系統可視內容的集合。其中Web配置管理提供給不同用戶進行前臺業務操作的應用組合,主要由業務配置、信源管理、多畫面管理、轉碼管理、收錄管理、報警管理、設備管理、數據報表組成。大屏監看則包含多畫面監看、節目相關性分析、內容層分析、聲光報警。
AI給未來的生活帶來了無限的想象,人工智能語音技術被得到了廣泛的應用,本系統創新性的將語音控制與監播監錄系統相融合,用戶可以通過語音指令的方式打開系統各個模塊并進行操作,例如“打開報警界面”“導出報警日志”等。通過語音指令可以使用戶遠離鼠標鍵盤的控制,通過最直接的方式發出指令,不再需要更為復雜的操作。

圖2 智能語音控制系統流程圖
通過智能語音識別引擎準確識別指定頻道中的語音數據,并翻譯為文字保存形成文稿庫。當設定關鍵字以后,系統根據所設置的關鍵庫在文稿庫中進行搜索,搜索完成后通過語義分析,將含有關鍵字的部分句段從文稿庫中摘出,并和視音頻文件做時間同步,然后自動剪切出正確的碎片化節目段落。
在傳統語音合成技術中,合成的語音大多比較生硬和突兀,很難做到自然流暢,本系統依托領先的語音技術和深度學習算法,為北京電視臺提供全面優質的文字轉語音服務。支持中英雙語,合成語音自然流暢,近乎真人發聲。當智能監播監錄系統發生異常信息時,可通過語音合成進行報警,讓應用準確地開口說話。
4K超高清頻道智能監播監錄系統引入智能化工具,提升異態信號識別精度,建立統一的安全播出質量監測展示和故障報警技術質量監播等綜合服務管理應用平臺,利用節目監錄數據為全臺提供高清內容的應用和服務,在保證安全播出的同時、實現播后節目數據的有效利用。