王學博
山東廣播電視臺 山東 濟南 250014
在融媒體業務不斷發展、創新的背景下,面臨著待審內容數量大、內容來源類型多、時效性要求高等新要求,強調既要滿足傳統節目審核機制,又要嚴格把控審核尺度,避免出現審查遺漏。在此環境下,更需要具備更加權威、專業、智能化的審核工具,用于滿足廣電受眾的需求和社會形式。
為保證廣電行業健康、可持續性發展,新形勢下的專網及定向傳播視聽節目應遵循《專網及定向傳播視聽節目服務管理規定》內容,嚴禁出現違反相關規定、危害社會公德、破壞民族團結等內容,建立健全的審查制度、播出制度。人工智能審核系統的應用需立足于審核內容要求和規范開展相關工作,以IPTV集成播控平臺內容審核流程為例,除了智能系統外,審核團隊還包括負責人、主管、編輯及相關專審人員,注重各個環節審核的真實性、導向問題,避免造成版權侵害、突發事件以及敏感話題。在進行內容審核時需滿足“先審后播、重播重審、再播再審”的要求,切實做到嚴格把關。
以某省的媒資系統來看,內容審核工作中專業人員每月詞條節目審核量在逐漸增加,以往人工審核已經無法做到無紕漏審核,加之當前廣電審核標準、維度均有所提高,審核人員數量、資歷有限,需要積極引入新技術進行內容審核工作。基于以上現狀,需要順應時代發展需求,合理應用政策,采用AI審核系統。目前常用的檢測方式包括人臉、語音、OCR、黃暴畫面識別等前沿技術,能夠全方位、智能化的檢測,并根據情況給出違規告警信息,有效提升工作效率。
廣電行業人工智能內容審核系統利用高性能X86通用服務器集群為平臺,利用CPU圖像處理、邏輯計算能力、AI智能識別技術、權威專業特征庫實現對審核業務流程的控制,實現信息交互與獨立展示,其系統框架如圖1所示。

圖1 系統架構設計
在實際應用中,人工智能審核系統能夠為廣電節目的發布起到良好的控制與服務作用,系統框架設計便于快速對接生產發布環節、各個系統,設計通過請求調用以及緩存和調度策略后,能夠直接對接AI職能層進行分析、審核、對比,完成后返回信息,并做出整合與定位,最終展現結果數據[1]。針對廣電領域所應用的人工智能審核系統架構的分析,詳細如下。
第一,基礎能力層,主要滿足日常審核工作,是極為必要的模塊,其職能包括:①系統配置管理,能夠根據資源分配規則將數據庫、數據字典、CPU資源、存儲空間資源等接入不同審核模板,支持備份與導入;②用戶及權限,用戶具有所屬存儲空間的文件創建、刪減等權利,便于周期性清理;③業務統計及結算模板,系統能夠根據第三方用戶所提供的服務能力生成業務結算單憑證,便于形成新的業務創收點,根據計費方式的不同提交核算業務結算單,例如視頻審核市場、抽幀等;④運維監控報警,主要對內存、硬盤空間、端口、網絡等狀態數據展開實時的監控,并通過窗口展示,一旦發現異常情況會自動進行分級告警,多方式傳送信息;⑤日志管理,包括能力調度處理、數據處理、常規操作、設備運行情況等,能夠實現自主化篩選、清除。
第二,AI智能層,主要功能包括:①敏感人物識別,針對落馬官員、歷史問題人物、劣跡藝人、涉政敏感人物等被重點監管的人,能夠精準對其進行近景、抬頭、側臉等多角度的識別,甚至存在遮擋的人臉畫面也能識別,并會實時更新特征庫;②人物標簽識別,智能標注任務,便于直接按照標注信息進行查詢或精準推薦;③色情識別,基于深度學習的圖像鑒別技術;④OCR識別,對視頻、圖片中文字進行識別;⑤ASR技術,能夠識別音頻內容,進行違規語音鑒別;⑥文檔識別,利用NLP自然語言處理算法和關鍵詞庫識別;⑦廣告垃圾識別。
第三,能力控制調度引擎層,利用AI審核能力進行調度監控或配置管理,主要功能包括:①資源分配調度,利用系統計算單位對任務進行計算與分配,支持共享或獨立運算配置;②優先級調整,平臺會根據緊急情況、核算任務實際情況進行優先處理。
第四,業務流驅動引擎層,人工智能審核系統中業務流驅動引擎層能夠實現對審核任務的優先級調整、添加、重試等功能,詳細包括:①快速業務對接,支持廣播和電視播出、節目制作以及網站進行松耦合且快捷的對接,并提供智能審核、標注服務;②自定義流程,支持靈活業務流程配置,滿足多樣化的審核流程;③任務優化調度,功能在于多任務實例調度優化,能夠根據優先級、資源占用情況、審核維度等多種因素優化業務[2]。
第五,管理與展示層,其功能包括:API調度、系統應用管理、結果展示以及復審復查。
人工智能審核系統在廣電領域的應用,第三方系統對接技術十分關鍵,會提供與各個領域的訪問與調用功能,并利用公網訪問接口實現公網訪問,從而實現內容審核服務,詳細如圖2所示。

圖2 第三方系統對接構架
針對不同業務的接入方主動發起任務審核,在實際應用中的系統對接方式主要包括以下幾項:①HTTP/JSON調用:應用相關Webservice接口進行文件名、素材名、路徑等參數傳遞;②XML+物理文件:指定存儲區ETP上傳,并對XML文件進行解析與審核;③輪詢存儲區:利用智能審核系統實現對指定存儲區的音頻內容的定期輪詢;④B/S送審頁面:提供接口調用的同時可應用B/S送審頁面進行素材文件、名稱訪問,再上傳,實現自動審核,并直接查詢結果。
人工智能審核系統在廣電領域中應用AI審核技術,其關鍵部分在于采用卷積神經網絡,能夠響應部分范圍內的周圍單元。針對一些大型圖像處理能夠發揮較好的作用。其中卷積層具有輸入數據提取特征的功能,涵蓋多個卷積核,完成提取后會進行選擇與信息過濾,確保審核科學性。
針對人工智能技術應用的算法,主要包括以下內容:
3.3.1 NLP算法模擬:能夠利用自然語言理解技術和數據庫實現對文本的分析,可通過上下文語境對一些辱罵性語言、色情性語言,以及涉及廣告、暴力等語言進行識別。
3.3.2 人臉識別算法:根據臉部特征對視頻中所包含的人臉進行識別,檢測位置、器官大小等內容,實現快速身份識別,可對比人臉特征、分離背景以及信息保存,再利用卷積神經網絡等算法提取、確認、生成結果。
3.3.3 語音合成算法:將給定的文字信息利用計算機進行處理,形成更為流暢、標準的語音,用于語音導航、虛擬主播、智能客服、后期配音等廣電業務中。從技術上可以將其分為波形拼接合成算法、參數合成算法以及規則合成算法這幾種。
3.3.4 OCR識別算法:可利用光學字符識別實現對報刊、數據、文稿等資料的掃描,并應用計算機輸入技術將其轉化為圖像信息[3]。OCR識別需要采用深度學習、內容識別技術進行特征提取、加強以及邊緣化優化,再進行文字校正。
目前來看,人工智能審核系統在廣電行業中的應用越來越廣泛,能夠基本滿足傳統節目審核機制,對各種音頻格式、視頻內容、有元數據等進行技術審核,確保生產制作符合規定,服務于大眾,還能根據不同業務場景需求和審核標準進行自定級檢驗。同時,利用智能識別算法能夠代替90%的人工審核成本,有效提升管理效率。部分算法經過改進后識別精度更高,其優勢還包括人臉識別率更高、功能實現全覆蓋、審核播放器更加專業、框架模塊化且便于接入,全鏈路內容更加安全。
結合人工智能審核系統在廣電領域的應用實況來看,智能審核系統中仍存在一定功能改進與新功能開發的空間,例如劣跡藝人方面。目前針對藝人分類庫部分仍需擴充和改進,可應用人臉識別功能建立分類和排序,能夠自動實現分類關聯,便于快速實現媒資庫信息分類,審核員也會第一時間下架相關影視節目,避免造成一定播出事故。近年來,部分廣電節目針對一些城市大屏展開嚴格審查,主要由于存在誤播的情況,由此可見,加強AI智能識別技術十分關鍵,目前來看智能審核在廣電領域的應用屬于初步嘗試,未來可不斷落實應用并進一步發展,如AI內容推薦、AI視頻修復等,實現技術、算法的再度創新。
綜合來看,人工智能審核系統在廣電領域的應用與當前行業形勢和市場需求相適配,能夠為廣電受眾提供更加精確、完美的服務。但在應用過程中發現,享受其便利的同時也存在一定的不足,需要積極優化相關技術,致力于加強媒體安全建設,創造更加和諧、健康的媒體環境。因此,在廣電行業應用人工智能審核系統時,需要根據實際情況重點強調技術優化,配合相關審核機制,利用技術輔助,嚴格遵循“先審后播、重播重審、重播再審”的流程,全面維護廣電行業發出內容的安全性、合規性。