殷 茵
江蘇省廣播電視總臺每年都購買大量版權音樂等音頻資源,服務于音頻生產。此前制作人員只能采用移動硬盤拷貝的方式存儲這些資源,無法精準地查找需要的類型音樂素材,同時大量常態化音頻生產所使用的專業編輯工具,操作復雜,影響音頻生產的效率。隨著互聯網和融媒體技術的不斷發展,對音頻資源的分類使用管理、音頻生產的方式提出了新的要求。為此江蘇省廣播電視總臺開發設計了音頻資源使用管理平臺,以實現音頻生產互聯網化,提高音頻生產的效率。
1.UI設計:視覺風格采用扁平化設計;采用響應式設計布局以滿足頁面對多終端的支持;突出核心搜索功能入口。
2.頁面制作:發布端頁面采用HTML5制作,兼容主流瀏覽器;前后端分離,頁面調用服務API接口;后臺開發采用Vue+Vue-Router框架。
1.基于“多種權限用戶”的平臺服務,所有用戶基于統一的入口對各自業務進行管理,后臺用戶通過角色控制進行音頻內容編輯、內容審核,可滿足不同權限下的個性化需求(如圖1所示)。

圖1 系統架構
2.CMS管理音頻文件編目信息并入庫。
3.CMS內進行在線音頻處理,打水印、分解多碼率、轉碼后入OSS存儲。
4.通過Elastic Search實現音頻編目檢索。
5.C端用戶通過CDN網絡接入服務網關,通過用戶鑒權訪問C端服務,通過防盜鏈簽名訪問被保護的音頻資源。
6.C端服務為無狀態服務,采用分布式部署,并使用數據緩存,保證高可用性和抗并發能力。
1.中間件及應用服務全部集群化部署,保證高可用。
2.全站https訪問、接口加密、使用WAF設備和網絡訪問控制等方式實現業務安全性目標。
3.規劃和建設系統的監控告警系統以及數據備份系統,進行業務保障和災難恢復。
4.通過服務版本管理以及批量滾動更新方式實現系統升級(如圖2所示)。

圖2 網絡架構
數據庫服務器3臺、檢索服務器3臺、緩存服務器2臺、消息服務器2臺、代理服務器2臺、java應用服務器4臺、Netcore應用服務器4臺、監控服務器2臺、備份服務器1臺,對象存儲1T。
后臺接到上傳音頻,自動啟動后臺任務,使用FFmpeg對音頻進行解析,獲取音頻的編碼器、幀率、采樣率、寬高、像素格式、采樣格式、碼率、時長、總幀率等信息,并作為音頻文件的元數據保存入庫。通過FFmpeg插件,將水印聲音與原音頻進行流混合以生成含水印的音頻文件,實現了音頻自動加水印的功能。該功能支持水印聲音自動適應原視頻的時長進行循環播放。
音頻展示前端自動生成聲紋波形,用于展示音頻聲音軌跡,相關波形圖采用了前端js插件及canvas繪制的方案解決聲紋顯示,通過wavesurfer.js插件將音頻地址通過插件中WebAudio進行下載,解碼整個音頻文件,再采用MultiCanvas渲染器繪制一個波形線,渲染到頁面canvas元素上,通過drawLines繪制波浪線和進度線及其樣式,創建時間軸元素將音頻的時間渲染到波形線上,從而生成了該音頻的波形圖碼。同時可以快速解析生成音波紋配置大小、顏色、播放速度、音量、暫停/播放、時間軸、光標等交互功能。
采用先進的WebAudio技術及WebAssembly技術,兼容多種計算機平臺,擁有和本地軟件一致性的體驗。跨平臺,同時支持windows/mac/linux平臺,并且各平臺擁有一致體驗,保證媒體工作者在不同平臺、不同工作環境下的剪輯需求,實現多地合作、異地協作的“云剪輯、云協作、云分發”的功能,能快速地將各端的音頻素材在線處理后,便攜高效地分發到臺里的制播系統,實現“制播云協作”,為“云資源的多平臺分發”提供高效便攜的云化工具。平臺集成在線編輯功能,具有音頻編輯及處理能力,無需另外安裝編輯軟件,能夠實現錄音、剪輯、電平調整、單軌多軌編輯、音頻轉碼、一鍵美化、反相檢測、降噪、電平標準化,以及AI語音轉文字、文字轉語音功能。
在線實時剪輯轉碼,兼具專業化與便攜化,能快捷高效地完成音頻的常規剪輯操作及在線實時轉碼;提供專業級的顯示界面,并加入了各種智能化提示與操作推薦,讓操作更專業更流暢;具備一鍵人聲美化功能,提供特殊效果,包括電話音、機器聲、重聲,有壓縮調整,混響調整,噪聲過濾功能;具備反相自動識別,一鍵處理;具備最終音頻自動動態調整,一般在峰值-4dB以下,響度-15dbfs以下;輸出格式可調,保存本地或云端,可保存工程文件。
在頁面的整體交互上,采用了更簡單易用的設計理念,使用了簡單易懂的圖標。為避免菜單繁多,所有的按鈕都在第一層,取消了菜單選擇或右鍵層級菜單。為讓按鍵有清晰的邊界,“單軌剪輯”主要分為“編輯剪輯區”“控制區”兩個區的按鈕,剪輯區的按鈕只負責音頻的輸入輸出、波形剪輯、音效處理,而控制區負責音頻的播放控制和界面的放大縮小。對于剪輯而言,波形的展示尤為重要,波形采用了準專業級別的展示,不僅展示了波形,而且顯示了時間和dB的網格線,并可進行無級縮放,極大地提高了在web上的編輯體驗,讓非專業和專業用戶都可方便地進行操作。
音頻資源使用管理平臺主要包含音頻資源管理和云編輯兩大功能。
網站域名:https://audio.jstv.com/home,頁面風格簡潔實用,首頁總目錄包含:版權音樂、配音、節目音頻、音效、原創音樂,頁面還設有全站搜索,登錄、注冊、滾動宣傳頁。使用頻率最高的版權音樂目錄排在最前面,按照主題、情緒、地域、配器風格分類,一目了然(如圖3所示)。目前平臺已上傳版權音樂近萬件,包含主題、情緒、地域、配器分類,每個分類有若干小類,音頻以wav高保真格式為主;音效近三千件,包含氛圍、旋律、人、環境、生活、運動等多個分類;近百人配音音頻,按風格及性別進行分類,便于快速挑選配音人聲。節目音頻、原創音樂板塊也在持續豐富完善中。

圖3 音頻資源使用管理平臺頁面
所有資源附帶音頻水印防盜設計,注冊用戶可實現對音頻資源的試聽、下載、收藏、筆記備注等功能。音頻內容資源經允許后,可實現快速管理與共享;所有用戶基于版權保護的前提下,均可以在平臺上完成基礎性的二次編輯以及試聽、下載、分享、收藏、筆記備注等操作,可滿足不同權限下的個性化需求,根據工作需求對相關音頻資源進行權限管理;音頻媒體功能模塊的“資源庫”可持續擴容與維護(如圖4所示)。

圖4 音頻資源使用管理平臺頁面
在音頻資源使用管理平臺上嵌入了云編輯工具,首次實現基于瀏覽器的在線多功能音頻編輯系統,直接點擊“編輯”按鈕即可一鍵調用,支持無極縮放,10ms剪輯精度;支持剪切、裁剪、復制、拷貝、刪除、一鍵恢復等常用操作;支持振幅增益控制、選擇區靜音、淡入淡出調整等;支持熱鍵操作;支持選區播放及跳過選區播放,讓試聽更方便;支持大部分常用的音頻格式;支持多軌合成:可實現4軌音頻的編輯,支持音量增益調節,立體聲均衡調節,支持實時顯示各軌時間戳、db值等(如圖5所示)。支持音頻去噪、美化處理、音頻轉碼、音頻AI、相位檢測等功能。可以根據常用的場景設置對應的EQ,提供高級設置功能手動調節。

圖5 云編輯界面
另外,該平臺創新性地提供了一鍵美化功能(如圖6所示),實現回聲、電話聲和混響效果。主持人、編輯記者等非專業制作人員也可以完成一些簡單的制作任務,讓平臺的應用更加廣泛。

圖6 一鍵美化功能
采用HTML5及Web技術,用于廣播電視音頻制作高碼率素材資源分類匯聚、管理、在線調用、在線音頻處理,從音頻資源的查找、調用、編輯、美化、合成、管理,實現音頻生產全流程的網絡化。
在線音頻編輯系統基于Web Audio前端音頻處理技術,采用WebAssembly技術將核心音頻處理算法交叉編譯,完全脫離傳統的客戶端模式,使用瀏覽器實現在線音頻編輯,支持windows/mac/linux/Android平臺,在線編輯系統集成單軌、多軌音頻編輯、在線錄音、音頻轉碼、一鍵美化、反相檢測、降噪、電平標準化,以及AI語音文字互轉等功能。
音頻資源使用管理平臺已上線運行了半年的時間,極大地方便了總臺各部門對音頻資源的使用及調用,作為荔枝云平臺的子功能模塊,很好地增強了荔枝云音頻板塊的功能支撐,為音頻生產及業務優化拓展提供有力保障。平臺匯聚制作音樂超萬件,音效數千件,極大地解決了過去制作音樂的使用管理及更新問題,同時提供了較為精準的音頻分類及查找功能,提升音頻生產人員的生產效率;完善用戶權限及認證管理,在方便內容創作生產同時,規范了制作音樂的保護與管理。音頻資源使用管理平臺匯聚的音樂、音效及配音等音頻資源,同時配合集成的在線音頻編輯工具,實現了在一個平臺上即可完成音頻資源的調用、轉換、錄音、編輯、美化、合成輸出等,簡化了日常音頻生產的流程,操作簡單,高效快捷,為媒體融合下的快速音頻生產提供技術支撐,實現了音頻生產全流程的網絡化。