郭 圣
(南京市人防指揮信息保障中心 江蘇 南京 210008)
視頻會議系統亦可稱為電視會議系統,基于這一系統的支持,能夠讓各個地點的人們依靠互聯網與多媒體設備,實現音視頻信號的實時傳輸,打破空間限制進行遠程線上會議。現階段視頻會議系統已經在政府部門、企事業單位中得以推廣應用,在很大程度上降低了會議成本,提高了辦公效率,參會人員也無需耗費時間與精力趕往會議現場,因此本文有必要對視頻會議系統關鍵技術及其在實踐中的具體應用予以研究。
隨著現代信息技術飛速發展,在很大程度上讓視頻會議系統在各個行業和領域中得以推廣應用,推動了通信手段與通信方式的革新。從國內的實際情況來看,政府部門與企事業單位對于視頻會議系統的需求持續提升,在日常工作中發揮著越來越重要的作用。視頻會議系統基于IP網絡進行構建,嚴格參照H.323、SIP等音視頻協議,在依靠多點控制及Oracle數據庫的基礎上,借助于QoS控制技術來對相關音視頻數據進行傳輸共享。在視頻會議系統內部,IP組播屬于視頻圖像的重要發送形式,它對局域網帶寬也提出了非常高的要求,對延時以及誤碼的修正率要求更高,對視頻會議圖像分辨率也有嚴格標準,這樣才能確保遠程線上視頻會議的順利進行,保證音視頻數據能夠及時準確傳送[1]。視頻會議系統不單單能夠帶來面對面遠程交流通信功能,近年來也被推廣普及到日常學習與工作中,促進了政策指令下達效率的提升,降低了傳統線下會議所需成本,減少了人力與物力的損耗。
一般來說視頻會議系統主要包含了服務器、會議室終端、桌面終端以及網關等部分。對于整個系統而言,會議服務器屬于其核心所在,它可以給用戶帶來群組會議連接功能,這一服務器往往以MCU為主。在實際應用過程中設置相對簡單,讓用戶能夠更加便捷地進行操作。PC終端屬于整個系統的關鍵組成模塊,通常而言基于計算機開展的會議要配備PC攝像頭,當前計算機已經逐漸成為電子辦公的標準配置,因此桌面會議終端不需要再添加其他配件。會議室終端能夠借助視頻采集卡來提供支持,其成本相對更低,而移動通信技術的飛速發展,用戶還可以通過智能手機直接利用移動網絡來參與視頻會議,也能夠在移動端發布或記錄會議內容[2]。
一是音視頻傳輸。借助于VCEG與MPEG視頻組提供的視頻編碼解碼標準H.264、SIP等,能夠帶來更高清晰度的畫面質量,提供多人音視頻實時交互功能。二是電子白板。與會人員能夠在白板位置對會議信息予以書寫,支持多人同時繪制,可以對屏幕中任何位置進行截圖,把截圖實時呈現在白板區域中。三是動態PPT。提供動態PPT展示功能,能夠對動態畫面實現高質量還原。四是媒體播放。能夠把存放于本地數據庫的多媒體文件當成是虛擬設備源,把音視頻文件直播播放給其他與會人員。五是會議記錄。能夠對整個視頻會議的過程進行實時錄制,錄制的文件會保存于本地數據庫之內,管理人員能夠對保存的會議記錄進行剪輯后再次上傳到會議視頻系統中,從而便于其他與會人員反復觀看。六是會議管理。管理人員依靠系統提前設置會議流程,開始會議后嚴格按照流程予以執行。
與過去所應用的標清視頻會議系統比起來,近年來逐漸推廣普及的高清視頻會議對于圖像質量提出了更高的要求,傳統的標清視頻會議系統支持的圖像質量不高,也并未有較為統一的標準規定,而對于高清視頻會議系統來說,現階段所適用的清晰度標準主要是1 080 p與1 080 i,甚至部分重要部門的視頻會議系統已經能夠達到2 k乃至4 k的圖像清晰度。目前從整體上來說,大部分政府部門和企事業單位應用的視頻會議系統都選擇1 080 p或1 080 i作為圖像清晰度標準,1 080指的是垂直方向有1 080條水平掃描線,P則指的是依靠逐行掃描技術對圖像實施掃碼,讓視頻會議系統可以給與會人員提供更好的視覺體驗,可以給用戶帶來更加高質量的服務,模擬出更加接近真實的會議環境。
對于視頻編碼技術而言,視頻會議系統一般是選擇H.264標準,它作為高度壓縮數字視頻編碼解碼器標準,擁有更好的圖像質量,提供更高壓縮率的編碼技術,其實際編碼過程包含了如下幾個環節:首先是對視頻幀間預測和幀內預測予以計算,獲得幀間數據的差值;其次對得到的數據實施量化和整數變換,補充幀間數據殘差;最后對處理結束后的圖像予以編碼和輸出。H.264標準在視頻編碼壓縮環節表現出更大的優勢,當圖像質量基本一致時,它的壓縮工作效率達到了一般標準的三倍左右,同時H.264標準表現出更高的容錯性,可以及時對數據傳輸過程中可能存在的延遲和丟包現象予以處理,對持續視頻圖像壓縮發揮了非常重要的價值,可以對視頻錯誤或異常現象實施有效處理,當網絡傳輸受到外部因素影響抑或是視頻會議處于低速網絡中,也可以讓會議順利開展,有助于保障視頻會議的穩定性。
過去很長一段時間以來,視頻會議系統往往都是選擇G.711/G.722等ITU標準的音頻編碼解碼技術,然而過去的單聲道傳輸逐漸難以達到新時代視頻會議用戶的實際需求,所以在當前的視頻會議系統內運用了MPEG制定的AAC-LD協議,還有一些單位選擇多聲道語音編碼解碼技術,在很大程度上契合了多聲道高清視頻會議的技術要求。另外為確保視頻會議過程中能夠提供更加高質量的通信服務,基于全雙工音頻的基礎上,借助于快速自適應回聲抵消技術以及自動降噪技術等,都能顯著提高會議過程中的語音通話質量。
通信協議屬于視頻會議系統的重要技術組成部分,通常包括了SIP協議以及H.323協議。SIP通信協議是IEIF所提出的,而后者則是國際電信聯盟ITU-T所提出的。一方面,SIP通信協議往往選擇文本編碼的形式,嚴格按照實時多媒體通信標準,主要運用于IP分組交換網絡中,屬于一種能夠調整各方通信媒體的程序,確保參與視頻會議的各方可以順利進行通信。另外SIP通信協議可以終止不同的通信連接,其涉及到用戶代理、代理服務器、注冊服務器和重寫服務器構成,各個功能模塊能夠提供多樣性、差異化的通信功能。另一方面,H.323協議屬于音頻通信協議,在IP分組交換網絡的支持下,能夠讓視頻會議數據和語音視頻數據進行同步通信,通常情況下主要包含了媒體通信傳輸模塊、信號命令控制模塊和數據會議模塊[3]。
近年來現代信息技術與互聯網通信技術的飛速發展,給視頻會議系統的構建帶來了非常大的支持,然而基于現階段視頻會議系統的實際運用狀況來說,該系統在實際功能上還存在一定的問題,阻礙了其普及運用。比如說部分硬件的成本較高,通常視頻會議系統僅僅可以支持基于SIP協議的客戶端連接,不兼容其他類型的客戶端,如此一來便對其運用范圍帶來了限制。對于目前視頻會議系統表現出的一些突出問題,研究人員在構建視頻會議系統的過程中必須要結合本單位實際需求,盡可能控制成本,提升視頻會議系統的通用性與兼容性,能夠符合主流通信的實際需要,對不同媒體流控制方法予以融合,從而確保通話質量。
按照視頻會議系統基本構建思路,同時在結合實際需求的前提下對整個框架予以靈活設計,視頻會議系統包含了如下幾個部分:
4.2.1 會議服務器
本文中所構建的視頻會議系統選擇SIP信令集中處理模式,通信控制器的主要作用是對視頻會議的全過程予以實時控制,對相關終端信令實施集中處理,同時對終端數據予以解析,隨后將其上傳到數據庫之內。動態控制器能夠直接提取數據庫內的數據,進行計算分析后形成終端連接狀態圖,可以實時反映視頻會議系統的運行狀態,借助于對提取信息的解析,第一時間掌握與會人員各自網絡資源狀態,為制定管理命令提供依據。
4.2.2 Web RTC服務器
此次構建的視頻會議系統包含了若干不同的通信平臺,視頻會議系統涉及到兩個客戶端,分別為SIP客戶端與Web RTC客戶端,對于視頻會議管理方面針對性地運用各自的解決方案。因為SIP不能夠對Web RTC予以直接管理,所以在系統構建的過程中選擇配備了單獨的服務器來進行有效的會議控制,讓兩個客戶端可以在信令層進行交互。
4.2.3 微控制單元
微控制單元的主要功能是在系統處于運行狀態時,對不同終端發出的信息流實施同步分離,同時對所含的音視頻數據予以提取,把獲得的數據再分別傳送到對應模塊予以解析,實現音視頻混合交換,最終處理完成的數據能夠直接傳遞到相應的終端。在構建視頻會議系統的過程中依托于媒體流控制理論,把集中和分散控制模式予以整合,微控制單元主要負責集中控制,從而有效增強了整個系統的運行穩定性,減少客戶端承載壓力,能夠支持更多人數、更大規模的視頻會議活動。
4.2.4 信令轉換網關
為確保視頻會議系統擁有更強的兼容性,實現SIP和Web RTC的有效轉換,讓兩個客戶端可以實時通信,在構建系統的過程中配置了信令轉換網關,提供能異構網絡之間的通信功能。
4.2.5 客戶端
前文已經提到,視頻會議系統中的客戶端包括SIP與Web RTC構成,SIP客戶端能夠和會議服務器連接,Web RTC通過信令轉換網關后與會議服務器進行連接。
服務器設計屬于視頻會議系統中的重要組成部分,本系統中涉及到會議服務器以及媒體服務器兩種。
4.3.1 會議服務器設計
此次構建的視頻會議系統包含了若干通信協議,基于此研究人員能夠將會議服務器合理劃分成SIP通信控制器以及動態控制器兩個組成部分。首先是SIP通信控制器,它可以提供系統內部會話功能,主要包含了用戶代理、注冊服務以及數據寫入等模塊。進行設計的過程中利用SIP Servlet來確保不同模塊具體功能得以實現。其次是動態控制器,能夠提供數據讀取、圖形分析以及動態調整幾種功能[4]。
4.3.2 媒體服務器設計
視頻會議系統處于運行狀態下必然會有海量的音視頻流傳輸進入,為有效降低海量數據對客戶端帶來的運行壓力,在系統設計時配置了媒體服務器,從而實現對媒體流的編解碼以及混合處理。媒體服務器主要包含了如下模塊:
一是媒體流收發模塊,它能夠從媒體流數據內對雙R消息實施解析,同時根據媒體類的自身特點來及時完成分類,還能夠把音視頻數據暫時存儲于緩沖區,對指定終端傳輸媒體流。二是消息收發模塊,這一模塊能夠對會議服務器傳輸而來的消息予以接收,進行解析后又傳輸給資源采集模塊。三是音視頻緩沖模塊,這一模塊中設置了若干緩沖區,具體來說是對終端傳輸的音視頻數據予以暫時存儲。四是資源采集模塊,其可以對媒體服務器實際運行時形成的數據予以全面及時收集,從而分析通話路數、內存占用等。五是編解碼模塊,設置這一模塊能夠實現對媒體流音視頻實施編解碼處理。為確保Web RTC客戶端具備較高的兼容性,設置編解碼模塊的過程中應當賦予其支持兩類不同編碼格式的功能,主要針對H.264和VP8,此模塊運用開源代碼。六是混合模塊,其可以對多路流媒體予以整合,借助于查找confer_id,確定參加會議的終端數量,按照結果來合理判定應合并的媒體流路數。
4.3.3 客戶端連接方式
對于視頻會議系統而言,在實際運行時應當確保參與會議的各個客戶端之間進行有效連接。此次所構建的視頻會議系統包含了若干通信平臺,因此保障Web RTC客戶端正確接入是關鍵所在,詳細來說需要在服務端配置信令轉換網關,讓Web RTC客戶端發出的信令能夠及時轉變成和SIP終端格式標準相同的信令,如此即可做到客戶端和服務器之間的有效信息傳輸[5]。配置信令轉換網關選擇了模塊化設計理念,其中包括代理模塊、網關事務模塊、會話模塊以及轉換模塊。一般來說,中間信令格式和轉換流程設計完成后,可以實現對多協議實施統一轉換。
云計算技術近年來在數字化辦公中得以廣泛運用,隨之也推動了云會議的發展,這一技術的突出優勢是用戶僅僅做出簡便的操作就能夠快速參加會議,和與會人員實時溝通交流。同時云會議也開始逐步朝著更加虛擬化、移動化以及軟件化的方向發展,在諸多行業及領域都表現出較好的適用性。目前來說云會議基本架構模式包含了H.264AVC以及H.264SVC兩類,還可以實現對公有云、私有云等不同云端形式的提前部署,提供整體業務拓展功能,對動態負載實施均衡化處理。在具體運用過程中,國外云會議通常會選擇SAAS模式的公有云部署方式,而在企業或者個人提出云會議需求的情況下及時帶來對應的租借服務。
該技術屬于現代化遠程呈現技術,在更新發展歷程中逐漸對空間IP聲學、空間照明以及人體工程等各種新興技術進行了整合與創新,可以借助于互聯網對真實空間情境予以呈現,帶來一種全新的跨越時空的視頻會議模式。另外將網真技術推廣運用到視頻會議系統之中可以非常便捷地進行相關操作,也能夠給參會人員提供更加真實的沉浸式體驗,可以對不同的視頻會議模式進行合理調整,讓其具有更高的靈活程度,提供更加多元化的使用功能[6]。網真技術在未來視頻會議系統更新與發展中必然擁有更加廣闊的市場前景,是前沿科技發展的直觀體驗。
綜上所述,視頻會議系統的推廣應用為政府部門和各企事業單位帶來了一個更加快捷高效的信息傳輸路徑,轉變了傳統線下會議的形式,有效降低人力物力成本,為參會人員提供更安全可靠的會議模式。大眾應當充分認識到視頻會議系統的功能與作用,在實際工作中不斷探索研究更新其應用方式,及時對視頻會議系統進行更新完善,為廣大用戶帶來更加高質量的會議體驗,促進辦公效率不斷提升。