謝鐘揚



摘要:隨著互聯網的快速發展以及在社會生活中的不斷普及,人們對于通話的需求也在不斷改變。近些年來計算機技術、多媒體技術以及互聯網網絡技術都得到了快速的發展,在這種環境下音視頻會話技術也在不斷地改變,音視頻會話系統也逐漸向數字化和網絡化的方向發展。在音視頻會話系統中,采用了一種物聯網語音協議(VoIP)技術,該技術最大的優勢是能夠廣泛地采用互聯網的相關環境,提供比傳統業務更好的服務。SIP(會話初始協議)作為VoIP技術中最重要的信令協議之一,具有簡單、開放、靈活以及可以進行擴展等多方面的優點。本文主要分析了基于SIP協議下的音視頻會話技術,探討了具體的音視頻同步技術。
關鍵詞:SIP協議;音視頻;會話技術;同步編碼
中圖分類號:TP3? ? ? 文獻標識碼:A
文章編號:1009-3044(2019)23-0228-02
開放科學(資源服務)標識碼(OSID):
隨著計算機網絡技術以及多媒體技術的發展,在信息化社會的背景下,人們的生活方式得到了極大的改變,最明顯的情況之一就是人與人通話方式的改變。在移動互聯網不斷發展的過程中,音視頻通話的方式也在不斷轉變,音視頻會話技術也得到了進一步的升級和更新。在音視頻會話系統中利用到了一種軟交換技術,該技術具有開放的體系架構,對數據信息能夠進行分組傳輸,是比較先進的呼叫控制技術,并且能夠為語音、視頻等多媒體數據,提供多種方式的實時服務,而SIP協議是作用于軟交換和應用服務器之間,能夠實現數據的互通,并提供相關的增值服務。SIP協議是一種應用層控制協議,在音視頻會話中起到了很大的作用。
1 SIP協議相關概述
1.1 SIP協議概念以及相應功能
目前的SIP協議已經發展成熟并且得到了廣泛的應用,其中應用最廣泛的一個領域就是網絡IP電話,基于SIP協議的音視頻會話技術的出現,改變了傳統的電話模式。隨著互聯網的不斷發展,SIP協議的應用范圍變得更加廣泛,SIP協議是一種控制協議,只涉及管理相應的會話,和會話者之間進行的多媒體數據的傳輸并沒有關系,會話者之間的多媒體數據的傳輸一般是借助其他傳輸協議來實現的。
SIP協議作為一種控制協議,其主要功能能夠實現建立、修改和終止相應的會話,針對用戶會話管理方面,其能夠提供用戶定位、用戶有效性、用戶能力、建立會話以及會話管理等功能。所謂用戶定位就是在SIP協議中,被叫方可以處于不同的位置并進行移動,呼叫方請求與被叫方建立通話,在發送相應的請求后,SIP服務器能夠轉發相應的請求給被叫方。用戶的有效性是指在收到對方的請求后,用戶可以自主選擇與對方建立會話,用戶之間想要建立會話,在這之前需要發送相應的請求,在相關的媒體參數被描述清楚后,相應的會話就會被建立。在會話管理中,SIP協議能夠提供添加、修改媒體流參數以及終止會話等方面的功能。
1.2 SIP協議的組成分析
SIP協議主要由用戶代理UA和網絡服務器組成,在用戶代理UA中,用戶代理客戶端和服務器以及背對背用戶代理是其主要組成;而在網絡服務器中,包括代理、注冊和重定向服務器等三種服務器存在。SIP協議相關組成架構如圖1所示。
1.2.1 用戶代理UA
在用戶代理UA中,用戶代理客戶端和服務器以及背對背用戶代理是其主要組成,客戶端能夠發起相應的請求到服務器端,服務器端產生相應的響應,在每一個用戶端程序中都會含有客戶端和服務器端。背對背的用戶代理是一種比較特殊的實體,其僅僅是一個邏輯實體,其能夠和服務器端一樣接受相應的請求,并做出響應傳送給客戶端,其就像客戶端和服務器端的串聯。
1.2.2 SIP服務器(網絡服務器)
在網絡服務器中,包括代理、注冊和重定向服務器等三種服務器存在,對于代理服務器而言,其既可以看作是客戶端也可以看作為服務器,客戶端的請求消息傳送給代理服務器,代理服務器又轉發給服務器。注冊服務器能夠對用戶的注冊請求進行回應,用戶在該服務器上完成注冊后,該服務器能夠保存用戶的位置信息到相應的位置服務器中。對于重定向服務器而言,其既不會發送請求的消息,也不會對其他請求消息進行響應,其主要作用是僅僅接受相應的請求消息,并獲取該消息的地址信息,經過相應的處理后,可以將相應的位置信息返回。
1.3 SIP協議消息
SIP協議的請求和響應都是屬于消息的范疇,SIP協議消息主由開始行、消息頭以及消息體三個部分組成,如圖2所示。
從圖中可以看到,一個空白行隔開了消息頭和消息體,其主要作用是能夠對消息頭和消息體進行區分。在SIP協議消息中,其可以分為請求消息和響應消息,通常情況下,用戶代理客戶端把相應的請求消息發送到用戶代理服務器,而對于響應消息而言,其傳輸方向則是相反的。
1.4 SIP協議的呼叫流程以及會話描述協議SDP
1.4.1 關于SIP協議的呼叫流程
SIP協議呼叫流程主要由注冊流程、無代理服務器的會話創建流程以及有代理的服務器的會話創建流程等組成。在注冊流程環節,SIP服務器會收到用戶發送的注冊請求,并對一個未認證的消息進行響應,在用戶代理服務器進行相關的認證后,其會重新發送對應的注冊請求,這時SIP服務器會接受和處理相應的請求,并返回相對應的響應消息。
1.4.2 SDP協議
SDP協議也就是會話描述協議的縮寫,用戶代理在進行會話創建的時候,需要對會話所需要的多媒體參數等進行溝通,SDP協議能夠描述用戶代理發送請求和返回的響應消息。SDP協議能夠提供一種用于描述會話相關信息的格式,這些信息包括會話信息和媒體信息。
2 基于SIP協議下的音視頻會話技術分析
2.1 關于音視頻同步分析
2.1.1 同步的概念
對于多媒體而言,其結合了音頻、視頻以及文本等多種媒體數據,在媒體數據單元之間存在著相對應的時間關系,如果要保持音視頻的同步,就要對這種相對應的時間關系進行維持。實現音視頻同步,該過程就是指維持了媒體數據單元之間的相對時間順序。
對于媒體流內部的同步而言,是指對于媒體流內部數據單元,它們之間也有一種固定的時間順序,并且根據這個相對時間順序,數據單元之間可以進行排列組合。按照這個相對時間順序,如果媒體流內部的數據單元能夠進行正常排列,那么在進行媒體數據單元的播放時,就能夠實現同步,相反不能按照相對時間順序進行正常排列,就不能夠達到同步的狀態。
對于媒體流間的同步而言,不同媒體對象的數據單元之間會存在一定的時間順序關系,而實現媒體流間的同步,就需要對相對應的數據單元間的時間順序進行保持。想要維持多媒體系統中的同步,就需要維持音頻和視頻二者之間的時間關系。音頻和視頻的不同步會給觀眾帶來一種極度的不協調感,但如果兩者之間的不同步時間控制在一定的范圍內,那么觀眾在視聽感覺上還是可以接受的。
2.1.2 音視頻不同步問題的相關因素
在采集音視頻的過程中,音視頻開始的時間,以及進行編碼和解碼處理的時間存在一定的差異,時間不一致,就會導致音視頻數據單元之間的時間順序不對,在進行編解碼時就會出現時間關系偏移的現象。再者在網絡數據打包處理的時間存在一定的差異,音視頻在經過相應的編解碼后,相應的數據需要經過網絡數據打包之后才能夠進行傳輸。
在編碼處理過程中視頻編碼數據量要大于音頻的編碼數據量,在進行網絡打包環節時,如果對打包處理的時間不進行有效的控制,音視頻不同步的問題就容易發生。當數據包丟失或者出現接受順序錯亂的情況,也會導致解碼過程中出錯,網絡數據包丟失會造成音頻或者視頻數據的不完整,丟棄相關視頻的編碼數據,也會導致音視頻不同步的情況發生。
2.2 基于時間戳的同步技術
在基于SIP協議的音視頻會話技術中,基于時間戳的同步技術貫穿于整個音視頻會話系統,在音視頻會話系統中,每個模塊中都會發生時間戳同步,這樣能夠保證音視頻同步的效果。在音視頻會話系統中的采集模塊中,進行視頻采集,得到的是以幀為計數單位的數據,而對于音頻采集環節,得到的是以時間為單位的數據,計量方式之間存在的差異,也會導致在同一時間內,無法對音視頻進行采集和結束。
在音視頻會話系統中的編碼模塊中,包含音頻模塊和視頻模塊,在采集緩沖區中編碼模塊會獲取一個同步數據塊,并對需要進行編碼的同步數據塊的時間戳進行記錄,然后根據其類型標志位傳送到相應的編碼模塊中。在網絡傳輸模塊中,對于每一幀視頻編碼數據進行打包之后才能夠發送,如果直接用一個數據包封裝一幀視頻編碼數據,會容易造成數據包無法發送成功的問題。從解碼緩沖區中,解碼模塊能夠提取相應的同步數據塊,并根據對應的類型標志位,對音視頻的編碼數據進行解碼。在完成解碼后將解碼數據重新進行封裝成同步數據,并放入到相應的播放緩沖區中。播放模塊從播放緩沖區提出相應的已完成解碼的音視頻數據,按照相應的時間順序就可以進行分別播放。
2.3 基于可變碼長同步編碼技術
在基于時間戳的同步技術中,網絡傳輸模塊進行音視頻編碼數據的傳輸,需要使用兩條信道實現,這時就需要處理多個步驟。而基于可變碼長同步編碼技術可以很好解決上述的問題。在基于可變碼長同步編碼技術中,提出了一種基于H.264幀間預測的音視頻同步編碼改進算法,而可變碼長就是其核心概念。
使用該算法可以將音頻編碼數據進行分割,形成多組不同長碼組,對于基于H.264進行幀間預測的階段,根據相對應的公式,能夠實現不同長碼與可變尺寸塊的映射,再依據音頻的編碼數據對可變尺寸的分割模式進行確定,根據相應的映射關系進行提取音頻編碼數據。
2.4 延遲檢測自適應選擇同步技術
對于上述的同步方案,在進行方案的選擇時需要考慮到網絡的狀態,這時就需要檢測網絡的狀態。針對網絡的延遲狀況、丟包率以及抖動等狀況進行檢測,并進行相應的等級評價。在網絡狀況良好的條件下,可以利用同步編碼技術傳輸相應的數據,如果網絡狀況表現出一般或者較差的狀態,這時就需要利用基于時間戳的同步方案。
在進行延遲檢測的時候,還有一種檢測網絡狀況的方式經常被用到,采用這種方式,是將每個時間間隔定義為[T1],得到會話終端之間的傳輸時延[dn]([1~n]總共[n]各時延數值),依據相應的公式,就可以得出[T1]時間間隔內相應的時延變化率。
[s2=1ni=1ndi-d-2]
其中[d-=1ni=1ndi] ,采用的方差來表示網絡狀況的時延波動大小。
3 總結
SIP協議具有簡單、易擴展以及容易實現等特點,在越來越多的應用中得到使用,該協議到目前為止也已經達到成熟的地步,在互聯網中越來越多的軟件和多媒體終端都采用了SIP協議。隨著計算機網絡技術的不斷發展,基于SIP協議的音視頻會話技術會得到更加廣闊的發展。
參考文獻:
[1] 林明河. 基于SIP協議的可視對講系統的設計與實現[D]. 華僑大學,2016.
[2] 凌小榮. 基于SIP網絡音視頻通信的研究與實現[D]. 華南理工大學,2014.
[3] 林健浩. 基于SIP協議的音視頻會話技術研究[D]. 廣東工業大學,2014.
[4] 鄒田,周到.基于SIP協議的音視頻通信終端的實現[J]. 中國新通信,2013,15(09):34.
[5] 楊真光. 基于SIP的視頻會議系統設計及實現[D]. 北京郵電大學,2013.
[6] 施昌偉. 基于SIP協議的即時通訊系統的研究與實現[D]. 南京郵電大學,2012.
【通聯編輯:張薇】