基于報文差分的隧道傳輸壓縮研究

2024-09-26 00:00:00鄭自永

現代信息科技 2024年14期

摘要：在傳統網絡傳輸中涉及不同協議層的數據嵌套封裝，然而越多層次的協議封裝嵌套就會增加越多的頭部字節的開銷，如何更為有效地利用網絡帶寬，減少冗余數據的傳輸，一直以來都是高效傳輸技術研究的熱點。通過對不同隧道網絡數據的切片化細分及研究，公開了一種基于報文差分的隧道傳輸壓縮方法，用于壓縮不同隧道傳輸方式的報文，主要針對各種VPN客戶端與服務端強化升級，包括PPTP、L2TP和IPSec等隧道傳輸方式。對隧道內網絡切片進行相關性分析，對IP報文進行端到端的對等報文差分壓縮與解壓，充分利用了隧道內不同網絡切片中傳輸報文間的相似特質，采用lzo、zlib等傳統壓縮算法，提高了端到端隧道傳輸的帶寬使用效率，為網絡隧道傳輸提供了行之有效的切片化壓縮技術支撐。

關鍵詞：報文差分；數據壓縮；隧道傳輸；網絡切片

中圖分類號：TN929.5 文獻標識碼：A 文章編號：2096-4706（2024）14-0009-04

Research on Tunnel Transmission Compression Based on Message Differentiation

ZHENG Ziyong

（Comba Network Systems Co.， Ltd.， Guangzhou 510663， China）

Abstract： In traditional network transmission， data nesting and encapsulation at different protocol layers are involved. However， the more layers of protocol encapsulation and nesting， the more overhead the header bytes will be. How to more effectively utilize network bandwidth and reduce redundant data transmission have always been the hot topics in efficient transmission technology research. By slicing and studying data from different tunnel networks， a tunnel transmission compression method based on message differentiation has been disclosed， which is used to compress messages of different tunnel transmission methods. It mainly focuses on strengthening and upgrading various VPN clients and servers， including PPTP， L2TP， and IPSec tunnel transmission methods. The correlation analysis of network slice within the tunnel is conducted， and the end-to-end compression and decompression of peer-to-peer message differentiation for IP message are carried out. It fully utilizes the similar characteristics between transmitted messages in different network slice within the tunnel， and uses traditional compression algorithms such as lzo and zlib to improve the bandwidth utilization efficiency of end-to-end tunnel transmission， providing effective slicing compression technology support for network tunnel transmission.

Keywords： message differentiation; data compression; tunnel transmission; network slice

DOI：10.19850/j.cnki.2096-4706.2024.14.003

0 引言

在有線通信領域經常涉及隧道技術[1-2]，比如虛擬隧道網絡VPN（Virtual Private Network）廣泛應用在互聯網、2G/3G/4G/5G通信接入網等，比如PPTP、L2TP和IPSec等隧道形式的網絡嵌套傳輸，帶寬緊張時影響傳輸服務質量、人為增加帶寬的成本有時也較為昂貴，報文壓縮的技術訴求便油然而生。圍繞報文壓縮需求，兼顧隧道內原始報文間的相似特質，引入了報文差分的思路，優化固定帶寬下的傳輸效率，且基于報文差分的壓縮方法，在不同網絡隧道應用中的實現方式完全一致，具有高效的壓縮可移植性。

在網絡隧道傳輸中，越多網絡嵌套的形式下，數據傳輸的冗余也越來越多，往往傳遞很小的數據載荷[3]，比如語音，其攜帶冗余頭開銷很大。為了解決冗余技術難題，基于報文差分的隧道傳輸壓縮的研究，在分析網絡隧道中網絡報文之間的相似特質，將其切片化分類，并引入了報文差分再壓縮的思路，結合傳統lzo、zlib等壓縮算法，很大比重上壓縮了隧道內報文大小，節省了傳輸帶寬資源。尤其在隧道內還有隧道的多重網絡嵌套場景，更多層次的報文間相似特質、差分后具有更小的信息熵、更大的壓縮效率，從而更大程度提升了傳輸效率、保障了同等帶寬下的服務質量，極大地降低了各種虛擬隧道網絡的實施難度。

1 網絡傳輸的問題

現有網絡在隧道傳輸領域中，報文壓縮技術的壓縮效果大多依賴所傳報文具體內容，報文內容不確定性越大、信息熵越大、壓縮效果越差，反之則壓縮效果越好。對單一報文獨立壓縮往往效果不佳，并不能減少網絡隧道各種頭部封裝帶來的冗余。相鄰報文之間也是獨立的，傳統傳輸技術未考慮報文之間的相關性，而隧道內報文間相關性很強的字節是普遍存在的，甚至完全相同，使深度壓縮具有一定基礎。

此外，網絡建設已進入深度覆蓋時期，在很多場景下，沒有增加傳輸帶寬的可能，比如：山區、鄉村，人口密度低，網絡安裝困難，傳輸配置較低；城市城中村，人口密集，建筑復雜，網絡資源競爭多；海事船舶上，網絡帶寬昂貴、傳輸資源有限；諸多網絡場景，都存在傳輸帶寬不夠、傳輸效率較低問題。

最終，在不增加網絡傳輸帶寬的情況下，如何壓縮隧道傳輸中的冗余數據，提高網絡帶寬利用率，便成為熱門技術難題，根據當下的市場需求與技術困境，基于報文差分的隧道壓縮研究[4-6]，提出了“依據相關性、分析網絡報文，進行報文壓縮，解決報文冗余的問題”“在報文壓縮上，引入相關性、切片分析，解決壓縮率不足的問題”兩個解決問題的核心點，最終使得隧道報文壓縮率可達30%，最大幅降低了虛擬隧道業務的傳輸對現有網絡的要求，從而在不增加帶寬的條件下，提高了傳輸服務質量。

2 隧道傳輸壓縮技術實施

2.1 傳輸壓縮技術概要

現有網絡傳輸技術中，大量的協議封裝，例如HTTP、RTP、TCP、UDP、IP等，在無線基站通信中，還包括GTP、VPN（IPSec）等二次網絡封裝[7-8]，導致類似語音等的小包傳輸成本高、效率低，頭部開銷遠遠大于載荷本身；另外就具體載荷本身，相鄰報文間也存在一定的相關性，在隧道傳輸中的分組報文，可以通過頭部和載荷相關性分析，同時結合相關壓縮算法[9]，減少數據冗余，提高分組傳輸效率。

圖1描述了如何通過深入分析原始報文、選擇參考報文、執行差異分析處理與壓縮、結合壓縮信息頭，靈活高效地壓縮網絡隧道中的分組報文，在業界首次對網絡分組報文進行相關性分析、降低信息熵值、壓縮減少傳輸信息量，使原有網絡中分組間冗余、重復的信息得到大幅削減，整體數據量減少68%，提高了網絡帶寬資源的利用效率。

傳輸壓縮研究首次提供了動態靈活的壓縮方案，支持壓縮算法靈活調整，通過壓縮頭交互，在壓縮與解壓端同步進行處理，具備了壓縮隧道切片特性，整體實施有了很強的擴展性。針對不同的網絡隧道分組、不同的網絡切片，生成不同的參考報文，每個隧道分組都能夠進行獲取最強的相關性、最優的壓縮效果，實現了隧道分組壓縮的切片化，圖2描述了不同隧道傳輸中的不同切片化數據流，其在壓縮與解壓兩端之間的數據傳輸大致框架。

在上述基礎上，基于報文差分的隧道傳1Fpb/vT/kw3lXPodsyDpimYl1xDlSuAZq9rCd6SpH9k=輸壓縮方法還靈活了兼容多種壓縮算法，實時交互、可變更、可組合，使得整個網絡隧道分組報文的壓縮更為合理，兼具相關性熵值削減與分組無損壓縮的兩大技術優勢。

2.2 報文差分的傳輸壓縮

為了進一步壓縮隧道內原始報文大小，提升傳輸效率，結合了隧道內傳輸報文間相似的特質，采用lzo、zlib等類似開源壓縮算法，將相近報文差分后得到更小的信息熵、更大的壓縮效率，更大程度地壓縮冗余數據、保障同等帶寬下的傳輸服務質量。

充分利用隧道內所傳輸報文間的相關性，將隧道網絡精準切片化，采用相近報文差分后再壓縮的方法，從時間維度提升壓縮率，提升隧道傳輸效率。

基于報文差分的隧道傳輸壓縮方法，其包括隧道傳輸業務中的客戶端與服務端，對等處理壓縮與解壓流程，其包括客戶端壓縮/解壓、服務端壓縮/解壓，端到端對等實現，其中不同切片的隧道壓縮采用不同參考報文的進行差分環節處理。

其中，基于報文差分的隧道壓縮，需新增壓縮信息頭，同步壓縮/解壓端的處理，包括以下內容：

1）參考報文標識，用標識區分參考報文，更新參考報文時加1。

2）壓縮算法標識，0：無壓縮，1：lzo算法，2：zlib算法，3：other算法。

3）當前報文標識，0：參考報文，1：壓縮報文。

此外，壓縮端可以設置壓縮參數，包括以下內容：

1）壓縮算法標識，1：lzo算法，2：zlib算法，3：other算法。

2）參考報文間隔，相鄰參考報文之間壓縮報文的個數，比如：參考報文間隔為3，表示每發一個參考報文，后續發3個與其相關的壓縮報文；3個壓縮報文發完之后，會更新并發送新的參考報文。

基于報文差分的隧道壓縮方法，具有鮮明的技術優勢與特征，如下：

1）對網絡報文進行相關性分析、減少冗余，提升壓縮效果。

2）相關度高的報文，其熵值更小，壓縮效果更好。

3）無損壓縮、算法靈活，網絡報文降冗余后再壓縮，效果顯著。

4）深度解析報文，分析相關性，劃分不同的切片，不同切片微通道執行獨立的壓縮，針對性強、壓縮率低。

5）降低了對丟包/時延敏感的業務的帶寬損耗，支撐多樣隧道網絡，如家庭寬帶、村通寬帶，海事衛星等。

2.3 隧道壓縮的處理流程

基于報文差分的隧道傳輸壓縮，包括壓縮與解壓兩個技術點，針對減少數據冗余、提高傳輸效率的技術需求，提供了一種配套的處理方法及流程，圖3、圖4描述了壓縮解壓核心處理環節，包括以下步驟。

2.3.1 壓縮環節的處理步驟

步驟S101，接收待發送原始報文，轉S102。

步驟S102，判斷是否作為參考報文發送，若是轉S107，否則轉S103。

其中，判斷依據為壓縮配置參數“參考報文間隔n”，每隔n個報文更新一次、重新發送參考報文，從而提高報文之間的相關性，持續得到更好的差分效果。在時間上相鄰越近的報文之間往往具有較好的相關性，即相似度，包括多層封裝頭部的相似度、傳輸載荷之間的相似度。

步驟S103，將原始報文-參考報文做差分處理，得到新報文，轉S104。

步驟S104，根據壓縮算法標識選擇壓縮算法，將差分后新報文執行相應壓縮處理，轉S105。

步驟S105，封裝壓縮信息頭，轉S106。

其中，壓縮信息頭內容：參考報文標識：ReferPackId、壓縮算法標識：1（lzo）、當前報文標識：1（壓縮報文），lzo算法為舉例，也可選擇其他壓縮算法。根據參考報文標識，解壓端可以輕松地找到參考報文，在結合壓縮算法，解壓縮端可以進行解壓縮處理，從而得到原始報文。

步驟S106，封裝隧道各層頭部信息，PPTP、L2TP和IPSec各自封裝各自相應的頭部信息，轉S110。

步驟S107，更新存儲參考報文，轉S108。

步驟S108，參考報文標識疊加，ReferPackId++，轉S109。

步驟S109，封裝壓縮信息頭，轉S106。

其中，壓縮信息頭內容：參考報文標識：ReferPackId、壓縮算法標識：0（無壓縮）、當前報文標識：0（參考報文），解壓縮端可以根據壓縮信息頭進行解壓同步，得到原始報文。

步驟S110，將數據包發往隧道對端。

2.3.2 解壓環節的處理步驟

步驟S201，從隧道內接收封裝后的IP報文，轉S202。

步驟S202，拆除隧道各層頭部信息，PPTP、L2TP和IPSec各自拆除各自相應的頭部信息，轉S203。

步驟S203，判斷是否為參考報文，若是轉S207，否則轉S204。

其中，根據壓縮信息頭“當前報文標識”，可判斷是否為參考報文，其中參考報文不需要解壓，非參考報文需要根據參數報文及其壓縮信息頭信息，進行解壓縮，得到原始報文。

步驟S204，拆除壓縮信息頭，轉S205。

步驟S205，根據壓縮信息頭“壓縮算法標識”，選擇壓縮算法，將所得報文執行相應解壓處理，轉S206。

步驟S206，根據壓縮信息頭“參考報文標識”，選擇參考報文，將解壓后報文與參考報文做逆差分，得到原始報文，轉S209。

步驟S207，更新存儲參考報文及其壓縮信息頭，壓縮信息頭用以指示逆差分操作，轉S208。

步驟S208，拆除壓縮信息頭，轉S209。

步驟S209，將原始數據包發往下游。

根據上述描述的基于報文差分的隧道傳輸壓縮方法，在傳輸隧道的網絡切片化、相關性分析的基礎上，進行針對參考報文的差分、再壓縮，并且結合了現有的無損壓縮算法，比如lzo、zlib等算法，普遍適用于PPTP、L2TP和IPSec等不同的隧道傳輸形式，圖5描述了經過報文差分的隧道壓縮前后呈現的壓縮效果，可見將多層嵌套隧道網絡的傳輸報文進行相關性分析切片化處理、再差分壓縮，能夠實現較大程度地壓縮削減冗余數據，極大提高了隧道網絡的傳輸效率，為偏遠山區、衛星海事等帶寬緊缺場景提供了高效的傳輸服務[10]。

3 結論

基于報文差分的隧道傳輸壓縮方法研究，在傳統隧道傳輸技術中，引入待傳輸原始報文間相關性分析，隧道網絡報文的切片化隔離處理，采用基于參考報文差分處理再壓縮的方法，從時間維度深度壓縮報文大小，提升傳統隧道傳輸中報文的傳輸效率。為網絡環境惡劣、帶寬緊缺昂貴等特殊場景及客戶，提供了高效的技術升級方案，且實際體驗效果顯著，具有很高的商業價值，極大推進虛擬網絡的建設與實施。

參考文獻：

[1] 殷振凱，劉培學，王中訓，等.民用北斗短報文的船載冷鏈信息壓縮傳輸方法 [J].單片機與嵌入式系統應用，2023，23（3）：16-19.

[2] 李德偉.基于網絡數據同步的測繪數據壓縮技術研究 [J].自動化技術與應用，2023，42（4）：83-86.

[3] 張煥彬，辛拓，梁佳鑫.基于北斗短報文的電力通信信息壓縮傳輸方法研究 [J].電氣技術與經濟，2023（2）：4-6.

[4] 潘濤，佟曉筠，張淼，等.基于壓縮感知和超混沌系統的圖像壓縮加密方法[J].計算機科學，2023，50（S01）：724-729.

[5] 李耀瑩，孫娟.自適應編碼與混合模型聯合改進圖像壓縮算法 [J].機械設計與制造，2023，383（1）：179-182.

[6] 錢正浩，曾紀鈞，江映燕，等.基于模型壓縮的可靠性切片容災承載方法 [J].微型電腦應用，2023，39（2）：67-70+88.

[7] 高振，陳福才，王亞文，等.基于擬態防御的VPN流量劫持防御技術 [J].計算機科學，2023，50（11）：340-347.

[8] 雷曉燕.VPN技術在遠程辦公中的應用及風險應對 [J].通信與信息技術，2020（5）：24-25.

[9] 但海濤.考慮互聯網多移動節點的數據壓縮傳輸方法 [J].長江信息通信，2023，36（7）：177-179.

[10] 饒加旺，王勇，馬榮華.文本大數據的智慧城市研究與分析 [J].測繪科學，2020，45（7）：170-180.

作者簡介：鄭自永（1986.09—），男，漢族，河南商丘人，主任協議軟件工程師，中級電子技術工程師，碩士研究生，研究方向：無線通信、計算機軟件、網絡規劃。

收稿日期：2024-01-26

現代信息科技2024年14期

現代信息科技的其它文章: 基于MATLAB的“電磁場與電磁波”虛擬仿真實驗設計; 基于數據挖掘的交叉學科教學模式探索與實踐; Python在應用統計學課程教學中的應用; 國內外教育領域人工智能研究熱點比較與前沿趨勢挖掘; 中藥自動抓配系統的設計; 基于ANSYS Workbench的某航空電子設備結構設計