姜龍 駱勇



摘? 要: 傳統的運動教學視頻壓縮算法壓縮幀數少,信噪比低。為了解決上述問題,提出基于人工智能技術的運動教學視頻壓縮算法,利用多線性子空間KL變換技術進行運動教學視頻編碼,引用人工智能技術中的鉆石搜索法構建視頻壓縮算法,分析視頻圖像運動中矢量的基本規律來檢測算法的有效性,確定多個子空間的數據,將視頻幀數進行分辯,分辨出新的變量進行XL變換處理來完成教學視頻編碼,編碼后采用鉆石搜索法的兩種模式進行互補,從而確定出最小誤差點,利用SAD算法算出最佳匹配矢量,完成運動教學視頻的壓縮。與傳統算法進行實驗對比,結果表明,基于人工智能技術的運動教學視頻壓縮算法壓縮幀數多、信噪比高、清晰度高,具有很好的壓縮效果。
關鍵詞: 人工智能技術; 運動教學視頻; 視頻壓縮; 壓縮算法; 視頻編碼; 最小誤差點確定
中圖分類號: TN911.73?34; TP18? ? ? ? ? ? ? ? ? 文獻標識碼: A? ? ? ? ? ? ? ? ? ? ?文章編號: 1004?373X(2020)21?0055?04
Sports teaching video compression algorithm based on artificial intelligence technology
JIANG Long1, 2, LUO Yong2
(1. Jiangsu Normal University, Xuzhou 221116, China; 2. Lianyungang Technical College, Lianyungang 222000, China)
Abstract: As the traditional sports teaching video compression algorithm has fewer compressed frames and lower signal?to?noise ratio, a new sports teaching video compression algorithm based on artificial intelligence technology is proposed. The multi?line subspace KL transform technology is used for sports teaching video coding. The diamond search method in artificial intelligence technology is used to construct video compression algorithm. The basic law of vector in video image motion is analyzed. In order to check the validity of the algorithm, the data of several subspaces is determined, and then the number of video frames is discriminated to get new variables and perform XL transform processing, so as to complete the teaching video encoding. The two modes of diamond search method are adopted for complementary after encoding, so as to determine the minimum error point. The SAD algorithm is used to calculate the best matching vector to complete the compression of the sports teaching video. The results of comparison experiment show that, in comparison with the traditional algorithm, the sports teaching video compression algorithm based on artificial intelligence technology can get many frames compressed, and has high signal?to?noise ratio, high definition and good compression effect.
Keywords: artificial intelligence technology; sports teaching video; video compression; compression algorithm; video coding; minimum error point determination
0? 引? 言
現在的教育不僅僅是知識的教育,而是全面發展的教育,讓學生在運動、智力、意志力、情感等方面得到全面和諧的發展,各個大學都開展了運動教學,它引導學生開展各種活動,通過學生在學習和掌握運動技能的反復練習中鍛煉學生的身體,達到增強體質的目的。體育課也傳授個人衛生方法的知識,使學生養成講究衛生的好習慣,提高學生的健康水平[1]。某些高校為了提高學生的自主學習能力,用人工智能技術的運動教學視頻來傳授知識。因此本文基于人工智能技術研究了一種新的運動教學視頻壓縮算法[2]。
人工智能技術的運動教學視頻壓縮算法是一種有效的算法,其中最重要的環節就是視頻壓縮處理和編碼變換處理。當前,有學者提出壓縮方法主要利用關鍵幀檢測和指示符運動建模的智能教學視頻的壓縮算法[2],還有學者提出基于運動矢量細化的幀率上變換與HEVC結合的視頻壓縮算法[3]。但是這兩種方法運行復雜,運算時間長,所以本文采取簡便高效的鉆石搜索法。為了提高壓縮率,本文結合了多媒體擴展指令集(MMX)技術,在進行編碼處理變換時,采取KL變換,降低局限性[3]。為了提高編碼處理的全面性,本文提出基于多線性子空間KL變換的壓縮視頻方法,通過廣義主成分分析法(GPCA)將視頻圖像信號映射到多個線性子空間,讓每個子空間的變換系數都靠近,可以使編碼獲得更好的結果。
1? 基于多線性子空間KL變換的運動教學編碼視頻
本文將GPCA方法和KL變換結合應用于運動教學視頻編碼,即提出了基于多線性子空間KL變換的運動教學視頻編碼[4]。GPCA是把多個線性子空間中的數據集分割出來,估計線性子空間的維數和基向量。本文用這一方法進行圖像和視頻編碼,單一的輸入樣本不能保證是在分割出的各個小方塊中,所以本文需要足夠多的樣本證明實驗的準確性[5]。雖然GPCA方法的計算復雜度很高會消耗大量的計算時間,但是通過降低子空間的維數和減少子空間分割出的個數,讓GPCA方法在一般情況下是可行的[6]。
處理后的GPCA可以進行運動教學視頻的壓縮,這種視頻壓縮方法比DCT方法消耗時間少、更加便捷[7]。GPCA法主要是利用圖像幀數進行KL變換處理,通過離散小波變換得到圖像的第一個幀數的一個多尺度分解,分解出圖像中的低頻信號和高頻信號,然后利用GPCA方法分割各個線性子空間的數據,最后對分割的有效數據進行KL變換編碼,從而對運動教學視頻更好的進行壓縮。解碼時需要截取低頻信號和高頻信號,這樣才能得到完整的視頻編碼。
單一尺度圖像變換編碼時,視頻幀會劃分成一個個大小相等的子塊,因為圖像的紋理特點不同,很難在同一個線性空間中進行平均分割,所以直接對視頻幀分割處理是有局限性的[8]。為了解決這一局限性,本文先對圖像幀數進行訪問,根據訪問結果進行運動預測,根據預測結果進行視頻編碼。通過預測結果更好地了解圖像的高頻和低頻區域,準確地分割[9]。如果分割的都是低頻子帶會導致只得到基本層的解碼;如果分割的是高頻子帶也會導致解碼不全面,只有低頻子帶和高頻子帶都分割才能得到比較完整的視頻編碼。通過合理的方法將視頻幀分割成大小相等的子塊,接下來利用小波的多分辨、多分析過程將圖像的高頻分量和低頻分量進行分層,具體編碼流程如圖1所示。
1) 輸入視頻幀并對輸入的幀進行小波分析分辨;
2) 對分析出的高頻和低頻進行分組形成新的向量;
3) 對組成的新向量進行KL變換處理;
4) 對變換處理得到的系數進行量化,最后輸出視頻編碼。
輸入一個圖像幀,經過小波分析分辨形成了三層波層、一個低頻分量和三個高頻分量,圖片左上角為低頻分量,將子帶中三個高頻分量系數組成一個新的向量,低頻分量進行KL變換處理與新的向量分開,向量進行GPCA運算和KL變換,得到運動教學視頻的編碼如圖2所示。
2? 基于人工智能技術的視頻壓縮算法
應用人工智能技術中的鉆石搜索法構建視頻壓縮算法,分析視頻圖像運動中矢量的基本規律[10]。鉆石搜索法是把要搜索的范圍放在一個大的圓形區域內,在圓形區域內分布好正方形小格子,圓形與每個小格子的交點代表待搜索點的位置,在搜索點搜索圖像的頻譜如圖3所示。
因為視頻圖像的頻譜大多數是菱形的,與鉆石的形狀非常相像,所以鉆石分割法非常適合視頻壓縮。鉆石搜索法包括大鉆石搜索模式和小鉆石搜索模式[11]。如圖4和圖5所示。
雖然兩種搜索模式很相似,但選擇時不能隨意選擇。搜索模式的大小和形狀會影響到搜索的速度和精確度,所以在選擇時要十分的謹慎,選擇最合適的鉆石搜索模式[12]。鉆石搜索法的基本操作為:先用大鉆石搜索模式進行搜索,確定出小鉆石搜索模式的邊界點進行運算,發現最小誤差點,如果最小誤差點在各個小格子的交點上則直接進入最后搜索階段,進行小鉆石搜索模式,判斷出最佳匹配塊的運動矢量。如果發現最小誤差點不在各個小格子的交點處,則以上一次找到的最小誤差點為中心點,對局部沒有匹配的點進行SAD運算,最后取平均值,提供最佳匹配矢量點。
雖然操作是循環操作,但在執行時只需要進行條件判定,符合條件則執行相應的操作,這種方法大大提高了CPU的利用效率,節約時間。通過舍棄部分運算結果進行編碼可以更好的進行視頻壓縮,鉆石搜索法為人工智能技術的視頻壓縮節省了空間,提高了壓縮率。
運動教學視頻壓縮算法計算式為:
[SAD(m,n)=m=1Mn=1Nbk(m,n)-bk-1(m+j,n+j)] (1)
式中:[bk(m,n)]和[bk-1(m+j,n+j)]分別代表第[k]幀和第[k-1]幀像素點[(m,n)]的亮度值;[M]和[N]為水平和垂直像素數;[j]為最大可能平移的水平和垂直像素數[13]。
雖然鉆石搜索法提高了視頻壓縮率,但鉆石搜索模式在進行SAD最小誤差點運算時包含大量的循環運算,這種頻繁的循環運算非常適合MMX技術。MMX技術為鉆石搜索法釋放了額外的處理器周期[14]。
MMX和鉆石搜索法互相補充,大大地提高了視頻的壓縮率。結合后可以準確地計算出SAD值并且運算時間大大減少,與單獨運用鉆石搜索法相比速度提高了3倍,使用MMX指令計算絕對值不需要計算中間結果和分支,直接計算運動矢量估計絕對值。這樣用8位精度計算了絕對值不需要利用16位精度,也無需條件分支語句,使人工智能技術的視頻壓縮變得更加簡單[15]。
3? 仿真測試結果與分析
為檢測本文研究的算法效果,設計對比實驗,通過兩種不同的方法對視頻進行壓縮,實驗對比量為:壓縮完成的時間和相應的壓縮所需要的幀數即運動教學視頻的壓縮率。選取的運動教學視頻文件是運動預備知識的視頻,視頻中男子有輕微的手部和腿部動作,用鉆石搜索法和傳統壓縮法對該視頻進行壓縮。首先對視頻圖像幀數進行分割,然后根據各自的方法進行視頻壓縮,因為實驗會受到電壓、計算機的影響出現誤差,所以本文最后的壓縮時間和壓縮率都取多次實驗的平均值。通過三種方法對運動教學視頻壓縮得出結果,對比圖如圖6所示。
由圖6可知,鉆石搜索法對運動教學視頻的壓縮率比傳統方法的壓縮率高。在相同的時間內,鉆石搜索法壓縮的幀數比傳統方法多,且鉆石搜索法的穩定性強,不受視頻中人物動作的難易程度影響。所以鉆石搜索法對人工智能技術的運動教學視頻壓縮比傳統方法更加完善。
本文將GPCA方法和多線性子空間KL變換法相結合應用于運動教學視頻的編碼,即提出基于多線性子空間KL變換的運動教學視頻的編碼。針對一個女生說話的視頻進行編碼,用KL變換和三維空間等級樹集的編碼方法同時編碼,對比最后編碼成功的視頻的清晰度和信噪比。
在KL變換編碼過程中選取32幀圖像序列進行離散小波變換處理,得到高頻和低頻信號并用GPCA方法分割出有效分量,最后進行編碼處理,三維空間等級樹集的編碼主要利用小波系數變換分解出高頻子帶和低頻子帶,不同的是它是從低頻向高頻不斷的分割,得到實驗需要的子帶。將子帶中像素坐標[(i,j,k)]寫入不重要像素表中和不重要集合中,代入式(1)得出編碼處理,在編碼過程中是以樹為單位的。開始編碼時需要對[i,j,k]三個向量進行分量初始化,得到初始化后的分量由公式算出平均值,從而完成整個編碼過程。得到的編碼結果如表1所示。
分析表1可知,本文算法編碼的視頻信噪比高、壓縮比高、更加清晰、穩定。對于幀數變化不大的視頻序列,采用本文的變換處理法可以收集到更多的邊緣信息,編碼出更清晰的視頻。
對比分析本文算法、文獻[2?3]算法對8種運動教學視頻的壓縮情況,結果如表2所示。
分析表2可得,本文算法對8種類型運動教學視頻進行壓縮過程中的壓縮效率始終處于96%~99%之間,而傳統算法壓縮8種類型運動教學視頻的壓縮效率都低于本文算法。同時對比分析可得,相比其他兩種算法,本文算法的平均壓縮比高、信噪比高,說明本文算法壓縮不同類型運動教學視頻的壓縮性能更佳。
實驗為了分析本文算法的應用性能,在某高校中隨機選擇100名運動視頻分析人員,采用問卷調查的手段得到這些人員對于本文算法的滿意度,結果如圖7所示。
全面分析圖7可得,這些運動視頻分析人員采用本文算法壓縮運動教學視頻過程,對于本文算法壓縮運動視頻的壓縮便利性、壓縮清晰度、壓縮效果以及壓縮信噪比的滿意度都占據較大比例,說明本文算法的實際應用效果較佳,可大量推廣使用。
4? 結? 語
本文運用GPCA方法和多線性子空間KL變換方法對視頻進行編碼,設計了一種有效的視頻壓縮算法。通過實驗證明,鉆石搜索法比H.263方法更適合視頻編碼。本文研究的基于人工智能技術的運動教學視頻壓縮已經應用到一些高校中,并得到了滿意的結果。相信在今后基于人工智能技術的運動教學視頻壓縮中會發展的更好。
參考文獻
[1] 馮佳.基于數據人工智能技術的體育網站開發編程[J].自動化與儀器儀表,2018(1):144?146.
[2] 孟春寧,陳梓銘,馮明奎,等.基于關鍵幀和指示符運動模型的教學視頻壓縮算法[J].激光與光電子學進展,2018,55(10):118?129.
[3] 蔡于涵,熊淑華,孫偉恒,等.基于運動矢量細化的幀率上變換與HEVC結合的視頻壓縮算法[J].計算機科學,2020,47(2):76?82.
[4] 馬琳,張傳新.體育人工智能的探討[J].泰山鄉鎮企業職工大學學報,2006(4):40?41.
[5] 艾強,劉業飛.基于五人制足球網上體育教學系統的研究[J].電子測試,2018(13):179?180.
[6] 劉健,吳飛,姚蕾,等.基于多線性子空間KL變換的可伸縮視頻壓縮方法[J].電子與信息學報,2010,32(5):1188?1192.
[7] 楊春玲,余英林.基于三維小波變換嵌入式視頻壓縮算法的研究[J].電子學報,2019,29(10):1381?1383.
[8] 徐麗琨,黃登山.基于H.263標準的視頻壓縮算法的優化及研發[J].電力系統通信,2005,26(7):31?34.
[9] 祝世平,王再闊.一種基于對象的分形視頻壓縮算法研究[J].光電子·激光,2018,21(5):725?730.
[10] 須明,王博,何亦征,等.兩種實時視頻壓縮算法DSP嵌入式框架方案比較[J].航空電子技術,2016,37(1):33?37.
[11] 李曉萌,王建軍.低比特率下視頻壓縮算法的研究[J].計算機應用,2018,23(10):24?26.
[12] 陳秋華.一種內存讀寫數據壓縮算法[J].中國集成電路,2018,27(7):42?47.
[13] 徐夏剛,葉正麟,張定華.分形視頻壓縮的一種快速算法[J].西北工業大學學報,2017,22(2):196?199.
[14] 王曉利.基于數學形態學的視頻幀間壓縮算法研究與實現[J].微計算機信息,2018,27(8):223?224.
[15] 鐘代笛,張琦.壓縮域內的視頻圖像處理算法[J].電視技術,2017,25(12):21?22.
作者簡介:姜? 龍(1987—),男,江蘇東海人,碩士,講師,主要研究方向為運動教學。