999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于改進沙漏的攀巖運動關鍵點檢測算法

2024-09-22 00:00:00譚光興唐天南易彤陳海峰
現代電子技術 2024年17期

摘" 要: 針對關鍵點檢測中目標尺度多變以及不同特征適應性等難題,為進一步提升現有的姿態估計方法在實現姿態估計任務時的性能,驗證單階段和多階段姿態估計方法各自的有效性,提出一種基于改進沙漏的攀巖運動關鍵點檢測算法。首先設計一個多路池化殘差結構,改善由于沙漏網絡多次上下采樣帶來的信息損失和上下文信息提取不足的局限性,提升淺層特征在關鍵點檢測中的表現;其次在沙漏網絡中引入沙漏注意力結構,通過利用特征映射將輸入信息劃分為不同大小的特征塊序列,在特征編碼和特征解碼兩個過程中,充分挖掘圖像有效信息,使得在特征匹配過程中不僅考慮本身的擬合程度,更考慮到關節位置之間的關聯信息。實驗表明,提出的算法在公開數據集MPII、COCO和針對攀巖運動的數據集上表現良好,且算法泛化能力較好,能夠應用于多種運動場景中的人體關鍵點檢測任務。

關鍵詞: 沙漏注意力; 關鍵點檢測; 攀巖運動; 多路池化; 關聯信息; 特征編碼; 特征映射

中圖分類號: TN911.73?34; TP391" " " " " " " " "文獻標識碼: A" " " " " " " " " " 文章編號: 1004?373X(2024)17?0117?06

Rock climbing keypoint detection algorithm based on improved hourglass

TAN Guangxing, TANG Tiannan, YI Tong, CHEN Haifeng

(School of Automation, Guangxi University of Science and Technology, Liuzhou 545000, China)

Abstract: In view of the variable target scales and adaptability for different features in keypoint detection, a rock climbing keypoint detection algorithm based on improved hourglass is proposed in order to further improve the performance of the existing attitude estimation methods during the process of achieving attitude estimation tasks and verify the effectiveness of single?stage and multi?stage attitude estimation methods. A multi?channel pooling residual structure is designed to eliminate the information loss caused by multiple up?samplings and down?samplings of the hourglass network and the limitations of insufficient context information extraction, and improve the performance of shallow features in keypoint detection. An hourglass attention structure is introduced into the hourglass network. The input information is divided into feature block sequences of different sizes by feature maps. The effective information of the image is fully exploited in the two processes of feature encoding and feature decoding, so that not only the fitting degree of itself is considered, but also the correlation information between joint positions is considered in the process of feature matching. The experiments show that the proposed algorithm performs well on the public data sets MPII and COCO and the data sets for rock climbing, and the algorithm is of good generalization ability, so it can be applied to the tasks of human keypoint detection in a variety of sports scenes.

Keywords: hourglass attention; keypoint detection; rock climbing; multi?way pooling; association information; feature encoding; feature mapping

0" 引" 言

攀巖運動作為一項曾經人類挑戰自身極限的戶外極限運動,隨著愛好者的逐漸增多和競技攀巖運動的不斷發展,攀巖運動開始由室外運動轉為更為安全的室內運動。與其他傳統的室內運動不同,攀巖運動對運動者的全身素質要求全面,由于其獨特的競技性和觀賞性,攀巖運動素有“空中芭蕾”的美譽。

隨著攀巖運動加入更多大型賽事,比賽項目的多樣性和多元性會逐步增加,數字技術和電子技術在攀巖運動中將發揮更重要的作用,如運用計算機設備輔助運動員進行訓練和評估,通過電子虛擬設備幫助運動員進行更安全、高難度訓練[1?2]。這類通過數字圖像技術和電子通信技術幫助攀巖運動員提高自身運動水平的方法也存在許多挑戰:一是針對不同運動員體態特征和攀巖運動的特殊性難以實現對運動員關鍵信息的精準捕捉和針對性訓練,在速度賽中通常更關注于速度而非技巧,而在攀石賽中通常更關注于技巧,難度賽往往需要兼備多個方面[3];二是傳統的穿戴式設備和電子設備往往會對運動員帶來一定程度的束縛,從而使運動員產生一定的抵觸心理。針對上述挑戰,非穿戴式設備和電子設備往往在舒適性和通用性上有很大的改善,對此許多研究員提出了結合深度卷積網絡的姿態估計方法[4?5]。

與早期方法使用基于手工特征的方法不同,結合深度卷積網絡的姿態估計方法,精度高且泛化能力強,具有普適性。目前,應用最廣泛的方法大多都是基于從圖像分類領域中遷移過來的深度學習的網絡結構,這類方法按照目標任務可分為單階段和多階段兩類。例如,2016年由何凱明等人提出的ResNet網絡結構和2017年基于Res?Inception的COCO關鍵點挑戰的獲勝者均為單階段網絡結構,這類網絡結構往往在骨干網絡后添加相應上采樣或反卷積以獲得較高的空間分辨率,但隨著目標任務的不斷變化,簡單增加網絡深度和容量很難帶來很好的性能提升[6]。

除單階段網絡結構外,另一類姿態估計方法是多階段網絡結構。每個階段都可以算作簡單小型網絡,包括完整的下采樣和上采樣,且每種方法可以是自底向上方式,也可以是自頂向下方式,而對于單階段網絡結構都是自頂向下方式進行[7]。在這類方法中,每個階段之間的特征圖和熱力圖仍然可以保證不壓縮圖像質量,各個階段之間同時監督,進而實現端到端的訓練。這類方法中最具有典型性的是本文采用的堆疊沙漏網絡。

從現有的實驗結果看,多級網絡結構更適合于姿態估計任務,它能最大程度地在保留高空間分辨率的同時,使得訓練過程更加可視化和靈活。事實上,多級網絡結構在大中型數據集上能得到很好的結果,而在像MPII、COCO等數據量很大的數據集上,其精度要低于單級網絡結構。

為解決上述問題,本文將采集的攀巖運動圖像制作為兩種不同標注類型的數據集:一種類型更關注運動員上半身運動特征;另一種類型更關注運動員中軸線的運動特征。前者通過觀察運動員頭部注意力和四肢點位,捕捉到運動員在運動情境時完成相應動作的運動決策和視覺搜索情況,從而實現針對性技巧訓練,這更適合于難度賽和攀石賽;后者通過觀察運動員中軸線的重心和四肢點位,捕捉到運動員在運動情境時完成全部動作的身體規范和穩定程度,從而實現針對性體能訓練,更適合于速度賽。本文提出基于改進沙漏的攀巖運動關鍵點檢測算法,通過提出的算法提升現有多階段姿態估計算法的性能,同時將算法應用于所提出的針對攀巖運動的動作數據集中,驗證單階段和多階段姿態估計算法各自的有效性。

1" 基于改進沙漏的人體關鍵點檢測網絡

1.1" 堆疊沙漏網絡

在多階段網絡結構中,許多網絡結構大多只使用最后一層輸出卷積特性作為網絡的輸出,這往往會造成多層信息在傳輸過程中的信息丟失,為更好捕獲人體關鍵點不同特征之間的位置和距離等關系,Newell等人提出了堆疊沙漏網絡。該網絡結構以卷積姿態機(Convolutional Pose Machine, CPM)網絡為基礎,借鑒ResNet殘差網絡的思想,設計了一個含有跳躍連接且結構對稱的由多個沙漏網絡堆疊而成的網絡結構,因其網絡結構外形似多個沙漏堆疊在一起稱為堆疊沙漏網絡。該網絡有多次反復的上下采樣過程,在計算損失函數時引入中繼監督對單個沙漏模塊單獨進行損失計算,使上一個沙漏模塊的損失對下一個沙漏模塊不構成影響,最終生成包括多尺度特征信息的熱力圖,檢測結果更為準確。但該網絡結構也存在局限性,如由于多次上采樣采用的插值方法帶來的信息損失和上下文信息提取不足帶來的淺層特征表現較差,從而影響各關鍵點之間的特征提取結果。沙漏子網絡結構如圖1所示。

1.2" 改進沙漏模塊

針對上述堆疊沙漏網絡存在的局限性,本文提出含有多路池化的改進殘差模塊。改進殘差模塊在保留原沙漏模塊殘差結構的基礎上新增一條池化路并對原有的卷積路做出調整,有效地改善原沙漏模塊感受野較小,對淺層結構信息挖掘不足的局限性。該模塊主要由卷積層、池化層、Batchnorm層、ReLU激活層等組成。由于單位映射可能會隨著網絡深度的加深導致優化難度加大等問題的出現,用一個1×1卷積層替換殘差結構中由單位映射構成的跳級路。新增一條池化路,即圖2中的下路,包括兩個3×3卷積層、一個2×2最大池化層和一個1×1卷積層。同時對中路進行調整,在原殘差結構的基礎上增加一個2×2最大池化層、一個3×3卷積層和一個1×1卷積層。三條分路分別有不同的任務分工,上路和中路通過深度卷積和1×1卷積層獲取高分辨率的圖像信息,同時較好地保留圖像原有信息,下路通過擴張提取圖像時的感受野,捕獲圖像的全局信息,最后將三路輸出進行特征融合后傳遞至下一個模塊,其中每一路的卷積層之間保留了原網絡的Batchnorm層和ReLU激活層,以防止特征提取過程中出現過擬合的現象。多路池化殘差結構如圖2所示。

1.3" 沙漏注意力模塊

針對堆疊沙漏網絡存在特征提取不足的缺陷,本文設計一個沙漏注意力模塊,沙漏注意力結構包括特征編碼和特征解碼兩個過程。特征編碼過程負責從輸入圖像中提取特征,特征解碼過程負責將處理完成的特征信息轉換為圖像輸出。具體來說,圖像信息經過特征編碼后,捕獲到一個[H×W×M]的特征映射,將其劃分為[H×W]個塊,每個塊的大小為[1×1×M],然后將該塊的序列信息輸入到沙漏注意力模塊的第一個子層,記為[E1]階段。隨后,以不同的塊大小重復4次,分別記為[E2]階段、[E3]階段、[E4]階段和[E5]階段。換言之,在特征編碼的每個階段,首先將輸入特征映射記為[Y∈RH×W×M],依次將[Y]劃分為[H×Wqi]個塊,每個塊的大小為[qi×qi×M],其中[qi]依次為1、2、4、8、16;再將特征塊依次輸入到注意力塊后續子層中;最終輸出與[Y]大小一致的新特征圖。隨著網絡深度增加,特征塊數量減少,特征塊大小增大。

與特征編碼類似,特征解碼可以理解為特征編碼的逆過程,即在特征解碼的[D5]、[D4]、[D3]、[D2]和[D1]五個階段,依次將輸入特征[Y∈RH×W×M]劃分為[H×Wqi]個塊,每個塊大小為[qi×qi×M],其中[qi]依次為16、8、4、2、1。隨后將這些塊輸入到注意塊的后續子層,得到相應的特征映射。同時隨著網絡深度的增加,特征塊的數量逐漸增加,特征塊的大小減少。最終按照由特征編碼到特征解碼排列,組合成如圖3所示的沙漏注意力結構。

1.4" 網絡整體架構

圖4為本文設計網絡的二階沙漏整體架構。在圖像輸入網絡后,首先使用步長為2的7×7卷積對圖像進行處理,隨后通過多路池化殘差塊和最大池化減小后續沙漏模塊的內部計算量。本文選取8個沙漏級聯的方式,在保留了原沙漏網絡,下一級沙漏的輸入由上一級沙漏的輸入的前向輸出、上一級沙漏經過1×1卷積處理后的輸出和上一級沙漏生成預測熱圖經過1×1卷積處理后的輸出,三者整合后的結果作為最終下一級沙漏的輸入的基礎上,在兩個沙漏之間引入沙漏注意力模塊,充分提取不同特征之間的關聯信息,減少信息損失。最終,輸入圖片經過沙漏網絡后,由1×1卷積整合處理,得到輸出熱圖和預測結果。改進堆疊沙漏網絡整體結構如圖5所示。

1.5" 損失函數

本文使用損失函數由均方損失[Lmse]和[L1]損失兩項組成,其表達式如下:

[L=αLmse+βL1] (1)

式中:[α]、[β]為超參數,設置[α=1],[β=1];均方損失[Lmse]是指預測值[yi]與目標值[f(xi)]之差的平方和,這類損失函數具有穩定的解,但魯棒性較差。[Lmse]的表達式如下:

[Lmse=1Ni=1N(yi-f(xi))2] (2)

式中[N]為訓練樣本的數量。

[L1]損失是指預測值[yi]與目標值[f(xi)]之差的絕對值,這類損失可以將預測值與目標值絕對差值的總和最小化,魯棒性較好。[L1]的表達式如下:

[L1=i=1Nyi-f(xi)] (3)

2" 實驗與分析

本節將從公開數據集和針對攀巖運動的數據集對本文算法進行驗證,并將本文算法與其他先進算法在數據集上進行實驗對比,同時提供算法實例展示結果。

2.1" 實驗數據集

本文采用面對大規模姿態識別任務適用性良好的MPII數據集和面對大規模任務更具挑戰的COCO數據集對所提出的算法進行驗證,并在針對攀巖運動的數據集中進行實例驗證以評估網絡性能。其中,針對攀巖運動的數據集包含2 306張圖像,涵蓋難度賽、速度賽和攀石賽三種不同類型的比賽場景,按照MPII和COCO數據的標注格式,定義16個人體關鍵點和17個人體關鍵點的兩種標注類型的攀巖數據集,兩種標注格式分別關注人體運動中不同部位的運動表現。本文將數據集劃分為兩部分,其中隨機取90%用于訓練,剩余用于驗證。

由于所使用數據集的不同,本文針對不同數據集采用適合的評價方法,對于MPII數據集采用PCK作為其評價方法,對于COCO數據集采用平均準確率(AP)和平均召回率(AR)作為其評價方法。PCK表示人體關鍵點正確檢測的比例,AP表示網絡所檢測到的關鍵點之間的相似度,其中MPII數據集中以頭部長度作為歸一化的參考,COCO數據集中針對不同的圖像劃分了不同的歸一化因子,通過引入不同關鍵點的尺度信息,計算關鍵點之間的相似度。

2.2" 實驗環境和參數設置

本文訓練和測試實驗環境均在由64位Windows 10系統,處理器CPU型號為i7?13700F,顯卡為24 GB顯存的GTX 4090所搭建的實驗平臺下完成,深度學習框架使用PyTorch。在訓練過程中使用面對大數據量表現良好的Adam優化算法作為網絡的優化器以更新網絡參數,初始學習率設為5×[10-4],定義warmup為線性方式預熱學習率,總訓練輪數為210。

2.3" 性能比較

在使用相同數據集和實驗環境條件下,將本文網絡與Mobilenetv2[8]、Scnet[9]、Litehrnet[10]、Shufflenetv2[11]、RLE[6]、Resnetv1d[12]、Swintransformer[13]、Hrformer網絡分別在MPII和COCO兩個數據集上進行性能比較以驗證其網絡的可行性和先進性。如表1所示,本文算法在MPII數據集所測試的7個部位中,相較其他算法對于各部位的檢測精確度更高,性能表現更優異。如表2所示,在COCO數據集中,可以看到本文算法在平均準確率AP值上明顯優于其他算法,平均召回率AR略低于其他算法。

2.4" 消融實驗

本文算法在MPII數據集上進行消融實驗,實驗結果如表3所示。

從實驗結果可以看到沙漏網絡再加入兩個模塊后精度均有不同程度的提升,對于各部位的檢測精度提升明顯。兩個模塊的加入使得網絡能夠學習到充分的特征信息,并改善了沙漏塊之間信息傳遞時易出現的信息損失問題。由此可得出結論,本文所提出的兩個模塊對于原沙漏網絡中肘部、手腕、臀部、腳踝四個檢測較為困難的關節點有了針對性提升。

2.5" 實例展示

為了更好演示本文算法在各種場景中的性能,對單人場景、多人場景和攀巖運動場景下檢測結果進行實例展示,如圖6所示。

在單人和多人場景中本文算法可以準確檢測到場景中運動員的位置和關鍵點信息。在攀巖運動場景下,選取三種賽事對應實例進行展示,可以發現對于攀巖的三類賽事,在難度賽和攀石賽這兩類技巧性較強的比賽中,本文算法能較好地檢測到運動員的特征關鍵點,通過對特征關鍵點的識別,可以供訓練員更好地對運動員的運動決策和視覺搜索方面作針對性訓練。在速度賽這類完成時間較短且容易出現圖像模糊的比賽中均能較好地完成該場景下的檢測任務。

3" 結" 語

本文分析了堆疊沙漏網絡存在的一些局限性,針對這些局限性設計改進殘差結構和關聯沙漏結構。通過引入兩種結構,較好地改善原網絡對淺層信息提取不足和信息丟失的局限性。同時,本文將改進網絡與攀巖運動這項日漸火熱的競技體育運動相結合,通過與數字圖像技術結合,更好地推動該運動的發展。實驗結果表明:本文算法在MPII數據集中各部位關鍵點檢測效果優于其他算法,并針對4個檢測較為困難的關鍵點檢測精度有所提升。在COCO這類大型數據集中檢測準確率穩定,同時在針對攀巖運動的數據集中能準確識別運動員的位置和身體關鍵點信息。本研究為更多體育運動與數字圖像技術結合提供參考。

注:本文通訊作者為唐天南。

參考文獻

[1] 曹榮武.競技攀巖運動的發展與趨勢[J].健與美,2024(1):136?138.

[2] 楊坤宇,謝林,段田雨,等.國內外攀巖運動現狀研究現狀、熱點與趨勢[C]//第十三屆全國體育科學大會論文摘要集——墻報交流(體育社會科學分會).北京:中國體育科學學會,2023:971?973.

[3] 曹海輝.淺析競技攀巖運動線路分析誤區及原則[J].當代體育科技,2020,10(31):240?242.

[4] SUN K, XIAO B, LIU D, et al. Deep high?resolution representation learning for human pose estimation [C]// IEEE/CVF Conference on Computer Vision and Pattern Recognition. New York: IEEE, 2019: 5693?5703.

[5] KREISS S, BERTONI L, ALAHI A. PifPaf: Composite fields for human pose estimation [C]// IEEE/CVF Conference on Computer Vision and Pattern Recognition. New York: IEEE, 2019: 11977?11986.

[6] LI J F, BIAN S Y, ZENG A L, et al. Human pose regression with residual log?likelihood estimation [C]// 2021 IEEE/CVF International Conference on Computer Vision (ICCV). New York: IEEE, 2021: 11005?11014.

[7] ZHANG H, WU C R, ZHANG Z Y, et al. ResNeSt: Split?attention networks [C]// 2022 IEEE/CVF Conference on Computer Vision and Pattern Recognition Workshops (CVPRW). New York: IEEE, 2022: 2735?2745.

[8] SANDLER M, HOWARD A G, ZHU M L, et al. MobileNetV2: Inverted residuals and linear bottlenecks [C]// 2018 IEEE/CVF Conference on Computer Vision and Pattern Recognition. New York: IEEE, 2018: 4510?4520.

[9] LIU J J, HOU Q B, CHENG M M, et al. Improving convolutional networks with self?calibrated convolutions [C]// 2020 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). New York: IEEE, 2020: 10093?10102.

[10] YU C Q, XIAO B, GAO C X, et al. Lite?HRNet: A lightweight high?resolution network [C]// 2021 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). New York: IEEE, 2021: 10440?10450.

[11] ZHANG X Y, ZHOU X Y, LIN M X, et al. ShuffleNet: An extremely efficient convolutional neural network for mobile devices [C]// 2018 IEEE/CVF Conference on Computer Vision and Pattern Recognition. New York: IEEE, 2018: 6848?6856.

[12] HE T, ZHANG Z, ZHANG H, et al. Bag of tricks for image classification with convolutional neural networks [C]// 2019 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). New York: IEEE, 2019: 558?567.

[13] LIU Z, LIN Y T, CAO Y, et al. Swin Transformer: Hierarchical vision transformer using shifted windows [C]// 2021 IEEE/CVF International Conference on Computer Vision (ICCV). New York: IEEE, 2021: 9992?10002.

主站蜘蛛池模板: 91精品啪在线观看国产| 国产丝袜精品| 欧美精品亚洲精品日韩专区va| 亚洲欧美人成人让影院| 亚洲欧美日韩天堂| 都市激情亚洲综合久久| 国产亚洲第一页| www亚洲精品| 成人一级免费视频| 在线免费不卡视频| 亚洲最大福利网站| 激情爆乳一区二区| 妇女自拍偷自拍亚洲精品| а∨天堂一区中文字幕| 伊人色在线视频| 久久久久亚洲av成人网人人软件| 国产精品无码AⅤ在线观看播放| 久久青草免费91观看| 成年片色大黄全免费网站久久| 欧美成人精品在线| 日韩精品免费一线在线观看| 伊人久久福利中文字幕| 亚洲人成成无码网WWW| 国国产a国产片免费麻豆| 亚洲电影天堂在线国语对白| 青草国产在线视频| 热久久国产| 伊人天堂网| 久视频免费精品6| 亚洲国产AV无码综合原创| 天堂成人在线| 无码AV日韩一二三区| 日韩欧美国产精品| 无码AV日韩一二三区| 一级一级特黄女人精品毛片| 日韩欧美国产另类| 亚洲 成人国产| 亚洲精品欧美日韩在线| 四虎永久在线精品国产免费| 91尤物国产尤物福利在线| 免费在线看黄网址| 亚洲成aⅴ人在线观看| 成年A级毛片| 免费Aⅴ片在线观看蜜芽Tⅴ| 在线欧美国产| 日韩精品亚洲一区中文字幕| 国产理论最新国产精品视频| 精品综合久久久久久97超人| 国产成人精品一区二区| 国产无码性爱一区二区三区| 欧美精品啪啪一区二区三区| 日韩视频免费| 波多野结衣中文字幕一区| 国产白浆在线| 国产jizz| 久久国产精品77777| 永久成人无码激情视频免费| 国内精品91| 999精品视频在线| 精品撒尿视频一区二区三区| 久久久精品久久久久三级| 国产主播一区二区三区| 午夜国产不卡在线观看视频| 小说区 亚洲 自拍 另类| 高清亚洲欧美在线看| 国产色婷婷| 欧亚日韩Av| 久久免费视频播放| a网站在线观看| 奇米影视狠狠精品7777| 国产精品开放后亚洲| 亚洲精品卡2卡3卡4卡5卡区| 亚洲精品桃花岛av在线| 美女国内精品自产拍在线播放| 亚洲综合色在线| 国产一在线| 99精品福利视频| 2024av在线无码中文最新| 免费xxxxx在线观看网站| 国产自在线播放| 韩国v欧美v亚洲v日本v| 一级毛片在线播放|