劉攀,文漢云



摘要:在新冠病毒(COVID-19)全球肆虐的大背景下,為有效阻止新冠病毒在人群中傳播,多地要求在公眾場合佩戴口罩,針對這一問題,提出一種基于FasterRCNN算法的口罩佩戴檢測方法,手動通過labelimg進行數(shù)據(jù)集標定,再對深度學習模型進行訓練,實驗結(jié)果表明,該深度學習算法的檢測的準確率達到97.57%,可以有效檢測人員的口罩佩戴情況。
關(guān)鍵詞:深度學習;口罩佩戴檢測;計算機視覺
中圖分類號:TP18? ? ? ? ? ? 文獻標識碼:A
文章編號:1009-3044(2021)21-0014-03
開放科學(資源服務)標識碼(OSID):
Research on Mask Wearing Detection Based on Faster RCNN
LIU Pan, WEN Han-yun
(School of Computer Science, Yangtze University, Jingzhou 434000, China)
Abstract: In the context of the global raging COVID-19 virus (COVID-19), in order to effectively prevent the spread of the new coronavirus among the population, many places require masks to be worn in public. To address this problem, a mask wearing test based on the Faster RCNN algorithm is proposed. Methods: Manually calibrate the data set through labelimg, and then train the deep learning model. The experimental results show that the detection accuracy of the deep learning algorithm reaches 97.57%, which can effectively detect the wearing of masks.
Keywords: deep learning; mask wearing detection; computer vision
引言
自新冠病毒在全球爆發(fā)以來,世界各國的社會生產(chǎn)生活活動陷入停滯,人民的生命健康、財產(chǎn)都遭受極大的威脅,為有效阻止新冠病毒[1]在人群中進一步傳播,各地各部門要求人們出行佩戴口罩,本文提出的利用FasterRCNN[2-3]深度學習算法來進行口罩佩戴檢測可以與紅外測溫系統(tǒng)結(jié)合起來,組成一個口罩佩戴檢測加紅外測溫的門禁系統(tǒng),可以廣泛應用于各大高中院校、公司、公園、商超等人流量大的場合,不僅可以有效避免檢測人員與他人近距離接觸,還可以對未佩戴口罩的人員進行標識,以便檢測人員實時進行提醒。
用于口罩佩戴檢測的FasterRCNN深度學習算法是一種典型的two-stage目標檢測算法,整個目標檢測過程分為兩步,先由主干特征提取網(wǎng)絡生成特征層之后,再由其他算法生成一系列的候選框,two-stage目標檢測算法的特點是檢測精度高,但檢測速度相對較慢,與之相對應的有YOLO[4]、SSD等一些one-stage目標檢測算法,one-stage算法直接將先驗框的定位問題轉(zhuǎn)化為回歸問題一起處理,因此具有出色的檢驗速度,但相對的檢測精度卻有所下降。本文所選擇的FasterRCNN算法是由何凱明等人在2015年提出的,該算法是在RCNN和FastRCNN算法的基礎上改進而來的,該算法解決了RCNN[5]和FastRCNN[6]算法訓練速度慢,檢測時間長的問題,將主干特征提取網(wǎng)絡生成的特征層共享,大大減少了計算量,提高了訓練速度和檢測速度,為了保證口罩佩戴檢測的精度和準度,本文選擇了FasterRCNN目標檢測算法。
1 FasterRCNN目標檢測算法
與RCNN和FastRCNN算法相比,F(xiàn)asterRCNN算法創(chuàng)造性地使用RPN(Region Proposal Network)代替原來的Selective Search方法產(chǎn)生建議窗口,通過共享特征層大大減少了計算量,從而提高了算法的檢測速度,F(xiàn)asterRCNN算法的原理如圖1所示。
FasterRCNN算法對輸入進來的圖片在保持原有縱橫比的前提下重新調(diào)整為固定尺寸大小,然后通過主干網(wǎng)絡進行特征提取得到特征層,將特征層輸入到RPN網(wǎng)絡中,經(jīng)過3x3的卷積,再分別對每個先驗框進行分類(前景和后景)和計算對應先驗框的偏移量,然后計算出proposals,而Roi Pooling層則利用proposals從特征層中提取的proposal feature送入后續(xù)全連接層和Softmax網(wǎng)絡進行分類。
1.1主干特征提取網(wǎng)絡
FasterRCNN可以采取多種主干特征提取網(wǎng)絡,常見的有VGG、Resnet和Xception等,本文采用的是Resnet50網(wǎng)絡。Resnet網(wǎng)絡是一種深度殘差網(wǎng)絡,該網(wǎng)絡將前面若干層的某一層的數(shù)據(jù)輸出直接跳過多層引入到后面數(shù)據(jù)層的輸入部分,這意味著后面特征層的內(nèi)容會有一部分由前面的某一層線性貢獻,深度殘差網(wǎng)絡可以有效解決因網(wǎng)絡深度加深而產(chǎn)生的學習效率下降而準確率無法有效提升的問題,其結(jié)構(gòu)如圖2所示。