付迎迎 林治 吳承鑫 薛金水 楊吉



摘要:高校課堂的出勤率一直是反映學校教學效果的一項重要指標,針對傳統考勤方式占用時間長、學生 代替考勤等問題,利用人工智能技術,提出了包含目標檢測和人臉識別技術的深度學習輔助考勤系統。通 過教室內的攝像頭設備捕獲的視頻流,跟蹤參加特定課程的學生,實現了技術化考勤,提高了上課效率, 從而實現教室管理的自動化、智能化。
關鍵詞:目標檢測;人臉識別;課堂;考勤
中圖分類號:TP391.41文獻標識碼:A
0 引言
學生出勤率對高校來說具有重要意義,其可以 督促每個學生的進步。傳統考勤常采取老師記名方 式,費時、費力、實施效果差。然而,隨著科技的 發展,有很多方法可以提高考勤效率,其中之一 就是人臉識別 [1]。人臉識別可以借助人臉數據庫從 視頻片段中識別某人面部,還可應用于身份驗證 服務。
在科技飛速發展的時代,應該充分將人臉識別 應用于課堂考勤。人臉識別可以最大限度地減少考 勤時可能發生的欺詐行為,如缺勤和人為錯誤。因 此,人臉識別所運用的技術和實現手段非常適合大 學智慧化教學。通過合適的算法設計人臉識別系 統,使考勤過程更加精確,避免出錯。
1 深度學習技術原理
1.1 目標檢測技術
計算機視覺研究中一項重要的任務是目標檢測 技術,其根本目的是從攝像頭獲取外界信息,從 圖像中找到特殊的對象(目標)。該任務包括識別 圖像中物體的位置和邊界,并將物體分為不同的 類別 [2]。目標檢測技術與圖像分類和檢索一起構成 了視覺識別的關鍵部分,現有技術方法可以分為 兩種主要類型:一是優先考慮推理速度,模型包 括 YOLO、單次多目標檢測器(single shot multibox detector,SSD)和 RetinaNet 等;二是優先考慮檢 測準確性,模型包括更快區域卷積神經網絡(faster region-based convolutional neural networks,Faster R-CNN)、掩膜區域卷積神經網絡(mask region-based convolutional neural networks,Mask R-CNN)和級聯 區域卷積神經網絡(cascade region-based convolutional neural networks,Cascade R-CNN)。
區域卷積神經網絡方法(region-based convolutional neural networks,R-CNN)的提出開創了深度學習 技術運用到目標檢測任務中的先例,是利用深度學 習進行目標檢測的里程碑之作,對目標檢測技術的 發展起到了促進作用。R-CNN 是將待檢測圖像預 先劃分出目標候選區域,然后只檢測這些候選區 域,不必再滑動固定窗口對整幅圖像進行檢測,減 少了計算量并提高了檢測率。
快 速 區 域 卷 積 神 經 網 絡(fast region-based convolutional neural networks,Fast R-CNN)的主 要創新是感興趣區域池化層,池化層可將不同大小 候選框的卷積特征圖統一采樣成固定大小的特征。 Fast R-CNN 主要解決訓練階段步驟多以及耗費大量 的時間和資源等問題。該模型可將原有的特征提取 和分類操作進行合并,從輸入圖像到得出結果,全 部在一個網絡中完成。
2015 年,隨著 YOLO 算法的出現,深度學習 目標檢測算法也發生了一定的改變。相較于早期的 算法,YOLO 算法直接在同一個卷積神經網絡中完 成感興趣特征向量的提取,得到分類結果,從而簡 化了檢測模型的結構,去除一些不必要的計算使檢 測時間大大縮短 [3]。結合計算機運算能力,這種算 法使得實時檢測目標變為可能。YOLO 算法改變了 之前檢測算法的滑動窗口方式,將目標檢測視為一 個回歸問題,檢測網絡的輸出可直接給出目標的具 體信息。YOLO 算法檢測網絡在開始時將輸入的待 檢圖像分割成 S×S(S 為尺寸)大小的網格,每個 網格負責檢測各自的區域,看是否有物體的中心點 落在了網格內。若單元格內有目標的區域信息,就 由這個單元格負責檢出。
每個單元格會預測多個邊界框,每個邊界框包 含了目標坐標 x 和 y、邊界框寬度 w、邊界框高度 h 和置信度等 5 個有效值。其中,置信度包含了這個 邊界框是否有目標以及準確度,置信度計算公式為:
1.2 人臉識別技術
人臉識別的任務是根據預先存在的臉部特征數 據庫對照片或視頻圖像中出現的人臉進行比對識 別。從圖像檢索開始,人臉識別對圖像出現的物體 進行檢測,區分人臉和其他物體,然后將檢測到的 人臉和數據庫進行比對識別。
由于低成本相機和計算能力的可用性,研究人 員一直從多個角度研究人臉識別問題。生物學特征 則被用來確定識別對象的身份信息。有效和高效的 人臉識別系統很大程度上依賴于特征提取和分類過 程 [4]。目前多種人臉識別算法已被開發。
人臉識別是基于圖像辨別個體的一項技術。這 項技術被應用于許多領域,包括生物識別、安全信 息、進入控制區域、執法、智能卡和監視。人臉識 別系統可以分為兩個階段:第一階段是面部特征的 挑選或提取;第二階段涉及模式的特征分類。綜 上,特征的提取和特征的分類是開發人臉識別系統 的兩個最關鍵過程。自深度神經網絡問世以來,卷 積神經網絡(convolutional neural networks, CNN)在目標檢測的各個領域都表現出色,一度成為研究 人員熱衷的人臉識別方法。由于能夠從輸入數據中 學習復雜的模式,深度學習特別是 CNN,近年來 在神經網絡技術方面取得了很大的進步 [5]。
2 系統功能設計
本文依托高校智慧校園建設,面部識別比對數 據庫采用的是學生錄取報到時采集的數據。課堂考 勤管理系統設計框圖如圖 2 所示。
2.1 目標檢測模塊
目標檢測模塊主要對課堂人數進行在線監控, 考慮到課堂攝像頭安裝位置以及遮擋物的影響,學 生人群暴露在視角下只有上半身或是更少部分,這 對檢測提出了更高的要求。因此,本系統選用了 YOLOv5 算法。
YOLOv5 算法在整體結構框架上并沒有大的改 動,主要是在圖像輸入時增加了 Mosaic 數據增強 算法、自適應錨框計算、自適應圖片縮放等功能。 這些功能使 YOLOv5 算法在檢測精度和速率上都有 了一定的提升,有利于從圖像中發現目標,從而提 高檢出率。
2.2 人臉識別模塊
人臉識別模塊是根據教室內攝像頭產生的視頻 流提取學生人臉特征,并進行檢測和對比。一般課 堂考勤都是在課前幾分鐘內進行,該模塊可以由教 室自主控制,也可以設置為在某個時間段抓拍識別。 由于大多數教室攝像頭安裝位置在教室頂部, 導致學生臉部數據不清晰,且相較于正常圖像,在 視野內人臉占據感興趣區域偏小,不易識別。本系 統采用的是 FaceNet 人臉識別算法。該算法發表于 2015 年,其直接利用深度學習網絡描述人臉的歐式 空間中的點的映射向量,通過對比計算特征向量間的歐式空間中點的距離,判斷人臉的相似度 [6]。
2.3 數據管理模塊
數據管理模塊主要是對考勤數據進行統一管 理,便于教師和管理人員下載統計數據,包括人臉 識別打卡簽到數據和課堂在線人數統計。
3 結語
本文設計了基于目標檢測與人臉識別相結合的 課堂考勤系統,通過智能化手段將目標實時檢測和 人臉識別算法運用到高校課堂管理中,實現了由傳 統考勤方式轉為智能化考勤新模式。該系統減少了 教師工作量,有利于課堂教學數據數字化管理,為 進一步建設智慧校園拓寬了新思路。
參考文獻
[1] 唐琳 . 基于人臉識別技術的學生課堂考勤管理系統的 設計與實現 [J]. 數字技術與應用,2023,41(9): 208-210.
[2] 黃繼梅 . 基于人臉識別的課堂考勤系統研究與實現 [J]. 科學技術創新,2021(17):100-101.
[3] REDMON J,DIVVALA S,GIRSHICK R,et al. You only look once:unified,real-time object detection[C]//2016 IEEE Conference on Computer Vision and Pattern Recognition(CVPR). Las Vegas,NV:IEEE,2016:779-788.
[4] 董亞蕾,張師寧,武旭聰 . 基于小人臉識別的高校課 堂考勤系統研究 [J]. 現代信息科技,2023,7(12): 62-65.
[5] 李春梅,張揚,陳靜雪,等 . 人臉識別與高校學生考 勤系統 [J]. 科技視界,2022(28):25-27.
[6] SCHROFF F,KALENICHENKO D,PHILBIN J. FaceNet:a unified embedding for face recognition and clustering[C]//2015 IEEE Conference on Computer Vision and Pattern Recognition(CVPR). Boston,MA:IEEE, 2015:815-823.