王寶旭 楊會玲 何烊波 張剛 周石柱 葉利華



摘要:本文旨在開發一套防范因關窗疏忽導致兒童墜樓危險的窗戶智能防護系統,擬采用人臉檢測、年齡段識別、單目深度估計等人工智能技術檢測兒童靠近窗戶并自動關閉來規避危險事件的發生,提升智能家居安全水平。
關鍵詞:兒童安全;人臉檢測;深度學習;年齡段識別;單目測距
中圖分類號:TP399 文獻標識碼:A
文章編號:1009-3044(2020)19-0065-02
開放科學(資源服務)標識碼(OSID):
1 引言
近年來,兒童在居住場所意外墜樓事故頻頻發生,除了大人疏于看護等主觀原因,高層住戶窗戶缺乏防護欄等安全設施也是一個重要的因素。為了避免悲劇重演,家長須提高兒童安全監管意識,同時應做好防護措施。為了盡可能消除窗臺存在的隱患,開發一套自動預防兒童墜樓監護系統實有必要[1]。目前,市面上已經存在智能窗系統,但其主要功能集中在防盜、放劫、防雨等方面[2],并沒有專門針對檢測與保障家中兒童安全的窗戶。因此研發一種新型的多功能兒童安全防護智能門窗成為智能居家與安全保障的發展趨勢[3]。
2 系統構架與設計
兒童室內安全智能門窗防護系統由終端設備、服務端和APP端組成,如圖1所示。該系統的硬件部分是一款基于人臉檢測、年齡識別、單目圖像深度估計來實現兒童識別的終端設備,它是兒童室內安全智能門窗防護系統中的重要部分,主要包括兒童檢測、警報功能、單目測距、智能開關、數據記錄模塊等功能。服務端有云端數據控制,用戶終端控制等功能。系統基于tensorflow設計分類大腦,使用OpenCV對采集的圖像進行預處理,然后采用人臉檢測、年齡識別、單目圖像深度估計等算法進行風險評估。
3 系統功能實現
3.1 終端技術實現
終端部分基于深度學習的人臉檢測、年齡段識別、單目圖像深度估計等人工智能算法為核心,實現門窗的自動開閉操作[4]。
終端運行流流程如下:
1)終端開啟后,硬件完成初始化,從服務器獲取設置;
2)通過攝像頭不斷地采集數據,將圖像輸入到服務器端;
3)通過圖像處理與識別判別是否是兒童,再判斷風險;
4)如果有危險就會發送關窗和警報信號,并將此事件上傳服務器存檔。
圖像處理與識別運行流程如圖2所示。人臉檢測判斷是否有人,如果有人,再通過年齡段識別判斷是否是兒童,如果是兒童,再通過行為預測和深度估計進行分析是否有危險。用戶通過APP端查看終端設備的運行記錄,如窗戶自動通風記錄、窗戶自動防護記錄等信息。也可以設置住戶人臉、警戒距離、警報設置、自動防護等終端功能,通過服務器傳輸到終端來設置終端的相應功能。
年齡段識別由人臉檢測和年齡識別兩個部分構成。1)人臉檢測:通過攝像頭輸入的圖像,不能直接拿來進行操作,由于受到各種環境,拍攝角度,人物姿態,表情等因素,需要對圖像進行人臉檢測[5],找出圖像中人臉的具體位置,并將人臉提取出來。通過多任務學習方法[6],將人臉檢測分為三步(如圖3所示)。通過三次卷積計算實現由粗到細的生成結果,其中Pro-posal Network(P-Net)的全卷積網絡,以此來獲得候選人臉窗口及其邊框的回歸向量并采用非極大值抑制(Non-maximum sup-pression,NMS)進行合并;Refine Network(R-Net),對上一階段得到的所有候選框進行篩選;Output Network(O-Net)輸出最終的人臉對象框,并輸出五個面部特征點的位置(如圖4所示)。在進行人臉對齊之前,需要對圖像中的人臉的關鍵點進行檢測。通過對人臉進行映射或仿射變化,得到正臉人臉圖像。2)年齡識別:年齡識別通過采用深度學習對人類進行學習并進行估計,直接輸出估計的年齡結果。
深度估計基于深度學習單目估計方法,其原理是利用像素值關系反映深度關系,通過是擬合一個函數f把圖像I映射成深度圖,利用函數映射關系從像素值中恢復出相對深度值[7]。
3.2 服務端實現
服務器端主要使用Html、css、Javascript、Java和Mysql等技術共同開發完成,服務端和APP端之間通過Socket建立連接,進行通信。首先ServerSocket將在服務端監聽某個端口,當發現APP端有Socket來試圖連接時,accept該Socket的連接請求,同時在服務端建立一個對應的Socket與之進行通信。服務器端記錄用戶和設備信息,并將記錄上傳到服務器的終端設置、識別數據、警報記錄等,用戶可以隨時在APP端查看這些數據信息。
4.3 結果分析
4.3.1 訓練模型
通過在互聯網上采集4萬張兒童圖像構建模型訓練數據集,數據包括兒童及非兒童兩種類型,如圖5測試庫部分樣例所示,其中圖集a是兒童樣例,圖集b為非兒童圖集。訓練中,通過隨機抽取其中的60%用來訓練模型,30%用于測試模型,剩余的10%用于驗證模型。
我們首先基于DCNN深度卷積網絡模型對圖像進行特征提取嘲,模型的各卷積層配置如圖6所示。
利用該模型對圖像進行特征提取,如圖7(a)所示;圖像與Sobel-Gx卷積核的卷積結果如圖7(b)所示;Sobel-Gy卷積核卷積層所得到的最終結果如圖7(c)所示。
4.3.2 實驗對比
由于三層不同卷積核操作之后的感受野不同,人臉在圖像中的大小不一。隨著卷積層數的逐漸增加,感受野的范圍在逐漸擴大。卷積神經網絡通過這種層層推進的方式,每一個卷基層都能學習到不同的特征,最后實現相關的識別、分類功能。為了驗證卷積核大小對測試精度的影響,本文設計了四種卷積核進行測試,四種卷積核大小的不同組合下的實驗結果如表1所示:
上述實驗結果表明,模型中的卷積核大小對識別準確率有較大影響,相同卷積層數的情況下,每層卷積核越大,識別精度越高。在保證性能相差不大且CNN規模較小的考慮下,本文將網絡的結構改進為三層卷積核為5*5的卷積層。
4.3.3 識別示例
為了消除指標之間的量綱影響,實驗中對數據標準化處理,解決數據指標之間的可比性。原始數據經過數據標準化處理后,各指標處于同一數量級,再進行綜合對比評價。實驗結果如圖8所示。
5 結束語
針對目前兒童意外墜樓事故頻頻發生的問題,本文設計了兒童安全智能門窗的防護系統,有效解決兒童門窗安全防護問題。隨著生活方式的改變,兒童安全智能門窗的防護系統在生活中有著越來越重要的作用。新型的多功能兒童安全防護智能門窗必將成為智能居家與安全保障重要組成部分。
參考文獻:
[1]錢坤,馬淑文.家用超聲波兒童防墜樓監護系統[J].大眾科技,2016,18(7):26-28.
[2]不公告發明人.一種基于物聯網的智慧安防數據系統:CN110471346A[Pl. 2019-11-19.
[3]鄧輝.建筑智能門窗及技術發展分析[J].門窗,2017(4):32-34.
[4]林水清,林泰立,趙寶田,梁聰偉.門窗開關裝置:CN207332598U[Pl. 2018-05-08.
[5]譚萍.人臉識別門鎖:CN205680149U[P]. 2016-11-09.
[6]湯旭.基于深度學習的跨年齡人臉識別[Dl.北京:中國科學院大學,2017.
[7]席林,孫韶媛.基于SVM模型的單目紅外圖像深度估計方法:CN102708569A[P]. 2012-10-03.
[8]許路,趙海濤,孫韶媛.基于深層卷積神經網絡的單目紅外圖像深度估計[Jl-光學學報,2016,36(7):0715002.
[通聯編輯:唐一東]收稿日期:2020-03-15
基金項目:浙江省新苗人才計劃項目(編號:2019R417037);國家級大學生創新創業訓練計劃項目(編號:201910354027)
作者簡介:王寶旭(1999-),男,主要研究領域為人工智能;楊會玲(1998-),女,主要研究領域為圖像處理;何烊波(1999-),男,主要研究領域為人工智能;張剛(1999-),男,主要研究領域為軟件工程;周石柱(1997-),男,主要研究領域為軟件工程;葉利華(1978-),男,主要研究領域為機器學習。