





摘 要:傳統的感知控制系統是在單一的傳感器數據基礎上實現的,其粗粒度的數據結果無法用于對實際環境中人員活動情況的檢測。針對該問題,通過布置樹莓派智能采集系統感知環境數據,分析并建立了綜合的活動感知模型。分布在不同關鍵位置的樹莓派Pico采集器將分散的檢測數據發送給樹莓派進行收集匯總,其中包括環境光照、溫濕度、噪音、人體活動、照明、空調等方面的數據。依據匯總的多傳感數據建立了數據模型,通過模型更新并找到了最優閾值,解決了由于不同采集工具的應用和采集位置的變化而導致的閾值差異問題。研究發現,采用多層神經網絡可以學習環境數據,實現對實驗室活動類型的精確甄別。該檢測系統實現了對實驗室環境的動態感知與智能管理,減輕了實驗室管理人員的工作量,優化了資源調配,減少了能源消耗。
關鍵詞:樹莓派;采集系統;檢測系統;傳感數據;神經網絡;實驗室環境檢測
中圖分類號:TP311.5 文獻標識碼:A 文章編號:2095-1302(2024)09-00-04
DOI:10.16667/j.issn.2095-1302.2024.09.009
0 引 言
傳統的感知控制系統是在單一的傳感器數據基礎上實現的,其粗粒度的數據結果無法用于對實際環境下人員活動情況的檢測[1-2]。攝像設備因其數據的敏感性在部署位置上受限。目前,以神經網絡預測熱舒適指標PMV作為空調控制系統的核心控制目標,正受到業界的廣泛關注。然而,當前以PMV為關鍵指標的控制系統存在一些顯著的不足,主要是由于PMV的預測精度不高以及參數取值的不精確性所導致。因此,系統存在應用場景單一、應用范圍小、預測控制結果差等問題[3]。受神經網絡在視頻預測[4]領域應用的啟發,為突破單一傳感數據的局限,團隊在教室、實驗室、自習室等公共場所布置了智能數據采集系統,旨在構建一個綠色、智慧化的校園。實施采集數據包括環境光照、溫濕度、噪音、人體活動、照明、空調等方面的數據。樹莓派作為實驗室服務節點與多個Pico采集器以藍牙通信的方式進行組網。分布在不同關鍵位置的樹莓派Pico采集器將分散的檢測數據發送給樹莓派收集并匯總,進而控制電器,同時輔以攝像頭進行遠程圖像傳輸和人體活動識別。目的是為有效識別場景中的人體活動情況,提供智能節能管理和環境健康分析等服務。
1 背景與挖掘目標
高校的教室、實驗室、辦公室等環境所配備的空調、計算機等都是耗能量比較大的設備。如果沒有管理人員的時刻看護和管理,很容易造成能源浪費。高等院校肩負著培養人才、科學研究、社會服務和文化引領等多重任務,在環境友好型社會的發展進程中應發揮引領作用[5]??紤]到高校節能減排的必要性,本文特別研發設計了一款基于樹莓派的數據采集系統。它可以通過實時采集環境光照、溫濕度、聲音發生頻次、人體運動情況等數據,建立數據模型,進而實時檢測教室或辦公環境中的人員活動情況,檢查是否存在電器設備比如空調、計算機等過度耗電的情況。通過構建基于指標加權的用電分析模型,實現智能節電的目標。
2 分析方法與過程
在智能采集終端獲得的環境數據中,光照、溫度、人體活動情況等數據可以作為判斷教室實際使用事件的依據。根據采集到的數據確定一次完整的教室使用事件以及上課、考試或維護等事件。
如圖1所示,建模的總體流程如下:
(1)有選擇地提取教室中的歷史功耗數據并構建專家
樣本;
(2)對形成的數據集進行數據探索分析和預處理,包括探索人員活動時間間隔的分布,指定冗余屬性,識別收集數據中的缺失值,處理缺失值,并根據建模需要構建屬性;
(3)構建教室使用事件識別模型并分析和優化;
(4)調用模型,自動識別實時采集到的環境數據。
3 數據采集與抽取
在教室的日常使用過程中,教室的用途和環境會經常發生改變,比如上課或考試、理論課或實踐操作課、空調制熱或制冷等。為此,利用多個樹莓派Pico采集終端實現了多點采集,并設置數據匯總,目的是解決因終端采集頻率較高導致數據量大的問題。以每分鐘為一個時間片斷,對原始數據采用了無放回抽取,以一周的教室環境記錄作為原始建模數據。
依據人體舒適度相關性分析[6],確定樹莓派采集終端采集的教室環境數據包含以下8個屬性:時間戳、環境光照強度值、環境溫度值、環境濕度值、每分鐘聲音達到分貝閾值的次數、每分鐘有人體活動的次數、當前的時間、空調工作狀態下的電表電量。
4 數據探索分析
一次完整的未使用時段(即無聲音記錄且無人體運動記錄的時段)被視為一個用電時間間隔。當然,實際上在評估這種間隔時,不能只看一種數據,因為諸如光照等環境因素的顯著變化也很關鍵。教室兩次使用間隔時長一般為5~10 min。
排除一些考試和維護的時段,基本和教室上課時段一致。實驗統計了一周內的教室使用數據。教室使用頻次分布見表1所列。聲音達到分貝閾值的次數大致可以說明附近有頻率較高的活動。人體紅外熱釋電傳感器采集的人體活動數據會因風扇、室外風等影響而波動不太明顯[7],因此升級為毫米波雷達傳感器。
分析表1可知,每分鐘聲音達到分貝閾值的次數和人體活動次數變化很大。其中間隔時間為5~10 min時,每分鐘聲音達到分貝閾值50次、有人體活動的次數33次,可以判斷其為一次課間時間;每分鐘聲音達到分貝閾值60次且人體活動頻率較低時,分析其為上課時間;每分鐘聲音達到分貝閾值10次左右且人體活動次數在10次以下、光照變化也不劇烈時,可以認為無人員活動,進行節電操作。
5 數據預處理
教室使用事件包括:上課、考試、實訓、維護等。設計的目標為識別這些事件,需要從原始數據(包括理論課、實踐課、課間休息、考試和日常維護、有人意外經過)中識別哪些數據記錄是完整的課程事件;哪些是偶爾發生的事件,以便識別事件中的教室使用事件。一般情況下,判斷完整教室使用事件的關鍵因素是每分鐘聲音達到分貝閾值的次數和人體活動次數。在閾值優化模型中,為了提高在大量教室使用事件中發現正常事件的效率,建立了篩選規則,以消除非教學和維護等時間段的數據。數據變換流程:完整的教室使用事件劃分→劃分日常使用事件閾值尋優→屬性構造→篩選日常使用事件→得到建模數據樣本集。類似地,也要對其他傳感器數據,包括光照強度、溫度、噪音、電器使用情況等方面的數據進行篩選。下面以噪音和光照為例進行介紹。
5.1 完整的教室使用事件甄別
教室的各種環境數據被存儲在樹莓派智能終端,并通過網絡傳輸到數據中心,其中記錄了包括上課、考試、課間、維護清掃和無人使用等所有情況下的環境數據。而一次使用事件由數條甚至上千條的傳感器狀態記錄組成,所以首先要在傳感器數據集中甄別哪些連續的時間片段屬于完整的教室使用事件。
在教室使用狀態記錄中,若每分鐘聲音達到分貝閾值的次數、人體活動次數同時較低,則說明教室無人使用;而每分鐘聲音達到分貝閾值的次數較高、人體活動次數較低時一般為上課過程中。通常一次事件開始時聲音并不會太高并且間歇發生,事件開始時間往往在這之前。音量閾值可以通過傳感器設置,但間隔時間需要作為變量進行調整。假設單位時間按1 min計算,對在單位時間內環境音量達到傳感器設置的閾值的次數進行統計。單位時長內聲音達到分貝閾值的次數有連續且增強的一段區域可以判定為事件開始時間,對應的連續且減弱的一段區域可以判定為事件結束時間。這里的單位時間是一個重要的回歸模型系數。
完整的教室使用事件的劃分有以下幾步:首先是識別一次噪音和人體活動同時偏低的數據,記錄為M1;再按照順序識別接下來的第一條噪音和人體活動偏高的數據,記錄為M2,需要判斷任意一組連續數據(如從M1到M2之間)的時間跨度是否大于設定的時間閾值T,以避免前后兩次活動數據被劃分為同一事件。重復此過程,直至遍歷完整個訓練數據集的最后一條記錄。
從教室環境數據中梳理出一次完整的使用事件,截取每分鐘聲音達到分貝閾值的次數和人體活動次數超過閾值的記錄,將相鄰時間作差分。教室使用事件中的環境數據見表2所列。
5.2 教室使用事件閾值尋優模型
實際情況下實驗室的用途會發生變化,在不同位置收集的數據會存在偏差,固定時間閾值對于處理某些特殊情況也并不理想。存在一個使用過程被分成兩個事件,或者兩個事件被合并成一個事件的情況。為解決閾值變化問題,本文建立了閾值尋優模型來更新并尋找最優閾值,由此解決了因使用情況和采集位置變化而導致的閾值差異問題。光照的波動頻率一般呈現正態分布,可以用于驗證模型的準確性。當習慣框的位置趨于穩定時,表明當前閾值設定效果較好。同時穩定的變化趨勢和較小的斜率變化可以作為評估系統穩定性的關鍵特征。為了進一步提高分析的準確性,應去除噪聲數據,并計算斜率指數以量化這種穩
定性。
通過智能數據采集終端采集教室環境數據,并劃定合理的閾值和對應的事件數量。對教室使用數據劃分閾值進行尋優,變化區間在1~9 min。自動優化閾值后得到在此期間內教室使用事件劃分的最佳閾值為5 min。
構建教室使用情況的4個關鍵屬性指標:時長指標、頻率指標、教室的量化指標以及教室使用的波動指標。對一次教室使用事件抽取主要的環境數據,具體見表3所列。
6 數據預處理及變換
實際采集到的環境數據存在記錄缺失的情況,需要對缺失的數據記錄進行修正。在溫濕度、光照等傳感器啟動時需要進行預處理,這段事件通常是沒有記錄的。工作過程中出現的某些意外情況會導致采集到的數據不是實時有效數據。這可能是由設備故障、網絡中斷或進程調度異常等原因導致的,使得狀態記錄時間內的時間戳未能正確更新。針對這類問題,可以采用下一個時間戳對應的數據值進行修正。建模所需數據樣本示例見表4所列。
7 構建模型
BP神經網絡構建完成之后,要采用樣本數據對其進行訓練[8]。經過數據預處理后,得到教室日常使用日志,包括教室使用時間、結束時間等,然后通過多層神經網絡模型[9]來識別教室使用事件。由于日常使用事件在特征上與空閑事件不同,這些不同的特征體現在具體屬性上。因此,將收集的教室日常使用時的屬性數據作為訓練樣本,以訓練多層神經網絡。然后,根據訓練的網絡對新采集的數據進行測試,如圖2所示。
訓練事件識別網絡使用的訓練集來源于教室使用記錄。BP算法首先需要根據網絡預測誤差計算最后一層的學習信號,隨后逐層向上,依次計算倒數第二層直至第一層的學習信號。因此,算法也被稱為誤差反向傳播算法[10]。在計算完每一層的學習信號后,根據權重調整公式決定如何調整每一層的權重矩陣,最后更新所有層的權重矩陣。研究發現,擁有兩個隱藏層的神經網絡具有較好的訓練效果。
訓練后的神經網絡可以用于識別相應的教室使用事件。將前文所述的待檢測樣本的7個屬性作為輸入,設定輸出層的預期值范圍為±1。將測試數據代入上述模型進行實際測試。利用反向傳播機制訓練模型,進行模型優化時需要注意數據本身特征之間存在量級差異,需要進行標準化,以消除此差異,最后再對插值誤差進行估計。聚類之后可根據當前檢測的屬性值推測當前時間內的教室用途。
8 結 語
針對實驗室的管理問題,設計了一個易于使用和維護的管理系統。該系統結合多層神經網絡學習實現了對實驗室活動類型的精確甄別,隨著數據的不斷積累,其準確性穩步提高。該系統可以長期持續協助實驗室管理人員管理實驗室,甚至可以靈活添加新傳感器并遷移到其他使用場景,可以有效減少電力浪費,節約人力成本。
參考文獻
[1] NICOL F,STEVENSON F. Adaptive comfort in an unpredictable world [J]. Building research amp; information,2013,41(6):661-666.
[2]郭文強,董瑤,李清華,等. PSO-BP 神經網絡在開關柜設備溫度預測中的應用[J].陜西科技大學學報,2020,38(1):149-153.
[3]王玉濤,于金星,陳鑫,等. 基于樹莓派的自適應空調控制系統設計[J].物聯網技術,2020,10(10):76-78.
[4]曹潔,沈鈞珥,張紅,等. 基于小波和多維重構的BP神經網絡交通流短時預測[J].計算機應用與軟件,2018,35(12):61-65.
[5]劉發明,谷坤,王雪芹. 基于節能減排的高校節約型校園建設[J].節能技術,2010,28(3):229-231.
[6]王曉輝,劉靜蕾,邊會娟,等. 基于改進BP神經網絡的室內環境熱舒適度預測與分析[J].控制工程,2021,28(7):1437-1445.
[7]高學彬,張志強,葉世偉,等. 無線傳感器網絡中的被動式紅外傳感器模型研究[J]. 計算機應用,2007,27(5):1086-1088.
[8]連之偉,曹彬,杜衡,等. 建筑室內熱環境舒適區間確定方法[J]. 建筑科學,2022,38(8):9-14.
[9]王永亮.基于BP神經網絡數字識別技術的研究[J]. 山西電子技術,2021,49(5):77-80.
[10]鮑偉,任超.基于GWO-BP神經網絡的電池SOC預測方法研究[J].計算機應用與軟件,2022,39(9):65-71.
收稿日期:2023-09-26 修回日期:2023-10-24
基金項目:安徽商貿職業技術學院重點產學研項目:基于語音控制智能節能系統的研究(2021KZZ04);移動互聯應用技術專業教學團隊(2020jxtd093);AR及CoreML技術在古詩App“繪傳承”中的應用研究(KJ2020A1082);安徽商貿職業技術學院物聯網應用技術專業群(2020zyq29)
作者簡介:湯義好(1983—),男,講師,研究方向為軟件技術與人工智能。