胡 銳,袁海峰,芮 忠
(蘇州科技大學信息化建設與管理中心,江蘇 蘇州 215009)
個人的熱舒適度是影響用戶對室內環境總體滿意度的重要因素之一。在一份對215 座辦公大樓用戶舒適性的調查報告中顯示,只有39%的受訪者對其工作環境感到滿意[1]。有研究表明,一些來自室內環境的不適因素會導致用戶的工作表現顯著下降[2]。在經濟發達的城市中人們大約有90%以上的時間都待在室內[3]。因此,室內環境對人們的身心健康有著深遠的影響[4]。
熱舒適度被定義為一種表達對所處熱環境滿意程度的心理狀態[4]。人們的熱舒適度不僅取決于溫度、濕度等環境因素,還包括生理因素(如性別和心率)、心理因素(如壓力和心態)、行為因素(如活動水平和著衣水平)等多方面[5]。因此,人們的熱舒適度因人而異。例如,性別已被證明與熱舒適度密切相關,而之前的研究表明,在辦公室里,女性比男性更喜歡相對較高的溫度[6]。此外,由于氣候背景的差異,即使在中國,南方人和北方人在熱舒適度上也有顯著的區別[7]。
在大多數的辦公建筑中,管理員通常根據行業指南(ASHRAE)來選擇中央暖通空調的設定值。然而,由于多個原因,將暖通空調設定為固定值的傳統策略不太可能同時滿足多個用戶的熱舒適度。首先,房間內的空氣溫度是不均勻的,基于固定值的暖通空調送風策略無法保證房間內的不同地點的空氣溫度保持在設定溫度,并且坐在風口附近或陽光直射下的人可能會有不同于其他人的熱感覺。最后,僅以室內溫度作為熱舒適度的唯一指標,不足以反映用戶的熱舒適感受。此外,有幾項研究表明,即使室溫是根據推薦的室內條件設置的,用戶對室內溫度環境的不滿意率仍然很高,這反映了人們實際的熱舒適度和預測的熱舒適度的不一致[8]。
預測平均投票(PMV)模型是最常用的評價熱舒適度的方法[9],PMV 模型考慮了4 個環境因素:空氣溫度、相對濕度、空氣速度和平均輻射溫度,以及兩個人為因素:人體新陳代謝率和衣服等級,以7 分制(從冷到熱)預測用戶的平均熱感覺。在ISO 7730 中,PMV 作為標準的熱環境指標,并將PMV=0 內作為舒適區域。但是,該舒適區域是在人體舒適或接近舒適的情況下推導得到的,并沒有考慮到用戶衣著等外在環境的影響。此外,PMV 模型是在實驗室環境下基于人的反饋建立的,并且在PMV 模型中的人為因素中假設所有受試者都是相同的,而不考慮個人差異。這可能導致實際和預測的熱舒適度之間存在一定的差異[10]。因此,在偏離舒適狀態時,PMV 會與實際值偏差較大,并且PMV 指數將人體視為一個整體,對預測穩態空調環境下的反應很有用,但不能預測瞬態反應[11]。
由于人們會在不同的情況和季節天氣穿著不同級別的衣服,且舒適區的冷熱邊界受濕度影響。在ASHRAE 標準中,基于不同著裝水平、濕度條件下,規定了80%久坐或輕度活動的人可以接受的熱舒適度條件或舒適區域溫度。從嚴格意義上來說,舒適感設計溫度應該考慮作用溫度而不是空氣溫度。在該標準下給出的舒適區溫度正是作用溫度。因此,以該標準來研究不同用戶的舒適度具有重要參考作用。
本文提出一個個性化的暖通空調控制框架,該框架能夠動態地確定最佳暖通空調設置,包含送風模式和溫度設置,減少人員參與。基于ASHRAE 標準中的舒適區域溫度,結合深度學習算法以及溫度預測模型來預測不同暖通空調設置下各個用戶所在的空氣溫度,最后依據評分模型選出最佳暖通空調設置。以現有會議室空間為例,驗證了該框架的可行性,并對結果進行了討論。
目前,在基于熱舒適度的暖通空調送風策略的研究中主要分為兩種:一種是基于人的反饋進行調節;另一種是基于人體生物信號進行調節。
基于人的反饋進行調節的方法主要分為兩類:基于PMV 的方法和不基于PMV 的方法。在基于PMV 的方法中[12-15],研究人員通過傳感設備和手機應用程序來收集用戶的熱舒適度反饋,決策模塊再根據PMV 模型或用戶的總體反饋來實時修正暖通空調的設定值。文獻[16]在PMV 的基礎上,通過構建熱舒適度模型,使用神經網絡進行暖通空調的設置。然而,這些基于PMV的方法存在著一定的局限性,比如需要假設穩態空調環境,不能預測瞬態反應,需要多個參數來估計PMV 模型(如平均輻射溫度、代謝率等),在實際使用中這些參數可能會與實際情況有較大的偏差。
在非PMV 方法中[16-18],研究人員通常使用從室內環境收集的數據來模擬用戶的熱舒適度,再根據行業準則(ASHRAE)推薦的設定值和模擬得到的用戶的熱舒適度值來實時修正暖通空調的設定值。文獻[19]使用傳感設備來獲得環境變量(如環境溫度、濕度等),基于用戶的熱舒適度反饋得到用戶的舒適溫度邊界,并根據該舒適溫度邊界進行暖通空調的設置。然而,這種基于所收集得到的用戶熱偏好(從冷到熱)的非PMV 方法也存在著一定的局限性,比如缺乏人體數據(如皮膚溫度、運動水平等),基于用戶反饋的方法可能存在時延,甚至無法滿足所有用戶的熱舒適度需求。
在基于人體生物信號進行調節的方法中[20-21],研究人員通過人體生物信號(如皮膚溫度、心率)來評估實驗室條件下人體熱舒適水平。文獻[21]在三種環境條件下(微冷、中性、微熱)評估了參與者的整體熱舒適度、局部熱舒適度和平均皮膚溫度,以整體和局部熱感覺為因變量構建線性回歸模型,建立了人體熱舒適度預測公式,并根據人體熱舒適度預測公式進行暖通空調的設置。然而,由于基于人體生物信號進行調節的方法都是在實驗室條件下進行的,因此這些方法在實際使用中受限于環境和人為因素(如濕度、空氣流速和服裝等)的影響,對用戶熱舒適度的提高并不理想。
本文提出了一種新的個性化的暖通空調控制框架,該框架能夠利用人與環境的綜合數據來改善用戶的整體熱舒適度。本文研究的主要目的包括:
1)利用深度學習算法獲得用戶信息:如距離空調位置、穿著、姿態。
2)利用所獲得的用戶信息和環境信息,預測所有暖通空調設置模式下用戶所在位置的空氣溫度。
3)結合ASHRAE 標準得到的舒適區域溫度對所有暖通空調設置模式進行評價,選擇評分最高的暖通空調設置。
4)結合PMV 方法,對暖通空調固定設置模式和所開發的框架對多個用戶的熱舒適度方面的能力進行比較,證明所開發的框架在面對多用戶的場景下,可以針對性提高用戶的熱舒適度。
干球溫度Tdb是指人體周圍室內空氣的溫度,是從暴露于空氣中而又不受太陽直接照射的干球溫度表上讀取的數值。一般情況下,大多數行業準則建議的適宜溫度范圍為18~23 ℃,且室內的溫度差不能超過1 ℃。在久坐或近久坐的體力活動水平,即一般的辦公室活動的情況下,優化室內熱舒適度所需的適宜溫度范圍建議為19~28 ℃,且室內的溫度差不能超過1 ℃。根據不同季節人們的著裝不同,室內熱舒適度所需的適宜溫度范圍也會產生相應的變化。
平均輻射溫度TMR是指環境四周表面對人體輻射作用的平均溫度,且房間里所有的表面都被認為是均勻的黑色,其數值可由各表面溫度及人與表面位置關系的角系數確定或用黑球溫度計測量。平均輻射溫度還可以通過人體的6 個方向(上、下、左、后、前、后)的平面輻射溫度和6 個方向對應人體的投影面積計算出來。對于站著的人,平均輻射溫度可以通過公式(1)估計:
對于坐著的人,平均輻射溫度可以通過公式(2)估計:
作用溫度由空氣溫度、平均輻射溫度和空氣速度得到,反映環境對人體的熱作用溫度。它被定義為在一個均勻的黑色內表面的空間中,人體之間通過輻射和對流交換的熱量與實際非均勻環境中人體的干熱損失相等的溫度。作用溫度表示空氣溫度與平均輻射溫度兩者對人體的熱作用,可認為是室內氣溫與平均輻射溫度在某一系數下的加權平均值。作用溫度的簡化表達式為:
服裝熱阻值Icl是指熱量在單位面積的服裝上傳輸時,該服裝兩端溫度差與熱源功率的比值,即一個人所穿衣服的保溫量,單位為clo(1 clo =155 m2·°C·W)。一個人整體的服裝熱阻值可以用求和公式從單個服裝熱阻值中估計出來,服裝熱阻值表達式為:
式中Iclu,i是服裝i的有效熱阻值。
部分服裝熱阻值如表1 所示。

表1 服裝熱阻值
在本文的研究中,利用深度學習技術提取用戶信息,再結合深度強化學習算法和評價模型組成的評價系統得出暖通空調最優送風設置。所提出的暖通空調智能調控框架的工作流程如圖1 所示。

圖1 暖通空調智能調控框架
在室內按照和暖通空調的不同距離來布置溫度傳感器,且傳感器距離地面距離為1 m,暖通空調每一個小時換一次送風設置,溫度傳感器每10 min 采集一次數據,并將采集到的數據放入神經網絡中訓練。某一溫度傳感器在10 min 內采集的數據如圖2 所示。

圖2 溫度傳感器數據圖
分析所有溫度傳感器采集的數據可以發現,離中央空調中心位置相等距離的溫度傳感器在同一時刻采集到的溫度相差在0.1 ℃以內。因此可以使用與中央空調中心位置的距離代替傳統的平面位置表示,即用單一參數距離d代替平面坐標系表示位置信息。這樣不但降低了表示用戶實時位置的難度,而且減少了參數個數,從而減少了模型訓練的時間。
基于深度強化學習網絡(DQN)的溫度預測網絡設置為:輸入層包含2 個神經元,對應用戶距離d和距離為d處的空氣溫度t,中間層為3 層,各包含200、300、500 個神經元,輸出層為270 個神經元,對應270個暖通空調設置動作。基于對ASHRAE的推薦送風設置和舒適度的研究,所選擇暖通空調設置為:溫度區間19~28 ℃風量設置為[1,2,3],橫向風向3個[左,中,右],縱向風向3個[上,中,下],共組成270個暖通空調設置動作,預測精度為0.1。所構建的基于DQN 的溫度預測結構如圖3 所示。

圖3 基于DQN 溫度預測結構
圖3 中:s表示所采集得到的信息,包含用戶距離d和距離為d處的空氣溫度t;a表示暖通空調設置動作;t′表示對應暖通空調設置動作下距離為d處所測得的10 min后的空氣溫度;T(s,a;θ)為目標值網絡所預測的溫度,也是訓練好后的網絡輸出值;T(s,a;θ-)為當前值網絡所預測的溫度,誤差函數為(t′-T(s,a;θ-))2。
基于DQN 的溫度預測網絡的流程如算法1 所示。
算法1:基于DQN 的溫度預測算法

利用采集的數據同時訓練一個BP 神經網絡來預測距離為d處的空氣溫度,即在暖通空調智能調控框架中BP 神經網絡向DQN 網絡傳遞當前距離為d處的空氣溫度。所構建的BP 神經網絡的結構為:輸入層包含6 個神經元;對應用戶距離d和距離為d處的空氣溫度t;空調設置溫度、風量、橫向風和縱向風(其中風量、橫向風和縱向風的設置使用1、2、3 進行數字化)。中間層為3 層,各包含100、200、100 個神經元;輸出層為1 個神經元,對應10 min 后距離為d處的空氣溫度t′。
1)用戶距離
所采用的攝像機為標定后的雙目像機,并且將雙目相機安裝在與空調在一條水平直線上的位置。基于雙目測距原理,可以得到用戶與相機的距離dc。為了獲得更好的視野圖像,雙目像機在安裝時存在一定的俯角β,因此用戶距離雙目相機的水平距離dcl根據勾股定理可得:dcl= sinβ·dc。測得雙目相機距離中央空調的水平距離dct,從而推導可得用戶與中央空調的水平距離d=|dcl-dct|。
2)用戶穿著和姿態
使用香港中文大學開放的一個large-scale 數據集DeepFashion 作為訓練集,基于CNN 網絡進行訓練分類。從雙目像機中獲取單幀圖像,針對不同的用戶進行圖像分割,將分割出來的每一個用戶的圖像放入訓練好的網絡中進行識別,從而獲得該用戶的穿著。在本文中識別用戶衣著的種類為10 種(例如:短袖T 恤、長裙、牛仔褲、短裙、長袖T 恤等)。
從公開人體姿態數據集(MPII Human Pose Dataset)中選取人體姿態為站立和坐下的圖片作為訓練集,基于CNN 網絡進行訓練分類。從雙目像機中獲取單幀圖像,針對不同用戶進行圖像分割,將分割出來的每一個用戶的圖像放入訓練好的網絡中進行識別,從而獲得該用戶的姿態。
在本文中對于無法準確獲取的用戶穿著和姿態信息,采用默認值填充,用戶穿著的熱阻值默認為0.5 clo,用戶姿態默認值為坐。
以行業準則(ASHRAE)來評價各送風模式,圖4 為行業準則(ASHRAE)給定的不同衣服熱阻值、濕度條件下的推薦操作溫度T0。

圖4 推薦操作溫度
根據濕度傳感器的值,結合圖4 得到衣服熱阻值為1 clo 和0.5 clo 的推薦操作溫度的邊界,再根據3.2 節得到的用戶穿著,結合公式(4)得到用戶的衣服熱阻值,最后根據得到的用戶的衣服熱阻值結合式(5)、式(6)來調整推薦操作溫度的邊界[Tmin,Icl,Tmax,Icl]。根據3.2 節得到的用戶姿態,結合式(1)、式(2)得到該用戶相應的平均輻射溫度TMR,通過公式(3):,推出對應的舒適空氣溫度為:Tair= 2*T0-TMR,進而得到對應的舒適空氣溫度范圍為。
研究表明,在行業準則(ASHRAE)給定的推薦操作溫度范圍內,根據ASHRAE 熱感覺量表(見表2),在較暖區邊界附近,人會感到+0.5 的熱感覺;在較冷區域的邊界附近,人可能有-0.5 的熱感覺。在該規定區域的中間,一個穿著規定衣服的人會有一個非常接近中性的感覺。因此將所得推薦操作溫度范圍的中間值作為最佳操作溫度T*。最終構建的評價函數為:,Ri為其中一個用戶的獎賞,表達式為:

表2 ASHRAE 熱感覺量表
通過評價模型對所有暖通空調的送風模式進行評價,最終選取總獎賞r最高的送風模式作為最優送風模式。為了系統的穩定性,只有當該最優送風模式的獎賞高于上一個設定送風模式的獎賞10%時,才會將該最優送風模式發送給暖通空調系統。
本文使用一臺電腦代替決策模塊,并通過Python 腳本控制定制的紅外發射器,進而控制暖通空調系統。這種控制方法不涉及暖通空調系統的細節,不需要對現有的暖通空調系統進行改造,可以極大地減少開發和測試決策算法的成本。
實驗地點選擇為一個70 m2的會議室。會議室配有獨立的暖通空調單元和桌椅,并且安裝了雙目相機、溫度傳感器和濕度傳感器。數據收集發生在2019年6 月—7 月的夏季,且所有采集的數據都來自該會議室。
在該會議室進行了2 次對比實驗來驗證所提方法在提高用戶舒適度上的表現。實驗1 為暖通空調固定設置,設置為26 ℃,風量為3,橫向風向為中,縱向風向為中;實驗2 為本文所述暖通空調智能調控方法。實驗時保證2 次實驗的初始屋內濕度(40%)和干球溫度(30 ℃)一致,且各進行1 h。共選取20 個參與者參與實驗,其中男性10人,女性10人。所有參與者可以自由在室內活動,試驗期間,會議室門窗處于關閉狀態。每個參與者被要求每10 min 通過手機提供反饋:舒適、一般、不舒適。考慮到數據的穩定性,參與者被禁止打開門窗。
用戶的舒適度采用2 個指標來表示:
1)基于模型的舒適度指標,即空氣溫度是否在模型得到的舒適空氣溫度區域內。
2)基于參與者的舒適度指標,即根據所有參與者的反饋。
參與者的舒適度每10 min 采集一次,在實驗結束后記錄暖通空調的用電量。
實驗1 暖通空調固定設置的參與者感覺舒適的人數結果如圖5 所示,實驗2 暖通空調智能調控方法的參與者感覺舒適的人數結果如圖6 所示。

圖5 暖通空調固定設置

圖6 暖通空調智能調控
從圖5 和圖6 的對比中可以看出,在暖通空調固定設置下,無法滿足所有參與者的熱舒適度,本文所述的智能調控方法可以比固定暖通空調花費更少的時間來滿足大部分參與者的熱舒適度,并且在30 min(基于模型30 min)的時候(基于參與者40 min),就滿足所有參與者的熱舒適度。在2 次實驗中,由于參與者個體的差異,基于參與者反饋的熱舒適度要比基于模型的舒適度低。
本文對基于熱舒適度的暖通空調送風策略進行了綜合評述,并提出了一種能在不同的環境和用戶行為的情況下確定最佳的送風設置和溫度設置的暖通空調控制框架。通過深度學習技術獲取用戶行為信息,結合深度強化學習算法和相關行業準則(ASHRAE)得到暖通空調智能送風策略。最后,實驗證明這些額外的用戶行為信息可以顯著提高用戶的熱舒適度,相比傳統暖通空調固定設置可以滿足多用戶情境下的熱舒適度要求。