彭 誠
隨著我國城鎮化水平的不斷提高,城市用地日趨緊張,為了提升土地利用率,城市中高層建筑數量急劇增長[1].高層建筑中電梯需要長時間處于運行狀態,上下運行與中間停靠耗電量較大,消耗較多能源[2].巨大的電梯能耗已經成為當前人們關注的重點,為了降低電梯能耗,發展建筑節能技術,需要對電梯能耗進行有效的實時監測.
雖然現階段全國建筑能耗監測平臺已經運行了較長的時間,并獲取了海量的電梯能耗數據;國內外相關領域的研究也取得較為顯著的研究成果,但是目前的監管力度仍然不夠深入.為了更好實現電梯能耗監測,吳城汀[3]提出基于Euclid范數的電梯能耗評價新方法,采用二次拋物線函數擬合電梯運行能耗與試驗載荷的函數關系,對電梯運行工況進行分析.雖然該方法能夠實現對電梯能耗的有效預測,但是對電梯能耗監測的精度較低,與實際能耗有一定誤差.陳繼文等[4]提出基于ARM的綠色建筑電梯能耗遠程監測方法,實時采集電梯運行能耗數據,通過無線傳輸模塊與STM32控制板進行實時通信,實現電梯能耗遠程監測.雖然該方法能夠為電梯能耗評估提供可靠的依據,但是對于電梯能耗的計算過程耗時較長,降低了實際的運行耗時.為了解決現有方法的不足,更好地實現現代建筑中電梯能耗的實時監測,本文基于K-means聚類算法和BP神經網絡算法,提出一種新的電梯能耗實時監測方法.該方法先清洗能耗數據,提取影響建筑能耗特征值,然后利用相似系數法計算相似度,對相似電梯能耗數據進行小波分解,得到高低頻序列.最后針對低頻部分采用LSSVM-GSA檢測方法處理,而高頻部分采用均方加權處理方法,將兩個結果重構,得到最終監測結果.仿真實驗結果表明,所提方法能夠有效提升監測精度,減少監測用時,同時能夠保證監測過程的穩定性.
由于電梯能耗數據之間關聯性較強,所以無法單純從任何角度出發證明隨機一個能耗數據為異常數據,需要構建各數據之間的關聯矩陣,對不同數據之間的關聯進行深入分析.雖然BP神經網絡的整體性能比較好,但是在樣本數量較多且十分復雜的條件下,算法會出現計算速度慢、計算誤差較大等問題.而K-means聚類算法能夠針對各種不同類型的數據進行模塊化分類,將相似度接近的數據集進行統計.由于數據的來源、種類不同,導致數據間的差異性也更大.為了進一步完善BP神經網絡算法的性能,需在算法中加入K-means聚類算法.將聚類后的數據集作為BP神經網絡的訓練樣本,使其能夠獲取更加準確的數據清洗結果,同時更好實現數據間的映射.研究結合上述兩種算法對電梯能耗進行清洗,全面提升訓練質量,其中電梯能耗數據清洗的具體操作流程如圖1所示[5-6].

圖1 電梯能耗數據清洗流程圖
優先對不同類型的電梯能耗數據進行分類處理,結合分類結果進行閾值設定,確保最終聚類結果的準確性.將經過聚類處理后的樣本設定為神經網絡的訓練樣本,分析不同屬性之間的關聯性,構建屬性間的映射關系,進而得到網絡模型;將初始電梯能耗數據進行聚類處理,在對應的子網絡模型中輸入聚類處理后的數據,對其進行修正檢測.
將物理或者抽象幾何劃分為相似對象的過程稱為聚類,聚類屬于一種無監督方法.Kmeans聚類方法主要用來解決經典的非線性劃分問題.以下是通過K-means算法對樣本進行分類的具體操作步驟.

式中:n代表樣本的維數,即樣本歸屬和其相似度最高的集合.
當公式(1)成立,則樣本xi所處樣本集為wj,xi∈wj,通過閾值ε對樣本集與聚類中心之間的相似度進行更新:
對數據集的聚類中心進行更新,則有:
式中:m代表樣本集wj中的樣本數量.如果滿足公式中的條件,則停止聚類操作:

當對電梯能耗數據進行挖掘時,會出現部分性質相對比較特殊的數據,同時這部分數據的屬性行為也十分不協調,會使數據逐漸轉換為離群點.如果聚類算法初始聚類的選擇是通過電梯能耗數據完成的,最終獲取的數據中心可能會成為離群點,同時和實際聚類中心存在較遠的距離.為此,當對不同類型的電梯能耗進行聚類處理時,需要優先對各個數據集的離群點進行分析.
針對各個連續變量而言,需要優先通過最小二乘法求解最小誤差平方和最佳函數,同時進行匹配.另外,還需要引用最小二乘法對未知數據進行求解,確保最終求解結果和真實結果更加接近.因此采用最小二乘法擬合Sandia最終形成典型的電梯能耗年變化曲線,進而獲取能耗的年變化規律.將兩次獲取的能耗值均方差設定為閾值,利用閾值對聚類中心的離群點進行檢測,同時將離群點加入到對應的簇中.設定坐標系的橫軸為時間,縱軸為能耗,經過繪制得到能耗的分布變化曲線.由于得到的曲線和正態分布相近,需要借助正態分布曲線估計方法進行計算分析,具體的計算式為:
式中:μ代表平均值;σ代表方差.利用f(x)函數進行對數選擇,則能夠獲取式(6)的計算式:
令F(x)=Inf(x),則有:
通過最小二乘法逼近F(x),獲取式(8)形式的方程組:
式中:a0、a1和a2代表方程組的參數.
其中,計算能耗的均方誤差能夠表示為:
BP神經網絡是由輸入層、隱藏層和輸出層等組成[7-8].各個層通過神經元連接,通過逐層連接,信息可以從輸入層逐層傳遞到輸出層,形成整個神經網絡的運算過程.其中,網絡訓練主要劃分為正向和反向兩個步驟,具體的操作步驟如下:
①輸入矩陣X進行歸一化處理,則有:
式中:Xi代表歸一化處理結果;min(X)代表輸入矩陣的最小取值范圍.
②誤差正向計算.
設定網絡中含有n個輸入樣本,第i個輸入樣本為xi.當xi輸入到網絡中,則輸出的總誤差計算式為:
式中:yi代表網絡的實際輸出;y*i代表網絡的期望輸出.
③通過反向傳遞進行權值修正.
設定隨機兩個神經元之間的連接權值為wq,求解總誤差關于wq的梯度:
式中:W代表誤差平均值.
在上述分析的基礎上,將K-means算法和BP神經網絡算法進行有效結合[9-10],彌補兩種算法的不足,實現樣本訓練,同時構建網絡模型,獲取不同數據源之間的映射關系,最終完成數據清洗.
電梯能耗的變化和建筑內人員的活動存在密切關聯,建筑內人員的活動會對電梯的能耗產生影響,使得電梯能耗會在一定周期內出現有規律的變化.高峰時段人員進出頻繁,電梯的使用次數增加,從而導致電梯能耗上升;而在低谷時段,人員活動減少,電梯的使用次數減少,從而導致電梯能耗下降.其中,相似日的選擇能夠劃分為兩個部分,一部分是將能耗影響通過已經設計好的標準映射成對應的特征值,組建特征向量;另外一部分則是通過預測日相似程度確定相似日.設定存在n個樣本日,同時各個樣本日中都含有m個主導影響因素,則對應的特征向量能夠表示為:
式中:xi(m)代表第m個影響因素的特征值.其中,第n個樣本的特征向量矩陣可以表示為:
將任意兩個特征的相似度標記為rij,則相似度矩陣能夠表示為:
式中:R代表相似度矩陣.
在上述分析的基礎上,構建電梯能耗實時監測模型[11-12],具體的操作步驟如下所示:
①通過電梯能耗影響因素構建指標映射數據庫,選取各個指標的映射標準值.
②通過相似度計算方法獲取歷史日和近似日的相似度,同時選擇相似日.
③對步驟②中選取的相似日進行小波分解,獲取高低頻部分.
④通過LSSVM-GSA對低頻部分進行監測,同時將全部輸入和輸出數據進行歸一化處理.
⑤高頻部分主要采取均方加權方法進行處理.
⑥將低頻序列監測值和高頻序列監測值進行小波重構,獲取最終的監測結果.
為了驗證所提電梯能耗實時監測方法的有效性,需要進行仿真實驗測試.將文獻[3]提出的基于Euclid范數的監測方法、文獻[4]所提基于ARM的監測方法作為對比方法,與本文所提方法共同進行測試,以下為具體實驗分析結果.
實驗選H城市的某SOHO區域作為研究對象,重點對2016年至2020年的該區域的電梯能耗監測結果進行分析研究.利用圖2給出文獻[3]方法、文獻[4]方法和本文所提方法的電梯能耗監測值和實際值的對比結果,圖3給出監測結果的精度變化情況.

圖2 不同方法的電梯能耗監測結果對比

圖3 不同方法的電梯能耗監測精度對比結果
分析圖2中的實驗數據可知,三種方法的能耗監測值和真實能耗值存在不同程度的差異,但是相比另外兩種方法,所提方法的電梯能耗監測值和真實結果更加接近.圖3中的實驗數據也更加全面地證實了所提方法的優越性,能夠獲取較為準確的監測結果.
為了進一步驗證所提方法的性能,在不同條件下,實驗測試重點對比文獻[3]方法、文獻[4]方法和本文所提方法的監測用時,具體實驗結果見表1.

表1 不同方法的監測用時對比結果
分析表1中的實驗數據可知,由于測試對象和測試輸入參數維度的不同,致使各個方法的監測用時存在十分明顯的差異.但是相比另外兩種方法,所提方法的監測用時明顯更低一些,主要是因為所提方法在實際監測的過程中,增加了數據清洗環節,有效避免各種冗余數據導致監測用時增加.
為了驗證所提方法是否能夠穩定運行,實驗在均方根誤差和最大相對誤差絕對值不同的情況下進行穩定性測試,具體實驗結果見圖4和圖5.

圖4 不同均方根誤差下各個方法的監測穩定性變化情況

圖5 不同最大相對誤差絕對值下各個方法的監測穩定性變化情況
分析圖4和圖5中的實驗數據可知,隨著均方根誤差和最大相對誤差絕對值的增加,各個方法的監測穩定性呈下降趨勢,但是相比另外兩種方法,所提方法的下降趨勢更加緩慢,監測穩定性更好一些.
為了更好完成能耗監測,提出基于K-means聚類改進BP神經網絡的電梯能耗實時監測方法,先對能耗數據進行清洗,提取影響建筑能耗的特征值.然后使用相似系數法計算相似度,并對相似電梯能耗數據進行小波分解以獲取高低頻序列,最后分別處理高低頻數據,并將兩者結果重構,得到最終的監測結果.仿真實驗結果表明,所提方法能夠有效提升監測精度,降低監測用時,同時獲取更加穩定的監測結果.但是由于受到人為和外界因素的干擾,致使所提方法仍然存在一定的不足,后續將對其進行深入研究和完善.