關珊珊 管強 劉艷
(青島大學附屬醫(yī)院,山東青島 266000)
基于權重優(yōu)化復合聚類的空調控制研究
關珊珊管強*劉艷
(青島大學附屬醫(yī)院,山東青島266000)
為解決央空調控制過程中控制參數(shù)復雜,變量維數(shù)較高,多屬性數(shù)據點集中包含數(shù)值型屬性、類別屬性和混合型等多屬性結構的問題,本文針對工業(yè)環(huán)境下多屬性和多變量的特點,將模糊聚類算法與屬性加權優(yōu)化相結合,進而推導出優(yōu)化迭代公式并形成加權聚類算法,對于具體變量的相關屬性進行數(shù)學描述。仿真結果表明,該算法可以很好的處理相關多屬性約束條件下的變量聚類,結合模糊關系優(yōu)化混合屬性集的特征權重。和傳統(tǒng)算法相比,具有良好的正確率和分類邊界處理效果。
聚類屬性權值迭代可變加權
在進行數(shù)據挖掘分析時,對屬性權值進行優(yōu)化一直是十分重要的。常見的分析方法有過濾法[1]和包裝法[2],前者根據一個可解析的函數(shù)子集分類判別函數(shù)尋求可行特征子集或最優(yōu)特征子集,后者將分類算法的分類正確率作為目標子集的選擇判斷依據。
Matlin Sam uel[3]將特征選擇方法集成到分類和聚類算法中,提出了一個框架型結構的方法,但對于具體分類準則沒有界定;Xin Quan[4]對鄰域算法中的特例賦一定的權值以區(qū)分重要性,以使所構造的分類器分類效果更佳,但針對復雜環(huán)境下的多屬性變量沒有進行分析論述。
2.1屬性權值的自適應配置描述
設多屬性的m維空間R的某個區(qū)域內存在可構造C個聚類的數(shù)據集S={X1,X2,...,Xn},其中Xi={xi1,xi2,...,xim}∈R(i=1,2,...,n)描述第i個數(shù)據點在樣本空間中的位置。定義一個帶權值的"聚類"度量范數(shù),表征某單一屬性對聚類子集的不同反映和數(shù)據之間的差異性。即:
其中dk(xik,xjk)由第k個屬性類型決定。若其為無序類別屬性,定義為:
2.2基于屬性權值優(yōu)化的FCM聚類算法研究分析
[5]和[6],定義一個含有模糊隸屬度的模糊準則復合目標函數(shù):
從而復合目標函數(shù)為
可以看出,復合目標函數(shù)含有三個變量參數(shù),下面分別對這三個變量進行相關優(yōu)化計算。
2.2.1優(yōu)化權值因子
定義上述附加約束條件的優(yōu)化目標拉格朗日函數(shù)為
取其偏導數(shù)為0,可得
從而
2.2.2優(yōu)化隸屬度因子
定義帶上述約束條件的拉格朗日函數(shù)為:
令函數(shù)對各變量的偏導數(shù)為0,得到:
進而得到:
從而:
2.2.3優(yōu)化聚類中心
當屬性是有序屬性時,將目標函數(shù)改寫為
令目標函數(shù)對各變量的偏導數(shù)為0,得到:
從而得到:
條件:對于有序屬性進行合理歸一化的數(shù)據集S={X1,X2,...,Xn}和聚類子集個數(shù)c,初始化上述目標函數(shù)的特征權重向量W=(1,...,1,...,1)T(無先驗知識)或者W=(w1,w2,...,wm)T(有先驗知識),得到初始相異性度量d=(.,.)。
結果:數(shù)據點集S={X1,X2,...,Xn}的最終聚類結果S=C1∪...∪CK,最終的聚類中心點集V(0)={V(0)1,V2(0),...,Vk(0)}和最終的相異性度量d=(.,.)。
算法分析步驟:
Step1
初始化選取復合屬性數(shù)據點集S={X1,X2,...,Xn}的c個中心點構成初始的聚類中心集V={V1,V2,...,Vc},迭代次數(shù)t=0,隸屬度度量r設為2,特征權重度量q設為2,迭代終止參數(shù)設為ε。
Step2
Step3
對于有序屬性,聚類中心點更新公式為:
圖1 變量重要性分析結果
此時的時間復雜度為O(nmC)。
對于無序類別屬性,對數(shù)據子集中的所有取值進行全域尋優(yōu),將當前聚類中心點選擇為可使復合目標函數(shù)的最小化函數(shù)部分取得最小值時的極值,即
Step4
隸屬度更新公式為
其中,i=1,2,...,n ,j=1,2,...,C 。這一步的時間復雜度為O(nmC2)。
Step5
令t=t+1,使用下式更新屬性權值向量W=(w1,w2,...,wm)T。
其中,k= 1,2,...,m 。
這一步的時間復雜度為O(nm2C)。
Step6
4.1數(shù)據初始化
空調系統(tǒng)的精度取決于空調系統(tǒng)本身及自動控制兩個方面。空調統(tǒng)本身主要是冷、熱總量要能保證系統(tǒng)的要求,多采用集散控制裝置。中央空調集控裝置是用于監(jiān)視和控制中央空調設備及其周邊設備,如主機、空調箱、水泵、冷卻塔,各種控制閥門等設備和零件的可視化智能控制器。
表1 聚類輸入變量
本文針對主要參數(shù)對輸入變量應用SPSS數(shù)據分析軟件,進行神經網絡和灰色關聯(lián)度算法分析,挑選重要性高的變量進行聚類,圖1是應用算法進行重要性分析的結果。
最終得到如下輸入變量:(表1)
4.2仿真結果對比
通過傳統(tǒng)FCM聚類算法和基于屬性權值調整的聚類算法在正確率和迭代時間上的對比可以看出,新算法在迭代終止時間和聚類正確率方面具有相當?shù)膬?yōu)勢。
三維空間聚類結果對比可以看出,由于新算法充分考慮了聚類子集數(shù)據在空間上的分布情況,良好的改善了聚類邊界的混疊問題。
中央空調控制的過程具有大滯后、強耦合、評價指標多等特點,控制過程往往較為復雜。
本文將模糊C均值聚類算法和屬性權值優(yōu)化相結合,給出了相應參數(shù)的更新公式和相關算法流程,并應用生產中的實際數(shù)據進行方針對比,證明本方法的正確性和優(yōu)越性。
文中算法考慮了控制過程中的高維度多屬性數(shù)據點集進行聚類分析時屬性權值對聚類結果的影響。通過仿真分析,看出新算法在迭代正確率和處理邊界混疊方面具有一定的優(yōu)勢。
[1]Koleszar G E.A Description of the Weapon Optimization and Resource Requirements Model[R]INSTITUTE FOR DEFENSE ANALYSES:Report IDA D-2360,2009.
[2]Pawlak Z.et al.Rough stes[J].Communications ofACM,2010,38(11):89-95.
[3]Matlin Samuel.Review of the Literature on the Missile Allocation Problem[J].Operations Research.2010,18(3):334-373.
[4]XIN-QUAN CHEN,HONG PENG,JING-SONG HU.An adaptive optimization method of configuring feature weight group.Proceedings of the Fifth International Conference on Machine Learning and Cybernetics,Dalian,13-16August2006.pp1281-1286.
[5]Huan Liu and Lei Yu.Toward Integrating Feature Selection Algorithms for Classification and Clustering[J].IEEE Transaction on knowledge and data engineering,Vol.17,No.4,April2005. pp491-502.
[6]宇文,劉宏,查紅彬.基于特征選擇分組加權聚類的表情識別[J].計算機輔助設計與圖形學學報,2005,17(11):2394~2401.
[7]江艷君,李檸,黃道.修正初始權值的BP網絡在CSTR故障診斷中的應用[J].華南理工大學學報,2004,30(2):207-210.
關珊珊(1985—),女,滿族,吉林琿春人,工程師,碩士研究生,醫(yī)療儀器設備驗收、巡檢、維修維護。
管強(1983—),男,本科,工程師,從事醫(yī)院暖通空調系統(tǒng)設備管理工作。