周 悅, 張力心, 郭 威
(1. 上海海洋大學(xué) 工程學(xué)院, 上海 201306; 2. 沈陽建筑大學(xué) 信息與控制工程學(xué)院, 沈陽 110168; 3. 上海深淵科學(xué)工程技術(shù)研究中心, 上海 201306)
?
基于改進資源受限免疫系統(tǒng)結(jié)構(gòu)故障分類算法*
周悅1,2,3, 張力心2, 郭威3
(1. 上海海洋大學(xué) 工程學(xué)院, 上海 201306; 2. 沈陽建筑大學(xué) 信息與控制工程學(xué)院, 沈陽 110168; 3. 上海深淵科學(xué)工程技術(shù)研究中心, 上海 201306)
針對無監(jiān)督結(jié)構(gòu)故障檢測與分類問題,提出了一種基于資源受限人工免疫算法的故障檢測與分類方法.該算法將無標簽樣本數(shù)據(jù)作為抗體組成人工識別球ARB群體,ARB根據(jù)刺激值的大小進行選擇、變異和分配B細胞等進化過程來提高ARB的質(zhì)量,得到能夠反映數(shù)據(jù)結(jié)構(gòu)的記憶ARB網(wǎng)絡(luò),實現(xiàn)對實測數(shù)據(jù)的分類.仿真結(jié)果表明,新的網(wǎng)絡(luò)連接閾值計算方法使網(wǎng)絡(luò)連接更有效,該算法能夠?qū)崿F(xiàn)有效的故障分類,并且引入Silhouette指標來判斷網(wǎng)絡(luò)穩(wěn)定性和聚類效果,具有一定的可行性.
結(jié)構(gòu)健康監(jiān)測; 故障診斷; 無監(jiān)督; 人工免疫算法; 聚類; 資源受限; 網(wǎng)絡(luò)連接閾值; 聚類有效性指標
重大土木工程基礎(chǔ)設(shè)施是保證國民經(jīng)濟穩(wěn)定、可持續(xù)發(fā)展的物質(zhì)基礎(chǔ),及時發(fā)現(xiàn)安全隱患,建立安全預(yù)警系統(tǒng)是近年來國內(nèi)外學(xué)術(shù)研究的熱點問題之一[1-2].結(jié)構(gòu)健康監(jiān)測系統(tǒng)(structural heath monitoring,SHM)是一種仿生智能系統(tǒng),它利用信息技術(shù)分析結(jié)構(gòu)系統(tǒng)的健康狀態(tài),及時監(jiān)測和診斷結(jié)構(gòu)故障以避免災(zāi)難的發(fā)生.通過運行結(jié)構(gòu)健康監(jiān)測系統(tǒng),可以實時監(jiān)控結(jié)構(gòu)的整體行為,對結(jié)構(gòu)的損傷部位和損傷程度進行診斷,對結(jié)構(gòu)的服役情況、可靠性、耐久性和承載能力進行智能評估,為結(jié)構(gòu)的維修、養(yǎng)護與管理決策提供依據(jù)和指導(dǎo)[3-4].其中,故障診斷是結(jié)構(gòu)健康監(jiān)測的核心內(nèi)容,其實質(zhì)就是將人們掌握的有關(guān)故障的知識加工成智能診斷系統(tǒng)所接受的語言,將其記錄下來,并把待診斷樣本與系統(tǒng)記憶故障知識相匹配[5].對于復(fù)雜的建筑結(jié)構(gòu)而言,預(yù)知所有的故障模式是不可能的,這使得結(jié)構(gòu)健康監(jiān)測系統(tǒng)面臨著新的挑戰(zhàn).
無監(jiān)督結(jié)構(gòu)故障檢測則是利用未知標簽的樣本,判斷待測數(shù)據(jù)所屬的故障模式類型.聚類分析是模式識別和數(shù)據(jù)壓縮領(lǐng)域中一種重要的無監(jiān)督學(xué)習(xí)過程,它把一個沒有類別標記的樣本集按某種準則劃分成若干個子集,使相似的樣本盡可能歸為一類,而不相似的樣本盡量劃分到不同的類中.對于大規(guī)模數(shù)據(jù)集而言,一方面,樣本的總數(shù)很大,這對聚類算法尤其是經(jīng)典聚類算法(如k-means聚類算法、FCM聚類算法等)的可擴展性而言是一個挑戰(zhàn);另一方面,數(shù)據(jù)集類別數(shù)的增加將導(dǎo)致某些類別由于類內(nèi)樣本數(shù)較少或類內(nèi)分布相對密集,而以近似于孤立點的形式存在于樣本空間中,這樣聚類中心在迭代的過程中容易陷入局部最優(yōu)值,而無法發(fā)現(xiàn)該類型數(shù)據(jù)集的正確聚類[6-9].
資源受限人工免疫系統(tǒng)(resource limited artificial immune system,RLAIS)是Timmis提出的一種數(shù)據(jù)聚類模型[10],具有多目標搜索特性,克服了傳統(tǒng)聚類算法對初始聚類中心敏感和基于梯度進化容易陷入局部最優(yōu)解的缺點,且無需預(yù)先知道聚類數(shù),非常適合應(yīng)用于無監(jiān)督故障檢測中.因此,本文提出了一種改進的資源受限人工免疫算法(improved resource limited artificial immune system,IRLAIS)進行無監(jiān)督的結(jié)構(gòu)故障分類.
RLAIS算法引入了人工識別球(artificial recognition ball,ARB)概念,將系統(tǒng)中相似的ARB連接組成一個ARB網(wǎng)絡(luò),每個ARB根據(jù)刺激水平大小競爭獲得系統(tǒng)中有限數(shù)量的B細胞資源,那些不能獲得B細胞的ARB將會被消除,最后留下的數(shù)據(jù)代表(記憶ARB)形成的網(wǎng)絡(luò)就是數(shù)據(jù)的壓縮或分類形式.其中,ARB采用了克隆和變異來進化學(xué)習(xí).
RLAIS算法在數(shù)據(jù)挖掘和模式識別領(lǐng)域得到了較好的應(yīng)用,但RLAIS算法仍存在一些不足:
1) 網(wǎng)絡(luò)連接閾值(network affinity threshold,NAT)決定了ARB網(wǎng)絡(luò)粒度的大小,NAT在初始化時給定為抗原樣本間親和力的平均值,在網(wǎng)絡(luò)學(xué)習(xí)進化過程中保持不變,而ARB進化過程會使ARB之間的親和力提高,出現(xiàn)不同ARB子網(wǎng)絡(luò)相連接的情況,影響網(wǎng)絡(luò)進化效率;
2) 算法結(jié)束條件僅為網(wǎng)絡(luò)基本穩(wěn)定,而未使用定量有效的聚類評價函數(shù)來判斷聚類結(jié)果;
3) 每一代刺激值較高抗體不一定被保存下來.
本文針對RLAIS算法存在的不足,進行如下改進:
1) 連接閾值NAT取抗體與抗原親和力的進化平均值,即NAT在ARB網(wǎng)絡(luò)進化的每一代重新計算,使NAT能夠反映ARB的親和度的變化,使ARB連接構(gòu)成的網(wǎng)絡(luò)更有效;
2) 引入Silhouette指標[11]評價聚類結(jié)果;
3) 將每一代中刺激度高的ARB直接保留下來,避免優(yōu)秀個體被破壞.
傳感器采集的動態(tài)響應(yīng)測量數(shù)據(jù)經(jīng)過標準化、降維和提取敏感損傷特征向量(q為其維數(shù)),通過本文的IRLAIS算法進行故障檢測和分類.該算法分為兩個階段:
1) 學(xué)習(xí)階段,即將樣本數(shù)據(jù)作為抗體組成ARB,計算ARB的刺激值,通過克隆、變異、分配B細胞和資源限制等學(xué)習(xí)過程生成有代表性的記憶ARB網(wǎng)絡(luò);
2) 應(yīng)用階段,即應(yīng)用學(xué)習(xí)后的記憶ARB網(wǎng)絡(luò)對實測數(shù)據(jù)進行分類.
本文符號定義如下:Sag={Ag1,Ag2,…,Agi,…,AgNAG}為從樣本數(shù)據(jù)中隨機選擇數(shù)據(jù)組成的抗原集合,i={1,2,…,NAG},其中,NAG為集合Sag的規(guī)模,Agi和PAgi=(PAgi1,PAgi2,…,PAgiq)T分別表示Sag中的第i個抗原及其特征向量;Sarb={ARB1,ARB2,…,ARBj,…,ARBNARB}為從樣本數(shù)據(jù)中隨機選擇數(shù)據(jù)組成的ARB集合,j={1,2,…,NARB},其中,NARB為集合Sarb的規(guī)模,ARBj和PARBj=(PARBj1,PARBj2,…,PARBjq)T分別表示Sarb中的第j個ARB及組成該ARB抗體的特征向量.
2.1學(xué)習(xí)階段
初始化抗原集合和ARB集合,學(xué)習(xí)過程示意圖如圖1所示.

圖1 學(xué)習(xí)過程示意圖Fig.1 Schematic diagram of learning process
2.1.1初始網(wǎng)絡(luò)的生成
匹配程度aff(Agi,ARBj)的計算公式為
(1)
式中,ρ為匹配系數(shù).式(1)中,兩個特征向量之間的距離決定了匹配程度,距離越大,匹配程度越?。环粗ヅ涑潭仍酱?
代表相同B細胞的ARB通過資源競爭產(chǎn)生具有分類能力的記憶抗體,它由一個抗體及其刺激水平和所擁有的B細胞組成.ARBj代表由第j個抗體組成的ARB.
連接閾值NAT為所有ARBj∈Sarb與所有抗原Agi∈Sag之間匹配程度的平均值,即

(2)
計算ARBj兩兩之間的相似度(即匹配程度),若大于NAT就建立連接,否則不連接.每一組互聯(lián)的ARB所構(gòu)成的子網(wǎng)絡(luò)代表一個模式類,即第k個子網(wǎng)絡(luò)為Sarbk={ARBk1,ARBk2,…,ARBkn,…,ARBkNARBk},其中,NARBk為子網(wǎng)k中相互連接的ARB的個數(shù).
2.1.2計算ARB刺激度
ARB與抗原、互聯(lián)的ARB之間的特征向量匹配程度決定了ARB的刺激值,ARBkn的刺激水平為

(3)

2.1.3分配B細胞資源
根據(jù)ARBj∈Sarb刺激水平的大小分配B細胞,ARBj得到的B細胞數(shù)目為

(4)

B細胞分配完畢后,要進行資源有限限制,使網(wǎng)絡(luò)中B細胞數(shù)為Nb,即每一次新學(xué)習(xí)循環(huán)開始都將B細胞恢復(fù)到Nb.如果N>Nb,首先刪除刺激水平最低的ARB中的B細胞,如果一個ARB里的B細胞都被移去,那么這個ARB就被移去.該過程循環(huán)進行,直到最后的B細胞數(shù)量達到限定值,使得具有較高刺激值的ARB得以生存;如果N≤Nb,則具有最高刺激值的ARB將又被增加N-Nb個B細胞.擁有B細胞的ARB將經(jīng)歷進化過程.
2.1.4ARB進化過程
ARB要經(jīng)過一個學(xué)習(xí)進化的過程,ARBj∈Sarb首先根據(jù)刺激值的大小進行克隆,克隆數(shù)為
ej=σsj
(5)

(6)


2.1.5聚類準則函數(shù)
采用Silhouette(Sil)指標來判斷聚類效果,Sil指標值為

(7)

2.2應(yīng)用階段
學(xué)習(xí)后的記憶ARB網(wǎng)絡(luò)用來對測量的數(shù)據(jù)進行分類,過程如圖2所示.
一個模式未知的待分類時間序列數(shù)據(jù)經(jīng)標準化、降維和提取敏感損傷特征向量處理后視為入侵抗原Ag.計算Ag與所有記憶ARB網(wǎng)絡(luò)中ARB的親和力,親和力最大值為

(8)
如果affmax≥θ,θ為新模式閾值,則Ag所屬故障類別km為與其產(chǎn)生最高親和力的ARB所屬的ARB子網(wǎng)絡(luò)的類別,即km=arg(affmax);否則,affmax<θ,表明出現(xiàn)新的故障模式,并進行報警.
實際工程中,健康監(jiān)測系統(tǒng)所采集的數(shù)據(jù)均為結(jié)構(gòu)在環(huán)境振動、運營荷載下的響應(yīng)信號,為此本文針對環(huán)境激勵下四層2×2跨、1/3縮尺的鋼框架Benchmark結(jié)構(gòu)模型[12]進行損傷識別分類研究.

圖2 應(yīng)用過程示意圖Fig.2 Schematic diagram of application process

3.1聚類分析
圖3為網(wǎng)絡(luò)結(jié)構(gòu)與進化代數(shù)的關(guān)系.為了便于觀察,每種故障模式中僅選取20個樣本數(shù)據(jù),鑒于高維數(shù)據(jù)在二維平面上無法表示,選擇第一維和第二維為坐標軸進行繪制,且將數(shù)據(jù)歸一化為[-1,1]區(qū)間.
由圖3可知,由于IRLAIS算法具有較好的收斂性,可以快速完成聚類分析.與抗原匹配度高的ARB刺激度也會較高,基于刺激度的克隆選擇和變異后的平均刺激度會有所提高,使與抗原匹配度高的ARB能分配更多的B細胞,資源限制機制使匹配度差的ARB被刪除.隨著進化代數(shù)T的增加,ARB群體與抗原的匹配程度不斷增大,數(shù)量減少,在T=120時,Sil指標值約穩(wěn)定在0.75,這時網(wǎng)絡(luò)結(jié)構(gòu)基本穩(wěn)定,得到親和力高的、

圖3 網(wǎng)絡(luò)結(jié)構(gòu)與T的關(guān)系Fig.3 Relationship between network structure and T
精簡的ARB網(wǎng)絡(luò).互連的ARB構(gòu)成的子網(wǎng)絡(luò)個數(shù)即為聚類數(shù).
3.2算法對比
圖4為IRLAIS與RLAIS在進化過程中網(wǎng)絡(luò)規(guī)模變化對比.由圖4可知,IRLAIS每代進化更有效,能以更少的迭代次數(shù)達到穩(wěn)定,且最終網(wǎng)絡(luò)規(guī)模較小.連接閾值NAT隨ARB進化增大,更能反映ARB實際狀態(tài),使網(wǎng)絡(luò)連接更有效.每一代進化中刺激值高的ARB得到保存而免遭淘汰,促進了算法的收斂速度.

圖4 算法對比Fig.4 Comparison in algorithms
3.3故障識別結(jié)果
利用記憶ARB網(wǎng)絡(luò)與待分類特征向量的匹配程度來實現(xiàn)故障的檢測和分類.將測得的300個特征向量重新貼上標簽,這些特征向量被記憶ARB網(wǎng)絡(luò)分成三個子類.
與Chen[13]使用的K均值聚類算法相比,本文算法能在數(shù)據(jù)類數(shù)未知的情況下準確計算分類數(shù).表1顯示了分配到每個子類中的特征向量的個數(shù).Chen算法平均分類成功率為83%,本文算法分類成功率約為93%,高于Chen算法分類成功率.

表1 分配到每種聚類中的特征向量的個數(shù)Tab.1 Number of feature vectors assigned to each clustering
本文提出了一種改進的基于資源限制人工免疫算法的無監(jiān)督結(jié)構(gòu)故障分類算法,利用有限B細胞資源競爭得到刺激度高的ARB網(wǎng)絡(luò),從而進行故障模式檢測與分類.仿真試驗計算分析驗證了該算法的有效性.
[1]Worden K,F(xiàn)arrar C R,Manson G,et al.The fundamental axioms of structural health monitoring [J].Proceedings of the Royal Society A,2007,463(2082):1639-1664.
[2]姜紹飛,吳兆旗.結(jié)構(gòu)健康監(jiān)測與智能信息處理技術(shù)及應(yīng)用 [M].北京:中國建筑工業(yè)出版社,2011.
(JIANG Shao-fei,WU Zhao-qi.Structure health monitoring and intelligent information processing techno-logy and application [M].Beijing:China Building Industry Press,2011.)
[3]Lynch J P.An overview of wireless structural health monitoring for civil structures [J].Philosophical Transactions of the Royal Society A:Mathematical, Physical & Engineering Sciences,2007 (1851):345-372.
[4]Ko J M,Ni Y Q.Technology developments in structural health monitoring of large-scale bridges [J].Engineering Structures,2005,27(12):1715-1725.
[5]袁慎芳.結(jié)構(gòu)健康監(jiān)控 [M].北京:國防工業(yè)出版社,2007.
(YUAN Shen-fang.Structural health monitoring and damage control [M].Beijing:National Defense Industy Press,2007.)
[6]孫吉貴,劉杰,趙連宇.聚類算法研究 [J].軟件學(xué)報,2008,19(1):48-61.
(SUN Ji-gui,LIU Jie,ZHAO Lian-yu.Clustering algorithms research [J].Journal of Software,2008,19(1):48-61.)
[7]Taherdangkoo M,Bagheri M H.A powerful hybrid clustering method based on modified stem cells and fuzzy C-means algorithms [J].Engineering Applications of Artificial Intelligence,2013,26(5/6):1493.
[8]周濤,陸惠玲.數(shù)據(jù)挖掘中聚類算法研究進展 [J].計算機工程與應(yīng)用,2012,48(12):100-111.
(ZHOU Tao,LU Hui-ling.Clustering algorithm research advances on data mining [J].Computer Engineering and Applications,2012,48(12):100-111.)
[9]張宇獻,劉通,董曉,等.基于改進劃分系數(shù)的模糊聚類有效性函數(shù) [J].沈陽工業(yè)大學(xué)學(xué)報,2014,36(4):431-435.
(ZHANG Yu-xian,LIU Tong,DONG Xiao,et al.Validity function for fuzzy clustering based on improved partition coefficient [J].Journal of Shenyang University of Technology,2014,36(4):431-435.)
[10]Timmis J,Neal M.A resource limited artificial immune system for data analysis [J].Knowledge-based Systems,2001(14):121-130.
[11]周世兵,徐振源,唐旭清.新的K-均值算法最佳聚類數(shù)確定方法 [J].計算機工程與應(yīng)用,2010,46(16):27-31.
(ZHOU Shi-bing,XU Zhen-yuan,TANG Xu-qing.New method for determining optimal number of clusters inK-means clustering algorithm [J].Computer Engineering and Applications,2010,46(16):27-31.)
[12]劉娟,黃維平,石湘.基于遺傳算法的海洋平臺損傷診斷 [J].振動、測試與診斷,2012,32(2):327-349.
(LIU Juan,HUANG Wei-ping,SHI Xiang.Damage diagnosis for offshore platform based on genetic algorithm [J].Journal of Vibration,Measurement & Diagnosis,2012,32(2):327-349.)
[13]Chen B,Zang C Z.Unsupervised structure damage classification based on the data clustering and artificial immune pattern recognition [C]//Proceedings of 8th International Conference on Artificial Immune Systems.York,UK,2009:206-219.
(責(zé)任編輯:鐘媛英文審校:尹淑英)
Structural fault classification algorithm based on improved resource constrained immune system
ZHOU Yue1, 2, 3, ZHANG Li-xin2, GUO Wei3
(1. College of Engineering Science and Technology, Shanghai Ocean University, Shanghai 201306, China; 2. School of Information and Control Engineering, Shenyang Jianzhu University, Shenyang 110168, China; 3. Engineering Research Center of Hadal Science and Technology, Shanghai 201306, China)
Aiming at the unsupervised structural fault detection and classification problem, a fault detection and classification algorithm based on the resource constrained artificial immune system was proposed. The unlabeled sample data were regarded as antibodies which constituted the artificial recognition balls (ARBs) group in the algorithm. According to the amplitude of stimulation value, the ARBs performed such evolutionary processes as selection, mutation and B cells distribution so as to improve the quality of ARBs, and the memory ARBs nets reflecting the data structure could be obtained, which could realize the classification of measured data. The simulated results show that the new calculation method for network connection threshold makes the network connection more effective. The algorithm can realize the effective fault classification, the Silhouette index is introduced to judge the network stability and clustering effect, and the algorithm has certain feasibility.
structural health monitoring; fault diagnosis; non-supervision; artificial immune algorithm; clustering; resource constrain; network connection threshold; clustering validity index
2015-11-09.
國家自然科學(xué)基金重點項目(51439004); 遼寧省自然科學(xué)基金資助項目(201102180); 上海市科學(xué)技術(shù)委員會基金資助項目(14DZ2250900).
周悅(1970-),女,上海人,教授,博士,主要從事水下機械裝備和網(wǎng)絡(luò)化控制等方面的研究.
10.7688/j.issn.1000-1646.2016.04.12
TP 391.4
A
1000-1646(2016)04-0428-06
*本文已于2016-03-02 16∶49在中國知網(wǎng)優(yōu)先數(shù)字出版. 網(wǎng)絡(luò)出版地址: http:∥www.cnki.net/kcms/detail/21.1189.T.20160302.1649.062.html