崔鐵軍,馬云東(1.遼寧工程技術大學安全科學與工程學院,遼寧 阜新12000;2.礦山熱動力災害與防治教育部重點實驗室,遼寧 阜新12000;.大連交通大學遼寧省隧道與地下結構工程技術研究中心,遼寧 大連116028)
因素空間理論由汪培莊先生所創,至今得到了一定的發展,先生最新一篇論文[1]描述了因素空間與因素庫的具體概念并進行了討論。針對作者所研究安全系統工程領域[2~6],遇到了使用傳統方法難以處理的問題。如作者在另一篇文章中描述了這樣一個例子,在對某電器系統安全性進行調研時,對一位操作者提出系統安全性問題后的回答:系統在12 ℃以下多出現故障,工作七八十天后故障較多,系統嚴重不穩定。這個例子有一些特點,例子是一個多因素決策系統;因素的表達是一個域值,即因素是一個范圍;基礎數據來源于多個使用者的經驗,不同的工作時間和工作環境使他們對系統的評價基礎不同;基礎數據對事物的描述具有模糊性;如何知曉這些描述的置信度:這些描述能否可以相互佐證?
當然,目前有一些方法可以對描述語義進行處理。錢怡等[7]對對象定位處理中分類信息融合技術進行了研究;余曉敏等[8]利用改進SEaTH 算法研究了面向對象分類特征選擇方法;竇丹丹等[9]基于信息熵和SVM 多分類對飛機液壓系統故障進行了診斷;牛俊磊等[10]基于全方位優化算法改進了馬田系統分類方法;黃恒秋等[11]實現了混合值不完備決策信息系統的粗糙分類方法。但是,就處理如上例特點的問題顯得捉襟見肘。
為解決上述問題,筆者將汪先生在文獻[1]中提出的因素空間對象的屬性表示方法進行了修改,使之在單位屬性圓內可以表示無窮多個屬性對對象的影響,進而分析對象的相似性,并轉化為相似性的數值表達,得到對象集聚類劃分的規則。
因素是分析事物屬性與因果關聯的要素。因素空間是以因素命名的坐標空間,它是事物描述的普適性的數學框架,是人工智能特別是智能數據科學的基本數學理論。
因素被數學地定義為一種映射。它把一個對象(具體事物)映射成為一個屬性值(用自然語言中的形容詞來描述),這種映射稱為質映射;同時,也映射成為一個性態(用有限維歐氏空間中的實向量來表示),這種映射稱為量映射。例如,身高是一個映射,它把一個對象張三映射成性態“很高”,同時,也映射成一個量態1.8(m),如圖1所示。任何事物都同時存在著質與量的兩種規定性。從量變到質變,量決定質。
基于這一哲理,我們設定這兩種映射共存。因素f的量映射形成一個(一維或高維)坐標軸Xf,f的質映射所得的屬性值是Xf中的普通或模糊子集。有關模糊子集的形成方法早已由模糊集理論解決。

Figure 1 Personal factors expressed in factor space圖1 人的因素空間性態表述
因素是分析,是抽象,回到具體,便是認識的分析綜合過程。如圖1所示,把諸因素軸聯合起來,就得到以因素命名的坐標架,這就是因素空間。任何事物都可以被看成是因素空間中的點。數學的定義便是以因素F為指標集的一個集合族。這里F是諸因素所形成的一個集合,由于因素與因素之間存在著布爾運算,F是一個布爾代數,故因素空間被定義成以布爾代數為指標集的集合族。
因素庫是一種新的數據庫,它是因素空間理論的數據實現,它對數據的處理采用一系列的基本表格形式。
如圖1所示是汪先生提出的人的因素空間性態表述圖。該圖能表示因素空間的基本建立思想,即對象集中的某一個對象(一個人)與這個對象屬性之間的關系,只要屬性確定下來,那么一個實例化的人就確定了。但是,在實際問題中,問題的研究對象往往屬性較多,使用圖1形式,其屬性的大小方向及它們和屬性之間的關系難以確定且不直觀,難以進行進一步分析。所以,本文提出了屬性圓的概念;同時,為表述方便先給出實例中對象x1的屬性圓,如圖2所示。
定義1 設系統T=(U,C,D)為決策表,U={x1,x2,…,xm}為對象集合,m為對象數量;C={a1,a2,…,an}為條件屬性集,n為條件數量;屬性是一個連續的區間,和表示該區間的上下界,q∈{1,…,n};D={d1,d2,…,dk}為決策集合,k為決策數量。如需區別對象之間的變量概念,在變量下方添加xi,如表示對象x1的屬性a1。

Figure 2 Attributes circle of the object x1圖2 對象x1 的屬性圓表示
定義2 構建基礎信息決策表Ψ(T)表示系統T。表頭集合為{U,C,D},其中,C中的屬性aq必須歸一化。設的真實范圍[A,B],對于因素的研究范圍[LL,UL],LL≤A,UL≥B,
通過上面的定義可知,Ψ(T)中的數據是經過歸一化的,即這為屬性圓的建立提供了基礎。
定義3 屬性圓是在坐標系中的一個單位圓,即半徑為1,在這個坐標系統中,屬性圓可以表示對象集中的所有對象。屬性圓周上某一點aq與圓心a0的連線為屬性域線(下文簡稱“域線”),代表了論域中所有對象在屬性上(歸一化)的取值范圍,域線長為1。在域線上,表示屬性域值的起點,表示屬性域值的終點。在屬性圓中的線段用L(κ1,κ2)表示,κ1、κ2表示屬性圓中任意的兩個點,如aq域線表示為L(aq,a0)。屬性角為域線L(aq,a0)與L(aq+1,a0)之間的夾角。屬性圓中的面積使用M(κ1,κ2,…,κο)表示,κ1,κ2,…,κο表示屬性圓中任意的多個點,這些點按照出現順序能組成凸多邊形。屬性圓定義的規則可總結如式(1)所示的規則:

式中參數見定義1及定義2。
為進行分類方法的說明,先給出x1與x6的相似性定義圖,如圖3所示。首先從幾何圖示的角度給出對象相似的概念。如圖2中,表示了一個凸多邊形,其意義為同時表示了對象x1在屬性a2、a3上其特征的大小。圖3表示x1與x6的屬性圓圖的重疊圖(請注意,x1與x6中面積的底紋不同),那么與的重疊部分可以較大程度地反映x1與x6關于屬性a2、a3的相似程度。

Figure 3 Similarity definition between x1and x6圖3 x1 與x6 的相似性定義圖
但是明顯地使用上述方法確定x1與x6的相似程度存在困難。一方面上述方法與的重疊部分同時反映了x1與x6關于兩個屬性a2、a3的相似程度,不能就單一屬性確定。另一方面與的重疊部分需要通過復雜的解析手段才能確定。對于工程應用要求簡便快捷的特點顯然是不滿足的。因此,將相似的屬性圓思想轉化為數值計算方法進行定義和使用。
從圖3 可以看出,在a3屬性上和有一部分是重疊的,這部分說明a3屬性有一個區域對x1和x6有著相同的影響,也就是說在這個區域中x1和x6是相似的。基于該思想定義相似性。
定義5 在系統T中,xi,xj∈U,則定義S(xi,xj,aq)為xi與xj關 于 屬性aq的 相 似 度,S(xi,xj,aq)的確定方法如下:
當i=j時,S(xi,xj,aq)=1,一個對象與自己相比,自身的相似度為1。
當i≠j時,比較與的相對覆蓋區域情況。

其中,0≤S(xi,xj,aq)≤1。

上述定義的具體體現可見圖3。
定義7 基于xi、xj的總相似度S(xi,xj)的分類規則。設為xi、xj對于單一屬性aq的相似性判斷閾值,一般地1≥S(xi,xj,aq)≥λaq意為相似,S(xi,xj,aq)=0意為不相似,意為模糊相似。所以,對于意為相似,S(xi,xj)=0意為不相似,0<意為模糊相似。
任何理論的價值在于其處理實際問題的能力。上述理論的形成也是從實際問題中提煉出來的。
在對一個電器系統進行可靠性分析時,調研了七位使用過該系統的人員,他們給出了對系統可靠性的評價語言論述。由于他們工作調度等方面的原因使其操作系統的環境不同。實際上,就系統中元件發生故障概率而言,其影響因素是多樣的。比如,電器系統中的二極管,它的故障概率就與工作時間的長短、工作溫度的大小、通過電流及電壓等有直接關系。如果對這個系統進行分析,各個元件的工作時間和工作適應的溫度等可能都不一樣,隨著系統整體的工作時間和環境溫度的改變,系統的安全性也是不同的[10]。所以,他們給出的系統可靠性評價的基礎環境是不同的。
使用本文提出的方法試圖將這些操作人員的描述進行分類,如果得到的對象集(語義描述集合)分類與決策集分類相同,那么說明這些操作人員對系統可靠性評價是客觀的,可以相互佐證;如果對象集分類與決策集分類不對應,那么要增加其他操作者的評價才能進一步確定表述的準確性。
根據現場調研情況,如某位操作者的回答為:系統在12 ℃以下多出現故障,工作七八十天后故障較多,系統嚴重不穩定(由于篇幅所限,七個表述不都給出)。該系統一般100天大修一次,設定使用時間的域為[0d,100d];使用溫度考慮到系統位于北方戶外且有一定的保護,設定其域為[0 ℃,40 ℃];濕度是根據工作期間的季節氣候大體確定的。


Table 1 Basic information decision tableΨ(T)表1 基礎信息決策表Ψ(T)

Figure 4 Attributes circle of the object x2 ~x7圖4 x2 ~x7 的屬性圓
相似:S(x2,x1)=0.3214,S(x5,x3)=0.5906,S(x6,x3)=0.2315,S(x6,x5)=0.2632,S(x7,x4)=0.2592;
模糊相似:S(x3,x1)=0.0238,S(x4,x3)=0.0204,S(x5,x1)=0.0278,S(x5,x2)=0.0321,S(x5,x4)=0.0165,S(x6,x1)=0.0288,S(x6,x2)=0.0306,S(x6,x4)=0.0765,S(x7,x6)=0.0245;
不相似:S(x3,x2)=0,S(x4,x1)=0,S(x4,x2)=0,S(x7,x1)=0,S(x7,x2)=0,S(x7,x3)=0,S(x7,x5)=0。
對象聚類原則為:嚴格遵照相似與不相似劃分,參考模糊相似劃分。如S(x2,x1)=0.3214說明對象x2、x1要劃分為一組;S(x3,x2)=0說明對象x3、x2不能劃分為一組。所以,最終對象集U={{x2,x1},{x7,x4},{x5,x3,x6}}。在考慮表1中決策集D與對象集U的對應關系,發現U→D={{x2,x1}→d1,{x7,x4}→d3,{x5,x3,x6}→d2},這說明對對象的劃分就其決策屬性而言是非奇異的、準確的。轉化為語義即為七位操作人員盡管在不同環境下對系統進行了可靠性評價,但是這些評價語義是相對客觀的,所在環境屬性域值與決策等級對應較好,評價的語義可以相互佐證。
本文將汪先生提出的因素空間對象的屬性表示方法進行了修改,使其在單位屬性圓內可以表示無窮多個屬性對對象的影響,進而分析對象的相似性,并轉化為相似性的數值表達,得到對象集聚類劃分的規則。規則應按照嚴格遵照相似與不相似劃分,參考模糊相似劃分的要求對對象集合U進行劃分。如果對象集U與決策集D的對應關系是非奇異的(U→D={{x2,x1}→d1,{x7,x4}→d3,{x5,x3,x6}→d2}),那么說明盡管系統所處的環境因素不同,但是對系統的某一性質(文中為可靠性)的描述語義群中各條評價論述是相對客觀的,可以相互佐證,描述語義群是正確的。如果是奇異的,就需要增加描述語義群的評價論述,進一步加以確定。

Table 2 Similarity table of the objects表2 對象相似表
論文研究中假設了每個屬性對于對象的影響權重是相同的,對于權重不同的研究由于篇幅所限將另文論述。
[1] Wang Pei-zhuang.Factor spaces and factor data-bases[J].Journal of Liaoning Technical University(Natural Science),2013,32(10):1-8.(in Chinese)
[2] Cui Tie-jun,Ma Yun-dong.Prediction of periodic weighting based on optimized functional networks[J].Computer Science,2013,40(6A):242-246.(in Chinese)
[3] Cui Tei-jun,Ma Yun-dong.Prediction of soil settlement outside pit based on DE and SVM[J].China Safety Science Journal,2013,23(1):83-89.(in Chinese)
[4] Cui Tei-jun,Ma Yun-dong,Bai Run-cai.Selection of blast scheme based on coupling of genetic algorithm and artificial neural network[J].China Safety Science Journal,2013,23(2):64-68.(in Chinese)
[5] Cui Tei-jun,Ma Yun-dong.Research on multi-dimensional space fault tree construction and application[J].China Safety Science Journal,2013,23(4):32-37.(in Chinese)
[6] Cui Tei-jun,Ma Yun-dong.Traffic route dynamic guidance technology based on coupling of time recursive and artificial neuron network[J].Application Research of Computers,2013,30(10):2932-2935.(in Chinese)
[7] Qian Yi,Lin Ying,Wu Gang-shan.Research of fusing image classification into object localization[J].Application Research of Computers,2013,30(12):3844-3849.(in Chinese)
[8] Yu Xiao-min,Zhan Fei-bing,Liao Ming-sheng,et al.Object-oriented feature selection algorithms based on improved SEaTH algorithms[J].Geomatics and Information Science of Wuhan University,2012,37(8):921-924.(in Chinese)
[9] Dou Dan-dan,Jiang Hong-kai,He Yi-na.Effectively diagnosing faults for aircraft hydraulic system based on information entropy and multi-classification SVM[J].Journal of Northwestern Polytechnical University,2012,30(4):529-534.(in Chinese)
[10] Niu Jun-lei,Cheng Long-sheng.Classification using improved Mahalanobis-Taguchi system based on omni-optimizer[J].Systems Engineering-Theory & Practice,2012,32(6):1324-1336.(in Chinese)
[11] Huang Heng-qiu,Zeng Ling.Rough classification method in incomplete decision information system with hybrid value[J].Computer Engineering and Applications,2011,47(28):48-51.(in Chinese)
附中文參考文獻:
[1] 汪培莊.因素空間與因素庫[J].遼寧工程技術大學學報(自然科學版),2013,32(10):1-8.
[2] 崔鐵軍,馬云東.基于泛函網絡的周期來壓預測方法研究[J].計算機科學,2013,40(6A):242-246.
[3] 崔鐵軍,馬云東.基于差異進化支持向量機的坑外土體沉降預測[J].中國安全科學學報,2013,23(1):83-89.
[4] 崔鐵軍,馬云東,白潤才.基于ANN 耦合遺傳算法的爆破方案選擇方法[J].中國安全科學學報,2013,23(2):64-68.
[5] 崔鐵軍,馬云東.多維空間故障樹構建及應用研究[J].中國安全科學學報,2013,23(4):32-37.
[6] 崔鐵軍,馬云東.時間遞推耦合神經網絡的交通路徑動態誘導技術[J].計算機應用研究,2013,30(10):2932-2935.
[7] 錢怡,林瑩,武港山.對象定位處理中分類信息融合技術研究[J].計算機應用研究,2013,30(12):3844-3849.
[8] 余曉敏,湛飛并,廖明生,等.利用改進SEaTH 算法的面向對象分類特征選擇方法[J].武漢大學學報(信息科學版),2012,37(8):921-924.
[9] 竇丹丹,姜洪開,何毅娜.基于信息熵和SVM 多分類的飛機液壓系統故障診斷[J].西北工業大學學報,2012,30(4):529-534.
[10] 牛俊磊,程龍生.基于全方位優化算法的改進馬田系統分類方法[J].系統工程理論與實踐,2012,32(6):1324-1336.
[11] 黃恒秋,曾玲.混合值不完備決策信息系統的粗糙分類方法[J].計算機工程與應用,2011,47(28):48-51.