秦勝伍,陳駿駿,陳劍平,韓旭東,張文,翟健健,劉緒
?
基于粗糙集理論的巖體結構面模糊均值聚類分析
秦勝伍,陳駿駿,陳劍平,韓旭東,張文,翟健健,劉緒
(吉林大學建設工程學院,吉林長春,130026)
基于在利用模糊均值聚類算法對巖體結構面產狀進行優勢分組時,需要人為確定分組數和初始聚類中心,在迭代過程中容易陷入局部最優解的問題,通過改進聚類中心的算法,提出一種基于粗糙集的模糊均值聚類算法,以優化迭代過程,并通過對比多項聚類有效性檢驗參數,確定最優聚類分組情況。最后采用模糊均值聚類算法和改進后的算法對浙江白鶴隧道左洞測得的結構面產狀進行優勢分組并對比。計算結果表明,本文所提出的方法聚類效果明顯優于模糊均值聚類算法。
結構面;粗糙集;優勢分組;模糊均值聚類;聚類中心;有效性檢驗
巖體由結構面和結構體2個基本單元組成[1],且巖體中結構面的存在和分布是造成巖體具有不連續性和各向異性等性質的主要原因,同時也是控制巖體工程穩定性的重要因素。在工程地質分析過程中,巖>體結構面產狀的統計分析是極為重要的基礎工作[2]。通過現場勘查獲得結構面第一手資料后,要及時在室內進行統計分析,以便為工程設計提供參考。傳統的方法主要是依靠繪制節理散點圖、等密度圖和玫瑰花圖等比較直觀的圖形來判斷分析結構面的分布規律,但此類方法不能準確確定其優勢方位,而且這些方法是將走向、傾向、傾角分離出來進行分析,對巖體結構面的分析也比較粗糙[3],且在結構面裂隙非常發育的地區很難得到準確結果。SHANLEY等[4]最早提出結構面產狀的聚類算法,隨后經過改進,發展了用于結構面識別的模糊均值聚類算法[5?6],能在一定程度上較好地反映巖體結構面的分布情況,但由于該方法的聚類數和初始聚類中心通常依靠人為確定,在處理數據量較大的樣本時,容易陷入局部最優解,造成結果不準確。針對模糊均值聚類算法存在的缺陷,許多學者提出了多種改進方法,如:蔡美峰等[7]提出用遺傳算法來解決FCM算法計算時存在的局部最優問題;張奇等[8]提出基于凝聚層次分析法的模糊均值聚類算法,有效地克服了孤值點對聚類結果的影響;徐黎明等[9]提出基于混沌理論的FCM算法,解決了FCM算法對初始值敏感和局部最優解的問題;LI等[10]采用粒子群算法對FCM算法進行優化,使分類結果符合全局數據分布規律。本文在前人研究基礎上,結合粗糙集理論,提出一種基于粗糙集理論的結構面產狀優勢分組的新方法。這種方法優化了聚類中心的計算過程,能有效避免在迭代計算過程中陷入局部最優解,使分類結果符合整體結構面產狀分布規律。最后,通過對浙江諸永高速白鶴隧道左洞K127+001處測得的結構面產狀進行實例分析,驗證該方法的可行性和可靠性。
1 結構面的空間表示方法
在對巖體結構面進行優勢分組時,通常將結構面的產狀作為劃分依據。結構面的產狀一般用傾向(0°≤<360°)和傾角(0°≤≤90° )來表示。假設巖體結構面為一空間平面,則其產狀可用結構面單位法向量來表示,建立如圖1所示空間直角坐標系,結構面產狀單位法向量坐標與傾向()、傾角()的關系 為[11?13]


圖1 結構面的空間坐標表示
2 基于粗糙集的模糊均值聚類算法的理論基礎
2.1 粗糙集理論
在粗糙集理論中,為非空有限集合,稱為論域;是定義在上的等價關系;用表示的所有等價類的類簇(集合);用[]表示在等價關系下包含元素(∈)的等價類;對于論域的任意子集,有下近似集和上近似集分別滿足:
根據式(2)和式(3)中的集合關系式可知:下近似集表示的是某對象一定屬于類;而上近似集表示某對象可能屬于類。在巖體結構面產狀優勢分組計算中,可以采用粗糙集理論中的上近似集和下近似集來解決相鄰2個分組邊界數據的歸屬。具體的上近似集和下近似集可以利用關系矩陣和基本的矩陣運算求得[14]。
2.2 模糊均值聚類算法聚類中心的改進
在經典均值聚類分析中,聚類中心通常依靠人為確定。在本文中,若結構面產狀的分類邊界比較明顯,則可以將每個類簇的空間中心點作為聚類中心,具體可通過求解每一類中所有結構面產狀數據點的算數平均坐標值求得。
設研究區的結構面產狀可以分為組,A:(=1,2,…,)表示第組中的所有結構面產狀集合,x(=1,2,…,n)表示第類中的某一結構面產狀,則第類的聚類中心V可以表示為
但是上述方法在處理分組邊界不清晰的問題時,很難得到準確的結果,LINGRAS[15]通過利用粗糙集中的上近似集和下近似集的對均值聚類算法的聚類中心算法進行改進,可得到基于粗糙集的均值聚類算法聚類中心:
在式(5)基礎上,結合模糊集理論,可得到基于粗糙集的模糊均值聚類算法的聚類中心[16]:

式中:u為樣本x屬于類別的隸屬度關系。根據KIM等[17]提出的 KH 算法,定義隸屬度的函數為目標 函數:
式(6)和式(7)中,隸屬度u滿足:
當X≠V時,隸屬度u可以表示為

=1,2,…,;=1,2,…,(9)
式中:為控制著隸屬度分配和聚類模糊程度的加權參數,其最佳取值范圍為[1.5,2.5],在一般情況下,取2.0[6?7,18]。
利用式(7)所示目標函數進行迭代優化可以使其收斂到1個極小值,即可得到最優分類,且在計算過程中通過聚類中心的優化可以避免陷入局部最優解,得到更具有全局意義的結果。
2.3 聚類有效性檢驗和最優聚類數的確定
在模糊均值聚類算法中,聚類數的取值是影響聚類結果的1個重要因素,通常根據情況人為劃分確定。為了得到合理的聚類結果,本文首先通過觀察結構面產狀的極點圖及密度等值線圖,大體估計可能出現的分類組數,對這些可能出現的分類組數分別進行聚類計算得出相應結果,再利用聚類結果有效性檢驗函數對聚類結果進行最優化篩選。為了避免單一性,采用Xie?Beni指標XB、分類熵指標m和模糊分類系數m檢驗行聚類效果,計算式為[7, 16]:
式中:為聚類分組數;為樣本總數;u為隸屬度。2(X,V)為某一結構面樣本到聚類中心V的距離的平方;為距離最近的2個聚類中心之間的距離的平方;對數底數>0,且規定當u=0時,,本文取自然對數。當計算所得的指標S越小,分類熵指標H越接近于0,模糊分類系數F越接近1時,聚類效果越好;反之,聚類效果越差。綜合運用上述3個聚類有效性檢驗方法,確定合理的聚類數即為結構面分組數。
3 實現過程
基于粗糙集的模糊均值聚類算法實現過程見圖3,具體步驟如下。
1) 數據預處理。將野外實測獲得的結構面產狀用結構面單位法向量的形式來表示,且設定進行聚類的對象數即結構面總數為,對象中的元素可以用三維空間中的有限集來表示。其中X為第個空間結構面法向量對應的坐標,且X= (cosαsinβ,sinαsinβ,cosβ)(=1,2,…,)。
2) 聚類數范圍的確定。通過觀察研究區內結構面產狀的極點圖和等密度圖,確定聚類數的取值范圍。
3) 基于粗糙集的模糊均值聚類計算。利用改進后的算法對研究區聚類數取值范圍內的值分別進行計算。
4) 確定最優聚類結果。利用聚類有效性檢驗方法對步驟3)中所得的結果進行對比分析,并綜合考慮實際因素確定最優聚類結果。
4 實例分析
為了驗證基于粗糙集的模糊均值聚類算法在結構面優勢分組時的可靠性,取浙江諸永高速白鶴隧道左洞K127+001處測得的472個節理裂隙產狀(傾向、傾角)進行聚類分析。白鶴隧道位于浙江省諸永高速臺州段,該地區為侵蝕剝蝕中山、中低山丘陵區,處于余姚—麗水大斷裂與鶴溪—奉化大斷裂之間的斷塊內。研究區隧道洞身圍巖分布有含黏性土碎石及強風化灰黃色、紫紅色晶屑凝灰巖,巖石裂隙較發育。地下水基本為基巖裂隙水。復雜的地質構造使隧道在施工過程中常發生塌方和涌水的現象,對人們的生命財產安全造成威脅,因此,正確認識隧道區結構面的分布情況具有重要的工程指導意義。
根據在白鶴隧道現場勘查測定的472組結構面產狀,采用赤平極射投影法可得到結構面產狀的極點圖及等密度等值線圖,如圖2所示。

圖2 結構面產狀極點圖及密度等值線圖
從圖4可以確定研究區結構面的聚類數為2~5。現采用模糊均值聚類算法和基于粗糙集的模糊均值聚類算法對研究區測得的結構面產狀進行聚類計算,得到的聚類結果見圖3~6。

(a) 模糊C均值聚類算法;(b) 基于粗糙集的模糊C均值聚類算法

(a) 模糊C均值聚類算法;(b) 基于粗糙集的模糊C均值聚類算法

(a) 模糊C均值聚類算法;(b) 基于粗糙集的模糊C均值聚類算法

(a) 模糊C均值聚類算法;(b) 基于粗糙集的模糊C均值聚類算法
為了比較2種方法得到的評價結果,本文通過計算得到2種方法在不同分組情況下的聚類有效性檢驗指標,如表1和表2所示。對比分析表1和表2中的各校指標可知:

表1 模糊C均值聚類算法聚類有效性檢驗指標

表2 基于粗糙集的模糊C均值聚類算法聚類有效性檢驗指標
當分別為2,3,4和5時,由模糊均值聚類算法所得XB和m均比本文方法的大;m均比本文方法的小。根據2.3節中3個評價指標針對聚類有效性檢驗的判別標準(XB越小越優,m越接近0越優,m越接近1越優)可知:本文提出的基于粗糙集的模糊均值聚類算法得到的分類結果優于傳統模糊均值聚類算法的分類結果。
進一步分析基于粗糙集的模糊均值聚類算法得到的結果(表2)可知:除m外,其余2項指標均表明聚類數為3時的聚類效果最佳。實際上,當聚類數為3時的m與為2時的m幾乎相等,因此,可以確定聚類數為3時的聚類結果是最佳的。
綜上所述,本文中改進后的基于粗糙集的模糊均值聚類算法優于原有的模糊均值聚類算法,并且可得到白鶴隧道左洞的結構面優勢分組情況,如圖7及表3所示。

圖7 白鶴隧道結構面優勢分組結果

表3 白鶴隧道左洞巖體結構面聚類結果
5 結論
1) 基于粗糙集的模糊均值聚類算法的聚類效果明顯優于模糊均值聚類算法,本文提出的方法具有更好的有效性和實用性。
2) 基于粗糙集的模糊均值聚類算法在計算過程中可以根據數據分布自動搜索聚類中心,避免了因為人為確定初始聚類中心不準確而造成的誤差,使迭代結果更具有全局意義。
3) 應用本文的新方法對浙江白鶴隧道左洞巖體結構面進行了有效的優勢分組分析,得到了可靠的優勢分組結果,可為后續研究提供參考。
[1] 徐光黎, 潘別桐. 巖體結構模型與應用[M]. 武漢: 中國地質大學出版社, 1993: 1?5. XU Guangli, PAN Biedong. Modelling of rock mass structures and its applications[M]. Wuhan: China University of Geosciences Press, 1993: 1?5.
[2] 馮羽, 馬鳳山, 鞏城城, 等. 節理巖體結構面優勢產狀確定方法研究[J]. 工程地質學報, 2011, 19(6): 887?892. FENG Yu, MA Fengshan, GONG Chengcheng, et al. Data analysis method for optimized and dominant orientations of joints in rock mass[J]. Journal of Engineering Geology, 2011, 19(6): 887?892.
[3] 周玉新, 周志芳, 孫其國. 巖體結構面產狀的綜合模糊聚類分析[J]. 巖石力學與工程學報, 2005, 24(13): 2283?2287. ZHOU Yuxin, ZHOU Zhifang, SUN Qiguo. Synthetical fuzzy clustering analysis for joints occurrence of rock mass[J]. Chinese Journal of Rock Mechanics and Engineering, 2005, 24(13): 2283?2287.
[4] SHANLEY R J, MAHTAB M A. Delineation and analysis of clusters in orientation data[J]. J Math Geol, 1976, 8(3): 9?23
[5] MAHTAB M A, YEGULALP T M. A rejection criterion for definition of clusters in orientation data[C]//Issues in Rock Mechanics, Proceedings of the 22nd Symposium on Rock Mechanics. New York: American Institute of Mining Metallurgy and Petroleum Engineers, 1982: 116?123.
[6] HAMMAH R E, CURRAN J H. Fuzzy cluster algorithm for the automatic identification of joint sets[J]. Int J Rock Mech Min Sci, 1998, 35(7): 889?905.
[7] 蔡美峰, 王鵬, 趙奎, 等. 基于遺傳算法的巖體結構面的模糊均值聚類方法[J]. 巖石力學與工程學報, 2005, 24(3): 371?376. CAI Meifeng, WANG Peng, ZHAO Kui, et al. Fuzzy-means cluster analysis based on genetic algorithm for automatic identification of joint sets[J]. Chinese Journal of Rock Mechanics and Engineering, 2005, 24(3): 371?376.
[8] 張奇, 王清, 闕金聲, 等. 基于凝聚層次聚類分析法的巖體隨機結構面產狀優勢分組[J]. 巖土工程學報, 2014, 36(8): 1432?1437. ZHANG Qi, WANG Qing, QUE Jinsheng, et al. Dominant partitioning of discontinuities of rock masses based on AGNES[J]. Chinese Journal of Geotechnical Engineering, 2014, 36(8): 1432?1437.
[9] XU Liming, CHEN Jianping, WANG Qing, et al. Fuzzy-means cluster analysis based on mutative scale chaos optimization algorithm for the grouping of discontinuity sets[J]. Rock Mechanics and Rock Engineering, 2013, 46(1): 189?198。
[10] LI Yanyan, WANG Qing, CHEN Jianping, et al. K-means algorithm based on particle swarm optimization for the identification of rock discontinuity sets[J]. Rock Mechanics and Rock Engineering, 2015, 48(1): 375?385.
[11] 秦勝伍. 基于GIS的隧道施工超前地質預報[D]. 長春: 吉林大學建設工程學院, 2009: 64?69. QIN Shengwu. Geological prediction ahead of working face during tunnel construction based on GIS[D]. Changchun: Jilin University. College of Construction Engineering, 2009: 64?69.
[12] 陳劍平, 石丙飛, 王清. 工程巖體隨機結構面優勢方向的表示法初探[J]. 巖石力學與工程學報, 2005, 24(2): 241?245. CHEN Jianping, SHI Bingfei, WANG Qing. Study on the dominant orientations of random fractures of fractured rock masses[J]. Chinese Journal of Rock Mechanics and Engineering, 2005, 24(2): 241?245.
[13] 范雷, 王亮清, 唐輝明. 節理巖體結構面產狀的動態聚類分析[J]. 巖土力學, 2007, 28(11): 2405?2408. FAN Lei, WANG Liangqing, TANG Huiming. Dynamic cluster analysis of discontinuity orientations of jointed rock mass[J]. Rock and Soil Mechanics, 2007, 28(11): 2405?2408.
[14] 劉財輝, 苗奪謙. 基于矩陣的粗糙集上、下近似求解算法[J]. 計算機應用研究, 2011, 28(5): 1628?1630. LIU Caihui, MIAO Duoqian. Algorithm of upper and lower approximations based on matrix[J]. Application Research of Computers, 2011, 28(5): 1628?1630.
[15] LINGRAS P. Interval set clustering of web users with Yough k-means[J]. Journal of Intelligent Information System, 2004, 23(1): 5?16.
[16] BEZDEK J C. Pattern recognition with fuzzy objective function algorithms[M]. New York: Plenum Press, 1981: 203?239.
[17] KIM D W, LEE K H, LEE D. Fuzzy clustering of categorical data using fuzzy centroids[J]. Pattern Recognition Letters, 2004, 25(11): 1263?1271.
[18] 高新波, 李潔, 謝維信. 模糊均值聚類算法中參數的優選[J]. 模式識別與人工智能, 2000, 13(1): 7?11. GAO Xinbo, LI Jie, XIE Weixin. Optimal choice of weighting exponent in a fuzzy-means clustering algorithm[J]. Pattern Recognition and Artificial Intelligence, 2000, 13(1): 7?11.
Fuzzy-means cluster analysis based on rough set for grouping of discontinuities
QIN Shengwu, CHEN Junjun, CHEN Jianping, HAN Xudong, ZHANG Wen, ZHAI Jianjian, LIU Xu
(College of Construction Engineering, Jilin University, Changchun 130026, China)
When using the fuzzy-means method to analysis the distribution of discontinuities in the discontinuities distribution research in rock mass, the number of group and cluster centers should be firstly determined, which might fall into the locally optimal solution during calculation, in order to solve the problem, a new method was proposed by the optimization algorithm of cluster centers for the dominant partitioning of discontinuities of rock mass based on rough set. This method optimizes the iterative process and can get significant results. Numbers of clustering validity test parameters were taken as laboratory test index to determine the best result of dominant partitioning. Finally, taking the data of discontinuities which were measured in the left tunnel of Baihe in Zhuyong Highway, Zhejiang Province, as an example, the new method and fuzzy-means cluster was used to analysis and calculate the possible situation. The results show that the proposed method is obviously better than the fuzzymeans method.
discontinuity; rough set; dominant partitioning; fuzzy-means cluster analysis; cluster centers; effectiveness test
10.11817/j.issn.1672-7207.2016.09.029
P642.3
A
1672?7207(2016)09?3125?06
2015?08?16;
2015?10?22
國家自然科學基金青年基金資助項目(41202197);國家自然科學基金重點資助項目(41330636);中國博士后科學基金資助項目(20100471265);國土資源部公益性行業科研專項(201211095-6);科技部國家重大儀器科學設備開發專項項目(2011YQ030133)(Project(41202197) supported by the National Natural Science Foundation of China for the Youths; Project (41330636) supported by the National Natural Science Foundation of China; Project (20100471265) supported by the Postdoctoral Science Foundation of China; Project(201211095-6) supported by the Ministry of Land and Resources for Public Welfare Industry Special Research; Project(2011YQ030133) supported by Ministry of Science and Technology for Major Scientific Instruments and Equipment Development)
秦勝伍,博士,副教授,從事工程地質災害研究;E-mail:qinsw@jlu.edu.cn
(編輯 陳燦華)