廖時理,張 均,張利亞,姚 濤
(中國地質大學(武漢)資源學院,武漢 430074)
地球化學元素分布規律的研究是揭示元素礦化富集及空間變化規律的重要途徑之一,傳統的多元分析方法是建立在研究總體服從正態分布的基礎上的,然而實際情況中的化探數據大多數并不滿足正態假定這一前提,而且當數據的維數較高時,即使數據的樣本點很多,散布在高維空間仍然會顯得非常稀疏。這種情況下,傳統的多元分析方法將會受到局限。投影尋蹤聚類方法(PPC)的基本思想是把多維數據投影到低維(1~3維)的子空間上,尋找出能反映高維數據結構或特征的投影,從而能夠更加直觀地研究和分析高維數據[1]。最近幾年來,投影尋蹤方法在水利資源、農業、軍事等許多領域都有了廣泛應用,并取得了較好的效果,但是在地學領域,特別是金屬礦產勘查領域的研究應用幾乎還處于空白狀態,僅少數人進行了一些探索性工作,如肖凡(2008)[2]首次將投影尋蹤理論引入礦產勘查領域,并初步探討了與分形理論結合的可能性。基于此,本文提出采用基于實碼加速遺傳算法(Real coding based Accelerating Genetic Algorithm,簡稱 RAGA)[3]的投影尋蹤聚類(Projection pursuit cluster,簡稱PPC)[4]化探數據處理模型的新途徑,并進行了實例研究。
投影尋蹤聚類技術的實質是一種降維處理技術,即通過投影尋蹤技術將多維分析問題通過最優投影方向轉化為一維問題,并利用投影特征值與投影方向向量值進行綜合評價。其具體建模過程如下[1,5-9]:
(1)樣本評價指標集的歸一化處理。
(2)構造投影指標函數Q(a)。投影尋蹤就是把p維數據{x(i,j)|j=1,2,…,p}綜合成以a={a(1),a(2),a(3),…,a(n)}為投影方向的一維投影值z(i),

式中,x為單位長度向量,然后根據{z(i)|i=1,2,…,n}的一維散布圖進行分類。綜合投影指標值時,要求投影值{z(i)|i=1,2,…,n}具有如下散布特征:局部投影點盡可能密集,最好凝聚成若干個點團,而在整體上,投影點團之間盡可能散開。因此,投影指標函數可以表達成:

式中,Sz為投影z(i)的標準差,Dz為投影值z(i)的局部密度,即

式中,E(z)為序列{z(i)|i=1,2,…,n}的平均值;R為局部密度的窗口半徑,它的選取既不能使它隨著n的增大而增加太高,又要使包含在窗口內投影點的平均個數不太少,避免滑動偏差太大,R可以通過實驗來決定;r(i,j)表示樣本之間的距離,r(i,j)=|z(i)-z(j)|;u(t)為一單位階躍函數,當t≥0時,其值為1,當t<0時,其函數值為0。
(3)優化投影指標函數。當各指標的樣本集給定時,投影指標函數Q(a)只隨投影方向a的變化而變化。由于高維空間上的點可以通過不同的投影方向映射到低維子空間上,而不同的投影方向則反映了不同的數據結構特征。其中使投影指標函數達到最大的投影方向即為我們所求的最佳投影方向,它能夠最大可能地暴露高維數據的某類特征結構,因此,可以通過求解投影指標函數最大化問題來估計最佳投影方向,即最大化目標函數Max:

約束條件:

這是一個以{a(j)=1,2,…,p}為優化變量的復雜非線性優化問題,用傳統的處理方法較難。因此,本方法應用模擬生物優勝劣汰與群體內部染色體信息交換體制的基于實數編碼的加速遺傳算法(RAGA)來解決高維全局尋優問題。由于文章篇幅在此不做詳述,其具體過程參見文獻[1]。
(4)分類(優序排列)。把步驟(3)求得的最佳投影方向a代入下式:

由此即可得個樣本點的投影值z(i)。將z(i)和z(j)進行比較,二者越接近,表示樣本i與j越傾向于分為同一類,若按z(i)值從大到小排序,則可以將樣本從優到劣進行排序。
鳳太層控金-鉛鋅多金屬成礦區位于秦嶺泥盆系多金屬成礦帶中段。區域構造屬于揚子古陸邊緣秦嶺微板塊內北半部的構造斷陷沉降帶中的一級拉分盆地。
出露的地層主要為泥盆系,中上泥盆統(D2-3)約占總出露面積的85%;其次為石炭系、侏羅系及白堊系[10]。中上泥盆統(D2-3)以酒奠梁—王家院斷裂和趙家莊—都督門斷裂為界,可劃分為3部分:南部泥盆系為一套碳酸鹽巖、淺變質細碎屑巖;中部泥盆系為一套細碎屑巖-碳酸鹽巖-細碎屑巖夾碳酸鹽巖-細碎屑巖;北部泥盆系為一套淺變質的細碎屑巖,是該區的主要含礦層位[11]。其中,古道嶺組(D2g)灰巖與星紅鋪組(D3x)千枚巖的接觸面是區內鉛鋅礦的主要產出層位。
區內的基本構造格架為古岔河—殷家壩大型復式向斜,構造線方向為近 EW向,次級褶皺極為發育,褶皺形態緊閉至倒轉,呈線狀排列;該復式向斜西被區域性大斷裂所截,東被華陽花崗巖侵吞[10]。斷裂構造發育,南北兩側均受深大斷裂控制;北為鳳縣—山陽斷裂,南部為酒奠梁—獅子壩斷裂(向東延伸并入江口—鎮安—板巖鎮 EW向斷裂中)。此外,區內還廣泛發育有一系列的次級斷裂,主要有NWW向、NNE向、NW向和 NE向等4組[11]。
區內巖漿巖主要有分布在古岔河—殷家壩復向斜東端的獅子嶺花崗閃長巖體(圖1),出露面積約150 km2,還有若干中酸性小巖體。區內普遍發育花崗斑巖脈和閃長玢巖脈,尤其在河口—八方山—王家楞一帶發育較多。巖體分布與區域主體構造線方向一致,明顯受區域性深大斷裂的控制[12]。此外,礦集區西側深斷裂帶及其附近有小型基性-超基性巖體出露,東部北側有蘇家溝超基性巖體出露[10]。
本文所采用的數據為鳳太礦集區東部1∶5萬水系沉積物測量數據,每個樣品共分析有16個元 素,對數據進行特異值處理后以x+2σ為異常下限,其統計特征如表1所示。

圖1 陜西鳳縣太白地區地質略圖(據八方山詳查報告,有修改)Fig 1 Geological sketch map of Taibai and Fengxian in Shanxi Province

表1 鳳太礦集區東部1︰5萬水系沉積物測量主要元素特征統計表Table 1 Statistics of main elements analysis of river sediment samples collected at scale 1︰50000 in eastern Fengtai mineral cluster region
采用PPC模型的建模方法和過程對本批數據進行處理,為取得較理想的效果,在經過大量的試驗后確定對鳳太礦集區1∶5萬水系沉積物化探數據采用的具體參數為,初始種群數400,優秀個體數N=20,密度窗寬R=0.1Sz,交叉率pm=0.8,變異率pc=0.85,加速次數為20次。處理結果如下:
投影方向:a=(0.08617,0.35821,0.02508,0.38521,0.35112,0.36367,0.21673,0.40255,0.16241,0.18104,0.35303,0.23035,0.04984,0.06231,0.08420,0.01975)
投影值:z=(0.25524,0.58012,0.19979,0.37939,0.30957,0.34071,0.25007,0.25514,0.51125,0.33387,0.51142,0.32357,0.28028,0.34686,0.29118,0.34246,0.27859,0.26065,0.29148,0.23728,0.27261,0.34194,0.28005……)
對投影值進行基本的統計分析,采用x+2σ作為異常下限,其特征信息如表2所示。
分別用傳統的多元統計方法和 PPC模型投影值做異常圖進行對比:

表2 PPC模型投影值 z特征統計表Table 2 Statistics of characteristizvalue of PPC model projection

圖2 鳳太礦集區Pb,Zn,Au綜合異常圖Fig.2 Pb,Zn,Au composite anomaly map of Fengtai area

圖3 投影值異常圖Fig.3 Projection value anomaly map
如圖2和圖3所示,結合研究區的成礦規律與控礦因素[12,14],常規方法所得到的異常中,Pb,Zn的異常范圍較大,而且在針對本區成礦規律而言應該是無遠景的地區亦出現了大片的異常;Au的異常區域則顯得雜亂無章,與已知礦點的吻合性很差。無論是異常的形態規模還是分布,PPC模型的預測結果與實際的礦床(點)、分布的吻合度都要比綜合異常圖的結果好,比較而言,PPC模型的分析結果更加突出了一些與成礦有利部位的異常,減少了異常查證面積而沒有丟失異常信息。
用基于RAGA的PPC模型對陜西鳳太礦集區水系沉積物中16種元素進行分析,根據最佳投影向量a值將它們由大到小排序并作折線圖(圖4)。
根據折線圖的變化趨勢并結合實際情況,以0.3和0.1為分界點可將投影元素分為3類:Ⅰ類為As,Hg,Zn和 Pb;Ⅱ類為 Ti,Sb,Co,Mn,Bi,Cu,Au和Ni;Ⅲ類為 Mo,Ag,V和 Cr。Ⅰ類元素的值比較大,可能與本區為噴流沉積型的鉛鋅礦床有關,Pb,Zn為本區的主要成礦元素,在研究區內明顯富集,顯示投影方向值對主要成礦元素具有一定的突出作用。另外,研究區內As-Hg-Zn-Pb元素組合具有層控型鉛鋅礦床的特征[13],由折線圖得到的Ⅰ類元素組合則恰好反映了這一特征。Ⅱ類元素包括本區的主要成礦元素Au,Cu及其他一些相伴生的元素,投影向量值在突出主要成礦元素的同時,顯示這些伴生元素可能對找礦具有一定的指示作用。Ⅲ類元素的投影向量值較小,顯示與礦化的關系不是太明顯。
另外,將投影分類的結果與聚類分析的結果(圖5)進行對比,兩種方法所得到的元素分類結果差異不大,具有相似的元素組合,不同的是投影尋蹤模型的結果對研究區的主要成礦元素具有一定的突出作用。

圖4 最佳投影方向向量值分布圖Fig.4 Distribution of the best projection direction vector

圖5 鳳太地區元素聚類分析圖Fig.5 Diagram showing the element cluster analysis of Fengtai region
將PPC模型的投影結果與常規的多元處理方法在異常的識別和元素組合方面進行初步對比,結果表明,該方法具有如下優勢:
(1)該模型不僅能識別出異常強度較大的區域,而且能識別異常強度較小的區域,從而便于圈定異常區;并且在同樣的條件下,相對于常規的多元統計方法,所得到的結果更穩定。
(2)應用該模型不僅能夠將元素之間的相關性進行區分,還能夠突出研究區的優勢礦種,從而為確定進一步找礦的方向提供依據。
(3)該方法有著較為確定的取值標準,且不需要對數據進行預處理,減少了化探數據處理過程中的主觀因素影響,使處理結果更加具有確定性和合理性。
當然,由于該模型才開始應用于金屬礦產勘查領域,在實際運用過程中尚存在一些需要進一步探討和完善的問題,如在交叉率、遺傳率等參數的選擇上怎樣減小人為主觀性的權重,如何更有效地構建應用于金屬礦產領域的投影指標函數,如何對投影方向值所代表元素的地質意義進行更深入的探討,如何將該模型與分形技術更好地結合等等。
[1] 付強,趙小勇.投影尋蹤模型原理及其應用[M].北京:科學出版社,2006:21-49.
[2] 肖凡.基于 RAGA的PPC模型在個舊化探資料處理中的應用研究[D].武漢:中國地質大學,2008.
[3] 金菊良,楊曉華,丁晶.基于實數編碼的加速遺傳算法[J].四川大學學報(工程科學版),2000,32(4):1-5.
[4] Friedman J H,Turkey J W.A projection pursuit algorithm for exploratory data analysis[J].IEEE Trans.On Computer,1974,23(9):881-890.
[5] 王順久.水資源開發利用綜合研究[D].成都:四川大學,2003.
[6] 羅瑋,肖健華.基于核的投影尋蹤方法及其在模式分類中的應用[J].五邑大學學報,2003,17(3):6-8.
[7] 李競生,姚磊華.含水層參數識別方法[M].北京:地震出版社,2003:66-67.
[8] 張欣莉,丁晶,王順久.投影尋蹤在巖溶水水質分類中的應用[J].工程勘察,2001(5):26-27.
[9] 金菊良,張欣莉,丁晶.評估洪水災情等級的投影尋蹤模型[J].系統工程理論與實踐,2002(2):140-144.
[10] 王滿祥.陜西省鳳縣八方山多金屬礦床中段地質勘探總結報告[R].西安:西北有色金屬地質勘查局,1989:1-170.
[11] 向婷婷,李春蘭,劉雁.鳳太礦集區金鉛鋅礦地球化學特征及找礦方向[J].物探與化探,2004,28(3):245.
[12] 于曉琴.陜西鳳太礦集區金、多金屬礦產分布特征及成礦作用淺析[J].陜西地質,1997,25(1):13-16.
[13] 王瑞廷,王濤,高章鑒,等.鳳-太多金屬礦集區主要金屬礦床成礦系列與找礦方向[J].西北地質,2007,40(2):80.
[14] 隗合明.秦嶺鳳太礦田層控鉛鋅礦床的控礦條件及勘查標志[J].陜西地質,1990,8(1):69-75.