蘇婷,高靜霞,傅建軍,蘇誠,李家樂,陳靚瑜,黃雅馨
(1.上海海洋大學 農業部淡水水產種質資源重點實驗室,上海 201306;2.國家海洋局東海信息中心,上海 200137)
模糊聚類分析是依據客觀事物間的特征、親疏程度和相似性,通過建立模糊相似關系對客觀事物進行分類的數學方法(謝季堅等,2000)。其主要用途是對所研究的樣本進行合理的分類,并可作為模糊識別提供模板依據,把需要識別的事物與模板進行模糊比較,從而得到所屬的類別。
21世紀是人類開發利用、保護海洋的新世紀。海洋中的生物資源及各種自然過程的復雜和綜合性,多伴隨著模糊性。合理的統計方法有助于對海洋信息的分析,是有效利用海洋資源的前提。近年來,國內外學者利用數理統計方法對海洋生物種群、海洋化學、海洋氣象、海洋物理和軍事等方面進行了深入研究。Tzeng等(2001)及Turan等(2006)基于體型參數的統計模型對不同海洋生物進行了種群鑒定研究。以Beck(1987)為代表的國外學者探討了水質評價模型的不確定性;Akpinar等(2009)應用模糊推理模型對黑海南海岸波浪參數進行預測;柯麗娜等(2013)采用基于可變模糊識別模型對以萊州灣海水環境質量進行評價;熊德琪等(1998)采用模糊識別方法對大連灣海洋富營養化程度進行分析;邱章等(1984)及盧中發(1989)利用模糊多元分析方法對黑潮水團和鋒面渦旋進行分析;孫崢等(2007)通過運用模糊聚類識別方法對風暴潮災情等級識別進行研究;鄔惠國等(2013)使用模糊聚類分析方法進行海上交通事故分析。
本文選取魚類種群鑒定和海洋強風暴災害評估為研究實例,其共同點是在這兩類樣本中并沒有嚴格的類屬性和隸屬關系,它們在屬性等方面存在著重疊性、交叉性,具有“亦此亦彼”的性質,因此比較適合進行模糊劃分。本文利用基于等價關系的模糊聚類分析方法,嘗試對特定魚類種群形態學及強風暴災害數據進行合理分類,并利用實驗及實測數據進行比較分析,以期為魚類種群鑒定分析及強風暴災害評估提供合理的判別分析方法,為保護海洋生物資源及開展防災減災工作提供有效參考。
1.1.1 研究用魚類種群材料
鑒于海洋魚類的地理種群界定及采集存在較大困難,本研究采用淡水魚類作為研究對象。利用不同地理種群草魚及雜交組合的后代進行分析。繁殖于2008年5月進行,選擇大小相近、發育成熟的長江、珠江地理種群的個體作為親本,同步進行催產授精,混合交配方式干法授精(Fu et al,2009)。試驗獲得長江、珠江和雜交3個組合。
3個組合分別以相同密度用網箱培育,養到夏花規格,對3個組合進行剪鰭標記,各選60尾混養于同一網箱,做3個平行試驗組。7月15日,開始試驗,開始前對各組合抽樣測量全長。11月15日試驗結束,對試驗魚測量全長、體長等可量數據及其各框架參數。
1.1.2 數據采集
可量數據及框架參數由電子天平和游標卡尺測量獲得。試驗共測定形態參數26項目,包括7個可量性狀和19個框架參數,90尾魚,計2340個數據。可量性狀包括全長(TL)、體長(SL)、體高(BD)、體寬(BW)、頭長(HL)、吻長(SnL)及眼徑(ED);框架參數由Dxy以表示點x到點y的直線距離,框架測量坐標點的選擇基本依據Swain等(1999),測量框架圖見圖1。

圖1 草魚框架測量
1.2.1 研究用強風暴潮過程及災害數據
風暴潮能否成災,在很大程度上取決于強風暴潮過程最大增水是否與天文潮高潮相疊,尤其是與天文大潮期的高潮相疊。當然,也決定于受災地區的地理位置、海岸形狀、海底地形,尤其是受災地區的社會及經濟(承災體)情況(包括災害抗御能力)。本文根據1981-2000年以來對上海造成災害的13場強風暴潮的災情統計資料(胡德寶 等,2005),選取最大風力、過程最大增水、直接經濟損失3項指標作為風暴潮災害評估特征因素,將風暴潮災情按其嚴重程度進行等級劃分。
1.2.2 數據預處理
(1)可比性處理:在1981-2000年的20年中,上海地區經濟實現跨越式發展,不同年份之間的物價不具有可比性,因此我們對原始數據進行了可比性處理,全部統一到1997年的物價水平(表 1)。

表1 1981-2000年上海地區典型風暴潮災情統計表
(2)歸一化處理:采用標準差標準化法將特征因素值進行標準化,以保證進行聚類的各項指標均處于同等重要的地位(表2)。

表2 1981-2000年上海地區典型風暴潮災情數據歸一化表
1.3.1 模糊聚類分析
模糊聚類分析是把模糊數學的概念引入聚類分析中,以用來研究“物以類聚”的一種多元統計分析方法,是數值分類學的一門年輕分支。模糊聚類分析的實質一般是指根據研究對象本身的屬性來構造模糊矩陣,并在此基礎上根據一定的隸屬度來確定聚類關系。即用模糊數學方法把樣本之間的模糊關系定量的確定,從而客觀且準確地進行聚類。
1.3.2 基于等價關系的聚類方法
兩個集合之間的模糊關系有:自反性、對稱性和傳遞性。如果兩個集合同時具有這3個屬性,則稱這兩個集合具有等價關系。基于等價關系的聚類方法就是在等價關系的思想上建立起來的。集合上的等價關系所構成的類,兩兩互不相交,而且覆蓋整個集合區域。
(1)模糊相似矩陣:當集合X={x1,x2,……,xn}時,模糊相似關系R可以用模糊矩陣R=[rij]n×n。表示,而R是主對角線上的元素均為1的對稱模糊矩陣,即rij=l,rij=rji,這樣的模糊矩陣稱為模糊相似矩陣。
(2)傳遞閉包:設R為論域U上的模糊關系,若U上的另一個模糊關系R′滿足:
1)R′R′?R′(即 R′是傳遞的);
2)R′?R(即 R′包含 R);
3)若U上另有一模糊關系R"也滿足1)和2),則必有R′?R"(即R′是包含R且可傳遞的最小模糊集);
則稱R′是R的傳遞閉包,記為t(R)。
(3)模糊等價矩陣的求法:R2=R R,R4=R2R2,R8=R4R4,一直這樣算下去,就必然存在一個自然數k,使R2k=RkRk,這時的Rk即為一個具有模糊等價關系的模糊相似矩陣。
2.1.1 聚類分析結果
如圖2所示,基于3個組合可量性狀與框架參數的聚類分析發現,雜交組合先與珠江組合聚在一起,然后再與長江組合聚在一起,說明雜交組合形態上接近珠江組合。

圖2 聚類分析結果
2.1.2 判別分析結果
如表3所示,對3個組合26項形態參數(7個可量性狀和19個框架參數)進行統計分析發現,判別效果極顯著(P<0.01)。判別準確率P1為86.7%~93.3%,判別準確率P2為82.4%~100%,綜合判別率為90.0%。

表3 可量性狀與框架參數判別結果
為了提高公式的簡便性和實用性,從上述26項參數的變量中選出對判別貢獻較大的8個形態變量(ED、 D24、 SnL、 D38、 D12、 D58、 D16、D46),并進行判別分析建立函數,在判別公式中8個變量分別用V1~V8表示,3個組合的判別公式如下:
長江組合:Y1=2516V1+4378V2+2506V3+1280V4+833V5+1992V6+1788V7+571V8-1189;
珠江組合:Y2=2568V1+3871V2+2625V3+1367V4+909V5+1949V6+1713V7+617V8-1206;
雜交組合:Y3=2310V1+3809V2+2553V3+1385V4+842V5+2069V6+1732V7+637V8-1200;
通過以上3個判別公式可以判別3個組合的所屬,方法是將可量參數及框架參數的校正值代入以上公式,函數值最大的即為所屬。
2.2.1 聚類分析結構
(1)計算模糊矩陣:將表2建立模糊相似關系(M)后,利用平均絕對距離法計算模糊相似矩陣(R):

(2)模糊等價矩陣:經計算得R4=R2R2,故獲得R的傳遞閉包t(R),即建立了R的一個模糊等價關系。
(3)模糊聚類:通過取不同的閾值λ∈ (0,1)得到不同的分類關系。本文結合專家經驗和當地實際情況,選取λ=0.955,樣品被分為3類,即對應小災、中災、大災。

2.2.2 模型應用
本文構建的災害評估模型在“數字海洋”東海分局節點中“臨港新城風暴潮災害輔助決策系統”得到了初步應用。在城市地理信息系統支持下,模型結合水動力計算及城市經濟價值的空間分布,可以對強風暴災害等級進行精確分類。在此基礎上,結合災情指標體系等對強風暴進行風險評估。綜合使用其他評價模型和方法,系統還提供對災害影響范圍、災害程度的預測,快速判斷受災單位,估算受災人口和經濟損失,評估災害的社會經濟影響,為抗災減損工程調度,提供決策依據;災后根據災情實際統計數據修正估計模型,進行災害經濟損失綜合評估,為城市海洋災害綜合減災措施提供數據支持。

圖3 城市風暴潮災害經濟評估系統業務流程
模糊聚類分析可用于不同品系的初步歸類,量化品系間的差異程度,研究分析對象間的相似程度;可用于水產動物種群和品系鑒定等研究(Tzeng et al,2001;Konan et al,2010)。本研究基于體型參數變異進行多元統計分析。通過其模糊聚類分析結果,可以直觀地發現雜交組合群先與珠江組合群聚在一起,說明兩者形態具有更高的相似程度。
本研究聚類統計分析方法,可以作為海洋魚類種群鑒定研究的參考,為進一步了解和利用海洋生物資源提供有效手段。
由于風暴潮災害發生的突然性、災害評估的不精確性,模糊理論在風暴潮災害評估上得到了廣泛的應用。將風暴潮災害損失的各災度等級作為災害評估上的模糊集合,而且任一災害損失都在一定程度上隸屬于災害評估的模糊集合。因此,可以應用模糊聚類法對災害評估等級劃分進行研究,并根據最大隸屬原則確定災害損失所屬的模糊評估等級。
從根本上來說,海洋領域諸多問題實際是一個模式識別問題,而對研究對象的科學劃分是進行更深層次研究的前提,現有的各種劃分方法多是采用“硬劃分”或定性描述的方法,帶有一定的主觀經驗性。引入模糊的概念,能夠更加準確、形象的了解樣本的分類情況,更加符合人類的認知觀念。
需要注意的是,海洋是一個不確定環境下的復雜系統問題,用任一方法都無法解決問題的表里始末,只有應用類似于生物醫學領域里的“雞尾酒療法”才能對于如此困難的人類命題給出滿意的回答。可引入軟計算、智能計算等方法,更加全面的研究各類海洋現象。
致謝:在本文撰寫過程中與東海信息中心信息技術室葉娜主任及同事進行了有益討論,在此深表謝意。
Akpinar A,?zger M,K?mürcü M,2013.Prediction of wave parameters by using fuzzy inference system and the parametric models along the south coasts of the Black Sea.Journal of Marine Science and Technology,DOI 10.1007/s00773-013-0226-1
Beck M B,1987.Water quality modeling:A review of the analysis of uncertainty.Water Resources Research,23(8):1393-1442.
Chen W,Sui G,Tang D,2011.A fuzzy intelligent decision support system for typhoon disaster management.Proceedings 2011 IEEE International Conference on Fuzzy Systems(FUZZ-IEEE 2011):364-367.
Chen W,Sui G,Tang D,2011.Predicting the economic loss of typhoon by case base reasoning and fuzzy theory.Proceedings of the 2011 International Conference on Machine Learning and Cybernetics(ICMLC 2011):254-257.
Fu J,Wang R,Liu F,et al,2009.Comparative analysis on growth and morphology in Yangtze River♀,Zhujiang River♂and their F1 hybrids of juvenile grass carp.Agricultural Science&Technology,10(5):119-122.
Konan K M,Adépo-Gourène A B,Ouattara A,et al,2010.Morphometric variation among male populations of freshwater shrimp Macrobrachium vollenhovenii Herklots, 1851 from C?te d'Ivoire Rivers.Fisheries Research,103:1-8.
Swain D P,Foote C J,1999.Stocks and chameleons:the use of phenotypic variation in stock identification.Fisheries Research, 43:113-128.
Turan C,Oral M,?ztürk B,et al,2006.Morphometric and meristic variation between stocks of Bluefish(Pomatomus saltatrix)in the Black,Marmara,Aegean and northeastern Mediterranean Seas.Fisheries Research,79:139-147.
Tzeng T,Chiu C,Yeh S,2001.Morphometric variation in red-spot prawn(Metapenaeopsis barbata)in different geographic waters off Taiwan.Fisheries Research,53:211-217.
USGS.http://fisc.er.usgs.gov/carp_ID/html/ctenopharyngodon_idella.html
胡德寶,龔茂殉,孔亞珍,2005.強風暴潮對上海地區影響研究.華東師范大學學報(自然科學版),12(5-6):177-182.
柯麗娜,王權明,孫新國,等,2013.基于可變模糊識別模型的海水環境質量評價.生態學報,33(6):1889-1899.
盧中發,1989.模糊目標函數聚類算法及其在東海黑潮水團分析中的應用.海洋學報,11(3):165-174.
邱章,黃企洲,1984.模糊聚類法在海洋水團劃分中的應用初探I,海洋湖沼通報,1:15-19.
孫崢,莊麗,馮啟民,2007.風暴潮災情等級識別的模糊聚類分析方法研究,自然災害學報,16(4):49-54.
鄔惠國,朱現場,肖英杰,等,2013.基于模糊聚類的海上交通事故分析.中國航海,36(1):80-84.
熊德琪,殷佩海,1998.一種新的海洋富營養化程度模糊評價方法.交通環保,1(16):4-7.
謝季堅,劉承平,2000.模糊數學方法及其應用.武漢:華中科技大學出版社.
張躍,鄒壽平,宿芬,1992.模糊數學方法及其應用.北京:煤炭工業出版社.