鄭朝臣,駱仁軍,姜 濤,陳修報,劉洪波,楊 健,
(1.南京農業大學無錫漁業學院,江蘇無錫 214081;2.中國水產科學研究院長江中下游漁業生態環境評價與資源養護重點實驗室,中國水產科學研究院淡水漁業研究中心,江蘇無錫 214081)
中華絨螯蟹(Eriocheirsinensis),又稱河蟹、毛蟹、清水蟹、大閘蟹[1]。作為我國主要的名優水產品之一,中華絨螯蟹具有很好的市場價值、經濟價值、營養價值及文化價值[2]。由于不同產地間中華絨螯蟹的價格差異很大,市場上出現了假冒產地、以次充好等問題,對知名產地及其品牌產品造成了嚴重的影響;不僅損害了消費者的正當權益,也破壞了蟹產業的有序發展。目前在我國所有水產品的產地保護工作中中華絨螯蟹最受關注,消費者也最為在意;因此對其產地及其生境鑒別方法開展研究極有必要。目前,相關研究在分子生物學技術、生理生化和形態等方面均有進展[3-5]。其中,形態分析具有取材簡單和成本低的特點,已在魚類[6]、蟹類[7]、貝類[8]和蝦類[9]等水產品上有探索報道。目前主要存在兩類方法來開展相關分析,一類是傳統的形態學框架測量法,另一類是幾何形態測量法,包括外形輪廓法[10]和地標法[11]。本研究擬通過框架測量法對采自長江水系、黃河水系以及遼河水系8個不同產地(棲息環境)的中華絨螯蟹進行形態學差異比較,以期把握其產地之間的差異性,進而對這些差異在中華絨螯蟹產地鑒別上的應用潛力進行評價。
中華絨螯蟹樣本分別采自8個不同產地:長江水系的滆湖、駱馬湖、固城湖、軍山湖、梁子湖圍網養殖環境(分別簡稱滆湖、駱馬湖、固城湖、軍山湖、梁子湖),黃河水系的東營黃河口自然環境(簡稱東營)以及遼河水系的營口、盤錦等稻蟹共作養殖環境(分別簡稱營口、盤錦)。各地取20只進行研究,不同水系8個產地中華絨螯蟹的樣本基本情況見表1。
參照文獻[12-13]的研究方法對中華絨螯蟹進行形態測量。選取以下幾類參數:Ⅰ.背甲背面測量點位置(A1-A7,B1-B4,L1-L3,S1-S7);Ⅱ.背甲側面測量點位置(C1-C4);Ⅲ.腹甲測量點位置(L4,L5);Ⅳ.第四步足測量點位置(F1,F2);Ⅴ.第五步足測量點位置(F3,F4);H:測量點16處的高度;H1:鰓對應位置的寬度。應用電子游標卡尺對每只中華絨螯蟹樣本進行形態性狀參數測量,測量數據精確到0.01 mm。本研究共測量了160只樣本的表型形態數據(圖1)。

表1 不同水系8個產地中華絨螯蟹的采樣及蟹樣規格基本情況Tab.1 Sampling details of E.sinensis from eight geographical origins in different river systems
為了消除個體之間大小對研究結果分析的影響,選取各自的背甲長L3為標準,形態數據分別除以這個標準,矯正為比例性狀參數,對得到的該新比值參數(即表型特征值,表2)進行分析。本研究主要通過SPSS20.0軟件進行單因素方差分析(one-way ANOVA)、判別分析(linear discrimination analysis,LDA)、主成分分析(principal component analysis,PCA),利用MATLAB9.0進行支持向量機(support vector machine,SVM)分析。
單因素方差分析結果表明4個背甲參數(B2、S1、S2、S3)、1個腹甲參數(L5)、2個第四步足參數(F1、F2)、2個第五步足參數(F3、F4)、H(點16的高度)均存在顯著差異(P<0.05),其余性狀在不同產地(環境)群體間差異不顯著(P>0.05)(表2)。
從32個主成分中選取了2個主成分,累積貢獻率為89.4%,第一、二主成分分別為55.2%、34.2%。從得到的2個主成分可以看出這32個特征因子的相關性較高。而從2個主成分的2維散點圖中,不同產地蟹樣間重復較大,無法進行有效區分(圖2)。

圖1 中華絨螯蟹框架指標測量示意圖[12-13]Fig.1 Morphometric measurement of truss network parameters for the studied E.sinensisⅠ:背甲背面測量點位置 (A1-A7;B1-B4;L1-L3;S1-S7),Ⅱ:背甲側面測量點位置 (C1-C4),Ⅲ.:腹甲測量點位置 (L4,L5),Ⅳ:第四步足測量點位置 (F1,F2),Ⅴ:第五步足測量點位置 (F3,F4),A1:1-1′,A2:2-2′,A3:3-3′,A4:4-4′,A5:5-5′,A6:6-6′,A7:7-7′;B1:7-8,B2:7-9,B3:7-10,B4:7-11;C1:12-8,C2:12-9,C3:12-10,C4:12-11;L1:13-14,L2:13-15,L3:15-14,L4:14-16,L5:16-13,H:測量點16 處的高度,S1:12-17,S2:12-18,S3:17-3,S4:17-4,S5:17-5,S6:17-6,S7:17-7,F1:19-20,F2:21-22,F3:23-24,F4:測量點23 處的寬度[12-13];H1:17-17’鰓對應位置的寬度.

形態特征產地滆湖固城湖駱馬湖軍山湖梁子湖盤錦營口東營顯著性A10.08±0.0090.079±0.0060.078±0.0080.075±0.0070.072±0.0080.073±0.0090.102±0.1030.083±0.0080.256A20.246±0.0080.236±0.0090.241±0.0120.234±0.010.234±0.0110.233±0.0090.306±0.2560.244±0.010.206A30.64±0.0180.607±0.0170.618±0.0160.603±0.0170.611±0.0140.609±0.0140.72±0.3450.634±0.0150.062A40.905±0.0160.912±0.0320.896±0.0160.855±0.1820.887±0.0180.896±0.0171.015±0.3890.901±0.0170.083A51.045±0.0191.063±0.0241.044±0.0241.045±0.021.037±0.0141.048±0.0141.175±0.4161.052±0.0190.073A61.116±0.0181.112±0.1351.118±0.0191.124±0.0141.125±0.0181.119±0.0141.199±0.3111.131±0.0210.362A70.515±0.0350.497±0.0450.505±0.0350.512±0.040.503±0.0380.504±0.0360.584±0.2440.513±0.0340.097B10.606±0.0240.606±0.0320.618±0.0160.609±0.0250.612±0.0180.618±0.0210.696±0.2610.613±0.0180.052B20.71±0.0290.717±0.0260.72±0.0170.707±0.0220.711±0.0180.723±0.0210.817±0.3090.678±0.1440.038B30.838±0.0260.846±0.0210.842±0.0120.839±0.0160.839±0.0180.853±0.0140.949±0.3370.836±0.0160.053B40.905±0.0220.911±0.020.905±0.0170.904±0.0170.905±0.0140.917±0.0130.98±0.2490.904±0.0180.116L10.554±0.0070.557±0.0080.553±0.0060.542±0.0080.545±0.0070.551±0.0080.609±0.2040.553±0.0060.109L20.521±0.0160.532±0.0110.525±0.0080.534±0.0110.528±0.0090.526±0.0120.654±0.4070.526±0.010.066S10.446±0.0150.459±0.0220.449±0.0090.442±0.0110.448±0.010.45±0.0120.514±0.1870.452±0.0090.024S20.505±0.0220.498±0.0190.49±0.0120.495±0.0160.494±0.0130.495±0.0110.557±0.1940.487±0.0150.047S30.5±0.0140.517±0.020.497±0.0120.484±0.0340.502±0.0120.503±0.010.549±0.1640.498±0.0150.049S40.425±0.0110.439±0.0120.426±0.0130.422±0.0130.425±0.0140.43±0.0130.467±0.1350.425±0.0160.094S50.352±0.0160.363±0.0110.352±0.0160.35±0.0090.348±0.0110.354±0.0130.393±0.1340.356±0.0150.096

續表2
注:P<0.05為達到差異顯著水平。

圖2 不同水系8個產地中華絨螯蟹形態的主成分分析Fig.2 Principal component analysis on morphometry of E.sinensis from eight geographical origins in different river systems
基于PCA-LDA分析將32個形態特征降維得到的2個主成分建立的線性判別模型,正確率低于20%。而利用32個形態測量特征進行全維LDA分析,所得到的7個線性判別函數區分不同水系8個產地蟹的判別正確率為55%~95%(總體正確率為83.1%)(表3)。但交叉驗證后,其正確率則為15%~85%(總體正確率僅為52.5%)。函數1和2得到的LDA散點圖顯示,各產地蟹雖有一定程度的差異,但仍不能有效區分上述8個產地(圖3)。

圖3 不同水系8個產地中華絨螯蟹形態的判別分析散點圖Fig.3 The discriminate analysis on morphometry of E.sinensis from eight geographical origins in different river systems
利用SVM分析對樣本的32維特征建立模型分析,其訓練集和測試集的分類效果均不顯著,進而通過PCA-SVM對降維得到的2個主成分進行分類的效果更差。由于LDA能增強產地因子的特征向量,使差異性得到更大區分。于是通過LDA-SVM法對32維特征因子通過LDA降維得到7個特征因子進行SVM分析,可顯著提高8個產地的訓練集和測試集綜合正確率(達80%左右)。以上3種模式分別選擇20%、25%、30%三種比例樣本量作為產地測試集,每次隨機選擇樣本并運行5次,得到的訓練集模型平均正確率均高于88%,其中當測試集樣本量為20%時,LDA-SVM測試集正確率達到最高的83.1%(表4)。

表3 不同水系8個產地中華絨螯蟹形態的判別分析Tab.3 The discriminate analysis on morphometry of E.sinensis from eight geographical origins in different river systems

表4 不同水系8個產地中華絨螯蟹形態的支持向量機分析Tab.4 The support vector machine analysis on morphometry of E.sinensis from eight geographical origins in different river systems
本研究單因素方差分析中B2,S1,S2,S3,L5,F1-F4,H測量值在不同產地(環境)群體間存在顯著性差異(P<0.05),其余形態測量值差異不顯著(P>0.05)。不同的水域環境[14]和不同的養殖方式[15]等都可能對中華絨螯蟹的形態等產生一定的影響。當處于不同的養殖環境中,其外部形態會發生變化。通過多元統計分析的方法有可能找出形態學差異來區分不同養殖產地環境下的蟹。鄭寬寬等[16]以三疣梭子蟹(♀)為材料,選取頭胸甲、步足等部位進行形態比較研究發現,判別分析比主成分分析更能鑒別野生或養殖環境的三疣梭子蟹。當形態發生變化差異時,其體內所含有的脂肪酸、水分等物質也有所不同,可食部分的生化成分含量以及營養物質存在一定的差異[17]。其原因可能是其遺傳多樣性發生了改變,微衛星分析顯示出不同水域之間存在一定的遺傳變異,其變異的程度與所處位置的遠近存在一定的聯系[18]。中華絨螯蟹在我國經濟水產品中占有十分重要的地位,其豐富的營養物質以及味美,被大家所接受。通過可食部分呈味特性的測定,顯示出稻田養殖蟹的滋味品質優于池塘養殖蟹[19]。本研究中蟹養殖環境主要包括稻田養殖和圍網養殖環境,形態學的判別分析發現稻田養殖蟹有被判到野生蟹或是圍網蟹中,圍網蟹也有被判到稻田蟹中的現象。圍網蟹主要攝食天然餌料以及人工投喂料,稻田蟹餌料組成應該與其存在一定的差異。前人在對湖泊養殖和池塘養殖環境的河蟹進行比較發現兩者體長、體寬等形態指標存在差異,前者明顯比后者大[17]。因此,中華絨螯蟹的產地差異性可能與投喂的方式、餌料的種類、豐度以及水域環境等多重因素有關,需要在下一步的研究中加以把握。
通過形態學方法進行不同產地(環境)的中華絨螯蟹種群的判別分析,當判別正確率低于80%,則認為是無效判別,當判別正確率在80%~90%時,則認為判別結果可以接受,當判別正確率超過90%時,則認為是可以達到良好的判別效果[20]。LDA對32維特征因子的線性判別正確率仍然達到83.1%,說明宜從更高的維度來區分各產地。基于外形輪廓特征來區別漁業資源不同地理種群時,判別分析的運用中更加廣泛,其一定程度上可以達到良好的鑒別效果[10]。本研究中對相同/不同水系產地中華絨螯蟹判別結果顯示,除了營口外,其他群體都屬于有效判別。這進一步表明不同水系中華絨螯蟹種群之間存在差異。而對于處于地理位置相近、屬于長江水系的蘇州陽澄湖、常州滆湖及長蕩湖和江西軍山湖產蟹而言,傳統的形態框架分析所得的差異尚無法達到建立產地鑒別模型的標準,只能通過環境元素分析的方法來準確區分出其不同的產地[5]。本研究中營口蟹總體的判別正確率最低,與其他產地的蟹種群存在一定程度上的混雜(圖2,表3);而相同遼河水系的盤錦個體的判別正確率卻可達到良好的效果。兩者形態間存在的判別效果不同仍需在今后進一步的分析中找出原因。
支持向量機分析是在統計學習理論基礎上發展起來的一種新的機器學習方法。目前,支持向量機已應用于模式分類、回歸分析、函數估計等領域[21]。主成分分析和線性判別分析均為數據分析中的降維分析方法,對降維后獲的新特征數據可以結合支持向量機法進行差異性分類[22]。在本研究主成分相關的分析中,通過其降維既無法提高線性判別也無法改善支持向量機的分類效果,甚至降低了這兩種統計數據模型的判別效果(表4)。而在相關線性判別分析中,僅利用其,雖初始驗證的正確率較高(83.1%),但交叉驗證正確率偏低(52.5%)。但其與支持向量機分析結合后得到的訓練集模型正確率均高于88%。當測試集樣本量為20%時,正確率甚至可改善到83.1%。因此筆者建議,為提高蟹形態統計數據模型分類和驗證效果,宜先利用線性判別分析進行降維,增強產地的特征向量,使得產地差異性能有較大的區分,然后再通過支持向量機法來進一步分類。這將能達到有效提高不同產地蟹判別正確率的目的。