解小莉,杜俊莉,謝曉振,胡小寧,董曉萌,劉建軍,劉 璐,張軍昌,陳小蕾,袁志發,郭滿才
(1.西北農林科技大學理學院,陜西楊凌 712100; 2.西北農林科技大學機械與電子工程學院,陜西楊凌 712100; 3.渭南師范學院數理學院,陜西渭南 714099; 4.錦州醫科大學公共基礎學院,遼寧錦州 121000)
廣義復相關系數及其在小麥育種上的應用
解小莉1,杜俊莉1,謝曉振1,胡小寧1,董曉萌3,劉建軍1,劉 璐4,張軍昌2,陳小蕾1,袁志發1,郭滿才1
(1.西北農林科技大學理學院,陜西楊凌 712100; 2.西北農林科技大學機械與電子工程學院,陜西楊凌 712100; 3.渭南師范學院數理學院,陜西渭南 714099; 4.錦州醫科大學公共基礎學院,遼寧錦州 121000)
為了解決多個因變量Y和多個自變量X之間的相關分析,假設X與Y的聯合正態分布已知,而且X與Y存在線性相依,提出廣義復相關系數的定義、估計和檢驗。廣義復相關系數是簡單相關系數和復相關系數的自然推廣,應用上更為方便。
決定系數; 復相關系數;多元分析
多元分析的一個重要內容就是研究隨機變量之間的關系[1]。假設
(1)

從現有的研究中,可以從三個方面得到X與Y的相關信息。
1.1 X與Y間的獨立與相關
據Anderson(1958)所述[14],由樣本(n>p+m+1)得到的樣本離差或相關陣分別為:
(2)

(3)
其中L(μ,∑)為樣本的似然函數,Ω為μ和∑的變化范圍;L(μ,∑0)為H0成立時的似然函數,ω為μ和∑0的變化范圍,ω 為 Ω的子集。而且
0≤vXY≤1
(4)
當vXY=1時,X與Y獨立;vXY愈接近0,X與Y相關愈強;vXY=0,X與Y完全相關。
由于X與Y均為正態分布,故LXX>0,LXY>0,L>0, 此時有:

vXY=|Ip-B|=|Im-A|~Λ(p,n-m-1,m)
(5)
1.2X與Y典范相關分析中的相關信息[1,15]

(6)
令各特征值對應的單位特征向量為b1,b1,…,bp,則C=(b1,b2,…bp)為正交陣且C與CT互逆,并有
(7)
由矩陣的行列式性質有:
(8)
(9)
1.3Y關于X線性回歸中的相關信息[1,5]

(10)
回歸的無效假設為:H0:β=0,等價于H0:∑XY=0。檢驗統計量為:
(11)
綜合上述1.1~1.3所述X與Y相關的信息,有
(12)
2.1 線性回歸分析中vXY、B和R2的關系
(1)直線回歸(p=m=1)
則有
1-vXY=R2=1-(1-B)
(13)

則有
1-vXY=R2=1-(1-B)
(14)

則有
(15)
2.2 廣義決定系數和廣義復相關系數的定義和估計
如何將已公認的式(13)和(14)推廣到式(15)呢?為此,有以下的廣義決定系數和廣義復相關系數的定義和估計。


(16)

(2)ρ2和ρXY的估計
若樣本(樣本容量n>p+m+1)的離差陣L或相關陣R為式(2)所示,則ρ2的極大似然估計(ML)為:
(17)

2.3 廣義相關系數ρXY的性質
(1)對稱性:ρXY=ρYX,由vXY的對稱性決定;
(2)0≤ρXY≤1,由0≤vXY≤1決定;
(3)ρXY=0?∑XY=0,由∑XY=0?vXY=1定;
(4)若∑Y>0且Y=CX?ρXY=1,事實上有:
∑Y=C∑XCT>0,∑XY=∑XCT,∑YX=C∑X?


(18)
(2) p=2且m>1時的F檢驗
(19)
(3)p>2且m>1時,均進行近似χ2檢驗
(20)
[例]西北農業大學小麥育種組于1981年對9個小麥品種按完全隨機區組(重復3)進行試驗,用27個樣點數據得到 X1(冬季分蘗)、X2(株高)、 X3(穗粒數)、 X4(千粒重)、 X5(抽穗期)和 X6(成熟期)的相關陣為:
為了研究6個小麥性狀之間的相關系數,按最大樹法進行了系統聚類,先后形成四類: {X1,X5},{X4,X6} ,{X2,X3} ,{X1,X5,X4,X6} 。下面用廣義復相關系數描述這些性狀團間線性密切的程度,分析中分別用R15,R46和R1546等表示X1和X5、X4和X6,X1、X5、X4和X6之間的相關陣。
4.1 2對2 的廣義復相關系數的估計和檢驗
{X1,X5}與 {X4,X6}、{X1,X5}與{X2,X3}和{X4,X6}與{X2,X3}間均為2對2的廣義復相關系數,其檢驗均為式(19)所示F檢驗,n=27,p=m=2
F0.05(4,46)=2.586,F0.01(4,46)=3.776
(1) {X1,X5}與{X4,X6}的廣義復相關系數r(1,5)(4,6)
F=4.165>F0.01(4,46)=3.776
(2) {X1,X5}與 {X2,X3}的廣義復相關系數r(1,5)(2,3)
F=14.738>F0.01(4,46)=3.776
(3) {X4,X6}與{X2,X3}的廣義復相關系數 r(4,6)(2,3)
F=2.28 4.2 2對4的廣義復相關系數r(2,3)(1,5,4,6) 檢驗用式(19)所示χ2(pm)檢驗 上述性狀團間廣義復相關分析結果如圖1所示: X1~X6分別指冬季分蘗、株高、穗粒數、千粒重、抽穗期和成熟期。 X1~X6refertotillernumberinwinter,plantheight,grainnumberperspike,1 000-grainweight,headingstageandmaturity,repectively. 圖1 形狀團間的廣義復相關分析 Fig.1 Generalized complex correlation analysis between shape clusters 在式(1)前提下,文獻中的廣義復相關系數有兩個: ①張堯庭[1,2]提出的五種廣義相關系數: ②本文提出的廣義復相關系數: rxy 兩種定義的相同與相異之處為: 1)二者均具有本文2.3中所指出的五個性質。 2)本文所提出的rxy的計算結果是唯一的,而且是國際公認的簡單相關系數(rxy)和復相關系數(ry(x1,x1,…,xm))的自然發展,即當p=m=1、p=1且m>1和p>1且m>1時分別為rxy、ry(x1,x1,…,xm)和r(y1,y2,…,yp)(x1,x1,…,xm)。不僅如此,還有式(18)~(20)所示的統計檢驗。 是不唯一的。另外,張堯庭[1]指出五個廣義相關系數導出的統計量均為T2統計量,不如本文在式(18)~(20)所明確指出的F、χ2檢驗方便。 [1] 張堯庭,方開泰.多元統計分析引論[M].北京:科學出版社,1982:315. ZHANG R T,FANG K T.Multivariate Statistics Analysis[M].Beijing:Science Press,1982:315. [2] 張堯庭.廣義相關系數及其應用[J].應用數學學報,1978,1(4):312. ZHANG R T.Generalized correlation coefficient and its application[J].ActaMathematicaeApplicataeSinica,1978,1(4):312. [3] 陳希孺.數理統計引論[M].北京:科學出版社,1981:439. CHEN X R.Mathematical Statistics[M].Beijing:Science Press,1981:439. [4] 陳善林,張 浙.統計發展史[M].上海:立信會計圖書用品社,1987:230. CHEN S L,ZHANG Z.Statistical Development History [M].Shanghai:Ericsson (Lixin) Accounting Press,1987:230. [5] 袁志發,宋世德.多元統計分析[M].北京:科學出版社.2009:185. YUAN Z F,SONG S D.Multivariate Statistics Analysis [M].Beijing:Science Press,2009:185. [6] 袁志發.通徑分析簡介[J].國外農學—麥類作物,1981,1(3):42. YUAN Z F.Introduction of path analysis [J].ForeignAgronomy—Wheat.EtAl,1981,1(3):42. [7] 袁志發,周靜芋,郭滿才,等.決策系數—通徑分析中的決策指標[J].西北農林科技大學學報(自然科學版),2001,39(5):131. YUAN Z F,ZHOU J Y,GUO M C.Decision coefficient-the decision index of path analysis[J].JourralofNorthwestA&FUniversity(NaturalScienceEdition),2001,39(5):131. [8] 解小莉,袁志發.決策系數的檢驗及在育種分析中的應用[J].西北農林科技大學學報(自然科學版),2013,41(3):111. XIE X L,YUAN Z F.Statistical test of decision coefficient and its application in breeding[J].JournalofNorthwestA&FUniversity(NaturalScienceEdition),2013,41(3):111. [9] G.A.F塞伯.線性回歸分析[M].北京:科學出版社,1987:120. SEIBER G A F.Linear Regression Analysis[M].Beijing:Science Press,1987:120. [10] 袁志發,周靜芋.試驗設計與分析[M].北京:高等教育出版社,2000:171. YUAN Z F,ZHOU J Y. Experiment Design and Analysis[M].Beijing:Higher Education Press,2000:171. [11] 俞大剛.線性回歸模型分析[M].北京:中國出版社,1987:96. YU D G.Linear Regression Model [M].Beijing:China Press,1987:96. [12] 茆詩松,周紀薌.概率論與數理統計[M].北京:中國統計出版社,2000:147. MAO S S,ZHOU J X.Probability and Statistics [M].Beijing:China Statistics Press,2000:147. [13] 徐克學.生物數學[M].北京:科學出版社,2001:22. XU K X.Biomathematics [M].Beijing:Science Press,2001:22. [14] Anderson T W.Introduction to Multivariate Statistical Analysis,Wiley,1958:94. [15] 袁志發,常智杰,郭滿才,等.數量性狀遺傳分析[M].北京:科學出版社,2015:207. YUAN Z F,CHANG Z J,GUO M C.Genetic Analysis of Quantitative Traits [M].Beijing:Science Press,2015:207. Generalized Multiple Correlation Coefficient and Its Application in Wheat Breeding XIE Xiaoli1,DU Junli1,XIE Xiaozhen1,HU Xiaoning1,DONG Xiaomeng3,LIU Jianjun1,LIU Lu4,ZHANG Junchang2,CHEN Xiaolei1,YUAN Zhifa1,GUO Mancai1 (1.College of Sciences,Northwest A&F University,Yangling,Shaanxi 712100,China; 2.College of Mechanical and Electronic Engineering,Northwest A&F University,Yangling,Shaanxi 712100,China; 3.School of Mathematics and Physics,Weinan Normal University,Weinan,Shaanxi 714099,China; 4.College of Public Basic Sciences,Jinzhou Medical University,Jinzhou,Liaoning 121000,China) To solve the problem of correlation analysis between multiple dependent variablesYand multiple independent variablesX,it is assumed the joint distribution ofXandYwas known andXandYhad linear dependence. The definition,estimation and test of generalized multiple correlation coefficient were proposed in this study. Generalized multiple correlation coefficient is the natural popularization of simple correlation coefficient and multiple correlation coefficient,which has more convenient application in wheat breeding. Coefficient of determination; Coefficient of multiple correlations; Multivariate analysis 時間:2017-01-03 2016-07-15 2016-10-22 E-mail:xiemary@nwsuaf.edu.cn 袁志發(E-mail:zhifayuan@nwsuaf.edu.cn);郭滿才(E-mail:guomc@nwsuaf.edu.cn) S512.1;S330 A 1009-1041(2017)01-0087-07 網絡出版地址:http://www.cnki.net/kcms/detail/61.1359.S.20170103.1629.024.html

5 討 論





