999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

一個高效實現灰色關聯分析的R程序

2015-12-25 00:34:52高志華李桂琴石曉輝馬莉麗
安徽農學通報 2015年23期
關鍵詞:灰色關聯分析

高志華++李桂琴++石曉輝++馬莉麗

摘 要:灰色關聯分析模型是一種廣泛應用于各個科研領域的重要的統計模型,但其數據處理過程計算量很大。R是一門高級統計計算編程語言,可以在通用公共許可(GPL)規則下從互聯網免費獲取。該研究基于灰色關聯分析方法設計了一個可快速自動計算鄧氏關聯度的R程序,通過成功應用于實例,驗證了本程序的可行性和高效性。

關鍵詞:R語言;灰色關聯分析;R程序應用實例

中圖分類號 N941.5 文獻標識碼 A 文章編號 1007-7731(2015)23-13-04

An Efficient R Program for Implementing Grey Relational Analysis

Gao Zhihua1,2,3 et al.

(1College of Biological Science and Engineering,Hebei University of Economics and Business,Shijiazhuang 050061,China;2 School of Life Science,Hebei Normal University,Shijiazhuang 050016,China;3 School of Life Sciences,Fudan University,Shanghai 200438,China)

Abstract:Grey relational analysis model widely used in various scientific research fields is a very important statistical model,but it needs lots of computations to finish the whole data process. R is an advanced programming language for statistical computing and is available as free software downloaded from the Internet under the terms of the Free Software Foundations GNU General Public License.In this paper,based on the method of grey relational analysis,a fast automatic calculation program in R for Deng relational degree is designed,and successfully applied into the actual case to verify its feasibility and high-efficiency.

Key words:R program;Grey relational analysis;Application case in R program

灰色關聯分析是從無序、隨機的系統特征量中確定各因素間的關聯程度,早在1982年,鄧聚龍教授就提出了計算灰色關聯度的統計模型,該模型基本思想是根據序列曲線幾何形狀的相似程度來判斷其聯系是否密切,曲線越接近,則相應序列之間關聯度就越大,反之則越小[1-3]。灰色關聯分析方法是處理“小樣本”、“貧信息”不確定系統的有效方法,因其實用性強,且不像其他多元統計模型(如相關、回歸等)要求大樣本和符合典型分布,故在許多科學研究領域都用廣泛應用[4]。經初步統計中國知網文獻檢索結果,發現從2000年至今,公開發表的應用灰色關聯分析模型解決生命科學問題的相關學術論文已有506篇,且大體呈上升趨勢(如圖1所示),可見,灰色關聯分析方法在生命科學領域的應用日益廣泛。

圖1 2000年至今發表的灰色關聯分析方面論文篇數

目前,常用的數理統計軟件有:Excel、SPSS、SAS、DPS等[5,6]。在這506篇論文中有120篇明確指出了灰色關聯分析所使用的數據分析軟件,但是所使用的軟件種類卻不盡相同(見表1)。

Excel是Microsoft Office辦公軟件的組件之一,具有數據統計分析的功能,比較靈活、直觀,能夠根據不同計算目的,編寫不同的公式來進行一些簡單的數據分析,有6.67%的灰色關聯分析單獨使用Excel來完成,有27.5%的灰色關聯分析需要Excel配合其它軟件來完成,說明Excel在日常數據分析中占有重要地位,但是,如果使用Excel處理大量數據,即使是使用相同算法,也需要每次輸入眾多數學公式,進行繁瑣的代數運算,費時費力,還易出錯;SPSS和SAS都是非常優秀的國外數理統計軟件,它們區別在于:前者已經將常用的統計算法固化于軟件之中,只要熟練掌握使用方法,能夠減少重復性勞動,且分析效率高,但由于其自身封閉性,如果想使用一些不常用或最新的算法處理自己的數據,則不支持,除非軟件編制者更新這些算法,后者除了具備各種統計功能之外,還能夠通過編程來實現自己的特殊算法,以滿足不同的數據處理需求,但是,要求使用者事先熟練掌握其復雜的編程語法,由于二者都要求使用者事先熟練掌握大量的功能函數及相應分析模型的理論,而且都是英文操作界面,這就使得基礎科技工作者難以在短期內準確掌握;Matlab已經發展為綜合高性能的數值計算軟件,在數理統計方面的功能不斷增強,也支持編程,情況與SAS類似[7];DPS(Data Processing System)是由浙江大學農業與生物技術學院唐啟義教授研發的國內首款中文操作界面數理統計軟件,因其無需使用者了解具體運算細節,僅靠點擊鼠標即可完成絕大多數的數據分析任務,簡單易行,所以越來越得到廣大科技工作者的認可[8]。與SPSS、SAS和Matlab的22.5%使用率相比,有56.67%的學者選擇DPS進行灰色關聯分析也充分說明了這一點。但值得一提的是,無論是與SPSS、SAS、Matlab,還是DPS,都屬于商業軟件,有的甚至還需要二次支付額外費用才能使用這些軟件的某些數理統計模塊,無疑給科研工作增加了不小的成本投入。也正是基于這一點,本文首次探索R語言實現灰色關聯分析的新途徑。

1 R語言簡介

R語言是一門出色的統計計算編程語言,屬于解釋性計算機語言,可以在通用公共許可(GPL)規則下從互聯網免費獲取,能夠將其部署在Microsoft Windows、UNIX、Linux以及Macintosh OS X系統中,可以實現“一次編碼,到處運行”,極大提高了分析效率[9]。R語言為統計建模和圖示提供了種類繁多、唾手可得的軟件包,還允許用戶既可以使用成熟的統計技術,也可以使用實驗性的統計技術。同時,R語言具有極其豐富的繪圖功能,如前文圖1就是使用ggpolt2 R包繪制。與C/C++語言相比,R語言是一種更加高級的編程語言,易學易用,盡管其執行速度稍遜,但實踐表明,其開發速度帶來的效益遠遠大于執行速度帶來的損失,特別是在現代計算機的處理速度情況下。R語言現已逐步成為國內外眾多科技工作者青睞的數據分析工具。

2 鄧氏灰色關聯分析算法簡介及R實現

灰色關聯分析方法依據空間理論的數學基礎,按照規范性、偶對稱性、整體性和接近性的灰色關聯四原則,以確定參考序列和若干個比較序列之間的關聯系數和關聯度。鄧氏關聯分析模型是最早運用灰色系統理論計算灰色關聯度的統計模型,在各個學科領域均有應用,所以尋求一種簡單、自動、高效的鄧氏關聯度計算方法十分必要。

2.1 鄧氏灰色關聯分析算法 鄧氏灰色關聯分析模型包括以下6個計算步驟:

(1)確定待分析的變量序列。參考序列用x0表示,比較序列用xi(i=1,2,…,n,表示共有n個比較序列)表示,統稱為變量序列[4]。

(2)對變量序列進行無量綱化。為了消除各指標量綱不一致對關聯分析的影響,要在分析前對變量序列原始數據進行無量綱化處理,處理后的參考序列用x′0表示,比較序列用x′i(i=1,2,…,n,表示共有n個比較序列)表示。常用的方法有初值化法、均值化法、區間化法、逆化法、倒數化法等[10-11]。

(3)求差序列、最大差和最小差。根據公式:△0i(k)=|x′0(k)-x′i(k)|(其中,i=1,2,…,n,表示共有n個比較序列;k=1,2,…,m,表示每個比較序列由m個指標組成)計算參考序列與其余各比較序列的絕對差值,并找出其中的最大差和最小差,分別用△max與△min表示。

(4)計算關聯系數。其中,為關聯系數,ρ為分辨系數,0≤ρ≤1,一般ρ取0.5。

(5)計算關聯度。其中,為參考序列x0與比較序列xi的鄧氏關聯度,為第k個指標的加權系數。

(6)按取值大小進行排序。對各從大到小進行排序,取值越大,說明比較序列與參考序列的平均距離越小,越相似。

2.2 鄧氏灰色關聯分析算法的R實現及要求 利用R軟件(V3.20)編程實現上述算法,該程序提供了初值化和均值化兩種變量序列無量綱化方法,及是否加權計算鄧氏關聯度的選項,運行該程序的基本環境要求如下:(1)硬件要求:目前主流的個人電腦配置(32位或64位)均可,一般硬盤最好40GB以上,內存最好2GB以上。(2)軟件要求:安裝WindowXP或Windows 7操作系統,安裝2003及以上Microsoft Office辦公軟件,安裝V3.20及以上R環境。

3 R程序應用于實例

以灰度關聯分析方法對不同南瓜品種的產量和果膠質量(果膠含量、酯化度、粘度)進行綜合評價為例[12],使用上述R程序進行灰度關聯分析過程如下:

3.1 新建原始數據文件 新建原始數據文件example.csv,鍵入不同南瓜品種的產量和果膠質量(果膠含量、酯化度、粘度)的原始數據(見表2),保存并退出。

在上述命令中,greyRelationalAnalysis.R為鄧氏灰色關聯分析R程序,example.csv為原始數據文件,接下來的2個“1”分別是無量綱化方法參數和是否加權參數,out.csv為分析結果文件。在此,無量綱化方法參數共有2個:1表示初值化法,2表示均值化法;是否加權參數也有兩個:0表示不加權,1表示加權。

3.3 分析結果 采用初值化法將9種南瓜品種(含假設理想品種)各指標的平均值進行無量綱化后,得到如表3所示結果;再將8種南瓜品種分別與假設理想品種做比較,得到8種南瓜品種與假設理想品種間各指標的關聯系數(見表4);然后按照加權(各指標的權重依次為:0.35、0.25、0.20、0.20)和不加權兩種方式計算8種南瓜品種與假設理想品種間鄧氏關聯度;最后對兩類關聯度分別進行排序(見表5)。

由表5可知,不論是加權還是不加權,北京1號的鄧氏關聯度最高,京紅栗的鄧氏關聯度最低,根據灰色系統理論,北京1號不僅產量高,而且果膠品質好,適宜用于果膠開發,京紅栗不宜作果膠開發原料,這與蘇艷玲等[12]的分析結果一致,說明本文開發的R程序可以進行鄧氏灰色關聯分析。

4 討論與結論

根據研究對象的不同特征,除鄧氏灰色關聯分析模型外[13],還有灰色絕對關聯度、相對關聯度、廣義關聯度[14-16]、灰色斜率關聯度、區間關聯度Ⅰ[17]、點關聯度、區間關聯度Ⅱ[18]、B型關聯度、C型關聯度[19]、T型關聯度[20]、向量關聯度、復數關聯度[21]等。SPSS和DPS是十分成熟的軟件,但很難涵蓋上述所有灰色關聯分析模型;SAS和Matlab除了提供各種統計功能,還支持編程,但由于和SPSS、DPS一樣,只有付費才能獲得正版軟件的使用權,增加了廣大科技工作者的科研成本;Excel生動直觀,但計算繁瑣且容易出錯。R軟件是一款自由、免費、開源的軟件,具有強大的統計分析功能,同時又是一門高級編程語言,而且無需編譯過程,開發周期較短,代碼維護方便,程序運行簡單。本文根據鄧氏灰色關聯分析算法編寫的R程序分析了不同南瓜品種的產量和果膠質量(果膠含量、酯化度、粘度)各指標,得到了與蘇艷玲等[12]一致的分析結果,并且從原始數據輸入到分析任務完成僅用0.019秒(見圖2),可見本程序對灰色關聯分析的可行性和高效性,同樣,本程序也非常適合大量數據的分析和重復性強的工作。通過利用R編程對鄧氏關聯分析的成功探索,為日后繼續開發其它灰色關聯分析模型的R程序奠定了堅實基礎。

參考文獻

[1]鄧聚龍.灰色系統基礎方法[M].武漢:華中理工大學出版社,1987.

[2]李東亮,馮廣林,李剛,等.灰色系統理論在煙草質量評價中的應用[M].北京:中國水利水電出版社,2013.

[3]劉思峰,謝乃明.灰色系統理論及其應用[M].北京:科學出版社,2013.

[4]譚學瑞,鄧聚龍.灰色關聯分析:多因素統計分析新方法[J].統計研究,1995,65(3):46-48.

[5]朱海濤,陳黎,涂自良,等.DPS數據處理系統在藥學研究數據處理中的應用[J].醫藥導報,2006,25(4):363-365.

[6]唐啟義,馮明光.DPS數據處理系統——實驗設計、統計分析及模型優化[M].北京:科學出版社,2006.

[7]周建興,豈興明,矯津毅,等.MATLAB從入門到精通[M].北京:人民郵電出版社,2012.

[8]唐啟義.通用統計軟件DPS研制與應用[J].科學中國人,2004(9):56.

[9]郝智恒,何通,鄧一碩,等.R語言統計入門(第2版)[M].北京:人民郵電出版社,2014.

[10]徐文鳳,毛志泉,孫海濤,等.灰色關聯度分析法在拮抗絲核菌木霉菌株篩選中的應用[J].山東農業大學學報,2012,43(2):189-192.

[11]劉新梅,徐潤芳,張若勇.鄧氏灰色關聯分析的應用模型[J].統計與決策,2008,262(20):23-25.

[12]蘇艷玲,張學杰.不同南瓜品種果膠含量與特性分析及其利用評價[J].園藝學報,2014,41(11):2323-2328.

[13]鄧聚龍.灰色系統理論教程[M].武漢:華中理工大學出版社,1990.

[14]劉思峰,黨耀國,方志耕.灰色系統理論及其應用[M].北京:科學出版社,2010.

[15]XIE N M,LIU S F.Research on evaluations of several grey relational models adapt to grey relational axioms[J].Journal of Systems Engineering and Electronics,2009,20( 2):304-309.

[16]GU H,SONG B F.Study on effectiveness evaluation of weapon systems based on grey relational analysis and TOPSIS[J].Journal of Systems Engineering and Electronics,2009,20(1):106-111.

[17]崔杰,黨耀國,劉思峰.幾類關聯分析模型的新性質[J].系統工程,2009,27(4):65-70.

[18]肖新平,宋中民,李峰.灰技術基礎及其應用[M].北京:科學出版社,2005.

[19]王清印.灰色B型關聯度分析[J].華中理工大學學報,1989,17(6):77-81.

[20]唐五湘.T型關聯度及其計算方法[J].數理統計與管理,1995,14(1):34-37.

[21]謝乃明,劉思峰.積累關聯度模型的平行性和一致性[J].系統工程,2007,25(8):98-103.

(責編:張長青)

猜你喜歡
灰色關聯分析
內蒙古產業結構與經濟增長的動態關系研究
運動員組織承諾水平的評價與提升策略
新疆向西開放度與經濟增長灰色關聯分析
基于灰色關聯分析的制造企業跨國并購財務決策
秸稈資源化對吉林省經濟結構的影響研究
中國能源消費與經濟增長關系研究
時代金融(2016年30期)2016-12-05 19:01:53
基于灰色關聯分析的京津冀區域物流一體化協同發展
探究區域碳績效評價體系
中國市場(2016年30期)2016-07-18 05:05:12
海南省第三產業及其子行業對經濟增長的作用分析
中國市場(2016年20期)2016-06-12 04:45:59
甘肅省農產品物流與其影響因素關系的實證研究
商(2016年13期)2016-05-20 10:22:02
主站蜘蛛池模板: 国产91精品久久| 久久国产精品麻豆系列| 午夜国产精品视频| 亚洲成a人片| 亚洲精品少妇熟女| 日韩欧美网址| 伊人久久久大香线蕉综合直播| 中国一级特黄大片在线观看| 国产男女免费视频| 亚洲欧美另类日本| 欧美亚洲欧美| 内射人妻无码色AV天堂| 91久久偷偷做嫩草影院免费看| 亚洲首页国产精品丝袜| 久久大香香蕉国产免费网站| 国产中文在线亚洲精品官网| 国产中文一区a级毛片视频| 日本黄色不卡视频| 国产91色在线| 无码人妻热线精品视频| 思思热精品在线8| 国产美女精品在线| 欧美国产视频| 亚洲成人在线免费| 日本不卡视频在线| 在线a网站| 成人午夜天| 欧美色图久久| 久久永久免费人妻精品| 99精品视频在线观看免费播放| 中文字幕天无码久久精品视频免费| 国产91丝袜| 国产欧美日韩综合一区在线播放| 国产不卡网| 国产91色| 国模沟沟一区二区三区| 71pao成人国产永久免费视频| 亚洲男人的天堂久久精品| 波多野结衣的av一区二区三区| 超碰91免费人妻| 色AV色 综合网站| 国产美女无遮挡免费视频网站 | 国产一区二区三区在线观看免费| 亚洲欧美成人综合| 在线观看亚洲国产| 国产精品深爱在线| 重口调教一区二区视频| 中字无码精油按摩中出视频| 久久永久免费人妻精品| 久久99蜜桃精品久久久久小说| 91亚洲影院| 中日韩一区二区三区中文免费视频 | 成人在线亚洲| 在线观看国产小视频| 一区二区三区精品视频在线观看| 成人精品免费视频| 不卡的在线视频免费观看| 午夜国产在线观看| 欧美一级大片在线观看| 美女无遮挡免费视频网站| 91福利免费| 8090成人午夜精品| 97在线观看视频免费| 国产jizz| 色丁丁毛片在线观看| 欧美午夜理伦三级在线观看| 91无码人妻精品一区| 激情亚洲天堂| 国国产a国产片免费麻豆| 久久久久久久久18禁秘| 久久久噜噜噜| 亚洲国产综合精品一区| 国产成人亚洲欧美激情| 网友自拍视频精品区| 精品国产香蕉伊思人在线| 毛片卡一卡二| 91亚洲精选| 天天色天天操综合网| 日本高清在线看免费观看| 蜜芽国产尤物av尤物在线看| 亚洲天堂免费| V一区无码内射国产|