999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

名義變量的關聯強度分析

2017-08-11 10:48:45戴建國
商丘師范學院學報 2017年9期
關鍵詞:關聯

戴建國

(廣州大學 數學與信息科學學院,廣東 廣州 510006)

?

名義變量的關聯強度分析

戴建國

(廣州大學 數學與信息科學學院,廣東 廣州 510006)

針對獨立性檢驗統計量不能度量關聯性強弱和一些關聯測度不具解釋性的問題,首先介紹了Goodman—Kruskal提出的兩種度量名義變量間關聯性強弱的指標,然后將其拓展到多變量的情況,并給出了實例進行分析,結果表明其對實際情況的確有更好更合理的解釋意義.

名義變量;關聯測度;可解釋性

0 引 言

隨著大數據時代的興起,在數據分析工作中經常會遇到離散變量數據的情況,在醫學和社會學統計工作中尤為普遍,而其也通常是通過列聯表的形式來分析.在對于最簡單的二維名義變量列聯表(即兩個變量都不存在自然序)分析時,通常只對兩個名義型變量進行獨立性檢驗,涉及到的檢驗統計量有皮爾遜卡方統計量,Yate’s連續修正卡方統計量,似然比等檢驗統計量.但對于獨立性檢驗統計量來說,它們只能驗證變量間有沒有關聯,而不能給出一個度量關聯的指標,當然也存在一些度量列聯表中變量關系強弱的指標,比如Phi系數,列聯系數,Cramer’s系數[1]等一些度量指標,而他們依然存在局限性,首先它們作為一個度量指標沒有給出合理的解釋,其次是比較難用于高維列聯表的情況.而本文介紹的測度λGK,τGK克服了這些局限性,它們是Goodman—Kruskal在1954年提出來的[2],其都是以引入某變量后而減少預測誤差比例為基礎來構造的統計量.目前對于這兩個關聯測度的研究與應用的文獻有[3-6],尤其在文獻[3]中從不同的角度給出了τGK的更為一般的形式和深入的研究.

1 列聯表的概念與結構

設一個二維列聯表,其行為名義變量A有r個類別,列為名義變量B有c個類別,如表1所示,

表1 二維列聯表的一般結構

2 關聯測度λGK,τGK的定義與解釋

2.1 關聯測度λGK

當有兩個名義變量X,Y時,分別視為自變量和因變量,設它們的類別數分別為I,J,則有一個二維列聯表與之對應,其主要過程是基于最佳預測,當不知道X信息時,自然而然會將Y預測為其邊緣概率最大的一類;知道X信息時,則在X的每一個類別下預測Y類別中最大的那一類,其相對減小即為:

當可拓展到有n個名義變量的情況,設其中一個因變量為Y,其他n-1個為自變量記為X1,……X(n-1),對應的類別數分別為N1,……,N(n-1),則對應的關聯測度為:

2.2 關聯測度τGK

3 實例分析

表2 有關黨派認同的數據

4 結束語

對于以上給出的關聯測度,其與一些檢驗統計量和關聯指標相比,不僅能度量關聯性的強弱,而且具有可解釋性,在國外已被廣泛討論與應用,但在國內比較少人關注這兩個關聯測度,而且隨著R軟件的普及,也有專家給出計算相關指標的函數包,并命名為Goodman-Kruskal以方便被更多人使用,但該包中只給出兩個名義變量的計算函數,并沒有給出多變量的情況,所以有待進一步去研究.

[1]薛允蓮,姜世強,劉貴浩,等.列聯表資料的關聯強度[J].中國衛生統計,2011,28(3):244-246.

[2]GoodmanLA,KruskalWH.MeasuresofAssociationforCrossClassifications[J].Springer-Verlag,1979,31(49):20-30.

[3]HuangW,ShiY,WangX.Anominalassociationmatrixwithfeatureselectionforcategoricaldata[J].Statistics,2013,25(25):58-65.

[4]BiswasA,ParkE.Measuresofassociationfornominalcategoricalvariables☆[J].JournaloftheKoreanStatisticalSociety,2009,38(3):247-258.

[5]TahaA,HadiAS.Pair-wiseassociationmeasuresforcategoricalandmixeddata[J].InformationSciences,2016,s346-347:73-89.

[6]LeeAJ.Somesimplemethodsforgeneratingcorrelatedcategoricalvariates[J].ComputationalStatistics&DataAnalysis,1997,26(2):133-148.

[責任編輯:王 軍]

Nominal variable correlation strength analysis

DAI Jianguo

(School of Mathematics and Information Science,Guangzhou University,Guangzhou 510006,China)

in view of the independence test statistics can’t measure strength of correlation and some associated measures can’t be interpreted,first introduced the Goodman-Kruskal correlations strength index between two nominal variables i,then extended to multivariable case,and gives the examples were analyzed,and the results show that the fact there are better and reasonable explanation.

nominal variables;correlation measure;interpretability

2017-02-21

戴建國(1992—),男,江西撫州人,廣州大學碩士研究生,主要從事概率統計,數據挖掘的研究.

O211

A

1672-3600(2017)09-0011-03

猜你喜歡
關聯
不懼于新,不困于形——一道函數“關聯”題的剖析與拓展
“苦”的關聯
當代陜西(2021年17期)2021-11-06 03:21:36
船山與宋學關聯的再探討
原道(2020年2期)2020-12-21 05:47:06
“一帶一路”遞進,關聯民生更緊
當代陜西(2019年15期)2019-09-02 01:52:00
新制度關聯、組織控制與社會組織的倡導行為
奇趣搭配
基于廣義關聯聚類圖的分層關聯多目標跟蹤
自動化學報(2017年1期)2017-03-11 17:31:17
智趣
讀者(2017年5期)2017-02-15 18:04:18
探討藏醫學與因明學之間的關聯
西藏科技(2016年5期)2016-09-26 12:16:39
GPS異常監測數據的關聯負選擇分步識別算法
主站蜘蛛池模板: 国产在线一区视频| 久久99国产精品成人欧美| 午夜a级毛片| 精品三级网站| 伊人久久精品无码麻豆精品| 热99re99首页精品亚洲五月天| 亚洲一区国色天香| 久久综合九九亚洲一区| 97国内精品久久久久不卡| 亚洲性视频网站| 九九久久99精品| 3344在线观看无码| 日韩午夜伦| 成人福利在线视频| 综合天天色| 日本三级欧美三级| 欧洲高清无码在线| 亚洲综合国产一区二区三区| 男女精品视频| 国产精品亚洲αv天堂无码| 无码人妻免费| 麻豆精品久久久久久久99蜜桃| 亚洲天堂日韩av电影| 99尹人香蕉国产免费天天拍| 青青青国产在线播放| 少妇极品熟妇人妻专区视频| 40岁成熟女人牲交片免费| 国产探花在线视频| 国产精品19p| 久久久亚洲色| 欧美成人综合视频| 久久伊人久久亚洲综合| 少妇精品网站| 国产理论最新国产精品视频| 91在线国内在线播放老师| 99热在线只有精品| 性欧美久久| 国产一级毛片网站| 美女被操91视频| 欧美人人干| 2021国产精品自拍| 五月天在线网站| 毛片在线看网站| 国产精品一线天| 女人18一级毛片免费观看| 午夜毛片福利| 亚洲成人高清无码| 久久精品中文字幕免费| 欧亚日韩Av| 日韩中文精品亚洲第三区| 99久久精品免费看国产电影| 欧美中文字幕无线码视频| 亚洲91在线精品| 亚洲午夜综合网| 免费黄色国产视频| 欧美国产菊爆免费观看 | 国产精品视频3p| 久久伊人操| 一级爆乳无码av| 欧美有码在线观看| 亚洲性一区| 超碰精品无码一区二区| 韩日无码在线不卡| 91青草视频| 日本精品影院| 国产激情无码一区二区免费| 无码中文字幕乱码免费2| 四虎国产精品永久一区| 国产探花在线视频| 蜜桃视频一区| 一本一道波多野结衣av黑人在线| 在线视频亚洲色图| 国产成人无码AV在线播放动漫| 免费国产一级 片内射老| 色综合网址| 福利在线不卡一区| 91在线国内在线播放老师 | 国产色图在线观看| 亚洲经典在线中文字幕| 精品综合久久久久久97| 美女无遮挡被啪啪到高潮免费| 久久免费观看视频|