999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

模糊區間點二列相關系數和多系列相關系數

2023-01-13 12:04:20王鑫蕊竇鑫瑩楊志清施建華
高師理科學刊 2022年11期
關鍵詞:方法研究

王鑫蕊,竇鑫瑩,楊志清,施建華,2,3,4

模糊區間點二列相關系數和多系列相關系數

王鑫蕊1,竇鑫瑩1,楊志清1,施建華1,2,3,4

(1.閩南師范大學 數學與統計學院,福建 漳州 363000;2.福建省粒計算及其應用重點實驗室,福建 漳州 363000;3.福建省數據科學與統計重點實驗室,福建 漳州 363000;4.數字福建氣象大數據研究所,福建 漳州 363000)

在探討2個隨機變量的相關性研究中,隨機變量型態已由相同型態擴展至混合型態.然而,在混合隨機變量組合的條件下,當數據呈現模糊區間型態時,傳統相關系數演算法將不適合使用.借鑒傳統點二列相關系數研究成果,基于二分類與連續型以及多類別與連續型等混合型隨機變量組合,提出了模糊區間點二列相關系數和模糊區間多系列相關系數的改進算法,并通過蒙特卡洛模擬和實證分析,驗證了該方法的有效性.

模糊區間;點二列相關系數;模糊區間點二列相關系數;模糊區間多系列相關系數

自19世紀80年代皮爾遜(Pearson)首次提出了皮爾遜積差相關系數的演算方法之后,研究2個隨機變量間相關性的風潮隨之開啟.與相關圖和相關表2種傳統的方法不同,相關系數可以將相關性進行量化說明,更直觀地反映出變量間相關關系的強弱.皮爾遜積差相關系數是用線性關系的方式來衡量連續型隨機變量的相關性,取值介于區間,當相關系數為正數時表示2個變量呈現正向相關,當相關系數為負數時表示2個變量呈現負向相關,系數值越接近于0,則相對表示2個隨機變量的相關程度越弱.然而,對于離散型隨機變量或定序型隨機變量,將無法通過皮爾遜積差相關系數來衡量隨機變量間的相關性,學者們為了探討離散型隨機變量或定序型隨機變量的相關性,提出了等級相關系數方法,如Spearman等級相關系數和Kendall等級相關系數,它們都是利用排序秩差的方式來衡量分級定序變量之間的相關性.

此外,當2個變量是離散變量中的類別變量或連續變量中的定距變量時,往往需要根據變量的特性導入不同的相關系數演算方法,從而更準確地計算變量間的實質相關程度[1].在類別變量的部分,一般采用Harald Cramer于1946年提出的Cramer′s V系數進行變量的相關性探討,當2個變量完全相關時取值為1,完全獨立時取值為0.然而,對于類別變量與定距變量混合型態的數據集,變量之間的相關性無法根據之前所提及的方法進行衡量.1960年,Gupta[2]討論了類別變量與定距變量間相關性的問題,推導了一般情況下點二列相關系數的大樣本標準差公式,同時引入了多序列相關系數,并進一步研究了它的一些性質.

近年來,在類別變量與定距變量混合的環境條件下,相關混合數據開始逐漸涌現,如醫療領域中對于疾病治愈和用藥量的關系,教育領域中學生高考錄取和會考成績間的關系等,反映了混合型態的數據已成為各領域所亟需重視的方向.在投資學中,點二列相關系數可以被用來研究投資者人格與投資行為的關系,有利于據此提出有針對性的投資建議[3].在教育領域中,文獻[4]利用點二列相關系數研究語言偏誤與學生性別、年齡和社會環境間的相關性,研究結果說明了學生書面表達中存在的偏誤與語文學業成績呈現負相關,同時與性別、年齡和社會環境之間也存著在不同程度的相互影響;Vincent[5]等在考試環境下,通過點二列相關系數對實際數據進行了相關性分析,并對如何利用點二列相關系數解決實際問題進行了介紹.在醫學領域中,曹盼盼[6]等利用點二列相關系數公式分析了年齡、平均收縮壓、空腹血糖、血清白蛋白等與蒙特利爾認知評估量表(MoCA-B量表)評分的相關性,研究結果對老年慢性腎臟病的預防與治療起到了積極作用.

隨著現代數據收集的更新演化,現實所觀測到的數據發生了量與型態上的改變,數據采集的過程中變量的生成方式也由傳統的單變量轉變為區間型態變量,這也促進了區間數據統計分析方法的演進[7-8].從相關系數的研究進程來看,模糊區間相關系數已經被提出[9-11].但模糊區間相關系數大部分被用于衡量具有同一變量型態的模糊區間變量間的相關性[12],對于混合型態的模糊區間變量具有一定的局限性.本文將傳統的點二列相關系數方法進行創新,針對單一類別變量與模糊區間定距變量混合型態的數據集,提出模糊區間點二列相關系數這一新方法,并將其推廣到多類別變量與模糊區間定距變量的相關系數研究,進一步擴展了混合型態數據的應用層面,豐富和發展了多元化數據型態的相關性理論研究.

1 模糊區間點二列相關系數及多系列相關系數設計

1.1 模糊區間點二列相關系數

由于傳統的點二列相關系數在多元化數據型態下具有局限性,它對于區間型數據不再適用.因此,本文基于傳統的點二列相關系數方法提出模糊區間點二列相關系數的新定義,用以探討一組區間隨機變量和一組分類變量間的相互影響關系.具體地,模糊區間點二列相關系數(Point Biserial Correlation Coefficient of Fuzzy Interval,PBCCFI)的定義為:

1.2 模糊區間多系列相關系數

由于傳統的多系列相關系數公式比較復雜,人們往往需要借助類別變量上下限的正態曲線高度和正態分布表來計算.為了方便計算,本文提出了先將多類別變量轉化為二分類變量,再由模糊區間點二列相關系數公式來估計模糊區間連續變量與名義變量間相關性的方法,由此得到模糊區間多系列相關系數(Multiserial Correlation Coefficient of Fuzzy Interval,MSCCFI).

2 蒙特卡洛模擬

采用蒙特卡洛(Monte Carlo)方法對模糊區間點二列相關系數及模糊區間多系列相關系數進行模擬分析,通過模擬結果對該方法的效果進行評估.

2.1 模糊區間點二列相關系數

在模糊區間點二列相關系數的演算過程中,可以通過蒙特卡洛模擬方法對所提出的相關系數方法進行驗證,其模擬步驟為:

表1 模糊區間點二列相關系數

王某表現得一點兒也不跋扈,但有犀利的網友讀出了“威脅”:雖說這張關系譜里沒啥級別了不得的官員,但不乏“關鍵崗位”的人物。譬如表姐夫、姥爺的同事,和教育系統關系密切,說不準還會影響到老師的前途。所以即便關系不算近,也要“強蹭”一把。這就有點綿里藏針的味道了。

2.2 模糊區間多系列相關系數

在模糊區間多系列相關系數的演算過程中,應用蒙特卡洛模擬方法對模糊區間多系列相關系數的效果進行驗證,其模擬步驟為:

表2 模糊區間多系列相關系數

3 應用研究

從金融機構的信用貸款角度來看,金融機構在提供信貸專案時,也希望能在風險最小的情況下進行,也就是說個人或企業在申請信用貸款時,金融機構將對個人或企業的信用進行評估,并作為核發貸款的依據.因此,在金融產業領域中,對申請信用貸款的客戶進行信用評等審核,已成為金融機構核撥貸款的常規做法,同時也反映出信用評等與貸款審核結果之間存在著相互影響的程度[16].鑒于此,為了研究信用貸款審核結果和信用評等之間的關系,本文引用2019-01—2019-12某銀行的2個地區分行(分別記為A分行,B分行)的微小企業信貸計分卡總分及貸款審核結果等數據,進行模糊區間點二列相關系數的實證分析.

根據地區各采集了50位貸款申請用戶的數據,分別采取其信用評等計分的最低分和最高分組成區間數值,使其信用評等以區間型態呈現,同時記錄用戶的信用貸款審核結果.具體數據見表3.

表3 微小企業信貸的信用評等與貸款審核結果數據統計

該銀行在A,B分行中,一般以信用評等總分作為衡量貸款申請客戶信用狀況的依據.然而為了避免單一信用評等總分易造成信用誤評的現象及更好地維護客戶權益,部分銀行采用了雙重信用評等方式對貸款申請人進行信用評等.

表4 微小企業信貸的信用評等的描述性統計

續表4

平均值可以反映信用評等總分的集中趨勢,但單從平均值來看,無法判斷樣本觀測點的大致分布情況,因此必須結合標準差統計量的數值進一步對數據進行分析,最后通過均值和標準差2個統計量刻畫出數據的集中和離散程度.如在A分行的部分,以第4項數據為例,其平均值為79.9,數值較大,而其標準差為0.2,數值較小,此時可以認為該項數據的2種信用評分均較高且差異很小,說明該用戶有很大可能通過審核,這一結果與實際審核結果相一致,說明了描述性統計分析在數據分析中有至關重要的作用.在B分行的部分,以第26項數據為例,其平均值為70.9,標準差為0.9,說明該用戶的2種信用評分均較低且較為接近,可以猜測該用戶的審核結果應為拒絕,這也與實際審核結果相符.另外,當數據的平均值和標準差值均處于居中水平時,則無法通過描述性統計分析對審核結果進行判斷.

利用模糊區間點二列相關系數對信用評等總分與審核結果之間的相關性進行量化分析,結果見表5.

表5 信用評等總分與貸款審核結果的點二列相關系數

相關,而最低總分與該分行的信用貸款核撥不相關.表明該分行進行信用貸款核撥時更關注客戶信用評等的最高分,即客戶信用評等總分的最低分較低時,若最高分足夠高,該客戶有很大可能通過貸款審核.

4 結語

本文提出的模糊區間點二列相關系數和模糊區間多系列相關系數方法,適用于模糊區間類別變量相關性分析的一類問題,能有效地度量混合型模糊區間隨機變量的相關性.其中,模糊區間點二列相關系數方法與傳統點二列相關系數相比最大的優勢是可以保持數據的維度不被改變,將搜集到的區間觀測信息充分利用起來,得到的結果不僅可以體現2個變量間的相關性,還可以呈現變量改變時相關性變化的程度.而模糊區間多系列相關系數的優點在于其不僅簡化了多系列相關系數的演算過程,而且使多維數據在分析過程中保持維度不變,保證了數據信息的完整性,從而使分析結果更具有說服力,為決策者提供更合理的參考依據.

[1] 金林,李研.幾種相關系數辨析及其在R語言中的實現[J].統計與信息論壇,2019,34(4):3-11.

[2] Gupta S.Point Biserial Correlation Coefficient and Its Generalization[J].Psychometrika,1960,25(4):393-408.

[3] 孔煒.上海市股票投資者的人格與投資行為的關系的研究[D].上海:華東師范大學,2005.

[4] 孫學明.初中學生語文偏誤的統計學調查與研究[D].北京:首都師范大學,2004.

[5] Vincent L B,Michael A,Cox A.Interpretation of the point-biserial correlation coefficient in the context of a school examination[J].The Quantitative Methods for Psychology,2017,13(1):46-56.

[6] 曹盼盼,閻磊,顧玥,等.頸動脈內中膜厚度增加與老年慢性腎臟病患者發生認知功能障礙的相關性[J].中華實用診斷與治療雜志,2019,33(2):124-127.

[7] 王美涵,陳培樂,潘曉映,等.基于相依區間值數據的EWMA FIMSE控制圖[J].閩南師范大學學報(自然科學版),2021,34(3):1-7.

[8] 李城恩,潘曉映,王美涵,等.基于區間型數據計量的我國糧食產量研究[J].廣西師范大學學報(自然科學版),2022,40(1):206-215.

[9] Cheng Y T,Yang C.An Approach of Stocks Substitution Strategy Using Fuzzy Interval Correlation Coefficient[J].Communications in Statistics-Simulation and Computation,2016,45(4):1187-1196.

[10] Yang C C.Correlation Coefficient Evaluation for the Fuzzy Interval Data[J].Journal of Business Research,2016,69(6):2138-2144.

[11] 楊志清.計數區間的模糊相關系數研究[J].統計與決策,2020,36(20):28-32.

[12] 王忠玉,吳柏林.一類模糊數據的相關系數研究[J].經濟研究導刊,2015(2):248-251.

[13] Lev J.The Point Biserial Coefficient of Correlation[J].The Annals of Mathematical Statistics,1949,20(1):125-126.

[14] 秦志仁,董咪達.多系列相關系數的矩法估計[J].重慶師范大學學報(自然科學版),2004,21(1):10-13.

[15] 李金華.模糊數學方法與統計賦權[J].數量經濟技術經濟研究,2000(10):34-38.

[16] 汪順玉,吳世銀.評分員信度的多系列相關分析方法原理及運用[J].重慶郵電學院學報(社會科學版),2006(6):945-947.

Point biserial correlation coefficient and multiserial correlation coefficient of fuzzy interval

WANG Xinrui1,DOU Xinying1,YANG Zhiqing1,SHI Jianhua1,2,3,4

(1. School of Mathematics and Statistics,Minnan Normal University,Zhangzhou 363000,China;2. Fujian Key Laboratory of Granular Computing and Applications,Zhangzhou 363000,China;3. Fujian Key Laboratory ofData Science and Statistics,Zhangzhou 363000,China;4. Fujian Institute of Meteorological Big Data,Zhangzhou 363000,China)

In the study of the correlation between two random variables,the type of random variables has been expanded from the same type to the mixed type.However,under the condition of the combination of mixed random variables,the traditional correlation coefficient algorithm is not suitable for use when the data type presents a fuzzy interval pattern.Referring to the research results of traditional point biserial correlation coefficient,based on the mixed random variables combination of binary variables and multi-categorical variables with continuous random variables,the point biserial correlation coefficient and multiserial correlation coefficient of fuzzy interval are proposed.Afterwards,the effectiveness of this method is verified through Monte Carlo simulation and empirical analysis.

fuzzy interval;point biserial correlation coefficient;point biserial correlation coefficient of fuzzy interval;multiserial correlation coefficient of fuzzy interval

1007-9831(2022)11-0008-08

O21

A

10.3969/j.issn.1007-9831.2022.11.002

2022-03-15

國家社會科學基金項目(20XTJ003)

王鑫蕊(1997-),女,河南駐馬店人,在讀碩士研究生,從事應用統計分析研究.E-mail:857273302@qq.com

施建華(1977-),男,福建福清人,教授,博士,從事應用統計分析研究.E-mail:v0085@126. com

猜你喜歡
方法研究
FMS與YBT相關性的實證研究
2020年國內翻譯研究述評
遼代千人邑研究述論
視錯覺在平面設計中的應用與研究
科技傳播(2019年22期)2020-01-14 03:06:54
學習方法
EMA伺服控制系統研究
新版C-NCAP側面碰撞假人損傷研究
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
賺錢方法
主站蜘蛛池模板: 国产精品香蕉在线观看不卡| 久久香蕉国产线看精品| 人人91人人澡人人妻人人爽| 久久毛片网| 日日拍夜夜嗷嗷叫国产| 91成人免费观看在线观看| 91久久青青草原精品国产| 亚洲日韩久久综合中文字幕| 亚洲系列中文字幕一区二区| 色综合综合网| 69av免费视频| 中日韩一区二区三区中文免费视频| 农村乱人伦一区二区| 成人无码一区二区三区视频在线观看 | 久青草网站| 婷婷中文在线| 在线无码av一区二区三区| 国产主播在线一区| 国产a v无码专区亚洲av| 久久伊人久久亚洲综合| 亚洲最大情网站在线观看| 国产一级毛片网站| 白丝美女办公室高潮喷水视频| 久久鸭综合久久国产| 欧美亚洲日韩中文| 久久国产精品波多野结衣| 四虎精品免费久久| 大乳丰满人妻中文字幕日本| 72种姿势欧美久久久久大黄蕉| 精品亚洲国产成人AV| 亚洲国产AV无码综合原创| 欧美一区国产| 国产精欧美一区二区三区| 亚洲天堂视频在线播放| 少妇高潮惨叫久久久久久| 国产精品成人不卡在线观看| 99re热精品视频中文字幕不卡| 全免费a级毛片免费看不卡| 成人国产精品视频频| 精品福利一区二区免费视频| 亚洲中文字幕日产无码2021| 97影院午夜在线观看视频| 久爱午夜精品免费视频| 一级毛片免费观看久| 亚洲精品爱草草视频在线| 极品性荡少妇一区二区色欲| 精品视频一区二区观看| 青青热久麻豆精品视频在线观看| 无码aaa视频| 亚洲日本中文字幕天堂网| 国产玖玖视频| 亚洲成a人片77777在线播放| 亚洲综合二区| 亚洲第一成年网| 国内丰满少妇猛烈精品播| 国产免费好大好硬视频| 国产第一页屁屁影院| 日韩AV手机在线观看蜜芽| 精品黑人一区二区三区| 亚洲人成人伊人成综合网无码| 最新国语自产精品视频在| 国产高清精品在线91| 欧美成人看片一区二区三区| 精品国产福利在线| 一级爱做片免费观看久久| 欧美在线天堂| 国产成人AV综合久久| 国产精品久久自在自线观看| 欧美www在线观看| 欧美黑人欧美精品刺激| 久久久久亚洲AV成人人电影软件| 99久久国产自偷自偷免费一区| 国产三级国产精品国产普男人| 久久无码av一区二区三区| 99re视频在线| 日本一本正道综合久久dvd| 永久在线播放| 久草中文网| 国产在线啪| 大香伊人久久| 亚洲av日韩av制服丝袜| 国产第八页|