999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

結合K-均值聚類分析的線性回歸法在相關性分析中的應用
——以高考英語成績與高考總成績的相關性為例

2018-08-17 10:01:06董世榮
長春師范大學學報 2018年8期
關鍵詞:英語分析方法

董世榮

(閩南師范大學外國語言學院,福建漳州 363000)

回歸分析(Regression Analysis)是研究因變量y和自變量x之間數量變化規律,并通過一定的數學表達式來描述這種關系,進而確定一個或幾個自變量的變化對因變量的影響程度。可以簡單地理解為用一種確定的函數關系近似代替比較復雜的相關關系,用線性回歸方程來描述其關系,進而確定一個或幾個變量的變化對另一個變量的影響程度。回歸分析所研究的主要問題就是如何利用變量x,y的觀察值(樣本),對回歸函數進行統計推斷,包括對它進行估計及檢驗與其有關的假設等,從而為預測提供科學依據。

目前,在外語定量研究中基本都是采用線性回歸方法對兩個變量間相關性進行研究。簡單線性回歸的原理是基于最小二乘法原則(即保證各實測點至直線的縱向距離的平方和最小)得到回歸系數R2和回歸直線在Y軸上的截距b[1-4]。本文把SPSS 19.0系統軟件中K-均值聚類分析原理與一元線性回歸原理相結合,提出一種研究兩個變量間相關性的新方法。

1 數據與方法

1.1 數據來源

某校2014級某專業的學生,共計92人,以其高考總成績與高考英語成績為研究對象。

1.2 研究方法

(1)以樣本的高考總成績為因變量、高考英語成績為自變量,對樣本數據進行一元線性回歸的相關性研究(以下簡稱方法一)。線性回歸方法在SPSS 19.0統計軟件中的設置方法如下:“Analyze”→“Regression”→“Linear”,從而得到相應的輸出結果。

(2)結合K-均值聚類分析、再進行一元線性回歸的相關性研究方法(以下簡稱方法二):設置聚類數,把高考總成績變量作為被聚對象進行分類并迭代,把若干個最終聚類成績結果作為Y軸數據。再對每個聚類數內的若干個高考英語成績變量取平均值,并將這些均值數據作為X軸數據;然后對這兩列數據(X軸和Y軸)進行一元線性回歸處理,從而得到相應的線性方程和線性系數R2。

2 方法一的結果分析

2.1 數據來源的描述性統計

將92名學生的高考總成績和高考英語成績進行初步的統計分析,提取各項相關數據制表進行對比,其結果如表1所示。

表1 兩種成績的描述性分析

由表1數據顯示,高考英語成績和高考總成績的標準差分別為13.41和8.746,說明該專業學生的整體水平差異比英語水平差異相對較小,同時也說明這些學生的英語水平參差不齊,差距較懸殊。另外,高考英語成績與高考總成績Pearson相關性的雙側顯著性檢驗結果p為0.009,小于0.05,應否定零假設,即高考英語成績與高考總成績間不是獨立的,存在著相關性,Pearson相關系數為0.269。

2.2 方法一在SPSS 19.0軟件中的操作方法及計算結果

在主菜單欄中按“Analyze”→“Regression”→“Linear”和“Analyze”→“Graphs”→“Scatter”的順序逐一點擊鼠標,并進行相關設置;對92名學生的高考總成績和高考英語成績進行統計處理,提取出各項相關數據,并以高考總成績為因變量y,以高考英語成績為自變量x,其線性回歸方程為y=0.173x+491.3。

該線性回歸方程表明:高考英語成績每增加1分,其高考總成績約增加0.173分[4]。該方程中高考總成績與高考英語成績這兩個變量間的相關系數R2為0.072,表明這兩個成績變量并不服從正態分布。

3 方法二的結果分析

3.1 聚類分析的原理

聚類分析又稱群分析,是根據事物本身的特性研究個體分類的方法。通俗地說,就是指相似元素的集合,因此這種方法也常被稱為逐步聚類分析,即先把被聚對象進行初始分類,然后逐步調整,得到最終分類。

SPSS軟件中的聚類分析的原理如下:(1)根據用戶提供的待分析數據的分布情況,結合用戶分析需要所設定的聚類數目,采用距離最近原則進行分類;(2)逐一計算每一數據到各個中心點的距離,最后把各個數據按照距離最近的原則歸入各個類別,并計算新形成類別的中心點;(3)再按照新的中心位置,重新計算每一數據距離新的類別中心點的距離,并重新進行迭代收斂,直到達到一定的收斂標準并形成最終的聚類中心。

3.2 方法二在SPSS 19.0軟件中的操作步驟及計算結果

(1)在SPSS 19.0主菜單中按“Analyze”→“Classify”→“K-Means Cluster”的順序逐一單擊鼠標鍵,打開快速聚類主對話框。然后分別把高考總成績變量移入“Variables”中,把高考英語成績變量移入“Label Cases by”中。在“Number of Clusters”中,根據分析設置需要,填入相應的聚類分類數。其他的采用系統默認設置。

(2)在主對話框中分別打開“Save New Variables”和“Option”對話框,然后勾選“Cluser membership”及“Initial cluster centers,Cluster information for each case”選項,其他的按照默認設置即可。

(3)提取SPSS輸出結果中Final Cluster Centers的高考總成績數據于新建的Excel文件中,并作為Y軸數據;提取SPSS輸出結果的Report中Mean數據(高考英語成績),作為X軸數據;然后再將X軸與Y軸數據進行擬合直線作圖,從而得到線性方程和線性系數R2。

(4)改變步驟(1)中Number of Clusters的數值,進行類似操作,得到不同聚類數時高考總成績和高考英語成績間的線性方程和線性系數R2(表2),并將聚類數m與線性系數R2進行作圖(圖1)。

表2 不同聚類數與線性方程及線性系數之間的變化關系

由表2數據顯示,隨著聚類數的不斷增多,其相關系數的值也逐漸增大。當聚類數為6時,線性系數為0.875。然后隨著聚類數增大,其線性系數又逐漸降低。但聚類數并不能無限增大,當聚類數超過高考總成績的數量時,無法得到線性系數,例如這92位同學的高考總成績分別為35個不同數值,則聚類數不能超過35,否則該方法無法使用。

4 兩種方法在兩變量相關性分析時的優缺點對比

表3 高考英語成績的正態分布分析

表4 兩種方法在進行兩變量間相關性分析時的差異對比

注:*實際高考總成績:某一指定的高考英語成績對應的若干個實際的高考總績。可能的高考總成績(1):指定某一英語成績,采用方法一得到的高考總成績。可能的高考總成績(2):指定某一英語成績,采用方法二得到的高考總成績(6次和30次分別為聚類數,進一步對比不同聚類數在相關性分析中的差異性)。

對圖3的研究結果表明:(1)以實際的高考總成績的標準差為對照線(a線),當采用方法一(b線)進行相關性研究時,其在大于52%區域(圖3中CD段區域)和小于3%區域(圖3中AB段區域),離a線較近,表明采用線性回歸(方法一)得到的高考總成績與實際高考總成績的偏差較小,即該方法在兩變量間相關性分析時能夠得到較合理的分析結果。(2)以實際的高考總成績的標準差為對照線(a線),當采用方法二(c線和d線)進行相關性研究時,其在正態分布的3%~52%區域(圖3中BC和CD段區域),c線與a線的距離及d線與a線的距離均小于b線與a線的距離。這表明采用結合聚類分析的線性回歸法(方法二)得到的高考總成績與實際高考總成績的偏差較小,即該方法在兩變量間相關性分析時能夠得到較合理的分析結果。同時,不同的聚類數會對相關性分析結果造成一定影響。

5 總結

本文將某校2014級某專業學生的高考總成績及高考英語成績作為研究對象,分析了學生高考英語成績及高考總成績的相關性。研究結果表明,該專業學生的高考總成績差異幅度比英語成績差異幅度要小,英語水平總體參差不齊,差距較懸殊。

分別采用方法一和方法二對學生的高考英語成績及高考總成績的相關性進行分析。在高考英語成績的不同分布階段,兩個方法各自有優缺點。因此,為了達到較高的合理性或準確性,當樣本數據分布比較接近正態分布時,應采用一元線性回歸法(方法一)進行兩變量間相關性分析;當樣本數據分布比較偏離正態分布時,應采用結合聚類分析的一元線性回歸法(方法二)進行兩變量間相關性分析。

猜你喜歡
英語分析方法
隱蔽失效適航要求符合性驗證分析
電力系統不平衡分析
電子制作(2018年18期)2018-11-14 01:48:24
電力系統及其自動化發展趨勢分析
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
讀英語
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
捕魚
酷酷英語林
主站蜘蛛池模板: 国国产a国产片免费麻豆| 国产美女精品一区二区| 手机在线看片不卡中文字幕| 国产成人禁片在线观看| 国产天天色| P尤物久久99国产综合精品| 欧美黄网站免费观看| 国产欧美精品专区一区二区| 又黄又湿又爽的视频| 欧美伦理一区| 欧美三级视频在线播放| V一区无码内射国产| 欧美日韩在线观看一区二区三区| 黄色网在线免费观看| 一本综合久久| 孕妇高潮太爽了在线观看免费| 国产男女XX00免费观看| 中文字幕丝袜一区二区| 91精品免费高清在线| 国产激情无码一区二区免费| 激情爆乳一区二区| 国产成人91精品| 嫩草在线视频| 欧美国产日韩另类| 伊人久久精品亚洲午夜| 色综合a怡红院怡红院首页| 国产在线97| 伊在人亚洲香蕉精品播放| 成人精品视频一区二区在线| 亚洲日本韩在线观看| 亚洲一级毛片免费观看| 国产精品免费福利久久播放| 一区二区欧美日韩高清免费| 九九久久99精品| 国产精品妖精视频| 特黄日韩免费一区二区三区| 日韩高清成人| 国产精品色婷婷在线观看| 久久天天躁狠狠躁夜夜2020一| 亚洲第一成网站| 亚洲乱亚洲乱妇24p| 2021亚洲精品不卡a| 中文无码精品A∨在线观看不卡| 免费看美女自慰的网站| 欧美综合在线观看| 日韩欧美国产三级| 亚洲欧美不卡视频| 免费在线成人网| 日本妇乱子伦视频| 欧美午夜在线视频| 日本不卡在线| 国产美女91呻吟求| 欧洲高清无码在线| 免费无码又爽又刺激高| 三区在线视频| 日韩国产亚洲一区二区在线观看| 国产毛片一区| 国产精品九九视频| 国产JIZzJIzz视频全部免费| 亚洲日韩AV无码精品| 免费高清a毛片| 国产资源站| 日本国产精品一区久久久| 欧美A级V片在线观看| 尤物亚洲最大AV无码网站| 无码国内精品人妻少妇蜜桃视频| 思思99思思久久最新精品| 国产jizzjizz视频| 欧美在线国产| 国产成人无码Av在线播放无广告| 国产欧美日韩视频怡春院| 东京热一区二区三区无码视频| 国产尤物在线播放| 精品综合久久久久久97| 亚洲精品福利网站| 色丁丁毛片在线观看| 成人在线第一页| 91年精品国产福利线观看久久 | 3D动漫精品啪啪一区二区下载| 思思热精品在线8| 国产成人免费| 欧美日一级片|