蘇芳莉 李麗鋒
應(yīng)用統(tǒng)計(jì)學(xué)是一門(mén)重要的專業(yè)基礎(chǔ)課,然而,由于實(shí)驗(yàn)室建設(shè)、實(shí)踐基地建設(shè)和師資力量不足,課程存在“重理論、輕實(shí)踐、重方法、輕應(yīng)用”的問(wèn)題,教學(xué)偏離實(shí)際。以應(yīng)用統(tǒng)計(jì)課程為依托,在學(xué)生掌握統(tǒng)計(jì)基本原理、方法的基礎(chǔ)上,從案例背景、目標(biāo)、內(nèi)容和實(shí)施方案等四個(gè)方面,介紹結(jié)構(gòu)模型的設(shè)計(jì)理論和應(yīng)用方法,培養(yǎng)學(xué)生解決實(shí)際問(wèn)題的能力。
在生態(tài)安全控制和預(yù)測(cè)管理過(guò)程中,明晰各因素之間的因果關(guān)系,確定因素間相互作用及作用大小是土壤生態(tài)安全和控制的核心。確定全面、適宜的檢測(cè)與評(píng)價(jià)土壤沙化評(píng)價(jià)指標(biāo)體系是開(kāi)展土壤沙化監(jiān)測(cè)的關(guān)鍵[1]。土壤沙化受氣候、水文、植被、社會(huì)經(jīng)濟(jì)等多種難以直接測(cè)量的因素影響,探索各因素之間的演化過(guò)程,在數(shù)據(jù)中提取信息,從而評(píng)價(jià)和預(yù)測(cè)土壤沙化程度。
傳統(tǒng)上,結(jié)構(gòu)方程模型是一種建立、估計(jì)和檢驗(yàn)因果關(guān)系模型的方法,是基于變量的協(xié)方差矩陣來(lái)分析變量之間關(guān)系的一種綜合性統(tǒng)計(jì)方法[2],因此又稱為協(xié)方差結(jié)構(gòu)分析(CB-SEM)。這種方法要求樣本數(shù)據(jù)符合多變量正態(tài)性,測(cè)量指標(biāo)為線性關(guān)系。隨著大數(shù)據(jù)信息化時(shí)代的到來(lái),大多數(shù)的數(shù)據(jù)流常因因果關(guān)系復(fù)雜而難以確定確切的分布,數(shù)據(jù)類型除了高尺度的數(shù)據(jù)類變量之外,廣泛有低尺度的類別變量,因此許多研究者主張使用偏最小二乘法結(jié)構(gòu)方程模型(PLS-SEM)[3],該方法可最大化解釋內(nèi)生結(jié)構(gòu)的變異,用于同時(shí)具有豐富數(shù)據(jù)和理論框架的研究環(huán)境,對(duì)于異常數(shù)據(jù)特征(例如非正常數(shù)據(jù))和高度復(fù)雜的模型均適應(yīng)。研究目標(biāo)中有形成型指標(biāo),需要進(jìn)行理論上的探討,形成探索式架構(gòu),可以處理結(jié)構(gòu)復(fù)雜的模型問(wèn)題。除此之外,也適用于非正態(tài)總體,樣本量小的情形。目前,已有學(xué)者將PLS-SEM模型應(yīng)用于自然科學(xué)領(lǐng)域[4],但對(duì)于土壤沙化評(píng)價(jià)的應(yīng)用尚未見(jiàn)報(bào)道。
(一)設(shè)計(jì)目標(biāo)。以可測(cè)量的指標(biāo)構(gòu)成外部模型,以氣候、水文、植被、社會(huì)經(jīng)濟(jì)等不能直接測(cè)量的因素為潛變量建立結(jié)構(gòu)方程模型,探索能夠區(qū)分潛變量間因果關(guān)系,解決因素間復(fù)雜關(guān)系的問(wèn)題,為土壤生態(tài)安全評(píng)價(jià)提供全新的理論方法。
(二)設(shè)計(jì)思路。基于理論和邏輯創(chuàng)建連接變量和構(gòu)造的路徑模型。處理內(nèi)部模型和外部模型設(shè)置,外部模型用于評(píng)估指標(biāo)變量及其相應(yīng)構(gòu)造之間的關(guān)系,內(nèi)部模型顯示要評(píng)估的構(gòu)造之間的關(guān)系。區(qū)分構(gòu)造的位置以及他們之間因果的關(guān)系是研究的關(guān)鍵點(diǎn)。可以先根據(jù)已有文獻(xiàn)和箭頭的指向確定構(gòu)建體是內(nèi)生或者外生,外生變量充當(dāng)自變量,沒(méi)有指向他們的箭頭,而內(nèi)生構(gòu)建體由其他構(gòu)建體解釋,充當(dāng)因變量。再結(jié)合專業(yè)理論和統(tǒng)計(jì)模擬,確定構(gòu)建體規(guī)格和關(guān)系。以土壤沙化為例,根據(jù)已有文獻(xiàn)資料,確定氣象、水文、植被、土質(zhì)、社會(huì)因素、土壤沙化為潛變量,構(gòu)成內(nèi)部模型,其中氣象、水文、植被會(huì)影響土質(zhì)及形成土壤沙化,土質(zhì)與土壤沙化構(gòu)成因果關(guān)系。溫度、降水、人口密度、土壤容重等可測(cè)因素構(gòu)成外部模型。以內(nèi)部模型與外部模型初步建立了土壤沙化評(píng)價(jià)指標(biāo)體系。
健全的外部模型設(shè)計(jì)至關(guān)重要。需對(duì)外部模型指標(biāo)類型作出決策,例如是使用多項(xiàng)目還是單項(xiàng)目標(biāo)度,還是以反映型或形成型方式指定外部模型。具體來(lái)說(shuō),針對(duì)不同的指標(biāo)類型,需要使用不同的統(tǒng)計(jì)量確定模型的可靠性和有效性。例如對(duì)于反映型指標(biāo),需要驗(yàn)證指標(biāo)的一致性和有效性,對(duì)于形成型指標(biāo),需要評(píng)估指標(biāo)的共線性和相關(guān)性。經(jīng)過(guò)前期研究發(fā)現(xiàn),對(duì)形成型外部模型,通過(guò)冗余分析評(píng)估收斂效度,并測(cè)試指標(biāo)間共線性,及時(shí)調(diào)整評(píng)價(jià)指標(biāo),以便適合實(shí)際應(yīng)用。例如氣象因素,溫度、降水、風(fēng)速等部分體現(xiàn)氣象因素的特點(diǎn),為反映型指標(biāo),而土壤沙化類型有風(fēng)蝕沙化和水蝕沙化,則為形成型指標(biāo)。

圖1 土壤沙化評(píng)價(jià)結(jié)構(gòu)模型
(三)實(shí)施方案。
1.對(duì)于外部模型,運(yùn)行PLS-SEM算法,根據(jù)結(jié)果評(píng)估結(jié)構(gòu)模型的可靠性和有效性。可以根據(jù)專家意見(jiàn)和已有資料初步區(qū)分建構(gòu)體是反射型和形成型指標(biāo)。在根據(jù)信度(Loading)值,以0.76為界,當(dāng)指標(biāo)間信度值大于0.76時(shí),認(rèn)為是形成型指標(biāo),否則為反映型指標(biāo)。
對(duì)于反映型指標(biāo),收斂效度評(píng)估應(yīng)計(jì)算CA(Cronboch’s α)確定內(nèi)部一致性,閾值為>0.7;組成信度CR(Composite reliability),閾值為>0.8;和RA值驗(yàn)證可靠性和一致性,并根據(jù)可靠性對(duì)指標(biāo)進(jìn)行優(yōu)先排序。以外部載荷大于0.7為標(biāo)準(zhǔn),計(jì)算平均方差提取值(Average Variance Extracted, AVE),閾值>0.5,和indicator loadings,閾值>0.7,且要顯著。以上四點(diǎn)均滿足,說(shuō)明構(gòu)面具有信度級(jí)別的收斂效度。
驗(yàn)證模型的有效性,以評(píng)估指標(biāo)在多大程度上捕獲了結(jié)構(gòu)的主要方面。對(duì)形成型指標(biāo)可以利用冗余分析評(píng)價(jià)指標(biāo)的收斂效度,采用自舉程序來(lái)確定每個(gè)指標(biāo)權(quán)重的顯著性水平,以確定形成型指標(biāo)的意義和相關(guān)性。并根據(jù)雙變量相關(guān)性,決定是否將指標(biāo)從外部模型中排除。
2.對(duì)于內(nèi)部模型,主要評(píng)估內(nèi)部模型中的假設(shè)關(guān)系。內(nèi)部模型通過(guò)共線性檢驗(yàn)后,以決定系數(shù)(Coefficient of determination,R2)驗(yàn)證模型的預(yù)測(cè)精度,R2=0.33左右表示中度解釋能力, R2=0.19左右表示解釋能力薄弱;以Predictive relevance(Q2)驗(yàn)證預(yù)測(cè)的相關(guān)性,Q2越大代表預(yù)測(cè)相關(guān)性越強(qiáng);以路徑系數(shù)反映方向、強(qiáng)度及顯著性,以效應(yīng)量(Effect size,f2)確定建構(gòu)體對(duì)特定內(nèi)源建構(gòu)體的作用大小,并以0.02,0.15,0.35代表小、中和大的作用。
3.確定土壤沙化評(píng)價(jià)指標(biāo)體系。利用SmartPLS2.0/3.0軟件,繪制土壤沙化評(píng)價(jià)結(jié)構(gòu)方程模型,并對(duì)外部模型進(jìn)行信度檢驗(yàn)和效度檢驗(yàn),利用bootstrapping算法對(duì)內(nèi)部模型進(jìn)行共線性檢驗(yàn),評(píng)估內(nèi)部模型的假設(shè)關(guān)系,并最終確定土壤沙化評(píng)價(jià)指標(biāo)體系。實(shí)驗(yàn)方案的技術(shù)路線如圖2所示。

圖2 實(shí)驗(yàn)方案技術(shù)路線
應(yīng)用統(tǒng)計(jì)課程的實(shí)驗(yàn)教學(xué)內(nèi)容應(yīng)選擇具有一定現(xiàn)實(shí)和科研背景的材料,設(shè)計(jì)能夠?qū)⒗碚撆c實(shí)踐相結(jié)合的案例作為教學(xué)案例。從而提高學(xué)生學(xué)習(xí)興趣和分析問(wèn)題、解決問(wèn)題的能力[5]。本研究提出基于結(jié)構(gòu)方程模型的土壤沙化評(píng)價(jià)與預(yù)測(cè)問(wèn)題,從研究背景、目標(biāo)、內(nèi)容及實(shí)施方案4個(gè)方面進(jìn)行了詳細(xì)的論述,以便使學(xué)生在學(xué)習(xí)統(tǒng)計(jì)方法的同時(shí),實(shí)現(xiàn)對(duì)統(tǒng)計(jì)知識(shí)的應(yīng)用,提高學(xué)生的學(xué)習(xí)興趣,培養(yǎng)學(xué)生科研能力。