999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

樣本選擇模型及其估計方法*

2010-03-11 14:01:34
中國衛生統計 2010年6期
關鍵詞:方法模型

張 磊 王 彤

樣本選擇模型 (sample selection model)源于芝加哥大學的 James J.Heckman教授在 20世紀 70年代中期所從事的關于勞動供給的大量研究。1974年,他在《Shadow Prices,Market Wages,and Labor Supp ly》一文中通過對婦女勞動力供給與市場工資關系的研究提出樣本選擇模型及其似然估計,但因其估計方法復雜、計算量大等原因使得該模型并未得到重視〔1〕。稍后的五、六年間,Heckman對該模型的估計方法做出了進一步發展,終于在 1979年首創樣本選擇模型的兩步估計,即著名的“heckman correction”。此后的二十年間,樣本選擇模型在勞動力供給、消費、教育、出生率和種族、性別歧視等諸多方面研究得到了極大的應用。自2000年始,國外醫學領域已逐步將樣本選擇模型用于解決醫學問題如醫療費用、生存質量評價和 HIV檢驗方法評價等,而該模型在國內醫學領域的應用尚未見報道〔2-4〕。

樣本選擇模型的主要價值在于它可以有效校正抽樣設計無法消除的樣本選擇性偏倚。例如在慢性疾病醫療費用的研究中,常將醫療費用作為因變量而家庭收入等影響因素(x′i)作為自變量建立研究所需的回歸方程,即結果等式。事實上,我們僅能收集到確實去就診患者的醫療費用(yi),無法獲得確診但不選擇住院或其他治療的這部分病人的醫療費用,這樣就發生了樣本選擇偏倚。是否住院治療是一種選擇,每一個人都會很謹慎地評估它的成本和效益,而不太可能以丟硬幣這樣完全隨機的方式來決定是否住院治療,故而缺失的那部分應該發生的醫療費用通常不是理論上假設的完全隨機缺失 (MCAR,missing completely at random)。每個確診病人都會根據自身狀況(z′i)(如家庭收入、婚否和知識程度等)來擬定出一個“承受費用”。確診病人只有在發現住院費用(c)不高于承受費用時才會選擇住院治療;否則,不選擇住院治療。即每個確診病人是否住院是根據承受費用和真正住院醫療費用(c)的比較來決定。而每個確診病人的承受費用(d*i)與該病人的自身狀況(z′i)也可建立回歸方程,即選擇等式。由于僅能觀察到確診病人是否住院(di)而無法獲得承受費用(d*i)的信息,所以可以將二分類變量(di)作為選擇等式的因變量構造出 Probit或 Logit模型。那么在給定z′i后,選擇等式的回歸系數γ和誤差項vi以及界值c都決定了個體被選入可觀測樣本(di=1)的概率。γ值越大,則個體被選入樣本(di=1)的機會越大,醫療費用被觀測到的(yi=y*i)可能性越大。而c值越大,個體被剔出樣本(di=0)的機會越大,醫療費用缺失(yi=0)的可能性越大。如果γ=0,則個體是否被選入樣本是隨機的,僅受樣本含量的影響。如果c取 -∞,無論γ值多大,所有個體都會被選入樣本;如果c取 +∞,無論γ值多小,則所有個體都會被剔出樣本。然而,僅基于上述可觀測到的有偏樣本(di=1)來估計結果等式是存在偏倚的。這樣就可以構建出樣本選擇模型的基本結構:(1)是理論上存在的結果等式,(2)是因變量無法觀測到的選擇等式。(3)和 (4)分別反映了di和以及yi和的對應關系。當≥c時,di=1則yi=否則,di=0則yi=0。樣本選擇模型要求εi和vi相關且E[εi|vi]≠0。由于結果等式中x′i和 εi相關且εi和vi也相關,應用最小二乘估計無法獲取一致的參數估計量β,故衍生出有關該模型估計方法的大量研究。

估計方法

一、似然估計

1.參數方法

Heckman和 Gronau率先引入似然估計。該法需對誤差項分布做出如下假設 A:εi和vi服從均數為 0的雙變量正態分布,且相關系數介于 0~1之間。在假設 A成立的條件下,應用似然估計來獲取模型參數是最優的,且該法常作為檢驗其他估計方法功效損失的一個參考。當誤差項不服從雙變量正態分布但分布型已知時,可通過對應分布型的逆標準正態分布函數將結果等式與選擇等式的誤差項轉換為雙變量正態分布后仍選用似然估計。

2.半參數方法

盡管轉換分布的方法并不嚴格要求誤差項服從正態分布,但仍需要獲得誤差項邊緣分布的信息。Gallant和 Nychka提出的方法可以不需要獲得誤差項分布的任何信息而產生一致估計量〔5〕。該法通過將誤差項的聯合密度函數近似為 Hermite級數來構造受限形式的似然函數,進而獲得聯合密度函數和模型參數的一致估計。通過實例分析發現在背離正態分布的假設下,應用該方法是有效的。但是由于該法涉及較多數學理論且計算相對復雜,所以在實際應用中比較少見。

二、兩步估計

似然估計對于初始值的選擇比較敏感,并且樣本選擇模型的對數似然函數常不是全局凹的,因而無法保證似然函數的解唯一,所以該法在實際應用中也受到局限。而最常見的估計方法是 Heckman提出的兩步估計。依據誤差項的分布假設,兩步估計可分為基于雙變量正態分布的參數兩步估計和不要求分布假設的半參數兩步估計。

1.參數兩步估計

參數兩步估計仍要求誤差項服從雙變量正態分布即上述假設A。兩步估計的具體計算可歸納為以下幾個步驟:①將有二分類因變量的選擇等式構建成 Probit模型,然后應用最大似然估計獲得選擇等式參數的一致估計量。由于γ和σv常以比值形式出現,所以在樣本含量為n的完全樣本中,可應用似然估計來獲得。Probit模型的對數似然函數是嚴格凹的,所以最大似然估計量γ是唯一的。②通過估計量γ獲得每個人的預測值(z′iγ-c)/σv后 ,將其密度函數與分布函數的比值 ,構造出 λ((z′iγ-c)/σv)。 ③在因變量可觀測到的有偏樣本中,將σερεv^λi作為校正項加入結果等式后 ,應用最小二乘獲得 σερεv和 β的一致估計量〔6〕。

參數兩步估計假設誤差項服從雙變量正態分布,本質上是要求誤差項間的關系是線性的,即εi是vi的線性函數。由此可以考慮適當放寬vi的分布做出假設 B:vi的分布已知且εi是vi的線性函數。如vi服從正態分布就意味著εi和vi服從雙變量正態分布,這時假設 A等價于假設 B。由于假設 B允許vi服從其他分布,所以對選擇等式可以構建除 Probit以外的其他模型。如vi服從均勻分布,可應用線性概率模型中最小二乘殘差的簡單變換來代替 λ((z′iγ-c)/σv),然后仍應用兩步估計來獲得一致估計量。當然,也可以對誤差項進行分布轉換來應用參數兩步估計。

2.半參數兩步估計

參數兩步估計對分布假設異常敏感的特性限制了該法的應用,故而在樣本選擇模型問世后的二十多年里,一直有學者致力于研究對分布假設較為穩健的半參數兩步估計。與參數兩步估計不同,半參數兩步估計僅需做出假設 C:E[εi|zi,di=1]=g(z′iγ),其中g是未知函數。參數兩步估計中可通過雙變量正態分布的分布假設詳細刻畫出校正項g(·),即σερεv^λi。但是半參數兩步估計對于校正項的具體形式并不作要求。此外,半參數兩步估計不需要利用vi的分布來獲得選擇等式估計量,且不需要通過誤差項的分布關系來獲得校正項。而半參數兩步估計正是圍繞著這兩個“不需要”發展起來的,且這類估計方法的核心大致分為以下兩個方面:選擇等式回歸系數γ的估計和校正項的估計。

(1)選擇等式回歸系數γ的估計

為了避免對誤差項分布的過分依賴,常在第一步中對選擇等式應用一些半參數或非參數估計方法來獲得回歸系數γ。自 20世紀 80年代始,二分類選擇概率模型的估計方法在不斷完善,所以對選擇等式回歸系數γ的估計方法也在逐步發展。以下對文獻中所選用的方法作簡要介紹:

Cosslett首先通過應用非參數最大似然估計 (nonparametric maximum likelihood estimator)來獲得選擇等式回歸系數^γ。Powell、Stock和Stoker選用的平均導數估計 (average derivative estimator)計算相對簡單,但是要求自變量是連續的。Kim和 Pollard選用最大得分估計 (maximum score estimation),但由于該法所獲估計量^γ不是連續和漸近正態的,故不能應用標準的最優化方法。為了避免最大得分估計量的不連續性,Horowitz提出光滑最大得分估計 (smoothed maximum score estimation)。盡管該估計量是一致和漸近正態的,但是窗寬的選擇相對困難〔7〕。此外,Ahn和 Powel選用非參數 Kernel估計方法 (nonparametric kernel estimation method)要求選擇等式的誤差項是連續分布。Ichimura通過應用對分布不作要求的半參數最小二乘法 (SLS)和加權半參數最小二乘法 (WSLS)不僅可獲得一致和漸近正態的^γ估計量,且可獲得協方差陣的一致估計〔8〕。另外,Klein和 Spady引入了輪廓似然估計法(profile likelihood estimator)來獲得選擇等式的回歸系數,且所獲估計量是一致和漸近正態的,同時還可以計算出相應的半參數可信區間。此外,該方法還可以解決多分類和有序分類的選擇問題〔9〕。

(2)校正項的估計

在獲得選擇等式回歸系數^γ的基礎上,如何估計校正項是比較棘手的。事實上,樣本選擇模型的半參數兩步估計難點就在于如何溝通選擇等式與結果等式之間的關系,即在未知分布的基礎上如何獲得校正項的一致估計。對于校正項的估計,眾多學者包括Heckman本人都做出了深入的研究:

Heckman和 Robb率先提出樣本選擇模型的半參數兩步估計。該法通過對選擇等式應用非參數方法獲得回歸系數估計量^γ,然后進行傅里葉級數展開近似獲得校正項。Newey應用類似的方法在獲得校正項的同時,還可以直接計算出結果等式的協方差陣〔10〕。Powell和 Robinson則是依據差分思想,比較結果等式中因變量存在缺失和不缺失對象的差別,來達到消除校正項的目的。而 Ahn和 Powell在此基礎上還引入了加權變量〔11〕。Ichimura與 Lee對選擇等式和結果等式的聯立方程,應用迭代非線性最小二乘法,可獲得參數的一致估計。

綜合上述估計方法,Marcia Schafgans將半參數兩步估計歸納為:第一步,可選用多種半參數估計法如最大得分估計、光滑最大得分估計、輪廓似然估計、半參數最小二乘估計和平均導數估計等。由于最大得分估計量不是漸近正態的,光滑最大得分估計中參數窗寬的選擇比較困難,平均導數估計要求自變量是連續的,所以上述三種方法在實際應用中并不推薦。而輪廓似然估計和半參數最小二乘估計則由于所獲估計量是一致和漸近正態的,所以在實際應用中較為常見。第二步,存在以下兩種估計方法:(1)級數近似法該法利用第一步所獲的γ估計量進行級數近似來估計校正項后,應用最小二乘來獲得參數一致估計量。(2)核回歸估計該法通過核回歸估計來獲取校正項,進行差分后構造新的結果等式。

小 結

由于似然估計的計算需要占用大量時間,而兩步估計的計算相對簡單,所以最初對樣本選擇模型的估計方法常選用兩步估計。但是隨著計算機技術的發展和軟件包 (L IMDEP等)的開發,兩步估計與似然估計在計算上所需的時間相差無幾,但是許多學者仍然選用兩步估計。這主要是由于兩步估計還具有似然估計所不具備的優勢:①當樣本含量很大和參數數目較多時,似然估計比兩步估計的計算仍要復雜很多,且樣本選擇模型的對數似然函數常常不是全局凹的,故無法保證似然函數的解是唯一的。②似然估計對于參數估計初始值的選擇是比較敏感的,常需要給出一個好的初始值才能獲得較好的估計量,而兩步估計可以為似然估計提供可靠和有效的初始值。③兩步估計比似然估計更穩健。當結果等式的因變量存在測量誤差時,似然函數常會被誤設以至于最大似然估計量不一致。然而,由于測量誤差會被吸收到結果等式的殘差項中,則所獲得的兩步估計量是一致。由于兩步估計與似然估計的比較中存在以上優勢,所以兩步估計已成為計算樣本選擇模型參數估計量的標準程序,但該法仍存在需要完善的地方:

(1)共線性問題

盡管大多數應用學者認為樣本選擇模型兩步估計所獲估計量是完美的,但仍有部分學者基于兩步估計中存在的共線性問題而心存疑慮。事實上,許多統計學家對兩步估計中存在的共線性問題均給予了極大的關注,并提出了相應的解決辦法。在樣本選擇模型的建模過程中,常發現選擇等式的自變量向量和結果等式的自變量向量常是類似甚至是相同的。由于兩者之間存在一定程度的相關性,且校正項在特定的取值范圍內與選擇等式的自變量向量呈線性關系,那么結果等式的自變量向量與校正項間也存在某種程度的相關性,故對結果等式的估計極易產生共線性問題,而共線性問題又會導致較大標準誤以致所獲估計量不穩定。

(2)異方差問題

如果隨機誤差項的方差不是常數,即對不同的自變量觀測值彼此不同,則稱隨機項具有異方差性,這也是兩步估計過程中亟待解決的問題。兩步估計中,對結果等式標準誤估計是比較復雜的。由于樣本選擇模型要求兩等式殘差項不獨立,那么結果等式的方差很難退化為標準的方差 -協方差陣,且結果等式中常存在異方差性。顯而易見,結果等式中V(εi)并不是常數項,它是隨著選擇等式自變量向量和校正項的不同而不同。當校正項已知時,擴大結果等式可以通過廣義最小二乘法來獲得。但是當校正項未知且需要估計時,應用上述方法就不再適合。因此,眾多學者都提出了解決辦法如“sandwich”估計法和自助法等〔12〕。盡管對標準誤的估計有多種解決措施,但是至今尚沒有公認最優的方法,故在實例分析中,多數應用學家仍傾向于直接應用兩步估計的漸近協方差陣來獲取標準誤。此外,由于異方差與分布假設緊密相關,所以在對分布不作要求的半參數兩步估計中,異方差問題的解決也是比較棘手的。

在醫療費用調查研究中,每個病人常要面臨住院與否這樣的二分類選擇,而且還要對多種醫學檢查如尿檢、血檢、X線和 CT檢查等作出決策,這就意味著樣本選擇模型中選擇等式的因變量可能為多分類的,可構建成多分類 probit(polychotomous probit)或多項logit(multinomial logit)模型。盡管我們可以將選擇等式構建成有多分類因變量的離散選擇模型,但是如何反映選擇等式與結果等式的聯系將是很困難的。因此,如何將樣本選擇模型與離散選擇模型相結合可能會是該方法在醫學應用問題中需解決的發展方向之一。

3.社會實踐 PBL法

單純的課內加強實踐教學編排并不能讓學生馬上就會解決實際問題,還要定期組織學生上課期間或假期積極參與社會實踐活動,并對學生在課堂上學會的基本理論進行實際應用指導,培養學生對實際問題的判斷能力,縮短學生學習理論與實際工作應用的時間,從而為社會培養出實用型人才。我們在臨床本科專業采用了“指定式”社會實踐 PBL法,即指定調查方向,實踐前一到兩周教師將相關資料分發給學生,要求學生根據所提出的問題去調查、獲取和分析數據并撰寫論文;而在預防醫學本科和勞動與社會保障專業采用“查閱文獻 -開題報告 -討論審核 -具體實施 -統計分析 -形成論文”這一完整的科研模式,讓學生圍繞問題從調查單位和對象的確定、樣本的抽取、問卷的編寫、發放、回收與審核、數據的錄入、整理與分析、直到論文的撰寫。這樣,學生經過親身參與統計設計與調查、收集、整理和分析的整個過程,就比較系統地掌握了統計工作的各個環節。經過社會實踐活動,醫學生接觸和參與了實際的醫學科研工作,既拓展了科學視野、鍛煉了實踐能力、激發了探索和學習的熱情,又增強了學生運用統計知識處理實際問題的能力,更有利于培養醫學生嚴謹的科研思維,使學生畢業后很快融入到實際工作中去。

我們利用上述 PBL實踐教學法在我院臨床、預防、市場營銷和勞動與社會保障四個本科專業學生中試行。不僅提高了學生自主查閱資料、獲取信息的能力,拓寬了學生的知識面,還提高了學生統計邏輯思維和綜合分析的能力,并使學生在 PBL實踐中學會與他人進行有效的溝通、交流與合作,改革效果初現??偟膩碚f,PBL模式的實踐教學激勵了學生實踐的主動性、積極性和創造性,推進了學生自主學習、合作學習和研究型學習。也鮮明地顯示了實踐課在培養學生創新意識、綜合實踐能力與科研能力,培養現代化應用型人才中的重要作用。PBL教學效果并非是一個短期效應,它對學生解決實際問題能力的培養需要一個長期的過程,而這種能力一旦形成則終身受益。

1.葉小華,部艷暉,李麗霞,等.信息時代提高醫學統計學教學質量的探索.醫學教育探索,2008,7(2):138-139.

2.孫亞林,賀佳,吳騁,等.構建《醫學統計學》課程群的實踐探索.西北醫學教育,2008,16(6):1166-1168.

3.張羅漫,孟虹,孫亞林,等.信息化條件下《醫學統計學》分層次多目標教學探索與實踐.中國衛生統計,2009,26(3):311-312.

4.閆國立.中醫院校醫學統計學教學改革的探索與實踐.中醫藥管理雜志,2008,16(11):834-835.

5.王春平,王汝芬,翟強.多媒體技術在醫學統計學教學中的應用.中國衛生統計,2006,23(3):266-267.

6.Bhattacharya N,Shankar N,Khaliq F,et al.Introducing p roblem-based learning in physiology in the conventional.Indian M edical Curriculum.Natl M ed J India,2005,18(2):92-95.

7.鄧海燕,姚良悅,馬蓉.PBL教學模式在護理教學中的應用探討.護理研究,2008,22(1):262-264.

8.胡良平,劉惠剛.統計學的三型理論及其在生物醫學科研中的應用.中華醫學雜志,2005,85(27):1936-1940.

猜你喜歡
方法模型
一半模型
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
學習方法
3D打印中的模型分割與打包
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
賺錢方法
捕魚
主站蜘蛛池模板: 少妇露出福利视频| jizz国产视频| 国产二级毛片| 国产精品嫩草影院视频| 亚洲国产欧美国产综合久久 | 91精品啪在线观看国产| 亚洲国产综合精品一区| 毛片基地视频| 日本精品αv中文字幕| 亚洲三级成人| 中国成人在线视频| 最近最新中文字幕在线第一页| 亚洲日韩欧美在线观看| 国产99在线| 午夜福利在线观看成人| 欧美成人午夜视频| 国产九九精品视频| 91蜜芽尤物福利在线观看| 国产成人AV综合久久| 天天躁日日躁狠狠躁中文字幕| 欧美日韩免费| AV不卡在线永久免费观看| 亚洲色欲色欲www在线观看| 国产专区综合另类日韩一区| 欧美日韩一区二区三区在线视频| 一本大道无码日韩精品影视| 中文国产成人久久精品小说| 国产成人福利在线| 114级毛片免费观看| 亚洲午夜久久久精品电影院| 亚洲高清日韩heyzo| 免费国产黄线在线观看| 亚洲无线视频| 小说 亚洲 无码 精品| av在线5g无码天天| 无码aaa视频| 在线欧美a| 国产美女在线观看| 国产在线啪| 欧美午夜在线观看| 国产精品亚洲va在线观看| 亚洲日本www| 一级黄色网站在线免费看| 欧美成人影院亚洲综合图| 欧美激情视频一区二区三区免费| 自拍欧美亚洲| 精品欧美视频| 三级视频中文字幕| 美女视频黄频a免费高清不卡| 九色91在线视频| 刘亦菲一区二区在线观看| 日韩免费毛片视频| 在线观看欧美国产| 波多野结衣一区二区三区四区| 亚洲视频无码| 国产91精品最新在线播放| 无码中文字幕乱码免费2| 亚洲成人网在线观看| 亚洲日韩精品伊甸| 三级毛片在线播放| 亚洲精品波多野结衣| av性天堂网| 91亚瑟视频| 亚洲最大福利网站| 国产精品视频白浆免费视频| 最新日韩AV网址在线观看| 亚洲日韩日本中文在线| 国产精品免费露脸视频| 91久久偷偷做嫩草影院电| 另类欧美日韩| 久草视频精品| 人妻中文字幕无码久久一区| 国产欧美日韩视频怡春院| 毛片大全免费观看| 亚欧乱色视频网站大全| 免费看av在线网站网址| 国产麻豆另类AV| 久久免费观看视频| 五月天在线网站| 人妻少妇乱子伦精品无码专区毛片| 亚洲色图欧美激情| 久久福利网|