張小樂,黃晶霞
(1.楚雄師范學院數學系,云南 楚雄 675000;2.云南大學信息學院,云南 昆明 650031)
Logistic回歸模型不僅可以應用于人口預測,還可用于醫療衛生、社會學、經濟學等各個領域。在統計研究過程中,我們經常會遇到因變量為虛擬變量的情形,例如,在人口預測中生存率與死亡率、發病與未發病、性別比例問題。這時用線性回歸模型的方法對此類問題進行研究已不再可行,而logistic回歸模型可同時分析包含離散變量和連續變量的多個自變量,并能有效地分析自變量之間的交互作用,為多個自變量與因變量之間的相互關系提供一個定量描述。
本文在介紹Logistic回歸模型的基礎上,基于數值微分和最小二乘曲線擬合對Logistic回歸模型進行了參數估計,這種方法對人口、資源、環境等的發展和預測具有應用價值.只要滿足Logistic生長過程的事物,就可以采用Logistic函數預測,而在用Logistic函數進行預測的時候,本文中的估計方法就能發揮作用。
Logistic模型是1938年Verhulst-Pearl在修正非密度方程時提出來的,他認為在一定的環境中種群的增長總存在一個上限,當種群的數量逐漸向著上限上升時實際增長率就要逐漸地減少,因而也被稱為 Verhulst-Pearl方程[1]。
人口問題是影響我國發展的重要因素,準確預測出未來人口的發展趨勢有重要的指導意義,我們考慮種內對資源的競爭,自然資源、環境條件等因素對人口的增長起阻滯作用,且隨著人口的增加,阻滯作用越來越大。
我們記時刻t的人口為x(t),并將x(t)看作連續、可微的函數。記初始時刻(t=0)的人口為x0.假設人口增長率為常數r,也就是說單位時間內x(t)的增量等于r乘以x(t)。我們考慮t到t+△t時間內人口的增量,則有

令△t→0,則得到x(t)滿足如下的微分方程

阻滯作用體現在對人口增長率r的影響上,使得r隨著人口數量x的增加而下降.若我們把人口增長率r表示為人口數量x的函數r(x),則r(x)是減函數,于是(2)式可寫為

設r(x)是x的線性函數,即

這里的r表示人口很少時(理論上設x=0)的增長率,即人口不受環境和資源限制的固有增長率。為了明確參數s的意義,引入最大人口容量xm,即自然資源和環境條件所能容納的最大人口數量。則當x=xm時,人口的增長率為零,即增長率r(xm)=r-sxm=0,從而得到,于是(4)式可改寫為



Logistic回歸模型的參數估計的方法有很多,如極大似然估計、最小二乘估計、穩健估計、Bayes估計等等。本文用數值微分和曲線擬合法對logistic模型進行參數估計,并進行實證分析。
由Logistic模型的解(8)中可知,只要對參數xm,a,b進行估計即可,主要方法和步驟如下:
(1)首先求xm.對(6)式變形得到

(2)求參數a、b.將 (8)式變形為

根據中國統計局在《統計年鑒》中公布的“1950—2010”年人口統計數據,本文只選取1980年到2005年的總人口數據(見表1)來擬合。

表1 1980—2005年中國人口數據(萬人)
首先運用數值微分得到年增長率的值,然后再利用Matlab軟件進行擬合[6]。
通過Matlab軟件畫出散點圖(見圖1)可以看出該圖是一條單調函數的圖像,且是指數型的,因此可以選用一次多項式進行擬合。

圖1 1980—2005年擬合數據點
由表一中的數據估算出 xm=15.14(單位:億),a=0.5726,b=0.05073,從而得到中國人口的Logistic回歸模型的具體表達式為

通過Matlab軟件進行擬合可以直觀地看到數值的變化情況(見圖2),預測的數據和實際數據曲線擬合得比較好。

圖2 1980—2005年數據點與擬合曲線
于是求出預測中國人口的具體公式

我們取1980年的人口總數為x0=9.8705(注:單位:億)。
根據上式可以計算2000和2005年的人口數:
當t=20時,

誤差都較小,說明預測結果比較準確。
下面來預測2015年的人口總數,即取t=35,則

以此類推,我們可以估算出未來幾年的中國人口數(見表2)。

表2 由上述公式可估算未來2015—2040年的中國總人口數:(單位:億)
本文基于數值微分和最小二乘曲線擬合對Logistic回歸模型進行了參數估計,這種方法對人口、資源、環境等的發展和預測具有應用價值,由此計算了我國2000年到2005年總人口數的誤差情況,并預測了2015年—2040年我國的人口總數。只要滿足Logistic生長過程的事物,就可以采用Logistic函數預測,而在用Logistic函數進行預測的時候,本文中的估計方法就能發揮作用。
[1]姜啟源.謝金星.葉俊.數學模型[M].北京:高等教育出版社,2003:12—14.
[2]馬修斯 (Mathews,J,H),芬克 (Fink,K.D.).周璐.數值方法[M].北京:電子工業出版社,2010:12—14,207—208,261—264.
[3]李秋紅.何先平.數學模型在人口增長中的應用[J].太原師范學院學報,2008,7(2):55—56.
[4]李華中.Logistic模型在人口預測中的應用[J].江蘇石油化工學院學報,1998,10(2):32—33.
[5]邵曉峰.張克新.黃岡市人口增長模型的研究[J].數學的實踐與認識,2008,38(13):97—101.
[6]任玉杰.數值分析及MATLAB實現[M].北京:高等教育出版社,2007:213—216.