蔣耀萱
天津財(cái)經(jīng)大學(xué)
正態(tài)分布的起源與發(fā)展
蔣耀萱
天津財(cái)經(jīng)大學(xué)
中外古今,人類從未停止對“對稱美”的追尋。對統(tǒng)計(jì)學(xué)中這個(gè)形狀優(yōu)雅、簡潔漂亮的對稱鐘形曲線也不例外,即是當(dāng)今應(yīng)用最為廣泛的連續(xù)概率分布——正態(tài)分布。本文結(jié)合國內(nèi)學(xué)者研究成果,以狄美孚、高斯、麥克斯維爾和高爾頓四個(gè)主人公的故事為依托,梳理了正態(tài)分布的早期歷史,來揭開她的神秘面紗。
正態(tài)分布;鐘形曲線;概率分布;早期歷史
實(shí)際問題中涉及的隨機(jī)變量大都服從正態(tài)分布,這個(gè)近似“中間高,兩頭低”的對稱鐘形分布,憑借其普遍的適用性,占據(jù)了各種概率分布中的首要地位。正態(tài)分布又名高斯分布,以紀(jì)念曾一度被認(rèn)為第一個(gè)提出它的高斯,不過另外一個(gè)說法,正態(tài)分布是1733年狄美孚率先提出來的概念,因?yàn)楦咚故状卧谔煳膶W(xué)的探索中運(yùn)用了正態(tài)分布,并且研究了它的性質(zhì),所以后人又稱其為高斯分布。正態(tài)曲線雖然看上去很美,但它的出現(xiàn)到成為統(tǒng)計(jì)學(xué)中概率模型的理論基礎(chǔ)經(jīng)歷了數(shù)百年。從表現(xiàn)形式來看,正態(tài)分布既為概率論所有,又是統(tǒng)計(jì)學(xué)的理論基礎(chǔ),因此它的出現(xiàn)與應(yīng)用對后世有著重要的意義。
本文以正態(tài)分布的歷史發(fā)展為線索,以狄美孚、高斯、麥克斯維爾和高爾頓四個(gè)主人公為依托,對正態(tài)分布的早期發(fā)展過程中代表人物及其重要工作做出了梳理與總結(jié)。
正態(tài)分布函數(shù)密度曲線可以表示為:稱x服從正態(tài)分布,記為,其中為均值,為標(biāo)準(zhǔn)差,。標(biāo)準(zhǔn)正態(tài)分布令正態(tài)分布的為0,為1。
正態(tài)分布函數(shù)密度曲線特征:①曲線的高峰處在均數(shù)處正中位置。②正態(tài)分布函數(shù)密度曲線以均數(shù)為基準(zhǔn)左右兩邊對稱。③正態(tài)分布函數(shù)密度曲線有兩個(gè)參數(shù),即均數(shù)()和標(biāo)準(zhǔn)差()。④正態(tài)分布函數(shù)密度曲線下面積的總和為1。
(一)狄美孚與中心極限定理
通過陳希孺先生的《數(shù)理統(tǒng)計(jì)學(xué)簡史》,可以了解到正態(tài)分布的密度形式首次發(fā)現(xiàn)是在狄美孚-拉普拉斯的中心極限定理中。如此,我們就引入正態(tài)分布史上的首位主人公——狄美孚。
亞伯拉罕·狄美孚于1667年出生在法國。1733年的一天,狄美孚和幾位朋友探討自己的一篇7頁紙論文,在采納了朋友們意見的基礎(chǔ)上做了完善,最后這篇文字錄入在《機(jī)遇論》(第2版)的書中,也是此篇文章,狄美孚第一次推導(dǎo)出正態(tài)概率曲線表達(dá)式。追溯1730 年的《分析雜論》中出現(xiàn)的斯特靈公式,但毫無疑問是狄美孚首先發(fā)現(xiàn)的,狄美孚于1733年用它來得到二項(xiàng)分布的漸進(jìn)分布——正態(tài)分布。1774年,拉普拉斯首先證明了,并開始推廣狄美孚的結(jié)果,用較一般的形式構(gòu)建中心極限定理,也就是如今的狄美孚-拉普拉斯中心極限定理。
(二)高斯與觀測誤差分布
進(jìn)入18 世紀(jì),隨著數(shù)學(xué)的發(fā)展,致使天文學(xué)變得數(shù)學(xué)化起來。谷神星的出現(xiàn),我們故事的第二個(gè)主人公高斯登場。
高斯于1777年出生在德國,以數(shù)學(xué)享譽(yù)世界,堪稱近代數(shù)學(xué)的奠基者之一,后人們稱其為“數(shù)學(xué)王子”。他在1809年出版了《天體繞日運(yùn)動理論》一書,書中結(jié)尾介紹了一章關(guān)于“數(shù)據(jù)結(jié)合”的問題,用在人們意料之外的方法證明出了觀測誤差也服從正態(tài)分布,依據(jù)最大后驗(yàn)概率論證了觀測參數(shù)的估計(jì)值就是算術(shù)平均值。對于如何解決誤差分布,高斯通過拉普拉斯在1774年得到的結(jié)論,算出了誤差分布的密度是:,從此高斯提出了誤差正態(tài)分布,同中心極限定理的一般形式及最小二乘法的出現(xiàn),對后世產(chǎn)生了深遠(yuǎn)的影響,所以后人又稱其為高斯分布。
(三)麥克斯維爾與氣體分子運(yùn)動速度分布
20世紀(jì)正態(tài)分布被概率學(xué)家們越拓越寬,而后數(shù)學(xué)家和物理學(xué)家們發(fā)現(xiàn):條條曲徑通正態(tài)。接下來,我們介紹故事的第三位主人公。
麥克斯維爾(1831.6.13—1879.11.5),英國物理學(xué)家、數(shù)學(xué)家,在蘇格蘭愛丁堡出生,在劍橋去世。他不僅在經(jīng)典電動力學(xué)有所建樹,而且是創(chuàng)立氣體動理論的學(xué)者之一,還在統(tǒng)計(jì)物理和熱力等學(xué)科為人類科學(xué)發(fā)展作出突出的貢獻(xiàn)。1860年,麥克斯維爾在考慮氣體分子的運(yùn)動速度分布的時(shí)候,在三維空間中推導(dǎo)出了氣體分子運(yùn)動的分布是正態(tài)分布,這個(gè)三維正態(tài)分布就是三個(gè)正態(tài)分布的乘積,這就是麥克斯維爾-波爾茲曼氣體速率分布定律。
(四)高爾頓與二元正態(tài)分布
統(tǒng)計(jì)學(xué)是一門研究其它學(xué)科的方法論。麥克斯維爾把統(tǒng)計(jì)學(xué)引用到物理學(xué),下面我們第四位主人公則最早把統(tǒng)計(jì)方法應(yīng)用于生物學(xué),他建立的回歸分析模型對英國的生物統(tǒng)計(jì)學(xué)派的崛起作出了重要貢獻(xiàn)。
弗朗西斯·高爾頓于1822年2月16日在英國拉杰斯出生。美國心理學(xué)家曾估算其幼年時(shí)的智商接近200。高爾頓在學(xué)術(shù)上遍地開花,以至于人頌“維多利亞式的天才”。高爾頓首先發(fā)現(xiàn)親子兩代身高數(shù)據(jù)服從同一正態(tài)分布,進(jìn)而通過“正態(tài)漏斗”實(shí)驗(yàn)、“種豌豆”試驗(yàn)兩個(gè)類比實(shí)驗(yàn)解決了前期存在的一些困惑。1884年,高爾頓設(shè)立了“人體測量實(shí)驗(yàn)室”,利用收集的數(shù)據(jù)繪成二維圖來得到關(guān)于的二維分布,以期發(fā)現(xiàn)這一現(xiàn)象的原因。后來通過狄克遜的幫助,高爾頓得到了二維正態(tài)分布的答案。
通過狄美孚、高斯、麥克斯維爾和高爾頓四個(gè)主人公的故事,正態(tài)分布早期歷史的神秘面紗就揭開了,穿越百年歷史,從最初被發(fā)現(xiàn)到被人們重視,到構(gòu)成統(tǒng)計(jì)學(xué)的理論基礎(chǔ),正態(tài)分布曲線展示在世人面前,等候不同領(lǐng)域?qū)W者們的召喚。作為統(tǒng)計(jì)人,希望通過正態(tài)分布早期歷史的梳理與總結(jié),讓人們認(rèn)識正態(tài)分布的起源與發(fā)展,和其特有的雙重理論背景及重要價(jià)值。
[1]陳希孺.數(shù)理統(tǒng)計(jì)學(xué)簡史[M].長沙:湖南教育出版社,2000:28-156.
[2]于忠義.高斯與觀測誤差分布的發(fā)現(xiàn)[J].統(tǒng)計(jì)與信息論壇,2006,11.
[3]Maxwell.Illustrations of the dynamical theory of gases[J].Philosophical Magazine,1860,7:378~409.
蔣耀萱(1992—),男,漢族,天津人,天津財(cái)經(jīng)大學(xué)統(tǒng)計(jì)學(xué)碩士研究生,研究方向:金融風(fēng)險(xiǎn)管理。