崔召磊
摘 要 本文討論了連續型隨機變量和離散型隨機變量的分布函數的部分性質,并探討了二維連續型隨機變量在任意曲線上的概率是否為零以及其與一維連續型隨機變量的關系。這幾個問題是描述幾個常用概念之間聯系的基本問題,然而也是在教學中容易忽略的問題,本文為此進行歸納整理,以期對隨機變量有更清楚的認識。
關鍵詞 階梯函數 連續型隨機變量 邊緣分布
中圖分類號:O211.6 文獻標識碼:A DOI:10.16400/j.cnki.kjdks.2016.04.026
Abstract This paper discussed some properties of the distribution function of continuous random variables and discrete random variables, and to explore the probability of the two-dimensional continuous random variable in arbitrary curve is zero and the and one dimensional continuous random variable relationship. These problems are a few concepts between contact the basic problem description, but also in teaching easy to overlook problems. For this reason, to collate, to have a more clear understanding of random variables.
Key words step function; continuous random variable; marginal distribution
概率論是研究隨機現象的科學,通俗地講,就是研究某種現象或某個事件發生的可能性大小,比如投擲硬幣,出現正、反面的可能性有多大;在路上,偶遇一個孕婦,那么此孕婦生男孩和生女孩的可能性又各有多大?這個可能性就是概率論學科要研究的最主要目標——概率,那么要如何研究事件的概率問題,這就需要把隨機現象引入到一個合理有效、邏輯嚴謹的理論體系中,在這個過程中,隨機變量就像一座橋梁或基石,在理論研究中起著無可替代的作用。隨機變量從本質上看就是一個函數,或者更加清楚準確地描述為:從由隨機試驗的結果構成的樣本空間到實數上的一對一或多對一的映射。正是由于隨機變量的存在,隨機現象的研究中才將高等數學引入到了整個理論體系中,使得概率論學科獲得了巨大的進步。隨機變量在我們的教學過程中,一般只討論兩種典型情形:離散型隨機變量和連續型隨機變量。在概率論的講解過程中,可以發現離散型隨機變量的定義淺顯而直觀,易于理解和接受, 而連續型隨機變量的定義則有些抽象了。對連續型隨機變量的深層次理解,嚴重依賴于對高等數學相關內容的理解,尤其是對積分和各種函數知識的掌握。另外,無論是離散型隨機變量還是連續型隨機變量,我們的主要目標都要研究其概率的取值情況,也就是隨機變量的概率分布情況,因此在本文中我們主要討論的內容就是隨機變量的分布函數的一些特點。通過對概率分布函數的詳細分析,進一步加強對隨機變量,尤其是連續型隨機變量的認識,本文將幾個關于概率分布的基本問題進行整理和歸納,其中第一個問題分別討論了離散型隨機變量和連續型變量的分布函數的基本特點;第二個問題討論了一維、二維連續型隨機變量在什么情況下,概率的取值為零;第三個問題討論了二維連續型隨機變量與邊緣分布之間的關系。在下文中,我們將以上三個問題逐一加以討論。
第一個問題:離散型隨機變量的分布函數是階梯函數,連續型隨機變量的分布函數是連續函數。這個結論正確嗎?其逆命題成立嗎?
這里,我們首先要明確階梯函數的定義。定義在區間[]上的函數,如果存在有限個分點 = …,在每個開區間(), 上取常數,則稱之為階梯函數。將此定義推廣到無限區間上時,只要求滿足在任意有限區間上如上定義(參見王梓坤(1996))即可。總之,無論有限情形還是無限情形,從圖像上看,階梯函數都會出現階梯形狀。 故而,當離散型隨機變量取有限個值時,容易知道其分布函數一定是階梯函數;然而當其取值為可列多個值時,則不一定是階梯函數了。
例: 定義一個取值于(0,1)中的有理數 (互質)的離散型隨機變量如下:
= ,
其中 = , 為(0,1)上的有理數集。
顯然,此隨機變量確定的分布函數在區間(0,1)上的有理數點處都發生跳躍,其圖象無法形成階梯形狀,也就不是階梯函數。另外,更多的例子可以在朱作賓(1984)中找到。
這個問題的反向結論則顯然是成立的,即如果一個分布函數是一個單調上升且右連續的階梯函數時,則與其對應的隨機變量一定是離散型的,并且隨機變量的取值點就是跳躍間斷點。
那么連續型隨機變量的情形又是怎樣呢? 連續型隨機變量的分布函數是一個變上限積分函數,一定是連續的,但其反向,則不然。如果一個分布函數連續且在每一點都可導,那么其導數就是對應的密度函數,也就是這個分布函數一定是連續型隨機變量的分布函數。然而,將此結論中的可導條件稍微弱化一點,改成幾乎處處可導,則結論不成立。一個例子可以參見桂春燕(2015)。這個例子是基于康托爾集構造的,其過程比較繁瑣,本文只介紹一下該例子的構造思想。其具體思路為:在非康托爾集上按特定規則定義為常數(該常數與點所在的區間有密切聯系),而在康托爾集上定義為由非康托爾集上的常數序列確定的上確界(極限值)以保證連續, 通過這種方法構造的函數在非康托爾集上可導且導數為零,在康托爾集上不可導,而康托爾集為零測集,也就是說,我們得到了一個幾乎處處可導且導數幾乎處處為零的分布函數,故這個分布函數不是連續型隨機變量的分布函數。
第二個問題:一維連續型隨機變量在任意一點的概率為零,這是一個顯然的事實。那么這個結論推廣到多維情形又如何呢?是否可以推廣為二維連續型隨機變量在任意曲線上的概率為零?
這個問題的本質是考慮一個二元可積函數在曲線上的二重積分問題,而在二維空間內曲線的測度一般為零,比如常見的冪函數、指數函數等初等函數確定的曲線,此時上述推廣的結論是成立的。然而,數學常常會有讓人驚訝的奇妙之處。事實上,曲線的測度不一定是零, 一個有趣的例子就是皮亞諾曲線(可參見那湯松(1965))。關于此曲線的一種經典的構造方法是通過把一個正方形分割成4個小正方形,然后將小正方形的中心點相連,此過程不斷重復遞歸,取極限后,可構造出一條曲線,該曲線可以覆蓋整個正方形。這種語言描述顯得有點不夠嚴謹,趙明方(1965)給出了一類皮亞諾曲線的解析表達式,其具體定義如下:
在閉區間[0,2]上,令
且 = ,是整數,是[0, 36]上任意的一個實數。 再令
= , =
從而可由, 構造出一條曲線:,趙明方(1965)證明了此曲線就是正方形[0,1]譡0,1]上的皮亞諾曲線,可以表示正方形中的任何一個點。因此,如果在某個正方形上定義一個服從二維均勻分布的隨機變量,則其在對應的皮亞諾曲線上的概率為1。不過,這種曲線是極其特殊的,值得更進一步的研究和討論。為避開這種特殊情形,我們可以限制曲線為可由一元參數方程確定的光滑曲線,此時光滑曲線的面積(測度)一定為零,那么我們的結論在光滑曲線上就一定是成立的,也就是說二維連續型隨機變量在光滑曲線上的概率一定為零。
第三個問題:二維連續型隨機變量的邊緣分布是否一定對應連續型隨機變量?反之, 如果邊緣分布都對應連續型隨機變量,其二維隨機變量是否一定是連續型的?
這一個問題的前半部分的答案是肯定的。事實上,假設二維隨機變量的密度函數為,則的邊緣分布為
= ,
故存在一個非負函數 = 滿足連續型隨機變量的定義。然而,其反向結論則不成立,可見下面的例子。
例:假設隨機變量服從參數為1的指數分布,,則二維隨機變量的分布函數為:
此時, = 0, 從而不存在一個滿足二維連續型隨機變量的定義的非負二元函數,即不是二維連續型隨機變量。
以上幾個問題,是概率論教學過程中需要留意的幾個小問題,這些問題因為都是在非常規情形下出現,往往容易忽視,故而在學習研究概率論的過程中,要始終保持謹慎認真的態度,既要對知識有直觀的認識,又要嚴格對待理論體系的嚴密邏輯。
參考文獻
[1] 王梓坤.隨機過程通論.北京師范大學出版社,1996:73.
[2] 朱作賓.關于離散型分布函數的一個問題.安徽師大學報(自然科學版),1984:19-21.
[3] 桂春燕.連續的分布函數與連續型隨機變量的關系. 安慶師范學院學報(自然科學版),2015.21(1):101-102.
[4] . .那湯松,張德英,曹治平.皮亞諾曲線.數學通報,1964:43-46.
[5] 趙明方.再論皮亞諾曲線.數學通報,1965:35-36.