葉瑞松
(汕頭大學(xué) 數(shù)學(xué)系, 廣東 汕頭515063)
在概率論與數(shù)理統(tǒng)計的教學(xué)中,兩個一維連續(xù)型隨機(jī)變量的函數(shù)的分布及其相關(guān)的概率計算均比較復(fù)雜.很多大學(xué)生對這部分內(nèi)容的學(xué)習(xí)常常理不清頭緒,普遍不能夠很好地掌握這部分內(nèi)容,學(xué)習(xí)費力,效率不佳,可以說是事倍功半,從而導(dǎo)致失去進(jìn)一步學(xué)習(xí)的興趣;對數(shù)學(xué)專業(yè)的學(xué)生來說,也將影響其繼續(xù)學(xué)習(xí)后續(xù)隨機(jī)數(shù)學(xué)的相關(guān)課程.這其中的原因主要有兩個:① 兩個一維連續(xù)型變量的函數(shù)的分布及其概率的計算過程涉及較為復(fù)雜的二重積分計算, 包括積分區(qū)域的不規(guī)則,二次積分上下限的確定,累次積分的準(zhǔn)確計算等問題.②傳統(tǒng)教材上的例子多數(shù)脫離實際,是純粹理想的數(shù)學(xué)構(gòu)造,學(xué)生在學(xué)習(xí)過程未能切身體會其實實在在的應(yīng)用背景,學(xué)習(xí)上提不起興趣[1-4].
筆者根據(jù)多年在信號、圖像信息領(lǐng)域中經(jīng)常碰到兩幅圖像信息或兩個信號之間的求和模運算的實際問題,發(fā)現(xiàn)研究兩個一維隨機(jī)變量X,Y之和的模函數(shù)Z=mod(X+Y,L)的分布及其概率計算,無論在理論上還是應(yīng)用中均很有意義[5].這個函數(shù)在教材中是未作介紹的,但實際上這個函數(shù)在圖像信息加密和編碼中均發(fā)揮了很重要的作用,對這個函數(shù)的分布的研究很有必要,所得的結(jié)果可以用來指導(dǎo)圖像信息加密和編碼的應(yīng)用研究.這是對概率論教材中例子的很好補(bǔ)充.由于該函數(shù)具有很強(qiáng)的應(yīng)用背景,對工科學(xué)生來講,能讓他們明白該函數(shù)應(yīng)用的領(lǐng)域,了解該函數(shù)的應(yīng)用價值,這對提高他們進(jìn)一步學(xué)習(xí)概率統(tǒng)計的興趣,有很好的激勵作用.
目前大多書概率統(tǒng)計的教科書對兩個隨機(jī)變量的和函數(shù)的分布問題均有介紹,但是這個和函數(shù)的分布在應(yīng)用中需要改造才能加以應(yīng)用[6-8].本文針對圖像加密領(lǐng)域中兩個一維隨機(jī)變量和的模函數(shù),分別對連續(xù)型和離散型的情況進(jìn)行討論.雖然在工程應(yīng)用中碰到的隨機(jī)變量問題均是離散型的,但是也有必要對其連續(xù)型的情況做理論上的探討,進(jìn)一步提升學(xué)生的數(shù)學(xué)理論素養(yǎng).論文從理論上證明了兩種情況下的分布函數(shù)的相關(guān)結(jié)果,介紹了該函數(shù)在圖像信息安全領(lǐng)域的一個應(yīng)用,并用數(shù)值例子驗證了相關(guān)的理論結(jié)果.
首先介紹模函數(shù)mod(s,t),該函數(shù)是一個二元函數(shù),當(dāng)兩個自變量均是整數(shù)時,模函數(shù)就是求余數(shù).當(dāng)兩個變量是一般的實數(shù)時,表示取模,返回余數(shù),具體地講,就是將s寫成t與一個整數(shù)k的乘積和一個落在[0,t)之間的余數(shù)之和的形式s=kt+r, 那么mod(s,t)的函數(shù)值就是r.將這個模函數(shù)應(yīng)用到隨機(jī)變量的場合,引進(jìn)兩個一維隨機(jī)變量X,Y之和的模函數(shù),這是對傳統(tǒng)教材上的兩個隨機(jī)變量的和函數(shù)的一個推廣.
一般灰度圖像的亮度值的范圍在理論上均是歸一化為區(qū)間[0,1),所以本文的模函數(shù)中的模t一般設(shè)為1, 從而函數(shù)值的值域也是[0,1).一般的灰度圖像的亮度值可以取值0, 所以本文所說的服從均勻分布的隨機(jī)變量在取值0時,其概率或概率密度與一些教材上的定義稍有不同, 不同之處在于隨機(jī)變量取值0可以具有正的概率或概率密度.如果兩個隨機(jī)變量X,Y均是區(qū)間[0,1)上的均勻分布,將有下面的定理1.
定理1假設(shè)連續(xù)型隨機(jī)變量X,Y相互獨立,均服從區(qū)間[0,1)上的均勻分布,即X,Y~U[0,1).則Z=mod(X+Y,1)的分布也是U[0,1).

圖1 函數(shù)Z=mod(X+Y,1)的分布 函數(shù)計算示意圖
證由于X,Y相互獨立,且服從相同的均勻分布U[0,1),其概率密度函數(shù)為
所以二維隨機(jī)變量(X,Y)的聯(lián)合概率密度函數(shù)為

而Z=mod(X+Y,1)的取值在[0,1),假設(shè)Z的分布函數(shù)為F(z),則
(i)對任意的z≥1,F(xiàn)(z)=P(Z≤z}=1;
(ii)對任意的z<0,F(xiàn)(z)=P(Z≤z}=0;
(iii)對任意的0≤z<1,
F(z)=P(Z≤z}=P{mod(X+Y,1)≤z}=P{0≤X+Y≤z}+P{1≤X+Y≤1+z}
其中,當(dāng)0≤z<1時,分布函數(shù)的計算可以參看圖1. 從上面計算所得知道Z~U[0,1).
將隨機(jī)變量離散化,得到兩個隨機(jī)變量和的模函數(shù)的離散型問題,其結(jié)果可以用到數(shù)字圖像的加密領(lǐng)域中設(shè)計兩幅圖像和的模函數(shù).模函數(shù)以及和函數(shù)的變量均是整數(shù),所以有針對性地選取模為2的冪次數(shù)2m,其中m為某一個正整數(shù).具體的應(yīng)用場合就是數(shù)字圖像,一幅灰度圖像的亮度值可以用m比特的整數(shù)來表示,m比特的整數(shù)隨機(jī)變量總共可表示2m個不同的值{0,1,2,…,2m-1},也就是說,如果隨機(jī)變量X,Y表示m比特的圖像的亮度,其取值范圍就是{0,1,2,…,2m-1}. 比如m=8比特的數(shù)字圖像,有28=256個不同灰度層次.定理1的離散型版本即是下面的定理2.
定理2假設(shè)離散型隨機(jī)變量X,Y相互獨立,服從相同的均勻分布:

X(Y)01…2m-1pk2-m2-m…2-m
則Z=mod(X+Y,2m)的分布和X,Y的分布相同.
證Z=mod(X+Y,2m)的取值范圍為{0,1,2,…,2m-1},所以要得到其分布律,只要計算0≤k≤2m-1時,對應(yīng)的概率P(Z=k}:
P(Z=k}=P{mod(X+Y,2m)=k}=P{X+Y=k}+P{X+Y=2m+k}
=(2-m)2×(k+1)+(2-m)2×(2m-1-k)=2-m.
所以Z=mod(X+Y,2m)服從和X相同的分布.
到此,得到兩個一維相互獨立的均勻分布隨機(jī)變量和的模函數(shù)的相關(guān)結(jié)論.在實際應(yīng)用場合,均勻分布一般對應(yīng)類似噪聲的信號、圖像信息.服從均勻分布的隨機(jī)變量所表示的圖像一般是一幅具有明確內(nèi)容的明文圖像經(jīng)過加密而得到的密文圖像.在應(yīng)用中,很自然會碰到一個問題,就是一幅具有自然內(nèi)容的明文圖像的加密問題,其中一種辦法就是改變圖像每個像素的亮度值,從而遮掩了自然圖像的內(nèi)容.密碼學(xué)要求密文圖像要接近均勻分布,越逼近均勻分布,加密性能越好.所以有必要對這個問題進(jìn)行探討,如何實現(xiàn)這個加密要求的理想效果,理論上有下面的定理3. 定理3中隨機(jī)變量X表示某一幅模擬圖像的連續(xù)型隨機(jī)變量,其灰度值的范圍已經(jīng)歸一化到單位區(qū)間[0,1),所以其概率密度函數(shù)只是在[0,1)取值,而在[0,1)外的概率密度均為0.
定理3假設(shè)連續(xù)型隨機(jī)變量X,Y相互獨立,Y~U[0,1),X的概率密度函數(shù)為

則Z=mod(X+Y,1)的分布也是U[0,1).
證Z的取值范圍為[0,1),設(shè)Z的分布函數(shù)為F(z),則
(i)對任意的z≥1,F(xiàn)(z)=P(Z≤z}=1;
(ii)對任意的z<0,F(xiàn)(z)=P(Z≤z}=0;
(iii)對任意的0≤z<1,
F(z)=P(Z≤z}=P{mod(X+Y,1)≤z}=P{0≤X+Y≤z}+P{1≤X+Y≤1+z}.
由于(X,Y)的聯(lián)合概率密度函數(shù)為
和定理1一樣,計算當(dāng)0≤z<1時的分布函數(shù),可以參看圖1,但是這里的計算不能使用Ω1,Ω2的面積作為概率值,需要計算其累次積分.
F(z)=P(Z≤z}=P{(X,Y)∈Ω1}+P{(X,Y)∈Ω2}

所以和定理1結(jié)論一樣,Z~U[0,1).
同樣將定理3中的隨機(jī)變量離散化,應(yīng)用到數(shù)字圖像處理的領(lǐng)域中,也有相應(yīng)的離散型的定理4.
定理4假設(shè)離散型隨機(jī)變量X,Y相互獨立,X服從離散均勻分布:

X01…2m-1pk2-m2-m…2-m
Y的分布律為

Y01…2m-1pkp0p1…p2m-1
則Z=mod(X+Y,2m)的分布和X的分布相同,也是離散均勻分布.
證Z=mod(X+Y,2m)的取值范圍為{0,1,2,…,2m-1},當(dāng)0≤k≤2m-1時,
P(Z=k}=P{mod(X+Y,2m)=k}=P{X+Y=k}+P{X+Y=2m+k}
=2-m×pk+2-m×pk-1+…+2-m×p0+2-m×p2m-1+…+2-m×pk+1
證明完畢.
更一般地,如果服從均勻分布的隨機(jī)變量X與另一個服從任意分布的隨機(jī)變量Y相互獨立的話,則可以證明X與Y之和的模函數(shù)也一定服從X同樣的分布,即有下面的定理5.
定理5假設(shè)隨機(jī)變量X,Y相互獨立,X~U[0,b),b>0,Y為任意分布的隨機(jī)變量,則Z=mod(X+Y,b)的分布也是U[0,b),且與Y相互獨立.
證該定理的證明分兩步完成.
① 對任意常數(shù)y,證明Z=mod(X+y,b)~U[0,b).假設(shè)y=kb+a,其中k為整數(shù),而0≤a (i) 對任意的z≥b,F(xiàn)(z)=P(Z≤z}=1; (ii) 對任意的z<0,F(xiàn)(z)=P(Z≤z}=0; (iii) 對任意的0≤z F(z)=P(Z≤z}=P{mod(X+a,b)≤z}=P{0≤X+a≤z}+P{b≤X+a≤b+z}. 當(dāng)a≤z F(z)=P{0≤X≤z-a}+P{b-a≤X≤b-a+z}