隨機(jī)變量和的模函數(shù)分布及其應(yīng)用

2021-05-07 09:19:10葉瑞松

大學(xué)數(shù)學(xué) 2021年2期

葉瑞松

(汕頭大學(xué) 數(shù)學(xué)系，廣東汕頭515063)

1 引言

在概率論與數(shù)理統(tǒng)計的教學(xué)中，兩個一維連續(xù)型隨機(jī)變量的函數(shù)的分布及其相關(guān)的概率計算均比較復(fù)雜.很多大學(xué)生對這部分內(nèi)容的學(xué)習(xí)常常理不清頭緒，普遍不能夠很好地掌握這部分內(nèi)容，學(xué)習(xí)費力，效率不佳，可以說是事倍功半，從而導(dǎo)致失去進(jìn)一步學(xué)習(xí)的興趣；對數(shù)學(xué)專業(yè)的學(xué)生來說，也將影響其繼續(xù)學(xué)習(xí)后續(xù)隨機(jī)數(shù)學(xué)的相關(guān)課程.這其中的原因主要有兩個：① 兩個一維連續(xù)型變量的函數(shù)的分布及其概率的計算過程涉及較為復(fù)雜的二重積分計算，包括積分區(qū)域的不規(guī)則，二次積分上下限的確定，累次積分的準(zhǔn)確計算等問題.②傳統(tǒng)教材上的例子多數(shù)脫離實際，是純粹理想的數(shù)學(xué)構(gòu)造，學(xué)生在學(xué)習(xí)過程未能切身體會其實實在在的應(yīng)用背景，學(xué)習(xí)上提不起興趣[1-4].

筆者根據(jù)多年在信號、圖像信息領(lǐng)域中經(jīng)常碰到兩幅圖像信息或兩個信號之間的求和模運算的實際問題，發(fā)現(xiàn)研究兩個一維隨機(jī)變量X，Y之和的模函數(shù)Z=mod(X+Y，L)的分布及其概率計算，無論在理論上還是應(yīng)用中均很有意義[5].這個函數(shù)在教材中是未作介紹的，但實際上這個函數(shù)在圖像信息加密和編碼中均發(fā)揮了很重要的作用，對這個函數(shù)的分布的研究很有必要，所得的結(jié)果可以用來指導(dǎo)圖像信息加密和編碼的應(yīng)用研究.這是對概率論教材中例子的很好補(bǔ)充.由于該函數(shù)具有很強(qiáng)的應(yīng)用背景，對工科學(xué)生來講，能讓他們明白該函數(shù)應(yīng)用的領(lǐng)域，了解該函數(shù)的應(yīng)用價值，這對提高他們進(jìn)一步學(xué)習(xí)概率統(tǒng)計的興趣，有很好的激勵作用.

目前大多書概率統(tǒng)計的教科書對兩個隨機(jī)變量的和函數(shù)的分布問題均有介紹，但是這個和函數(shù)的分布在應(yīng)用中需要改造才能加以應(yīng)用[6-8].本文針對圖像加密領(lǐng)域中兩個一維隨機(jī)變量和的模函數(shù)，分別對連續(xù)型和離散型的情況進(jìn)行討論.雖然在工程應(yīng)用中碰到的隨機(jī)變量問題均是離散型的，但是也有必要對其連續(xù)型的情況做理論上的探討，進(jìn)一步提升學(xué)生的數(shù)學(xué)理論素養(yǎng).論文從理論上證明了兩種情況下的分布函數(shù)的相關(guān)結(jié)果，介紹了該函數(shù)在圖像信息安全領(lǐng)域的一個應(yīng)用，并用數(shù)值例子驗證了相關(guān)的理論結(jié)果.

2 一維隨機(jī)變量和的模函數(shù)及其分布

首先介紹模函數(shù)mod(s，t)，該函數(shù)是一個二元函數(shù)，當(dāng)兩個自變量均是整數(shù)時，模函數(shù)就是求余數(shù).當(dāng)兩個變量是一般的實數(shù)時，表示取模，返回余數(shù)，具體地講，就是將s寫成t與一個整數(shù)k的乘積和一個落在[0，t)之間的余數(shù)之和的形式s=kt+r，那么mod(s，t)的函數(shù)值就是r.將這個模函數(shù)應(yīng)用到隨機(jī)變量的場合，引進(jìn)兩個一維隨機(jī)變量X，Y之和的模函數(shù)，這是對傳統(tǒng)教材上的兩個隨機(jī)變量的和函數(shù)的一個推廣.

一般灰度圖像的亮度值的范圍在理論上均是歸一化為區(qū)間[0，1)，所以本文的模函數(shù)中的模t一般設(shè)為1，從而函數(shù)值的值域也是[0，1).一般的灰度圖像的亮度值可以取值0，所以本文所說的服從均勻分布的隨機(jī)變量在取值0時，其概率或概率密度與一些教材上的定義稍有不同，不同之處在于隨機(jī)變量取值0可以具有正的概率或概率密度.如果兩個隨機(jī)變量X，Y均是區(qū)間[0，1)上的均勻分布，將有下面的定理1.

定理1假設(shè)連續(xù)型隨機(jī)變量X，Y相互獨立，均服從區(qū)間[0，1)上的均勻分布，即X，Y～U[0，1).則Z=mod(X+Y，1)的分布也是U[0，1).

圖1 函數(shù)Z=mod(X+Y,1)的分布函數(shù)計算示意圖

證由于X，Y相互獨立，且服從相同的均勻分布U[0，1)，其概率密度函數(shù)為

所以二維隨機(jī)變量(X，Y)的聯(lián)合概率密度函數(shù)為

而Z=mod(X+Y，1)的取值在[0，1)，假設(shè)Z的分布函數(shù)為F(z)，則

(i)對任意的z≥1，F(xiàn)(z)=P(Z≤z}=1；

(ii)對任意的z<0，F(xiàn)(z)=P(Z≤z}=0；

(iii)對任意的0≤z<1，

F(z)=P(Z≤z}=P{mod(X+Y，1)≤z}=P{0≤X+Y≤z}+P{1≤X+Y≤1+z}

其中，當(dāng)0≤z<1時，分布函數(shù)的計算可以參看圖1. 從上面計算所得知道Z～U[0，1).

將隨機(jī)變量離散化，得到兩個隨機(jī)變量和的模函數(shù)的離散型問題，其結(jié)果可以用到數(shù)字圖像的加密領(lǐng)域中設(shè)計兩幅圖像和的模函數(shù).模函數(shù)以及和函數(shù)的變量均是整數(shù)，所以有針對性地選取模為2的冪次數(shù)2m，其中m為某一個正整數(shù).具體的應(yīng)用場合就是數(shù)字圖像，一幅灰度圖像的亮度值可以用m比特的整數(shù)來表示，m比特的整數(shù)隨機(jī)變量總共可表示2m個不同的值{0，1，2，…，2m-1}，也就是說，如果隨機(jī)變量X，Y表示m比特的圖像的亮度，其取值范圍就是{0，1，2，…，2m-1}. 比如m=8比特的數(shù)字圖像，有28=256個不同灰度層次.定理1的離散型版本即是下面的定理2.

定理2假設(shè)離散型隨機(jī)變量X，Y相互獨立，服從相同的均勻分布：

X(Y)01…2m-1pk2-m2-m…2-m

則Z=mod(X+Y，2m)的分布和X，Y的分布相同.

證Z=mod(X+Y，2m)的取值范圍為{0，1，2，…，2m-1}，所以要得到其分布律，只要計算0≤k≤2m-1時，對應(yīng)的概率P(Z=k}:

P(Z=k}=P{mod(X+Y，2m)=k}=P{X+Y=k}+P{X+Y=2m+k}

=(2-m)2×(k+1)+(2-m)2×(2m-1-k)=2-m.

所以Z=mod(X+Y，2m)服從和X相同的分布.

到此，得到兩個一維相互獨立的均勻分布隨機(jī)變量和的模函數(shù)的相關(guān)結(jié)論.在實際應(yīng)用場合，均勻分布一般對應(yīng)類似噪聲的信號、圖像信息.服從均勻分布的隨機(jī)變量所表示的圖像一般是一幅具有明確內(nèi)容的明文圖像經(jīng)過加密而得到的密文圖像.在應(yīng)用中，很自然會碰到一個問題，就是一幅具有自然內(nèi)容的明文圖像的加密問題，其中一種辦法就是改變圖像每個像素的亮度值，從而遮掩了自然圖像的內(nèi)容.密碼學(xué)要求密文圖像要接近均勻分布，越逼近均勻分布，加密性能越好.所以有必要對這個問題進(jìn)行探討，如何實現(xiàn)這個加密要求的理想效果，理論上有下面的定理3. 定理3中隨機(jī)變量X表示某一幅模擬圖像的連續(xù)型隨機(jī)變量，其灰度值的范圍已經(jīng)歸一化到單位區(qū)間[0，1)，所以其概率密度函數(shù)只是在[0，1)取值，而在[0，1)外的概率密度均為0.

定理3假設(shè)連續(xù)型隨機(jī)變量X，Y相互獨立，Y～U[0，1)，X的概率密度函數(shù)為

則Z=mod(X+Y，1)的分布也是U[0，1).

證Z的取值范圍為[0，1)，設(shè)Z的分布函數(shù)為F(z)，則

(i)對任意的z≥1，F(xiàn)(z)=P(Z≤z}=1；

(ii)對任意的z<0，F(xiàn)(z)=P(Z≤z}=0；

(iii)對任意的0≤z<1，

F(z)=P(Z≤z}=P{mod(X+Y，1)≤z}=P{0≤X+Y≤z}+P{1≤X+Y≤1+z}.

由于(X，Y)的聯(lián)合概率密度函數(shù)為

和定理1一樣，計算當(dāng)0≤z<1時的分布函數(shù)，可以參看圖1，但是這里的計算不能使用Ω1，Ω2的面積作為概率值，需要計算其累次積分.

F(z)=P(Z≤z}=P{(X，Y)∈Ω1}+P{(X，Y)∈Ω2}

所以和定理1結(jié)論一樣，Z～U[0，1).

同樣將定理3中的隨機(jī)變量離散化，應(yīng)用到數(shù)字圖像處理的領(lǐng)域中，也有相應(yīng)的離散型的定理4.

定理4假設(shè)離散型隨機(jī)變量X，Y相互獨立，X服從離散均勻分布：

X01…2m-1pk2-m2-m…2-m

Y的分布律為

Y01…2m-1pkp0p1…p2m-1

則Z=mod(X+Y，2m)的分布和X的分布相同，也是離散均勻分布.

證Z=mod(X+Y，2m)的取值范圍為{0，1，2，…，2m-1}，當(dāng)0≤k≤2m-1時，

P(Z=k}=P{mod(X+Y，2m)=k}=P{X+Y=k}+P{X+Y=2m+k}

=2-m×pk+2-m×pk-1+…+2-m×p0+2-m×p2m-1+…+2-m×pk+1

證明完畢.

更一般地，如果服從均勻分布的隨機(jī)變量X與另一個服從任意分布的隨機(jī)變量Y相互獨立的話，則可以證明X與Y之和的模函數(shù)也一定服從X同樣的分布，即有下面的定理5.

定理5假設(shè)隨機(jī)變量X，Y相互獨立，X～U[0，b)，b>0，Y為任意分布的隨機(jī)變量，則Z=mod(X+Y，b)的分布也是U[0，b)，且與Y相互獨立.

證該定理的證明分兩步完成.

① 對任意常數(shù)y，證明Z=mod(X+y，b)～U[0，b).假設(shè)y=kb+a，其中k為整數(shù)，而0≤a

(i) 對任意的z≥b，F(xiàn)(z)=P(Z≤z}=1；

(ii) 對任意的z<0，F(xiàn)(z)=P(Z≤z}=0；

(iii) 對任意的0≤z

F(z)=P(Z≤z}=P{mod(X+a，b)≤z}=P{0≤X+a≤z}+P{b≤X+a≤b+z}.

當(dāng)a≤z

F(z)=P{0≤X≤z-a}+P{b-a≤X≤b-a+z}

當(dāng)0≤z

綜上所述，可知Z=mod(X+y，b)～U[0，b).

② 接著證明對任意隨機(jī)變量Y，計算Z=mod(X+Y，b)關(guān)于Y的條件分布函數(shù)也是U[0，b)，且與Y相互獨立.實際上，假設(shè)Z關(guān)于Y的條件分布函數(shù)為

FZ|Y(z|y)=P{Z≤z|Y=y}=P{mod(X+y，b)≤z}.

則由于Z的取值在[0，b)，且由①的結(jié)論知道FZ|Y(z|y)=P{mod(X+y，b)≤z}是U[0，b)的分布函數(shù)，且與y值無關(guān)，因此證明了定理的結(jié)論.

注該定理的結(jié)論是匿名審稿專家所提供的建議，作者將這個結(jié)果總結(jié)在論文中，并根據(jù)專家的思路加以證明.顯然定理5的結(jié)果拓廣前面四個定理的相關(guān)結(jié)論.其一是不要求隨機(jī)變量Y的取值范圍，可以在整個實軸上取值；其二是不要求Y是連續(xù)型的隨機(jī)變量.對任意的隨機(jī)變量Y，只要Y與X相互獨立，則結(jié)論都是成立的.所以定理5的結(jié)論更具有概括性，將前面幾個定理的結(jié)果都可以包括在內(nèi)，體現(xiàn)了數(shù)學(xué)的統(tǒng)一性之美.

3 一個簡單的圖像加密應(yīng)用例子

數(shù)學(xué)上，灰度數(shù)字圖像可以用一個二維矩陣A表示，如果圖像是8比特即256個灰度級的灰度圖像，則A的元素的值屬于{0，1，2，…，255}.灰度圖像可以表達(dá)為一個隨機(jī)變量X生成的樣本，圖2(a)為Lena圖像，圖2(b)為其概率分布.因此，可以用第2節(jié)得到的結(jié)論來實現(xiàn)兩幅圖像X，Y之和的模函數(shù)運算.如果Y是取值于{0，1，2，…，255}的均勻分布的隨機(jī)變量，則Y生成的一個二維矩陣樣本B，類似于一幅噪聲圖像，圖3(a)為一幅均勻分布的隨機(jī)變量生成的噪聲圖像，圖3(b)為其概率分布.兩幅圖像A，B之和的模函數(shù)C=mod(A+B，256)，得到圖像矩陣C，如圖4(a)所示，圖4(b)為其對應(yīng)的概率分布.這個結(jié)果的圖像實際上可以看成隱藏著明文圖像Lena的信息的密文圖像，其分布也是離散均勻分布，驗證了定理4的理論結(jié)果.其解密也很容易實現(xiàn)，只要求圖4(a)的密文圖像矩陣和圖3(a)的密鑰圖像矩陣之差的模函數(shù)，即可得到明文圖像圖2(a):A=mod(C-B，256).這個簡單的加密算法很容易用matlab實現(xiàn)，代碼如下，供參考：

A=imread(‘lena.tif’); %讀取8比特灰度明文圖像Lena

figure， imshow(A); %顯示圖像Lena

figure， imhist(A); %顯示圖像Lena直方圖

[H，W]=size(A); %獲取圖像的高和寬

B=uint8(floor(rand(H，W)*256)); %生成一幅均勻分布的8比特灰度噪聲圖像

figure， imshow(B); %顯示噪聲圖像

figure， imhist(B); %顯示噪聲圖像直方圖

C=mod(A+B，256);

figure， imshow(C); %顯示密文圖像

figure， imhist(C); %顯示密文圖像直方圖

圖2 明文圖像Lena及其直方圖

圖3 密鑰圖像及其直方圖

圖4 密文圖像及其直方圖

4 結(jié) 論

本文根據(jù)圖像信息安全領(lǐng)域中經(jīng)常碰到的兩幅圖像信息或兩個信號之間的求和模運算的實際問題，探討了兩個一維的相互獨立的隨機(jī)變量X，Y之和的模函數(shù)Z=mod(X+Y，L)分布及其概率計算，證明了相關(guān)的理論結(jié)果，并提供一個具體的應(yīng)用例子.該函數(shù)具有很強(qiáng)的應(yīng)用背景，對該函數(shù)的介紹以及相關(guān)理論的證明可以促進(jìn)大學(xué)生進(jìn)一步理解和掌握隨機(jī)變量和的模函數(shù)的相關(guān)知識；具體的信息安全的應(yīng)用例子將進(jìn)一步提高大學(xué)生學(xué)習(xí)概率統(tǒng)計的興趣和動力.

致謝作者非常感謝相關(guān)文獻(xiàn)對本文的啟發(fā)以及審稿專家提出的寶貴意見，特別感謝審稿專家提供了本文的定理5的相關(guān)結(jié)果和證明思路.

大學(xué)數(shù)學(xué)2021年2期

大學(xué)數(shù)學(xué)的其它文章: “金課”背景下強(qiáng)化線性代數(shù)應(yīng)用教學(xué)的實踐與探索; 基于BOPPPS教學(xué)模式的離散數(shù)學(xué)教學(xué)改革的探索與實踐; 問題與征解; 一類廣義B-T方程邊值問題解的存在性; 關(guān)于Hardy型不等式的討論; 關(guān)于求解極限的若干思考

隨機(jī)變量和的模函數(shù)分布及其應(yīng)用

1 引 言

2 一維隨機(jī)變量和的模函數(shù)及其分布

3 一個簡單的圖像加密應(yīng)用例子

4 結(jié) 論

1 引言