摘要:設ρ和σ是表示量子狀態的兩個密度算子(跡為1的半正定算子),定義ρ到σ的相對熵為S(ρ‖σ)=tr(ρlogρ)-tr(ρlogσ)。分別應用密度算子的標準正交分解和凹函數的相關知識證明了S(ρ‖σ)≥0,同時把凹函數定義推廣到矩陣的跡形式。
關鍵詞:密度矩陣;量子的相對熵;跡
一、 引入
在經典信息論中,設系統X={(xi,p(xi))},i=1,…,n,隨機變量Shannon熵可以定義為隨機變量取不同值的一個函數,可以看作是概率分布的函數。
定義1設X={(xi,p(xi))},i=1,…,n為一個系統,Shannon熵定義為H(X)=H(p1,…,pn)≡-∑ni=1(pxlogpx),本文中“log”是以2為底的,“ln”是自然對數,因為log0沒有定義,從直觀上講,不發生事件對Shannon熵沒有貢獻,因此可規定0log0=0。
定義2設p(x)和q(x)是定義在同一指標集上的概率分布,p(x)到q(x)的相對熵定義H(p(x)‖q(x))≡-∑xp(x)logq(x)p(x),定義當p(x)>0時,-p(x)log0=+∞。
定理1設p(x)和q(x)是定義在同一指標集上的概率分布,則p(x)到q(x)的相對熵是非負的,即H(q(x)‖p(x))≥0,當且僅當p(x)=q(x)時等號成立。
證明對所有的正整數x>0,logxln2=lnx≤x-1當且僅當x=1時等號成立。那么其可以變形為-logx≥1-xln2,H(q(x)‖p(x))≡-∑xp(x)logq(x)p(x)≥1ln2∑xp(x)1-q(x)p(x)=1ln2∑x(p(x)-q(x))=1ln2(1-1)=0。由上面的可知,當且僅當p(x)=q(x)對所有的x成立時取等號。
Shannon熵測量的不確定性與經典概率的分布相關聯。描述量子狀態的方式是類似的,只是用密度算子代替概率分布,把Shannon熵推廣到量子狀態。以下把量子狀態下的相對熵的非負性證明做一些討論。
二、 內容
定義3設pi是量子系統中一組狀態|ψi〉對應的概率,稱ρ=∑ipi|ψi〉〈ψi|為一個純態系統的密度算子(或者成為密度矩陣)。
定理2密度算子ρ=∑ipi|ψi〉〈ψi|是一個跡為1的半正定算子。
證明因為ρ=∑ipi|ψi〉〈ψi|,所以tr(ρ)=tr(∑iρi|ψi〉〈ψi|)=∑iρitr(|ψi〉〈ψi|)=∑iρi=1,且對于任意的一個表示狀態的向量|φ〉,〈φ|ρ|φ〉=〈φ|∑iρi|ψi〉〈ψi||φ〉=∑iρi〈φ,ψi〉〈ψi,φ〉=∑iρi〈ψi,φ〉2≥0
定理3一個跡為1的半正定算子ρ一定是一個密度算子。
證明因為ρ是一個半正定算子,所以ρ一定有譜分解。ρ=∑iλi|i〉〈i|,其中λi是半正定算子的非負特征值,向量組|i〉是正交的,又因為∑iλi=1,所以以λi為一組狀態|i〉對應的概率的量子系統存在密度算子。
定義4設ρ是表示量子狀態的密度算子,(即Von Neumann熵)定義量子狀態下的熵為S(ρ)=-tr(ρlogρ)。如果λx是ρ的特征值,那么定義可以寫成S(ρ)=-∑xλxlogλx
定義5設ρ和σ是表示量子狀態的兩個密度算子,那么ρ到σ的相對熵定義為S(ρ‖σ)=tr(ρlogρ)-tr(ρlogσ)
定理4設ρ和σ是密度算子,那么S(ρ‖σ)=tr(ρlogρ)-tr(ρlogσ)≥0,其中ρ=σ時等號成立。
證明令ρ=∑ipi|i〉〈i|和σ=∑jpj|j〉〈j|分別為ρ和σ的標準正交分解,那么有tr(ρlogρ)-tr(ρlogσ)=∑ipilogpi-∑〈i|ρlogσ|i〉,因為〈i|ρ=pi〈i|,并且〈i|logσ|i〉=〈i|(∑jlog(qj)|j〉〈j|)|i〉=∑log(qj)pij,其中pij=〈i||j〉〈j||i≥0〉,由此可得S(ρ‖σ)=∑ipi(logpi-∑jpijlogqj),其中pij≥0,并且∑ipij=1,∑jpij=1。由于log(·)是嚴格的凹函數,所以∑jpijlogqj≤logri,其中ri=∑jpijqj,當且僅當存在某個j,使得pij=1時等號成立,于是S(ρ‖σ)≥∑ipilogpiri,當且僅當對于每一個i都存在一個j使得pij=1時取等號。即當且僅當pij是置換陣,由經典相對熵的非負性,即定理1可知S(ρ‖σ)≥0。
定理4的又一個證明要用到以下知識。
定義5設f(x)是關于實數變量x的可微實函數,如果對于所有的x和y,都有f(y)-f(x)≤(y-x)f′(x)成立,那么函數f(x)是凹的。
例如,設函數f(x)=-xlogx,當x>0時就是凹的,因為將它代入上式中,整理可得logxy≤xy-1,此式當x>y>0時成立,因為對x>0,有不等式log(1+x) 可將上面的定義推廣到矩陣求跡形式,可以得到以下定理。 定理5設ρ和σ是兩個n維矩陣,且不一定對易(如果ρσ=σρ,那么就稱n維矩陣ρ和σ是對易的),如果f(x)是一個凹函數,那么tr[f(σ)-f(ρ)]≤tr[(σ-ρ)f′(ρ)]。 證明設ρ和σ的特征值分別為α1,α2,…,αn和β1,β2,…,βn,將這兩組數按降冪排列,得到新的兩組數α′1,α′2,…,α′n和β′1,β′2,…,β′n,于是令定義2中的x和y分別取這里的α′i和β′i,利用函數的凹性,有 f(β′1)-f(α′1)≤(β′1-α′1)f(α′1) … f(β′n)-f(α′n)≤(β′n-α′n)f(α′n) 將這n個方程求和,注意有 ∑ni=1f(α′i)=∑ni=1f(αi)=trf(ρ) ∑ni=1f(β′i)=∑ni=1f(βi)=trf(σ) ∑ni=1α′if′(α′i)=∑ni=1αif′(αi)=tr[ρf′(ρ)] ∑ni=1β′if′(α′i)=∑ni=1βif′(αi)=tr[σf′(ρ)] 因此可得tr[f(σ)-f(ρ)]≤tr[(σ-ρ)f′(ρ)]。 現在可以利用定理5給出定理4的另一種證明。 證明對于任意兩個表示量子狀態的密度算子ρ和σ,定義f(ρ)≡-ρlogρ和f(σ)≡-ρlogσ,利用定理3,有-S(ρ‖σ)=tr[-ρ(logρ-logσ)]=tr[f(ρ)-f(σ)+f(σ)+ρlogσ]≤tr[(ρ-σ)(-logσ-1)-(σ-ρ)logσ]=tr(σ-ρ)=0。 所以S(ρ‖σ)=tr(ρlogρ)-tr(ρlogσ)≥0。 參考文獻: [1]Michael A. Nielsen, Isaac L. Chuang著,趙千川譯.量子計算和量子信息[G].清華大學出版社,2004. [2]Stephen M. Barnett, Quantum information, Oxford Master series in atomic, optical, and laser physics. [3]A. S. Holevo, Reliability function of general classicalquantum channel. IEEE Trans. Inform. Theory 46,2000:2256-2261. [4]T. Ogawa, H. agaoka, Strong converse to the quantum channel coding theorem, IEEE Trans. Inform. theory,1999(45):149-154. 作者簡介: 劉波,講師,陜西省西安市,陜西學前師范學院理學。