一種基于軟判決的非刪余極化碼參數識別算法

2023-10-11 13:33:14黃知濤

系統工程與電子技術 2023年10期

王垚, 王聰, 王翔, 黃知濤

(1. 國防科技大學電子科學學院, 湖南長沙 410073; 2. 陸軍工程大學通信士官學校, 重慶 400035; 3. 海軍航空大學信息融合研究所, 山東煙臺 264001)

0 引言

信道編碼技術可以有效提升數據傳輸的可靠性,被廣泛應用于各類數字通信系統中。在合作通信中,通信收發雙方預先約定所采用的編碼參數,接收端利用確定的編碼參數對解調后的比特序列進行譯碼,恢復發送端發射的通信內容。但在認知無線電、非合作通信領域,接收端往往缺乏足夠的先驗信息進行譯碼。此時,就需要利用接收到的解調序列,完成對編碼參數的識別[1-2]。目前,主要的編碼方式包括線性分組碼、卷積碼、Turbo碼、低密度奇偶校驗(low density parity check,LDPC)碼、極化碼等。但從公開發表的文獻來看,信道編碼參數識別的研究主要集中于線性分組碼[3-6]、卷積碼[7-9]、Turbo碼[10-13]、LDPC碼[14-16]。對極化碼參數識別的研究,尚處于起步階段。

極化碼是目前唯一一種被證明在二進制離散無記憶信道(binary discrete memoryless channel,B-DMC)下可達到信道容量的信道編碼方式[17],并在3GPP RAN1 #87次會議上被確定為5G增強移動寬帶場景下控制信道的信道編碼方案[18]。同時,極化碼在衛星通信和深空探測方面也有不錯的應用前景[19]?？梢灶A見,會有越來越多的通信系統采用極化碼作為差錯控制的手段,對極化碼進行參數識別研究具有重要的理論和應用價值?，F有針對極化碼參數識別的研究,均默認對象為標準非刪余極化碼。本文同樣針對標準非刪余極化碼展開研究,若無特別說明,文中極化碼均指標準非刪余極化碼。

極化碼從編碼過程上,可看作是線性分組碼的一個子類,但由于其特有的編碼理論與方法,現有的線性分組碼參數識別方法并不適用于極化碼。針對極化碼參數識別問題,文獻[20]針對二進制刪除信道(binary erasure channel,BEC)條件,采用硬判決序列作為處理對象,對刪除概率和碼長進行遍歷,求得每組參數對應的生成矩陣與其零空間,再利用碼字矩陣與零空間之間的對偶關系,確定各個參數。文獻[21]則利用極化碼生成矩陣的結構性質,對文獻[20]的方法進行了改進,簡化了求解零空間的過程。為提高算法性能,文獻[22]使用軟判決序列作為處理對象,引入對數似然系比(log likelihood ratio,LLR)[23],遍歷每個碼長對對偶關系進行檢測,完成對信息比特和凍結比特的識別。文獻[24]和文獻[25]則利用極化碼生成矩陣的結構性質,優化了校驗向量的計算過程,提高了處理效率。

但上述方法均假設極化碼的凍結比特取值為0,忽視了凍結比特可任意取值這一事實。由于凍結比特的取值不影響極化碼的譯碼性能,編碼理論研究通常假設該值為0,但在具體應用中可根據實際需要設定凍結比特的取值[26-27],以提高用戶終端(user equipment,UE)檢測下行控制信息(downlink control information,DCI)的速度和準確性[26],降低UE對DCI發生誤檢和虛警的概率[27]。另一方面,凍結比特的取值又是譯碼的必要信息[17]。因此,在非合作通信中,不能簡單地認為凍結比特取值為0。為了能夠正確恢復所傳信息,不但需要對碼長、碼率、信息/凍結比特的位置進行識別,還要對凍結比特的取值進行估計。

針對上述問題,本文對極化碼的性質展開研究,證明了當凍結比特取值不為0時,碼字矩陣與生成矩陣列向量之間的校驗關系與比特位類型、凍結比特取值之間的聯系。在此基礎上,將信息/凍結比特位的識別,以及凍結比特取值的判斷,轉化為一個一維三類的統計判決問題,并引入似然差(likelihood difference,LD)[7,28]構造判決統計量,檢驗碼字與生成矩陣間的校驗關系。同時,詳細分析了統計量的概率分布特性,基于極小化極大概率準則給出了判決門限。最后,利用不同碼字矩陣條件下等效碼率與真實碼率之間的關系,確定最終的識別結果,完成譯碼所需參數的求解。與現有方法相比,本文在保持相同計算復雜度水平且不降低識別性能的條件下,克服了現有方法無法識別凍結比特取值的不足,對現有極化碼參數識別理論進行了補充與完善。

1 極化碼識別基礎

極化碼的基礎是信道極化理論,其核心是通過信道極化處理,使各子信道呈現出不同的可靠性。隨著碼長的增加,子信道的容量將趨近于兩個極端,一部分子信道容量趨近于理想信道,剩余的子信道容量則趨近于0[17]。對于BEC,可采用巴氏參數(Bhattacharyya parameter,BP)估計子信道的可靠性[17]。對于更一般的B-DMC,如二進制加性高斯白噪聲(additive white Gaussian noise,AWGN)信道,則可以利用密度進化(density evolution,DE)[29],或高斯近似(Gaussian approximation,GA)[30]方法對信道可靠性進行估計。在編碼過程中,編碼器選擇可靠性最大的k個子信道傳輸信息,其余子信道傳輸凍結比特,凍結比特的取值保持不變。

具體而言,極化碼的編碼過程可用矩陣形式[17]進行表示:

ci=ui·GN

(1)

式中:ui=[ui,1,ui,2,…,ui,N]為第i個原始待編碼的比特序列;ci=[ci,1,ci,2,…,ci,N]為對應的輸出碼字,碼長為N=2n,n為正整數。GN為生成矩陣,可通過下式求得:

GN=F?n

(2)

GN·GN=I

(3)

ui的每個比特位可看作一個子信道。假設極化碼的信息比特位序號集合為A,其補集Ac={1,2,3,…,N}/A為凍結比特位序號集合。記k=|A|為集合A中的元素數量,則極化碼碼率可記為ρ=k/N。

(4)

式中:GN(A)由GN中的行標號屬于A的行向量構成,GN(Ac)則由GN中的行標號屬于Ac的行向量構成。式(4)也可寫為矩陣形式,如下所示:

(5)

根據極化碼的性質可知,極化碼生成矩陣GN可以根據給定的碼長唯一確定。此外,在數字通信系統中,通常線性分組碼與同步碼一起成幀,且有相應的幀同步碼盲識別算法[31],故本文假設幀同步已經完成。因此,極化碼參數識別的目的,是通過對接收序列的分析,獲得碼長、碼率、信息/凍結比特位置集合和凍結比特的取值等譯碼所必需的信息。

2 基于軟判決的識別原理與方法

2.1 識別原理

不失一般性,假設調制方式為二進制相移鍵控(binary phase shift keying,BPSK)調制,傳輸信道為AWGN信道。記yi=[yi,1,yi,2,…,yi,N]和ti=[ti,1,ti,2,…,ti,N]分別為ci對應的硬判決和軟判決結果,滿足:

ti,j=si,j+ni,j

(6)

式中:ni,j為均值為零、方差為σ2的高斯白噪聲序列;si,j為BPSK調制符號,與原始碼字ci,j之間滿足:

si,j=2ci,j-1

(7)

利用接收到的碼流序列r=[y1,y2,…,yQ]構建碼字矩陣RL,設碼字矩陣列數為L=l·2n,則有:

(8)

考慮碼長為N=2n,碼率為R=k/N的極化碼。首先,在無誤碼條件(yi=ci)下考察碼字矩陣RL和生成矩陣GL之間的校驗關系。

(1) 當RL的列數等于N,即L=N時。

根據式(5),接收到的碼字可表示為RL=RN=C=UGN,可得

(9)

這說明,矩陣RLGL中的列向量有3種取值類型,即二進制隨機序列、全部為“0”和全部為“1”。這3種情況分別對應:1)i∈A;2)i∈Ac且該凍結比特位取值為0;3)i∈Ac且該凍結比特位取值為1。因此,當L=N時,可利用上述性質,對信息/凍結比特位進行區分,并求得凍結比特的取值。同時,隨機二進制向量在RLGL列向量中所占比例與碼率相等。

(2) 當RL的列數大于N,即L>N(l>1)時。

(10)

(11)

進一步可得

(12)

(13)

(14)

(15)

(3) 當RL的列數小于N,即L

2.2 校驗關系檢測

由于信息在傳輸過程中受信道條件的影響,不可避免地將產生誤碼,此時碼字矩陣RL與GL之間的關系也將受到影響,RLGL中本應全“0”或全“1”的列向量會產生一定的誤碼。因此,需要合理選擇檢驗量,對RL與GL各列向量之間的校驗關系進行判斷。由于硬判決序列丟失了判決結果的可靠性信息,因此本文選擇軟判決序列進行處理,并記由軟判決結果ti構成的碼字矩陣為TL。

(16)

式(16)只考慮了第i個碼字的LD,將碼字矩陣的所有行考慮進去,則可得到平均LD:

(17)

H0:j為極化碼凍結比特位,傳輸比特0;

H1:j為極化碼凍結比特位,傳輸比特1;

H2:j為極化碼信息比特位。

當H0成立時,意味著碼字ci中下標為{pj,k}的碼元中,應有偶數個碼元為“1”。因此,當H0成立時,LDj的均值為

(18)

通過定義可知,函數tanh(-x/σ2)為奇函數,P(x|c=1)與P(x|c=0)互為對稱函數,因此可得

(19)

將式(19)代入式(18)可得

(20)

類似地,LDj的方差為

σ2(LDj|H0)=ζwt-ζ2wt

(21)

同理可得,當H1成立時,LDj的均值為

(22)

σ2(LDj|H1)=ζwt-ζ2wt

(23)

當H2成立時,由于碼字與向量g:,j之間的正交關系隨機出現,LDj的均值為

μ(LDj|H2)=0

(24)

LDj的方差為

σ2(LDj|H2)=ζwt

(25)

(26)

從式(26)可知,不同條件下統計量均值之間的差遠大于統計量的方差,因此可將本文將3類假設簡化為H0和H2,以及H1和H2兩個二元分類問題。設H0和H2之間的判決門限為Λ1,H1和H2之間的判決門限為Λ2。由于無法獲得3類假設的先驗信息,本文采用極小化極大準則求解門限Λ1和Λ2。

對于H0和H2而言,門限Λ1應滿足:

(27)

最終求得

(28)

同理可得

(29)

2.3 算法流程

如前文所述,本文利用平均LD作為統計量,完成RLGL列向量類型的判斷,并利用等效碼率隨碼字矩陣列數變化的規律實現對碼長的識別?，F將算法流程總結如下:

步驟 2依次對TL和對應的GL之間的校驗關系進行檢驗,利用GL每個列向量的校驗結果判斷比特位類型,以及凍結比特的取值。

2.4 算法計算復雜度分析

3 仿真分析

本節將對本文所提方法進行仿真驗證分析及性能比較,包括LD理論分布的驗證,算法有效性的驗證,分析接收碼字數量、碼率和碼長對性能的影響,以及與現有算法的性能比較。

3.1 統計模型驗證

LD概率分布的正確性是判決門限求解的前提條件,本節對所求解的似然差統計模型進行驗證。根據均值與方差的定義,通過仿真求得在不同假設條件下,LD的均值與方差,并與均值與方差的理論值進行對比,如圖1所示,其中橫軸為信噪比(signal to noise ratio,SNR)。

圖1 LD統計特性驗證Fig.1 Validation of the LD’s statistical characteristic

根據矩陣F?n的構造規律可知,其列向量碼重可能的取值為{2k|k∈{1,2,…,nmax}}。仿真設定了2種碼重值,分別為32、64。設定的SNR范圍為-10～12 dB,步長為1 dB。從圖1中可以看出,在不同假設條件下,通過仿真所求得的均值與方差和對應的理論值幾乎重合,證明了本文對LD概率分布函數推導的正確性。

3.2 算法有效性驗證

本節采用的極化碼碼率為1/2,碼長為32,L的遍歷范圍為(2,…,512)。在SNR為5 dB的條件下,L值為32與64時,GL各列向量對應的平均LD和判決門限如圖2(a)、圖2(b)所示。當統計量大于門限1時,則判定其對應的比特位為凍結比特位,且凍結比特取值為0。當統計量小于門限2時,則判定其對應的比特位為凍結比特位,且凍結比特取值為1。當統計量介于兩門限之間時,則對應的比特位為信息比特位。相應的判決結果如圖2(c)、圖2(d)所示。從圖2(c)、圖2(d)可以看出,當SNR為5 dB時,接收信號的誤碼率較低,當設定碼字矩陣行向量長度為64時,平均似然差的后32位存在負值,而前32位不存在負值,與前文理論推導結果一致。

圖2 n=32,SNR=5 dB條件下的算法結果Fig.2 Algorithm result when n=32 and SNR=5 dB

圖3則給出了L取不同值時,所求得的等效碼率。從圖3可以看出,隨著L的增加,等效碼率不斷降低。當L=32時,等效碼率首次達到最低值0.5。因此,可判斷該極化碼碼長為32,碼率為0.5,識別結果與真實值一致。

圖3 不同L條件下的等效碼率Fig.3 Change of equivalent code rate with different L

3.3 識別性能驗證

本節將分別考察碼字個數、碼率、碼長對算法識別性能的影響,驗證本文所提算法的識別性能。

(1) 碼字個數對識別性能的影響

本小節采用的極化碼碼長為64,碼率為1/2,凍結比特為二進制隨機序列。假設碼字矩陣行向量的數量分別為1 000、2 000、3 000、5 000,SNR為-2～4 dB,間隔為0.5 dB,蒙特卡羅次數為200,對算法在不同碼字數量條件下的識別性能進行考察。從圖4可以看出,碼字數量對于算法性能有較為明顯的影響。碼字數量增加,能夠較為明顯地提高算法的識別性能。這主要是因為,隨著碼字數量的增加,統計量平均LD與理論值的差值不斷縮小,算法誤判的情況也隨之減少,識別率同步提高。

圖4 不同碼字量對算法性能的影響Fig.4 Impact of data volume on algorithm performance

(2) 碼率對識別性能的影響

本小節采用碼長為64的極化碼,碼率分別設定為1/4、1/2、5/8、3/4,凍結比特為二進制隨機序列。碼字數量為2 000,SNR為-2～4 dB,間隔為0.5 dB,蒙特卡羅次數為200,對算法在不同碼率條件下的識別性能進行考察,識別結果如圖5所示。

圖5 不同碼率對算法性能的影響Fig.5 Impact of code rate on algorithm performance

從圖5可以看出,本文算法的識別性能受碼率影響較小。這是因為,極化碼信息比特位的選取是根據信道可靠度依次選取的,雖然信息比特位和凍結比特位的數量隨碼率變化而改變,但在識別過程中需要對所有的比特位進行檢驗。其中,GL中碼重較重的列向量對識別性能影響較大,這對于不同碼率的極化碼都是一樣的,因此碼率對算法識別的影響較小。

(3) 碼長對識別性能的影響

本小節設定的極化碼碼長分別為64、128、256、512,碼率為1/2,凍結比特為二進制隨機序列。碼字個數為2 000,SNR范圍為-2～8 dB,間隔0.5 dB,蒙特卡羅仿真次數為200。仿真結果如圖6所示。

圖6 不同碼長條件下識別性能仿真圖Fig.6 Impact of code lengths on recognition performance

從圖6可以看出,本文提出的算法具有良好的噪聲適應能力。但隨著碼長的增加,其誤碼適應能力逐漸降低。產生該現象的原因主要是以下兩個方面:一是隨著碼長的增加,單個碼字中出現誤碼的概率隨之增加,更易受到誤碼的影響。二是因為隨著碼長的增加,需要識別的子信道也變多,特別是GL中大碼重列向量的增多,增加了識別的難度。因此在相同條件下,隨著碼長的增加,識別率越低。從識別結果來看,當SNR為5.5 dB時,對于碼長為512的極化碼,所提算法能夠達到接近100%的識別率,說明算法具有較好的誤碼適應能力。

3.4 性能對比

由于現有算法均假設凍結比特取值為0,只能對信息比特位和凍結比特位進行區分,而不能識別凍結比特的取值。因此,本文選擇在凍結比特為0的條件下,與文獻[22]所提算法進行性能比較。設定的極化碼碼長分別為64、128、256、512,碼率為1/2。碼字個數為2 000,SNR范圍為-2～8 dB,間隔0.5 dB,蒙特卡羅仿真次數為200。對于文獻[22]的算法,只需進行比特位類型的識別,不需要對凍結比特的取值進行判斷。而本文算法仍認為凍結比特的取值未知,在識別比特位類型的同時,對凍結比特的取值進行判斷。仿真結果如圖7所示。

圖7 不同算法識別性能仿真圖Fig.7 Comparison of identification performance for different algorithms

從圖7中的仿真結果來看,兩個方法的識別性能相當,沒有明顯的差異。文獻[22]的方法采用一維二類判決,本文采用的則是一維三類判決。在計算復雜度方面,本文方法每進行一次判決,多出一次門限計算和門限比較,但總體計算量在同一量級。綜上所述,本文所提方法相較于現有方法,能夠在相同計算復雜度水平和識別性能的條件下,適用于更廣泛的應用場景。

4 結論

現有極化碼識別算法無法適應凍結比特不為0的場景,使用范圍受限。針對該問題,本文從理論上證明了標準非刪余極化碼凍結比特不為0時,碼字矩陣與生成矩陣之間的校驗關系。在此基礎上,提出了一種標準非刪余極化碼參數識別算法。算法引入LD構造統計量對軟判決序列進行處理,將比特位類型的判斷和凍結比特取值的識別轉換為統計判決問題,能夠有效識別信息/凍結比特位,以及凍結比特的取值。仿真結果驗證了本文所提算法的有效性和對低SNR的適應能力。與現有算法相比,本文算法在保持相同計算復雜度水平且不降低識別性能的同時,彌補了現有方法無法識別凍結比特取值的不足,具有更廣闊的適用范圍,在實際工程中有良好的應用前景。

系統工程與電子技術2023年10期

系統工程與電子技術的其它文章: 基于自適應馬氏空間與深度學習的滾動軸承退化趨勢預測; 考慮廣義耦合的多應力加速壽命評估方法; 面向能量差異混合信號的單通道盲源分離算法; 基于多參數可變濾波器的GFDM性能研究; 基于歐拉角的李群捷聯慣導誤差模型分析與比較研究; 基于CEEMD半球諧振陀螺輸出預測方法