王 垚, 王 聰, 王 翔, 黃知濤
(1. 國防科技大學電子科學學院, 湖南 長沙 410073; 2. 陸軍工程大學通信士官學校, 重慶 400035; 3. 海軍航空大學信息融合研究所, 山東 煙臺 264001)
信道編碼技術可以有效提升數據傳輸的可靠性,被廣泛應用于各類數字通信系統中。在合作通信中,通信收發雙方預先約定所采用的編碼參數,接收端利用確定的編碼參數對解調后的比特序列進行譯碼,恢復發送端發射的通信內容。但在認知無線電、非合作通信領域,接收端往往缺乏足夠的先驗信息進行譯碼。此時,就需要利用接收到的解調序列,完成對編碼參數的識別[1-2]。目前,主要的編碼方式包括線性分組碼、卷積碼、Turbo碼、低密度奇偶校驗(low density parity check,LDPC)碼、極化碼等。但從公開發表的文獻來看,信道編碼參數識別的研究主要集中于線性分組碼[3-6]、卷積碼[7-9]、Turbo碼[10-13]、LDPC碼[14-16]。對極化碼參數識別的研究,尚處于起步階段。
極化碼是目前唯一一種被證明在二進制離散無記憶信道(binary discrete memoryless channel,B-DMC)下可達到信道容量的信道編碼方式[17],并在3GPP RAN1 #87次會議上被確定為5G增強移動寬帶場景下控制信道的信道編碼方案[18]。同時,極化碼在衛星通信和深空探測方面也有不錯的應用前景[19]??梢灶A見,會有越來越多的通信系統采用極化碼作為差錯控制的手段,對極化碼進行參數識別研究具有重要的理論和應用價值?,F有針對極化碼參數識別的研究,均默認對象為標準非刪余極化碼。本文同樣針對標準非刪余極化碼展開研究,若無特別說明,文中極化碼均指標準非刪余極化碼。
極化碼從編碼過程上,可看作是線性分組碼的一個子類,但由于其特有的編碼理論與方法,現有的線性分組碼參數識別方法并不適用于極化碼。針對極化碼參數識別問題,文獻[20]針對二進制刪除信道(binary erasure channel,BEC)條件,采用硬判決序列作為處理對象,對刪除概率和碼長進行遍歷,求得每組參數對應的生成矩陣與其零空間,再利用碼字矩陣與零空間之間的對偶關系,確定各個參數。文獻[21]則利用極化碼生成矩陣的結構性質,對文獻[20]的方法進行了改進,簡化了求解零空間的過程。為提高算法性能,文獻[22]使用軟判決序列作為處理對象,引入對數似然系比(log likelihood ratio,LLR)[23],遍歷每個碼長對對偶關系進行檢測,完成對信息比特和凍結比特的識別。文獻[24]和文獻[25]則利用極化碼生成矩陣的結構性質,優化了校驗向量的計算過程,提高了處理效率。
但上述方法均假設極化碼的凍結比特取值為0,忽視了凍結比特可任意取值這一事實。由于凍結比特的取值不影響極化碼的譯碼性能,編碼理論研究通常假設該值為0,但在具體應用中可根據實際需要設定凍結比特的取值[26-27],以提高用戶終端(user equipment,UE)檢測下行控制信息(downlink control information,DCI)的速度和準確性[26],降低UE對DCI發生誤檢和虛警的概率[27]。另一方面,凍結比特的取值又是譯碼的必要信息[17]。因此,在非合作通信中,不能簡單地認為凍結比特取值為0。為了能夠正確恢復所傳信息,不但需要對碼長、碼率、信息/凍結比特的位置進行識別,還要對凍結比特的取值進行估計。
針對上述問題,本文對極化碼的性質展開研究,證明了當凍結比特取值不為0時,碼字矩陣與生成矩陣列向量之間的校驗關系與比特位類型、凍結比特取值之間的聯系。在此基礎上,將信息/凍結比特位的識別,以及凍結比特取值的判斷,轉化為一個一維三類的統計判決問題,并引入似然差(likelihood difference,LD)[7,28]構造判決統計量,檢驗碼字與生成矩陣間的校驗關系。同時,詳細分析了統計量的概率分布特性,基于極小化極大概率準則給出了判決門限。最后,利用不同碼字矩陣條件下等效碼率與真實碼率之間的關系,確定最終的識別結果,完成譯碼所需參數的求解。與現有方法相比,本文在保持相同計算復雜度水平且不降低識別性能的條件下,克服了現有方法無法識別凍結比特取值的不足,對現有極化碼參數識別理論進行了補充與完善。
極化碼的基礎是信道極化理論,其核心是通過信道極化處理,使各子信道呈現出不同的可靠性。隨著碼長的增加,子信道的容量將趨近于兩個極端,一部分子信道容量趨近于理想信道,剩余的子信道容量則趨近于0[17]。對于BEC,可采用巴氏參數(Bhattacharyya parameter,BP)估計子信道的可靠性[17]。對于更一般的B-DMC,如二進制加性高斯白噪聲(additive white Gaussian noise,AWGN)信道,則可以利用密度進化(density evolution,DE)[29],或高斯近似(Gaussian approximation,GA)[30]方法對信道可靠性進行估計。在編碼過程中,編碼器選擇可靠性最大的k個子信道傳輸信息,其余子信道傳輸凍結比特,凍結比特的取值保持不變。
具體而言,極化碼的編碼過程可用矩陣形式[17]進行表示:
ci=ui·GN
(1)
式中:ui=[ui,1,ui,2,…,ui,N]為第i個原始待編碼的比特序列;ci=[ci,1,ci,2,…,ci,N]為對應的輸出碼字,碼長為N=2n,n為正整數。GN為生成矩陣,可通過下式求得:
GN=F?n
(2)
GN·GN=I
(3)
ui的每個比特位可看作一個子信道。假設極化碼的信息比特位序號集合為A,其補集Ac={1,2,3,…,N}/A為凍結比特位序號集合。記k=|A|為集合A中的元素數量,則極化碼碼率可記為ρ=k/N。

(4)
式中:GN(A)由GN中的行標號屬于A的行向量構成,GN(Ac)則由GN中的行標號屬于Ac的行向量構成。式(4)也可寫為矩陣形式,如下所示:
(5)

根據極化碼的性質可知,極化碼生成矩陣GN可以根據給定的碼長唯一確定。此外,在數字通信系統中,通常線性分組碼與同步碼一起成幀,且有相應的幀同步碼盲識別算法[31],故本文假設幀同步已經完成。因此,極化碼參數識別的目的,是通過對接收序列的分析,獲得碼長、碼率、信息/凍結比特位置集合和凍結比特的取值等譯碼所必需的信息。
不失一般性,假設調制方式為二進制相移鍵控(binary phase shift keying,BPSK)調制,傳輸信道為AWGN信道。記yi=[yi,1,yi,2,…,yi,N]和ti=[ti,1,ti,2,…,ti,N]分別為ci對應的硬判決和軟判決結果,滿足:
ti,j=si,j+ni,j
(6)
式中:ni,j為均值為零、方差為σ2的高斯白噪聲序列;si,j為BPSK調制符號,與原始碼字ci,j之間滿足:
si,j=2ci,j-1
(7)
利用接收到的碼流序列r=[y1,y2,…,yQ]構建碼字矩陣RL,設碼字矩陣列數為L=l·2n,則有:
(8)

考慮碼長為N=2n,碼率為R=k/N的極化碼。首先,在無誤碼條件(yi=ci)下考察碼字矩陣RL和生成矩陣GL之間的校驗關系。
(1) 當RL的列數等于N,即L=N時。
根據式(5),接收到的碼字可表示為RL=RN=C=UGN,可得
(9)



這說明,矩陣RLGL中的列向量有3種取值類型,即二進制隨機序列、全部為“0”和全部為“1”。這3種情況分別對應:1)i∈A;2)i∈Ac且該凍結比特位取值為0;3)i∈Ac且該凍結比特位取值為1。因此,當L=N時,可利用上述性質,對信息/凍結比特位進行區分,并求得凍結比特的取值。同時,隨機二進制向量在RLGL列向量中所占比例與碼率相等。
(2) 當RL的列數大于N,即L>N(l>1)時。

(10)


(11)
進一步可得
(12)
(13)

(14)

(15)

(3) 當RL的列數小于N,即L 由于信息在傳輸過程中受信道條件的影響,不可避免地將產生誤碼,此時碼字矩陣RL與GL之間的關系也將受到影響,RLGL中本應全“0”或全“1”的列向量會產生一定的誤碼。因此,需要合理選擇檢驗量,對RL與GL各列向量之間的校驗關系進行判斷。由于硬判決序列丟失了判決結果的可靠性信息,因此本文選擇軟判決序列進行處理,并記由軟判決結果ti構成的碼字矩陣為TL。 (16) 式(16)只考慮了第i個碼字的LD,將碼字矩陣的所有行考慮進去,則可得到平均LD: (17) H0:j為極化碼凍結比特位,傳輸比特0; H1:j為極化碼凍結比特位,傳輸比特1; H2:j為極化碼信息比特位。 當H0成立時,意味著碼字ci中下標為{pj,k}的碼元中,應有偶數個碼元為“1”。因此,當H0成立時,LDj的均值為 (18) 通過定義可知,函數tanh(-x/σ2)為奇函數,P(x|c=1)與P(x|c=0)互為對稱函數,因此可得 (19) 將式(19)代入式(18)可得 (20) 類似地,LDj的方差為 σ2(LDj|H0)=ζwt-ζ2wt (21) 同理可得,當H1成立時,LDj的均值為 (22) σ2(LDj|H1)=ζwt-ζ2wt (23) 當H2成立時,由于碼字與向量g:,j之間的正交關系隨機出現,LDj的均值為 μ(LDj|H2)=0 (24) LDj的方差為 σ2(LDj|H2)=ζwt (25) (26) 從式(26)可知,不同條件下統計量均值之間的差遠大于統計量的方差,因此可將本文將3類假設簡化為H0和H2,以及H1和H2兩個二元分類問題。設H0和H2之間的判決門限為Λ1,H1和H2之間的判決門限為Λ2。由于無法獲得3類假設的先驗信息,本文采用極小化極大準則求解門限Λ1和Λ2。 對于H0和H2而言,門限Λ1應滿足: (27) 最終求得 (28) 同理可得 (29) 如前文所述,本文利用平均LD作為統計量,完成RLGL列向量類型的判斷,并利用等效碼率隨碼字矩陣列數變化的規律實現對碼長的識別?,F將算法流程總結如下: 步驟 2依次對TL和對應的GL之間的校驗關系進行檢驗,利用GL每個列向量的校驗結果判斷比特位類型,以及凍結比特的取值。 本節將對本文所提方法進行仿真驗證分析及性能比較,包括LD理論分布的驗證,算法有效性的驗證,分析接收碼字數量、碼率和碼長對性能的影響,以及與現有算法的性能比較。 LD概率分布的正確性是判決門限求解的前提條件,本節對所求解的似然差統計模型進行驗證。根據均值與方差的定義,通過仿真求得在不同假設條件下,LD的均值與方差,并與均值與方差的理論值進行對比,如圖1所示,其中橫軸為信噪比(signal to noise ratio,SNR)。 圖1 LD統計特性驗證Fig.1 Validation of the LD’s statistical characteristic 根據矩陣F?n的構造規律可知,其列向量碼重可能的取值為{2k|k∈{1,2,…,nmax}}。仿真設定了2種碼重值,分別為32、64。設定的SNR范圍為-10~12 dB,步長為1 dB。從圖1中可以看出,在不同假設條件下,通過仿真所求得的均值與方差和對應的理論值幾乎重合,證明了本文對LD概率分布函數推導的正確性。 本節采用的極化碼碼率為1/2,碼長為32,L的遍歷范圍為(2,…,512)。在SNR為5 dB的條件下,L值為32與64時,GL各列向量對應的平均LD和判決門限如圖2(a)、圖2(b)所示。當統計量大于門限1時,則判定其對應的比特位為凍結比特位,且凍結比特取值為0。當統計量小于門限2時,則判定其對應的比特位為凍結比特位,且凍結比特取值為1。當統計量介于兩門限之間時,則對應的比特位為信息比特位。相應的判決結果如圖2(c)、圖2(d)所示。從圖2(c)、圖2(d)可以看出,當SNR為5 dB時,接收信號的誤碼率較低,當設定碼字矩陣行向量長度為64時,平均似然差的后32位存在負值,而前32位不存在負值,與前文理論推導結果一致。 圖2 n=32,SNR=5 dB條件下的算法結果Fig.2 Algorithm result when n=32 and SNR=5 dB 圖3則給出了L取不同值時,所求得的等效碼率。從圖3可以看出,隨著L的增加,等效碼率不斷降低。當L=32時,等效碼率首次達到最低值0.5。因此,可判斷該極化碼碼長為32,碼率為0.5,識別結果與真實值一致。 圖3 不同L條件下的等效碼率Fig.3 Change of equivalent code rate with different L 本節將分別考察碼字個數、碼率、碼長對算法識別性能的影響,驗證本文所提算法的識別性能。 (1) 碼字個數對識別性能的影響 本小節采用的極化碼碼長為64,碼率為1/2,凍結比特為二進制隨機序列。假設碼字矩陣行向量的數量分別為1 000、2 000、3 000、5 000,SNR為-2~4 dB,間隔為0.5 dB,蒙特卡羅次數為200,對算法在不同碼字數量條件下的識別性能進行考察。從圖4可以看出,碼字數量對于算法性能有較為明顯的影響。碼字數量增加,能夠較為明顯地提高算法的識別性能。這主要是因為,隨著碼字數量的增加,統計量平均LD與理論值的差值不斷縮小,算法誤判的情況也隨之減少,識別率同步提高。 圖4 不同碼字量對算法性能的影響Fig.4 Impact of data volume on algorithm performance (2) 碼率對識別性能的影響 本小節采用碼長為64的極化碼,碼率分別設定為1/4、1/2、5/8、3/4,凍結比特為二進制隨機序列。碼字數量為2 000,SNR為-2~4 dB,間隔為0.5 dB,蒙特卡羅次數為200,對算法在不同碼率條件下的識別性能進行考察,識別結果如圖5所示。 圖5 不同碼率對算法性能的影響Fig.5 Impact of code rate on algorithm performance 從圖5可以看出,本文算法的識別性能受碼率影響較小。這是因為,極化碼信息比特位的選取是根據信道可靠度依次選取的,雖然信息比特位和凍結比特位的數量隨碼率變化而改變,但在識別過程中需要對所有的比特位進行檢驗。其中,GL中碼重較重的列向量對識別性能影響較大,這對于不同碼率的極化碼都是一樣的,因此碼率對算法識別的影響較小。 (3) 碼長對識別性能的影響 本小節設定的極化碼碼長分別為64、128、256、512,碼率為1/2,凍結比特為二進制隨機序列。碼字個數為2 000,SNR范圍為-2~8 dB,間隔0.5 dB,蒙特卡羅仿真次數為200。仿真結果如圖6所示。 圖6 不同碼長條件下識別性能仿真圖Fig.6 Impact of code lengths on recognition performance 從圖6可以看出,本文提出的算法具有良好的噪聲適應能力。但隨著碼長的增加,其誤碼適應能力逐漸降低。產生該現象的原因主要是以下兩個方面:一是隨著碼長的增加,單個碼字中出現誤碼的概率隨之增加,更易受到誤碼的影響。二是因為隨著碼長的增加,需要識別的子信道也變多,特別是GL中大碼重列向量的增多,增加了識別的難度。因此在相同條件下,隨著碼長的增加,識別率越低。從識別結果來看,當SNR為5.5 dB時,對于碼長為512的極化碼,所提算法能夠達到接近100%的識別率,說明算法具有較好的誤碼適應能力。 由于現有算法均假設凍結比特取值為0,只能對信息比特位和凍結比特位進行區分,而不能識別凍結比特的取值。因此,本文選擇在凍結比特為0的條件下,與文獻[22]所提算法進行性能比較。設定的極化碼碼長分別為64、128、256、512,碼率為1/2。碼字個數為2 000,SNR范圍為-2~8 dB,間隔0.5 dB,蒙特卡羅仿真次數為200。對于文獻[22]的算法,只需進行比特位類型的識別,不需要對凍結比特的取值進行判斷。而本文算法仍認為凍結比特的取值未知,在識別比特位類型的同時,對凍結比特的取值進行判斷。仿真結果如圖7所示。 圖7 不同算法識別性能仿真圖Fig.7 Comparison of identification performance for different algorithms 從圖7中的仿真結果來看,兩個方法的識別性能相當,沒有明顯的差異。文獻[22]的方法采用一維二類判決,本文采用的則是一維三類判決。在計算復雜度方面,本文方法每進行一次判決,多出一次門限計算和門限比較,但總體計算量在同一量級。綜上所述,本文所提方法相較于現有方法,能夠在相同計算復雜度水平和識別性能的條件下,適用于更廣泛的應用場景。 現有極化碼識別算法無法適應凍結比特不為0的場景,使用范圍受限。針對該問題,本文從理論上證明了標準非刪余極化碼凍結比特不為0時,碼字矩陣與生成矩陣之間的校驗關系。在此基礎上,提出了一種標準非刪余極化碼參數識別算法。算法引入LD構造統計量對軟判決序列進行處理,將比特位類型的判斷和凍結比特取值的識別轉換為統計判決問題,能夠有效識別信息/凍結比特位,以及凍結比特的取值。仿真結果驗證了本文所提算法的有效性和對低SNR的適應能力。與現有算法相比,本文算法在保持相同計算復雜度水平且不降低識別性能的同時,彌補了現有方法無法識別凍結比特取值的不足,具有更廣闊的適用范圍,在實際工程中有良好的應用前景。

2.2 校驗關系檢測





2.3 算法流程



2.4 算法計算復雜度分析

3 仿真分析
3.1 統計模型驗證

3.2 算法有效性驗證



3.3 識別性能驗證



3.4 性能對比

4 結 論