張光偉 白建東 頡琦 靳晶晶 張永梅 劉文元
(中北大學半導體與物理學院物理系,太原 030051)
連續變量量子密鑰分發系統中,本地光場和信號光場采用時分復用,偏振復用方式通過長距離單模光纖傳輸.外界復雜環境會使單模光纖產生雙折射效應,導致本地光場和信號光場的偏振態漂移,嚴重影響接收端平衡零拍探測結果.因此,高效動態偏振控制單元是推動系統外場實用化進程的關鍵技術.本文理論上證明了系統接收端僅考慮任意偏振消光比輸出時,偏振控制單元只需兩個控制自由度即可.在此基礎上將貝葉斯參數估計方法有效融入混沌-猴群算法,同時在現場可編程邏輯門陣列硬件上實現控制算法,結合積分型光場探測器建立動態偏振控制單元,仿真和實驗結果表明單次偏振控制靜態消光比達到30 dB 以上的平均周期為400 μs.為了應對偏振態連續變化情況,將動態偏振控制單元集成到連續變量量子密鑰分發系統,實驗測試了偏振態擾動速率在0—2 krad/s 范圍內系統仍然能夠正常運轉.
量子保密通信是基于量子物理原理而非數學計算的復雜性,結合“一次一密”,理論上可以使通信雙方共享無條件安全性密鑰.面對量子計算,Shor 算法等對現代密碼體系安全性造成的威脅,建立絕對安全的量子保密通信系統在國防、軍事和金融領域等都具有重要意義.量子保密通信技術手段主要有離散變量量子密鑰分發 (discrete variable quantum key distribution,DV-QKD) 和連續變量量子密鑰分發 (continuous variable quantum key distribution,CV-QKD)[1–3].在CV-QKD系統中,相干態連續變量量子密鑰分發協議 (coherent state quantum key distribution protocol),憑借光源易制備,中短距離上成碼率高,與現有的光纖通信網絡兼容性好等優點,是最接近實際應用的量子保密通信方式之一[4–17].在外場復雜環境下的長距離CV-QKD 系統中,光場信號傳輸介質有埋地光纖、架空光纖等,外界環境的劇烈變化會使單模光纖產生雙折射效應,即理想光纖的圓對稱性被打破,原來各向同性的光纖變為各向異性,x偏振方向的折射率與y偏振方向的折射率不同,使得光纖中本地光場和信號光場偏振態發生變化,影響接收端平衡零拍探測結果,導致系統無法正常運轉[18].為了進一步推動CV-QKD 系統從實驗室環境走向實際外場應用,引入光纖鏈路中的動態偏振控制技術,同時此技術也被廣泛應用于光通信領域.
光纖鏈路中偏振態實時跟蹤和控制單元,利用動態偏振控制器響應速度快,無遲滯效應,插入損耗小的特點,基于現場可編程邏輯門陣列 (fieldprogrammable gate array,FPGA) 硬件,結合梯度算法 (gradient algorithm,GA)[19,20]、多步長模擬退火算法 (simulated annealing algorithm,SA)[21,22]、遺傳算法 (genetic algorithm,GA)[23]、粒子群算法(particle swarm optimization,PSO)[24]以及差分進化 (differential evolution,DE) 和GA 相結合算法[25]等,加入外圍電路,同時考慮龐加萊球盲區問題[26],實現實時跟蹤和控制偏振態.電控擠壓型偏振控制器的響應速度一般在幾十微秒,為了提高反饋效率,可以采用鈮酸鋰型的偏振控制器,響應速度在百納秒,但其插入損耗高于電控擠壓型偏振控制器,跟蹤和控制偏振態變化速率的快慢,取決于偏振控制器件的響應速度和算法收斂性.DV-QKD系統中,通常采用時分復用和波長復用的方法,通過強參考光作為反饋信號實現實時偏振控制[27–29],利用量子密鑰分發后處理中冗余密鑰作為反饋控制偏振態[30],其基于雙區域計數的優點,縮短偏振態搜索時間,提高搜索效率[31,32],利用自動生成和確定偏振態驗證了在極端條件下長時間穩定運轉的可行性[33,34].本地本振CV-QKD 實驗系統中,通過數據后處理補償偏振態的變化[35].近年來,隨著人工智能與量子信息深度融合,引入了貝葉斯參數估計方法[36–42]、卡爾曼濾波器方法[43–45]、量子啟發式方法[46,47]以及模擬神經網絡結構和極大似然法[48]等對數據進行區域塊傳輸,從而提高量子信息傳輸的效率和容量[49].針對通信系統中多用戶問題,利用機器學習迭代算法提高收斂速率[50].人工智能和機器學習等新方法的出現,為突破高斯調制相干態CV-QKD 系統中動態偏振控制的關鍵技術提供了新的解決思路.
為了應對外場復雜環境下偏振態實時變化對于CV-QKD 系統的影響[51–53],本文理論上證明了系統僅考慮偏振消光比輸出時,只需兩個偏振控制自由度即可.通過建立傳輸矩陣,以偏振消光比大于30 dB 作為目標偏振態,在混沌-猴群算法[54,55]基礎上有效融入貝葉斯參數估計方法[56–58],對比了高斯分布、泊松分布、指數分布等作為貝葉斯先驗分布對偏振控制效果的影響機制;對比了偏振控制自由度個數對偏振控制的效果;基于FPGA 硬件實現偏振控制算法,結合積分型探測器和數據采集系統建立動態偏振控制單元,實驗測試了脈沖光情況下靜態偏振控制效果.針對實際偏振態連續變化情況,實驗測試了不同偏振擾動速率情況下CVQKD 系統運轉情況.
論文的第2 部分詳細地介紹了偏振控制原理,證明了接收端僅考慮光場任意偏振消光比輸出時,偏振控制單元只需兩個自由度即可.第3 部分詳細介紹了混沌-猴群算法有效融入貝葉斯參數估計方法的流程,理論仿真了不同先驗分布和控制自由度對于偏振控制效果的影響機制.第4 部分基于FPGA硬件實驗測試了智能控制算法對于偏振控制的性能;同時將偏振控制單元集成到CV-QKD 系統,在擾偏速率0—2 krad/s 范圍內測試了系統穩定性.第5 部分是總結.
偏振態可以用兩個變量 (α,δ) 的瓊斯矢量表示,其中α為偏振態振幅比角,δ為相位差角.偏振態也可以用兩個變量 (2χ,2ε) 的斯托克斯矢量表示,2χ為緯度角,2ε為經度角,即偏振態用龐加萊球表示.瓊斯矢量和斯托克斯矢量之間的關系滿足[59]:

圖1 擠壓型電控偏振控制器Fig.1.Extrusion type electronically polarization controller.
任意入射偏振態可利用斯托克斯矢量表示[61]:
由于連續變量量子密鑰分發系統接收端只考慮偏振消光比這一指標,無需使得任意入射偏振態變換到任意偏振態,考慮龐加萊球上的坐標x=sin 2χcos 2ε,由(1)式可得其中 tan2α即為偏振消光比.由以上推導可知,具有相同消光比的偏振態是以x為圓心,cos 2χ為半徑的圓環分布.
兩個互成 45°級聯擠壓器改變延遲量分別為θ1,θ2,其中方位角為 0°的擠壓器對應傳輸矩陣T1,方位角為 45°的擠壓器對應傳輸矩陣T2,入射偏振態Sin經過兩個自由度的偏振控制器后,輸出偏振態矩陣形式Sout:
對應的x=-cosθ1cos 2χsinθ2+sin 2χ(cosθ2cos 2ε+sinθ1sinθ2sin 2ε),理論上通過調整延遲量θ1,θ2得到任意x,即可得到任意偏振消光比覆蓋.
如圖2(a)所示,設輸入偏振態ε=0.32π,χ=0.32π,方位角為 0°擠壓器相位延遲量θ1在(0,2π)范圍內以 2π/9 的間隔固定,方位角為 45°擠壓器延遲量θ2在(0,2π) 范圍變化,形成多組同心圓,但此時并不能遍歷x軸,只有當輸入偏振態是特殊點如“南北極點”時,調節θ2可實現x軸全覆蓋.如圖2(b)所示,當兩個擠壓器同時在 (0,2π) 范圍變化,同心圓環繞y軸旋轉,此時雖然沒有完成偏振態在龐加萊球上全覆蓋,但實現了x軸全覆蓋,所以在僅考慮恢復偏振態消光比的系統中,兩個自由度即可滿足要求.

圖2 調節擠壓器延遲量偏振態的變化軌跡 (a) 固定 0°擠壓器,調節45° 擠壓器 相位延遲量;(b)調節 0°和45°擠壓器相位延遲量Fig.2.Change trajectory of state of polarization when adjusting phase retardation of extruder: (a) Fixing 0° extruder,adjusting phase retardation of the 45° extruder;(b) adjusting phase retardation of the 0° and 45° extruders.
動態偏振控制單元包括外圍電路和智能控制算法,本文基于混沌-猴群算法 (chaotic monkey algorithm,CMA),利用其全局搜索能力強,并行化搜索效率快的優點,同時參考貝葉斯方法通過對少量數據進行序列分析和實時更新的優點,有效融入貝葉斯參數估計方法,貝葉斯先驗、后驗分布是通過消光比構建分布算子模型,定義偏振消光比遵循的統計分布,即先驗分布,根據測量得到的數據,不斷對先驗假設進行更新和修正,最后形成后驗分布.通過智能算法控制偏振過程中,持續產生新的消光比數據,不斷優化先驗和后驗分布.同時拓展多自由度級聯偏振控制條件提高偏振控制效率.理論上仿真對比了高斯分布、泊松分布、指數分布作為先驗,后驗分布對偏振控制算法效果的影響機制,基于貝葉斯參數估計方法的混沌-猴群算法具體步驟如圖3 所示.

圖3 貝葉斯-混沌猴群算法流程圖Fig.3.Program flow diagram of Bayesian-chaotic monkey algorithm.
1)初始化.設種群規模M=1,偏振控制器的擠壓器取值為一組可行解,對應一只猴子;種群維數為D,對應偏振控制器的自由度;同時引入Logistic 混沌映射[62]:
課后練習內容較多,有閱讀理解、詞匯、語法、翻譯、口頭表達和寫作等。由于課時有限,不同的練習有不同的完成方式。課文理解部分可在課堂上以提問或討論的形式完成,可以采取隨機進入的教學方法,就任何句子或單詞短語提問。詞匯練習由學生課后完成,并把課堂上的講解任務分解到各組,各組成員協作完成,教師做適當補充。語法由教師根據專業四級考試做適當擴充講解。翻譯練習采取教師引導(用關鍵詞和短語)、學生完成的模式。
其中,H(k) 表示 (0,1) 之間的混沌隨機變量,初始值設置為H(k)=0.01 .算 法中第i只猴子在第D維中的分量θiD可以表示為
其中i=1,2,···,M,θiD∈[θmin,θmax] .θmin和θmax是解空間的下界和上界,范圍在 (0,2π) .
2)爬過程.以輸出偏振態消光比作為目標函數值,偏振控制自由度以步長α爬行,尋找目標偏振態消光比為30 dB 的位置.構建遞減步長:
k=1 為爬次數,β=0.7 為遞減因子,初始步長α=37π/70 .
3)望過程.偏振控制自由度經過“爬”過程后,進行望過程,目的是使當前偏振態消光比跳出局部最優值.構建遞增視野長度:
其中b表示望的范圍,G=1 為望次數,初始望范圍b=π/2 ;γ為遞增因子,初始值γ=1.2 .利用“爬”和“望”過程得到偏振控制自由度對應值θ1D,θ2D,···,θMD,同時通過對應當前消光比集合構建先驗分布.
4)跳過程: 針對上述分布中偏振態消光比的最大值,在其對應參數θiD附近σ∈(0,2π) 范圍內隨機取值,作為新的參數值θi′D,判斷其消光比是否增大,取代原分布中最小的消光比值,構建后驗分布,重新進行“爬”、“望”、“跳”等步驟,程序中設置最大“跳”次數j=100,目標函數值達到30 dB或j=100 程序結束.
偏振控制過程中,以偏振態消光比達到30 dB作為目標偏振態,分別以高斯分布、指數分布、泊松分布、二項分布、Beta 分布和均勻分布作為混沌猴群算法的先驗和后驗分布;依次對二、四、六、八、十和十二自由度級聯控制任意入射偏振態進行仿真,相應的偏振控制結果如圖4 所示.

圖4 先驗分布類型和偏振自由度達到目標偏振態所需迭代次數Fig.4.Average number of iterations to achieve target state of polarization based on prior distribution and degrees of f reedom of polarization.
對于任意入射偏振態,通過對比不同先驗分布對于算法控制目標偏振態的效果.圖4 結果表明同一種先驗分布下,不同級聯自由度個數對于偏振控制效果不同,不同的先驗分布對于偏振控制效果影響不同.同時也表明先驗分布為指數分布的混沌-猴群算法能夠在最少的迭代次數內實現目標偏振態控制;同一種先驗分布中,4 個自由度級聯的偏振控制器對于目標偏振態控制效果最優.
綜上,實驗中選擇以先驗分布為指數分布的四級聯偏振控制算法作為動態偏振控制單元核心算法.
連續變量量子密鑰分發系統中,發送端Alice的本地光場和信號光場相互垂直進入偏振合束器,采用時分復用,偏振復用的技術使本地光場和信號光場在同一根長距離光纖中傳輸到接收端Bob.實際外場環境的劇烈變化會使單模光纖產生雙折射效應,使得本地光場和信號光場之間發生串擾,嚴重影響接收端對信號光場正交分量的測量.因此光場進入接收端Bob 需要進行偏振解復用,動態偏振控制單元偏振解復用的效果直接影響連續變量量子密鑰分發系統性能.
圖5 所示為動態偏振控制單元示意圖.動態偏振控制單元主要有3 部分組成: 基于電荷放大器的積分型光信號探測器、擠壓型電控偏振控制器、FPGA 硬件.其中,積分型光信號探測器是時域脈沖平衡零拍探測器的一臂,將接收到的脈沖光場信號實時轉換為輸出電脈沖的峰值電壓,并作為反饋信號輸入動態偏振控制單元.擠壓型電控偏振控制器采用General Photonics 公司生產的PCD-M02偏振控制模塊,信號的偏振態可通過0—5 V 的模擬信號或者12 位TTL 數字信號控制,作為偏振控制器,可以控制任意入射偏振態輸出任意目標偏振態,響應時間為30 μs;作為擾偏器,可以輸出隨機變化的偏振態.實驗過程中利用FPGA 數字信號口驅動偏振控制器,實驗中采用Xilinx Artix-7FPGA 硬件,利用其集成度高,靈活性強,可重復編程特點作為控制核心.接收端Bob 時鐘恢復模塊得到的系統同步時鐘作為觸發信號,通過FPGA控制高速A/D 采集探測器峰值電壓作為反饋信號.同時在FPGA 硬件上運行智能偏振控制算法,計算得到的控制電壓通過數字信號驅動偏振控制器,實現對偏振態的實時控制.

圖5 動態偏振控制單元示意圖Fig.5.Schematic diagram of the dynamic polarization control unit.
高速偏振控制過程中,通過采集多點求平均的方法,提高測量系統的信噪比,降低探測器電子學噪聲的影響.實驗過程中用于求平均的電壓值越多,測量系統的信噪比越高,但是采集數據所用時間越長[18,63].綜合考慮,選擇采集25 個峰值電壓點求平均作為實時反饋信號,測量系統信噪比為38 dB.
實驗中對動態偏振控制單元中每次循環迭代各部分時間分布進行分析,每次循環迭代控制偏振的過程中,由FPGA 硬件控制A/D 采集數據時間(10 μs)占20%,動態偏振控制器響應(30 μs)時間占60%,FPGA 硬件程序計算時間(10 μs)占20%,每次循環迭代需要50 μs.
單次偏振隨機擾動情況下,以接收端Bob 偏振消光比大于30 dB 作為目標偏振態,實驗測試了以指數分布為先驗分布,4 個自由度級聯的混沌-猴群算法對于偏振控制性能的影響,如圖6 所示任意入射偏振態情況下,多次測量輸出靜態偏振態消光比達到30 dB.

圖6 控制目標偏振態迭代次數統計分布Fig.6.Statistical distribution of iterations to achieve target of state of polarization.
圖6 表明,47.3%任意入射偏振態可以在迭代5 次以內達到目標偏振態,72.8%的任意入射偏振態在迭代10 次內達到目標偏振態.經過多次測試,任意入射偏振態達到目標偏振態平均迭代8 次,對應平均偏振控制周期400 μs.
實驗中針對單次偏振控制過程,系統實時偏振消光比和偏振控制時間的關系如圖7 所示.可以看出,隨著控制時間增長,輸出偏振態消光比逐漸升高,但并非一個線性過程;當迭代次數大約到9 次時,當前偏振態消光比達到30 dB,迭代次數繼續增加,偏振消光比在30 dB 附近波動.實驗中實時監測偏振消光比變化,當偏振消光比達到30 dB,偏振控制程序停止運轉,尋優過程的當前解即為最優解.

圖7 單次偏振控制過程中消光比與時間關系Fig.7.Observed polarization extinction ratio versus the time for a typical single random polarization control process.
在CV-QKD 系統中,發送端Alice 光源為波長1550 nm,線寬15 kHz,輸出功率20 mW 的連續光源,經過振幅調制器調制為脈寬100 ns,重復速率為500 kHz 的高消光比脈沖光,經過99/1 分束器分成強的本地光場和弱的信號光場,信號光場經過振幅和相位調制器實現高斯調制,本地光場和信號光場相互垂直進入偏振合束器,并通過同一根單模光纖傳輸到接收端Bob,單模光纖衰減器設置為固定衰減10 dB.接收端Bob 首先經過一個動態偏振控制器作為擾偏器用來模擬由于外界復雜環境造成的偏振擾動.然后,動態偏振控制單元對光場進行偏振解復用,使得信號光場和本地光場分開,進行光場相對相位鎖定,完成平衡零拍探測.根據測量結果,發送端Alice 和接收端Bob 之間經過認證的經典信道評估系統參數和數據后處理,最終共享一組無條件安全密鑰.
實驗中將基于FPGA 硬件的動態偏振單元集成到CV-QKD 系統中,實驗測試了在不同偏振擾動速率情況下,系統的額外噪聲和通道損耗等關鍵參數.在此狀態下,發送端Alice 的調制方差VA=5.4,探測器電子學噪聲vele=0.033,接收端Bob 的探測效率η=0.68,數據協調效率β=0.95 .實驗室環境下,分別測試了擾偏速率為500,1000,1500和2000 rad/s 情況下,動態偏振控制單元進行偏振控制,系統長時間運轉時的關鍵參數.測試結果如圖8 所示.

圖8 連續偏振擾動速率對系統關鍵參數影響 (a) 通道傳輸效率;(b) 額外噪聲Fig.8.Influence of continuous polarization scrambling on key parameters of the system: (a) Channel transmittance;(b) excess noise.
圖8(b)陰影部分為考慮有限碼長效應情況下可以提取安全密鑰的區域.從圖8 可以看出,沒有主動加入偏振擾動情況下,即當前實驗室環境下偏振變化情況,由于實驗室環境相對比較穩定,偏振態變化緩慢,系統額外噪聲維持在一個較低水平;系統評估的通道損耗為0.099;通過擾偏器主動加入偏振態變化,模擬實際外界環境的偏振態變化情況.系統的動態偏振控制單元檢測到偏振態變化開始運轉控制當前偏振態到目標偏振態,隨著擾偏速率逐漸增大,實驗測試結果如圖8 所示,系統額外噪聲明顯增大,通道傳輸效率評估下降,原因是偏振態變化不可避免會影響到本地光場和信號光場相對相位鎖定效果,從而引入系統額外噪聲;當擾偏速率為2 krad/s 時,額外噪聲已經有部分超出閾值范圍,系統不能提取安全密鑰,動態偏振控制單元跟蹤和控制偏振態能力已經達到上限,繼續增大擾偏速率,系統不能夠正常運轉.
本文基于外場復雜環境下偏振態變化實際情況,在CV-QKD 系統基礎上構建了偏振控制單元理論模型.理論上證明了僅考慮接收端偏振消光比情況下,偏振控制單元只需控制2 個自由度即可.在混沌-猴群算法基礎上有效融入了貝葉斯參數估計方法,仿真結果表明以指數分布為先驗分布,同時以4 個自由度為偏振控制核心的偏振控制單元控制效果最佳.基于FPGA 硬件實驗上測試了動態偏振控制單元對于任意入射偏振態的控制效果,實驗結果表明控制任意入射偏振態到目標偏振態的平均周期為400 μs.考慮到實際偏振態連續變化情況,實驗測試了不同偏振擾動速率情況下CVQKD 系統的關鍵參數,實驗結果表明基于貝葉斯-混沌猴群算法的動態偏振控制單元相較于遺傳算法,在同等外部激勵條件下偏振控制效率提高3 倍,集成了動態偏振控制單元的CV-QKD 系統在偏振擾動速率為0—2 krad/s 范圍可以正常運轉.為了進一步縮短控制目標偏振態的平均周期,可以將擠壓型動態偏振控制器更換為響應速率為百納秒級的鈮酸鋰晶體偏振控制器;進一步優化算法,根據不同的入射偏振態消光比,自適應設置初始步長和相關控制參數,縮短程序運轉時間;加快探測端A/D 模塊采樣速率縮短數據采集時間;通過以上方法可以縮短平均控制周期,進而提高系統抗偏振擾動的速率以適應更復雜外界環境.