劉勁,徐玉豪,尤偉,陳曉,張子軍,馬辛
(1.武漢科技大學信息科學與工程學院,武漢 430081;2.北京航空航天大學儀器科學與光電工程學院,北京 100191;3.上海衛星工程研究所,上海 201109)
進入21世紀,航天大國紛紛開啟各自的深空探測計劃。中國航天筑夢蒼穹:“嫦娥”奔月[1]、“祝融”探火[2]、“羲和”追日[3],這些航天任務的成功實施標志著中國的深空探測技術日趨成熟。導航作為未來深空探測計劃必不可少的關鍵技術,需滿足的要求日趨增高。尤其是在行星探測的捕獲階段,航天器與地面站之間的通信延遲長,而捕獲期短,地面站無法為航天器提供實時高精度的導航信息。天文導航不依賴地面站,成為解決這一問題的關鍵技術。
天文導航有測角、測距、測速3種方式。測角導航和測距導航分別以航天器與近天體夾角[4]、脈沖星到達時間[5]作為測量量,通過卡爾曼濾波,間接獲得航天器速度。為了直接獲得速度信息,測速導航應運而生,它根據多普勒效應,測量天文光譜頻移,獲得速度信息,彌補了測角與測距導航的不足。通常情況下,測速會與測角或測距相結合[6-8],以提高組合導航的精度。上海衛星工程研究所和中國科學院研制的太陽原子鑒頻器[9]已完成在軌驗證,證實了天文組合導航的可行性與精確性[10]。天文多普勒差分導航[11]通過差分技術消除了太陽活動的影響,成為研究熱點。其測量量是太陽光譜頻移和行星光譜頻移之差。
目前,針對天文光譜頻移估計方法的研究進行得如火如荼,且已取得了一系列研究成果。歐洲南方天文臺(ESO)的高精度徑向速度行星搜索器(High accuracy radial velocity planet searcher,HARPS)利用互相關函數算法估計徑向速度[12]。模板增強徑向速度再分析應用算法比互相關函數算法具有更高的精度[13]。基于最小二乘匹配的光譜徑向速度分析儀的徑向測速精度[14]可達1 ms-1,用其對HARPS 徑向速度數據庫的系統誤差進行校正[15]。Silva等[16]提出了一種基于模板匹配的半貝葉斯方法。Rajpaul等[17-18]提出了無需高信噪比模板,僅用高斯過程對光譜建模測速的方法。文獻[19]通過建立偏移和補償模型降低太陽自轉引起的多普勒偏差給測速造成的影響。文獻[20]提出針對邊界效應的天文光譜測速方法,解決天文光譜測速中的非線性傅立葉相移問題,使天文測速精度進一步提升。以上方法均是觀測同一個天體,其光譜并不會受行星反射,自轉等影響。天文差分測速則是利用太陽和行星光譜對比,行星光譜必然受到多種因素干擾。因此,不能照搬傳統天文測速方法,而是要根據天文差分測速的特點,研究新的信號處理方法。
太陽是一個宏觀穩定,但微觀極不穩定的星體。由太陽耀斑等引起的太陽光譜擾動[21-22]、光譜線深度的差異以及行星反射率都會對多普勒差分測速造成影響[23]。通過建立速度誤差模型[24],對太陽多普勒差分導航中直接和反射太陽光源的面積重疊率、時間色散以及太陽自轉多普勒誤差3 個幾何誤差源進行分析[25]。多普勒差分測速原理上要求測速光譜產生于同一時刻離開太陽的太陽光子[26]。但目前缺乏時間同步的太陽直射和行星反射實測光譜數據。
在圖像生成方面,學者們先后提出變分自編碼器(VAE)和生成對抗網絡(GAN)。GAN 自2014 年被提出至今,在圖像處理、機器視覺等領域被廣泛引用,并改進出多個變體,如Wasserstein 生成對抗網絡[30-31]、條件對抗生成網絡[32]以及雙判別器對抗生成網絡[33]。按照配對原則可將GAN 分為非配對網絡和配對網絡,如循環生成對抗網絡[34](Cycle GAN)和對偶生成對抗網絡[35-36](Dual GAN)。由于行星和太陽光譜的輪廓大致相同,僅存在由宇宙中的各種影響因子引起的細節上的不同,符合Dual GAN 的主體不變、細節轉換的特點,所以此次實驗選用Dual GAN。同時Dual GAN 繼承了Wasserstein生成對抗網絡損失函數不會梯度消失的優點,這也是選擇Dual GAN的主要原因。
為了解決同步光譜對缺失的問題,本文利用Dual GAN 將非同步的太陽/行星光譜對轉換為同步的太陽/行星光譜對,用于多普勒差分測速。針對訓練集有限,進而導致泛化性差這一問題,本文把Dual GAN 與VAE 結合起來,利用VAE 的數據增強能力增廣訓練集。解碼器與生成器的作用相似,同為生成過程。因此,用Dual GAN 的生成器取代VAE 中的解碼器,使VAE 和Dual GAN 融合為VAE-Dual GAN。同時,利用Dual GAN 網絡的重建損失約束作用同時訓練生成器、判別器和VAE 的編碼器。
為了生成同步的太陽/行星光譜對,考慮到VAE的數據增廣能力,本文將VAE 和Dual GAN 結合起來,提出了VAE-Dual GAN,介紹了其網絡結構,并從理論上分析了子網絡的泛化性。
VAE-Dual GAN 結構如圖1 所示,模型由編碼器、生成器和判別器各2 個組成。生成器重構損失和編碼器重構損失分別用虛線和點劃線表示。黑色虛線框內為VAE-生成器模塊。黃色和藍色的實線箭頭分別表示偽太陽光譜和偽行星光譜生成過程。在偽行星光譜生成過程中,首先,編碼器Φsun將真實太陽光譜Ssun映射到太陽光譜隱空間Zsun,并在Zsun內采樣得到太陽光譜樣本zsun。然后,生成器將zsun轉化為與之同步的偽行星光譜。最后,偽行星光譜經過對偶編碼器Φplanet和對偶生成器Ψplanetsun生成重構太陽光譜。偽太陽光譜生成過程與之類似。Splanet表示真實行星光譜;和分別表示偽太陽光譜和重構行星光譜;Zplanet和分別代表真實行星光譜和偽太陽光譜經過編碼器后的隱空間。

圖1 VAE-Dual GAN結構圖Fig.1 VAE-Dual GAN structure
圖1 中黑色虛線框中的VAE-生成器模塊結構如圖2所示。該模塊利用生成器與VAE網絡中的解碼器作用相似的原理,用Dual GAN 的生成器代替VAE 解碼器,構成VAE-生成器模塊。Ssun域中的太陽光譜樣本為ssun,隱藏層Hj上方的數字代表神經元數,隱藏層之間的FC 代表全連接,編碼器通過采樣輸出均值μ(i)和方差σ2(i),編碼后的隱空間樣本zsun服從正態分布N(μ(i),σ2(i)),然后通過生成器模塊生成Splanet域的偽行星光譜。

圖2 VAE-生成器結構圖Fig.2 VAE-generator structure
VAE 損失函數由KL 損失LKL和編碼器重構損失構成,其表達式為:
式中:μ1和μ2分別為太陽和行星經過編碼器輸出的均值;和分別為二者的方差;α∈(0,1)為控制KL散度的約束能力的常數。
判別器損失Ld表達式為:
生成器損失Lg表達式為:
式(1)~(4)構成VAE-Dual GAN 網絡的總損失Ltotal,表達式為:
式中:β∈[0,1]為作用于生成器重構損失的常數,用來均衡生成器重構損失對網絡的作用力,防止其造成的過擬合現象。
VAE-Dual GAN 由2 個互為對偶的子網絡模型構成,兩個VAE 的作用是增廣訓練集。因此只需證明Dual GAN 其中一個網絡的泛化性即可。要證明泛化性,首先需要Lipschitz連續定義。
定義1.對于任意2 個樣本x和y,如果損失函L(x)相對于距離度量Δ滿足:
則稱L(x) 是Lipschitz 連續。其中,κL是Lipschitz常數。
在Dual GAN的子網絡中,分布之間的Wasserstein距離表達式為:
式中:f≤1 為連續函數,f滿足1-Lipschitz 連續;x和y分別為服從X和Y分布的樣本。
根據定義1,引入判別器函數fω和生成器函數gθ后,由式(7)可以得到目標函數為:
式(8)用來衡量判別器對真實樣本和生成樣本的區分質量。如果泛化效果好,隨著樣本數量的不斷增加,無限分布與有限分布之間的差異會更小。
利用給定的h個樣本Xh={x1,x2,…,xh}和Yh={y1,y2,…,yh},分別服從分布和(分別是分布X和Y的有限分布),在固定生成器的情況下,式(8)可以重寫為:
本文定義無限分布下和有限分布下的目標函數U和Uh為:
如果網絡泛化成功,在輸入樣本增加到一定的數量后,兩式的差值|Uh-U|會依概率收斂為0;如果泛化失敗,它將不能依概率收斂為0,這也意味著生成的分布過擬合真實分布。
文獻[37]受GAN 及其變體用有限的樣本最小化真實分布X和生成分布Y的散度或距離的啟發,對GAN的泛化性定義如下:
定義2.對于生成分布Y,如果分布之間的距離或散度d(?,?)用含有h個訓練樣本的有限分布和進行泛化,大概率式(6)成立,即:
則稱GAN具有泛化性。
根據定義1和定義2可以證明以下定理。
定理1.在與有界Lipschitz 常數κL有關的假設條件下[38]:
I.fω(x)在參數ω上是Lipschitz 連續,即對任意ω都有|fω(x) -fω′(x)|≤κL‖ω-ω′‖;
II.fω(x)在樣本x上是1-Lipschitz 連續,即對任意x都有|fω(x) -fω(x′)|≤κ‖x-x′‖;
III.兩個樣本的距離存在邊界BΔ,即|Δ(x,x′) |≤BΔ。
式中:a為目標函數的參數數量。
證.將式(10)~(11)代入式(13)得式(14):
需要說明:
由McDiarmid’s不等式可以得到:
(1)在網絡N 內將式(15)表述的變化邊界從適用于單個判別器函數fω推廣為聯合邊界,即對于網絡N 中的判別器函數fω,總存在一個ω′∈N 有‖ω-ω′‖≤這個網絡中所包含的損失函數滿足|N|≤其中a表示損失函數中的參數數量。
(2)分析在網絡N 之外的 判別器函數fω的情況。
因此,可以得出包括所有損失函數的聯合邊界:
定理1 得證。這表明了VAE-Dual GAN 有一定的泛化性。
多普勒效應是由于波源與觀測點的相對運動,使觀測光譜波長與原波長存在頻移。在只考慮多普勒效應下,航天器觀測到的行星光譜波長λp與太陽光譜波長λs的關系如下:
式中:c為光速;v為徑向速度。
對式(24)取對數,可以得到對數波長偏移τ為:
設太陽光譜ssun(lnλn)和行星光譜splanet(lnλn)的關系表達式為:
式中:ο(lnλn)為未知的反射率函數;λn為離散波長。
由于光譜的波長間隔不均勻,而原離散傅立葉變換無法處理非均勻間隔波長的光譜,所以采用非均勻離散傅立葉變換(NDFT)方法,表達式為:
式中:Lλ=lnλmax-lnλmin為對數波長的長度;k=1,2,…,K。
式(27)經過NDFT后,splanet(lnλn)和ssun(lnλn)的幅值Splanet(k)與Ssun(k)的累積誤差為:
式中:?k為傅立葉頻率下噪聲振幅的平方根;?(k)和φ(k)分別為splanet(lnλn)和ssun(lnλn)的相位;Ο(k)和?(k)分別為ο(lnλn)經過NDFT的幅值和相位;?為循環卷積符號。
當太陽/行星光譜對同步時,行星光譜僅受反射率影響;當太陽/行星光譜對不同步時,除反射率外,行星光譜還受太陽活動、太陽自轉等因素影響,ο(lnλn)的表達式復雜。因此,同步的太陽/行星光譜對可有效減小干擾因素的影響,提高測速精度。
初始學習率設為0.000 1,并且每100 次迭代衰減1.5%。隱藏層使用Leaky ReLUs 作為激活函數,泄露值設為0.2。網絡優化器為RMSProp(Root mean square prop),并將每次更新的判別器梯度的絕對值修正到不超過截斷常數,其值為0.1,優化器衰減速率為0.9。實驗平臺為宏碁筆記本,其處理器主頻為3.10 GHz,內存為16 GB。
本文數據集為ESO的HARPS觀測的天文光譜,該儀器覆蓋的光譜波長范圍為380~690 nm,儀器的探測器由2 個電荷耦合器件(CCD)組成,每個CCD分別可以讀取到36個波長區間的光譜,共72段光譜。相較于第2 個CCD,第1 個CCD 讀取到的光譜的信噪比較低。在第2 個CCD 的35 個波長區間的光譜中選擇光譜進行測速。
實驗太陽和月球光譜的4 個波長范圍,包括:5 964.872-6 032.103?;6 337.527-6 408.976?;6 541.882-6 615.640?;6 685.603-6 760.982?。它們各有特點:5 964.872-6 032.103? 區間信噪比高而RV標準差低;6 337.527-6 408.976?區間信噪比高且RV 標準差高;6 541.882-6 615.640? 區間是CHASE 工程的模板光譜;6 685.603-6 760.982?區間是隨機選擇的,其信噪比高而RV 標準差介于5 964.872-6 032.103? 與6 337.527-6 408.976?之間。
為了驗證VAE-Dual GAN的可行性,將3種天文光譜的測速結果進行對比,如表1所示。3種天文光譜包括:生成的偽月球光譜,加高斯噪聲的月球光譜,加泊松噪聲的月球光譜。本文用Evr表示真實月球光譜徑向速度標準差;Evp和Evg分別表示引入泊松噪聲和高斯噪聲的光譜測速標準差。

表1 徑向速度標準差Table 1 Standard deviation of radial velocity
表1顯示,VAE-Dual GAN 生成的偽月球光譜徑向速度標準差Evgan低于Evr,高于Evp和Evg,表明噪聲不是影響光譜測速精度的唯一因素。生成的同步光譜測速精度高于非同步光譜測速精度。
為了說明真實太陽光譜和生成的偽月球光譜的時間同步性,本文引入了結構相似指標度量[39](Structure similarity index measure,SSIM)。結構相似指標用來衡量兩幅圖像的相似度,計算公式為:
式中:μsun和μplanet分別為太陽光譜和行星光譜的均值和分別為二者的方差;σsun_planet為太陽光譜與行星光譜的協方差。VSSIM的取值范圍為[0,1]。VSSIM越大,表示二者相似度越高。表2給出了4種天文光譜對的VSSIM值,包括:真實太陽/真實月球光譜對(Real sun/Real moon,Rs/Rm)、真實太陽/偽月球光譜對(Real sun/Fake moon,Rs/Fm)、真實太陽/泊松噪聲月球光譜對(Real sun/Poisson noise moon,Rs/Pm)、真實太陽/高斯噪聲月球光譜對(Real sun/Gaussian noise moon,Rs/Gm)。

表2 結構相似性(SSIM)Table 2 Structural similarity index measure(SSIM)
表2 可以看出,對于每個波長區間,Rs/Rm 的SSIM 低于Rs/Fm,高于Rs/Pm 和Rs/Gm。這說明偽月球光譜與真實太陽光譜的SSIM 高于真實月球光譜與真實太陽光譜的SSIM。太陽表面活動引起了光譜的變化。時間不同步造成真實月球光譜與真實太陽光譜的SSIM 低。Rs/Fm 的SSIM 高,這說明二者的時間是同步的。此外,引入噪聲會降低光譜對的SSIM。這表明加噪方法無法得到高SSIM 的光譜對,不是生成同步光譜對的有效手段。
為了考察網絡層數對偽光譜質量的影響,本文在2層全連接層網絡的基礎上,將VAE編碼器和生成器分別增加一層全連接層,并增加二者的神經元數量。VAE 編碼器的3層神經元數量分別為500,300,200;生成器的3層神經元數量分別為200,300,500。
本節比較了2 層VAE-Dual GAN 和3 層VAEDual GAN 的Rs/Fm的VSSIM值以及訓練時間,結果如表3 所示,對于每個波長區間,3 層VAE-Dual GAN的Rs/Fm 高于Rs/Rm,但低于2 層VAE-Dual GAN 的Rs/Fm。這說明2 層VAE-Dual GAN 模型生成的偽月球光譜質量高于3 層的VAE-Dual GAN 模型。究其原因,過多的全連接層和神經元數將造成過擬合,進而導致偽光譜質量的下降。此外,表3 顯示,2 層VAE-Dual GAN 模型的訓練時間比3 層VAE-Dual GAN 模型短約10 000 s。這說明增加全連接層數和神經元數均會使訓練時間延長。

表3 網絡層數Table 3 The number of network layers
為了體現全連接層的優越性,本文將其與卷積層進行對比。基于卷積層的VAE-Dual GAN 的網絡結構具體如下:VAE編碼器為2層卷積層,生成器為5層轉置卷積層和1層卷積層;卷積核大小為3 × 3,通道數為32,步幅為2。
表4給出了2種VAE-Dual GAN 的Rs/Fm的VSSIM值以及偽光譜的徑向速度標準差。卷積層VAEDual GAN 的Rs/Fm 略高于Rs/Rm 和全 連接層VAEDual GAN 的Rs/Fm。卷積層VAE-Dual GAN 的徑向速度標準差高于全連接VAE-Dual GAN 的徑向速度標準差。究其原因,卷積層VAE-Dual GAN 僅關注光譜特征,而非相位。這導致卷積層VAE-Dual GAN Rs/Fm 的結構相似度高于全連接層VAE-Dual GAN,測速精度卻低于全連接層VAE-Dual GAN。

表4 卷積層與全連接層Table 4 Convolution layer and fully connection layer
為了驗證VAE-Dual GAN優于Dual GAN和VAECycle GAN,本文采用SSIM和標準化相對鑒別分數[40](Normalized relative discriminative score,NRDS)作為對比指標。光譜波長為5 964.872-6 032.103?。表5 給出了生成的偽行星光譜與真實行星光譜的結構相似度。

表5 GAN模型的VSSIMTable 5 VSSIM of GAN models
VAE-Dual GAN 生成的偽月球光譜與真實太陽光譜的相似度最高,Rs/Rm 最低,這說明3 個模型的偽光譜對在相似度上都有不同程度的提升,并且VAE-Dual GAN 的偽光譜優于VAE-Cycle GAN 和Dual GAN。
NRDS是評判GAN模型優劣的指標。將相同個數的真實光譜和多個GAN 模型生成的偽光譜混合投入一個分類器。經過足夠多的訓練迭代次數,使分類器可以完全區分出2類光譜樣本。當生成偽光譜的概率分布與真實分布高度接近時,分類器很難完全區分。NRDS計算公式為:
式中:A(Ci)為第i個GAN 模型輸出曲線Ci圍成的面積。TNRDS越高,對應的GAN模型越好。
下 面,考 察VAE-Dual GAN 與Dual GAN 和VAE-Cycle GAN的TNRDS,光譜波長為5 964.872-6 032.103?。圖3給出了各種GAN模型生成的錯誤率曲線,表6 給出了其對應的TNRDS。從以上結果可以看出,VAE-Dual GAN 的錯誤率曲線高于另2 個GAN 模型,且VAE-Dual GAN的TNRDS最 大。VAEDual GAN 的偽光譜的區分難度最高,即該模型生成的光譜對質量優于Dual GAN和VAE-Cycle GAN。

表6 GAN模型的TNRDSTable 6 TNRDS of GAN models

圖3 GAN模型的錯誤率曲線Fig.3 Error rate curves of GAN models
天文多普勒差分導航需要同步的太陽光譜和行星光譜,但目前無法滿足要求。為此,本文提出一種基于深度學習的太陽/行星光譜對生成方法。為充分利用VAE 的數據增強能力和Dual GAN 的轉換學習能力,將二者融合,以生成同步的太陽/偽行星光譜對。實驗結果表明,VAE 具有數據增強能力,解決了小樣本情況下約束能力較弱的問題。VAE-Dual GAN 的太陽/偽行星光譜對的測速精度和結構相似度均優于真實光譜對、含噪光譜對以及其他GAN生成的光譜對。這說明了VAE-Dual GAN的太陽/偽行星光譜對的質量高。