牛英滔 姚 行 張 凱
①(國防科技大學(xué)第六十三研究所,南京 210007)
②(南京信息工程大學(xué)電子與信息工程學(xué)院 南京 210044)
無線通信作為一種基于電磁波傳播的信息傳輸技術(shù),在現(xiàn)代社會中扮演著至關(guān)重要的角色。然而,由于電磁環(huán)境的開放性和復(fù)雜性,無線通信系統(tǒng)往往易受到各種干擾的影響,這將導(dǎo)致傳輸信號質(zhì)量下降、傳輸性能惡化甚至傳輸中斷[1]。為提高無線通信系統(tǒng)在干擾環(huán)境下傳輸?shù)目煽啃院瓦m應(yīng)能力,功率自適應(yīng)調(diào)整技術(shù)已被廣泛應(yīng)用于無線通信領(lǐng)域。它根據(jù)電磁環(huán)境和系統(tǒng)需求動態(tài)調(diào)整無線通信系統(tǒng)的發(fā)射功率,以實(shí)現(xiàn)信息的可靠傳輸,并提高系統(tǒng)的覆蓋范圍、容量和能效[2]。
傳統(tǒng)的功率自適應(yīng)方法往往受制于固定的策略或規(guī)則[3],難以適應(yīng)復(fù)雜多變的干擾環(huán)境。而啟發(fā)式算法可在傳統(tǒng)功率自適應(yīng)方法受限的情況下,更好地適應(yīng)復(fù)雜的干擾環(huán)境。其中,文獻(xiàn)[4]提出了一種基于粒子群優(yōu)化 (Particle Swarm Optimization,PSO)算法下的功率控制算法,通過以網(wǎng)絡(luò)節(jié)點(diǎn)總發(fā)射功率為優(yōu)化目標(biāo),得到在滿足一定傳輸速率下的最小總發(fā)射功率,并根據(jù)設(shè)置的時間周期重新計(jì)算分配節(jié)點(diǎn)發(fā)射功率,進(jìn)而達(dá)到功率自適應(yīng)。文獻(xiàn)[5]在對于蜂窩網(wǎng)絡(luò)D2D(Device—to—Device communication)通信中D2D用戶共享蜂窩用戶上行鏈路的頻譜資源引起的干擾抑制問題上,提出一種音調(diào)微調(diào)概率自適應(yīng)變化的遺傳和聲算法進(jìn)行功率控制,在滿足用戶最低信干噪比和最大發(fā)射功率要求的前提下,實(shí)現(xiàn)吞吐量最大化目標(biāo)。但啟發(fā)式算法可能需要大量的計(jì)算資源和時間來完成搜索過程,這使得系統(tǒng)難以適應(yīng)快速時變干擾環(huán)境。
隨著機(jī)器學(xué)習(xí)等人工智能技術(shù)的發(fā)展,基于智能抗干擾算法逐漸引起了研究者的關(guān)注。如文獻(xiàn)[6]提出一種基于強(qiáng)化學(xué)習(xí)的智能抗干擾通信方法。該方法基于互模擬等價關(guān)系(Bisimulation)識別不同狀態(tài)-動作對的相似性,實(shí)現(xiàn)知識在其間的重用。每個節(jié)點(diǎn)可以獨(dú)立地學(xué)習(xí)并迅速調(diào)整其策略,從而高效地抵御未知的動態(tài)干擾。該方法不僅加速了收斂,還提高了網(wǎng)絡(luò)吞吐量,并具有優(yōu)異的響應(yīng)速度和干擾記憶功能。文獻(xiàn)[7]提出了一種基于多智能體深度強(qiáng)化學(xué)習(xí)(Multi- Agent Deep Reinforcement Learning, MADRL)的上行鏈路功率控制方法,用于多小區(qū)多用戶通信系統(tǒng),解決服務(wù)質(zhì)量(Quality of Service, QoS)約束的上行鏈路功率控制問題。
盡管基于機(jī)器學(xué)習(xí)等技術(shù)的功率自適應(yīng)方法在提高無線通信系統(tǒng)的對信道和干擾環(huán)境的適應(yīng)能力、功耗節(jié)約方面有一定成效,但其調(diào)整過程需要較多次數(shù)的迭代,時延大、計(jì)算復(fù)雜度高,自適應(yīng)調(diào)整速度慢,可能導(dǎo)致系統(tǒng)難以跟上電磁環(huán)境的變化,進(jìn)而導(dǎo)致傳輸性能不穩(wěn)定。
為此,有學(xué)者研究了基于穩(wěn)定性控制理論的通信抗干擾方法。文獻(xiàn)[8]引入一種帶積分器的狀態(tài)反饋控制器,當(dāng)系統(tǒng)受到突發(fā)干擾時,誤碼率(Bit Error Rate, BER)可以快速穩(wěn)定在目標(biāo)值。文獻(xiàn)[9]提出了一種基于切換系統(tǒng)的穩(wěn)定性理論和多重李雅普諾夫函數(shù)的穩(wěn)定控制算法,使切換系統(tǒng)在漸近條件下滿足穩(wěn)定性要求。但是對于更為復(fù)雜的電磁環(huán)境,簡單的狀態(tài)反饋控制器可能無法提供足夠的穩(wěn)定性保證和收斂速度。為解決這一問題,本論文提出了一種基于干擾觀測的模型預(yù)測控制方法,通過對系統(tǒng)和干擾狀態(tài)的估計(jì),及對未來狀態(tài)信息的預(yù)測,能夠更快地響應(yīng)干擾,從而提高無線通信系統(tǒng)在惡意干擾下的傳輸可靠性。
具體而言,本文首先將干擾環(huán)境下的無線通信系統(tǒng)建模為受外部干擾影響的廣義穩(wěn)定性控制系統(tǒng)[10]。然后,采用滑模干擾觀測器對系統(tǒng)狀態(tài)和干擾狀態(tài)進(jìn)行估計(jì)。再通過泰勒級數(shù)展開對系統(tǒng)未來狀態(tài)信息進(jìn)行預(yù)測。最后,通過求解優(yōu)化問題,得到最優(yōu)的控制律來調(diào)整系統(tǒng)的功率,以實(shí)現(xiàn)系統(tǒng)在干擾環(huán)境下的傳輸可靠性。仿真結(jié)果表明,本文提出的抗干擾控制方法與已有方法相比,能夠有效解決收斂速度慢和穩(wěn)定性差的問題,為無線通信系統(tǒng)的抗干擾功率自適應(yīng)調(diào)整技術(shù)提供了新的思路和方法。
如圖1所示,假設(shè)無線通信系統(tǒng)是連續(xù)傳輸?shù)模蓴_的出現(xiàn)或變化對系統(tǒng)而言相當(dāng)于對系統(tǒng)傳輸過程的擾動。因此,本文分析系統(tǒng)在干擾下的穩(wěn)定性時,將系統(tǒng)建模為連續(xù)時間域廣義控制系統(tǒng)。系統(tǒng)在對電磁環(huán)境進(jìn)行感知后,發(fā)射端根據(jù)反饋信息調(diào)整發(fā)射功率,以確保接收端的誤碼率不超過預(yù)設(shè)的目標(biāo)誤碼率。

圖1 無線通信系統(tǒng)抗干擾控制模型
根據(jù)此系統(tǒng)模型,對通信參數(shù)做出以下假設(shè):假設(shè)發(fā)射機(jī)的發(fā)射功率為Ps,傳輸信道為加性高斯白噪聲(Additive White Gaussian Noise, AWGN)信道,此外,信道遵循塊衰落特性且信道內(nèi)的噪聲功率已知。接收機(jī)在Ps下的誤碼率為Pe,若不考慮自由空間傳播損耗,且通信信號發(fā)射功率Ps和信道內(nèi)的噪聲功率PN都用dBm表示,當(dāng)不存在干擾時,傳輸過程中的信干噪比可簡單表示為SINR=Ps-PN。系統(tǒng)在BPSK調(diào)制和(2016,504) 低密度奇偶校驗(yàn)碼(Low Density Parity Check Code, LDPC)的誤碼曲線如圖2所示。可見,隨著信干噪比的增大,誤碼率近似呈線性關(guān)系減小,所以曲線瀑布區(qū)可以擬合成如圖2中所示的直線。

圖2 在某種調(diào)制和某種LDPC碼下的誤碼曲線
假設(shè)系統(tǒng)正常傳輸?shù)哪繕?biāo)誤碼率為yr(t)。選取發(fā)射功率Ps為控制輸入變量u(t),接收端的信干噪比為系統(tǒng)狀態(tài)變量x(t) ,誤碼率Pe為系統(tǒng)輸出變量y(t)。系統(tǒng)建模的目的是將系統(tǒng)用如式(1)形式的線性微分方程來描述
這里的 A,B,C,D是常量,分別稱作動態(tài)特性系數(shù)、控制系數(shù)、傳感系數(shù)和直接項(xiàng)。
如圖2所示,系統(tǒng)的誤碼率曲線在瀑布區(qū)近似為一直線。因此,可根據(jù)圖2用直線方程寫出誤碼率與系統(tǒng)輸入信干噪比的關(guān)系,即
由于在沒有干擾時, SINR=Ps-PN,所以在t時刻后的 ?t時刻的系統(tǒng)狀態(tài)由控制輸入u(t)和此時的噪聲功率組成,且假設(shè)接收的SINR是可以準(zhǔn)確估計(jì)的,則

在未引入穩(wěn)定性控制器的條件下:u(t)=xe(t)+PN(t), 其中xe(t)為信干噪比目標(biāo)值。
為了得到發(fā)射功率到誤碼率的傳遞函數(shù),令

其中,動態(tài)特性系數(shù) A=-1 ,控制系數(shù) B=1,傳感系數(shù) C和直接項(xiàng) D根據(jù)某種調(diào)制和編碼方式下擬合的直線斜率和截距而定。
根據(jù)式(7),結(jié)合廣義運(yùn)動控制系統(tǒng)將受未知干擾影響的無線通信系統(tǒng)表達(dá)為
其 中,y(2)(t)=CA2x(t)+CBu˙1(t)+CABu1(t)為y(t) 的2 階 導(dǎo) 數(shù)。b(t) 為 控 制 增 益,滿 足b-≤b(t)≤bˉ, b-和 bˉ為正常數(shù),表示b(t)的上下界。目標(biāo)是解決優(yōu)化控制問題,使得式(8)所示的受擾系統(tǒng)的輸出以性能指標(biāo)最優(yōu)的形式,漸近地與參考信號一致。
首先,定義變量
假設(shè)yr(t) 是分段連續(xù)的,其n階導(dǎo)數(shù)存在且有界。則誤差系統(tǒng)滿足
其中,
其中,e(t) 為未知干擾導(dǎo)致的控制誤差,e(i)(t)表示e(t) 的 第i階 導(dǎo)數(shù),w(t)表示未知干擾和系統(tǒng)不確定性的集總干擾[11],b0為b(t) 標(biāo)稱值;函數(shù)wn(t)由目標(biāo)誤碼率yr(t)構(gòu)造。
基于連續(xù)時間域非線性廣義預(yù)測控制方法,采用具有顯式控制輸入加權(quán)的改進(jìn)廣義預(yù)測控制性能指標(biāo)作為優(yōu)化目標(biāo)。即通過最小化這一改進(jìn)的廣義預(yù)測控制性能指標(biāo)D(t)來實(shí)現(xiàn)最優(yōu)的控制性能。
不同于傳統(tǒng)的非線性廣義預(yù)測控制方法[12]和文獻(xiàn)[13]無偏模型預(yù)測控制方法,改進(jìn)的廣義預(yù)測控制性能指標(biāo)綜合考慮了系統(tǒng)的預(yù)測誤差、控制輸入加權(quán)以及性能權(quán)重等因素,以更精確地評估控制系統(tǒng)的性能。其中優(yōu)化目標(biāo)為
其中,T> 0 為控制周期;Q> 0為控制誤差的權(quán)重;R ≥0 為控制輸入的權(quán)重;ur(t)為穩(wěn)態(tài)控制輸出,定義為
可知若要得到預(yù)測的性能指標(biāo),則需要得到跟蹤誤差、控制輸入、目標(biāo)(控制)輸入的預(yù)測值。
在時域 0≤τ ≤T內(nèi)的控制誤差e(t+τ)可用泰勒級數(shù)近似為
其中,r ∈N[14]為控制階次。
簡便起見,變量的估計(jì)值是對跟蹤誤差系統(tǒng)的狀態(tài)和干擾進(jìn)行估計(jì),用符號 (?·)表示,變量的時域預(yù)測值是利用這些估計(jì)值通過泰勒級數(shù)展開的形式預(yù)測滾動時域內(nèi)的未來狀態(tài)信息,用符號 (·)表示。定義決策變量為

如果系統(tǒng)相對階較低(1或2), 對任意選取的控制器參數(shù)(Q, R, r, T), 閉環(huán)系統(tǒng)始終漸近穩(wěn)定[14]。將控制階次r=0代入式(19)得跟蹤誤差的預(yù)測值以及控制輸入、目標(biāo)輸入的預(yù)測值為

同理,可得控制輸入、目標(biāo)輸入的預(yù)測值為
其中,Γ?(τ)=[1τ]。
基于式(30)、式(31)和式(32),式(15)所示的廣義控制性能指標(biāo)的預(yù)測值為

取決策變量U*(t)的第1行作為實(shí)際控制律,可得
其中,為了區(qū)分輸入功率u(t)和在干擾環(huán)境下的實(shí)際控制律u*(t),加入符號*。k0和k1分別為控制階次為零時的最優(yōu)增益

控制系統(tǒng)中的干擾觀測,與無線通信系統(tǒng)中的干擾檢測、干擾認(rèn)知的作用和實(shí)現(xiàn)方式有所不同。干擾觀測并不直接感知或估計(jì)干擾信號,而是通過跟蹤誤差來生成干擾對系統(tǒng)狀態(tài)影響的估計(jì)值。若要得到跟蹤誤差、控制輸入、目標(biāo)輸入的預(yù)測值求解出最優(yōu)控制律使得控制器得以實(shí)現(xiàn),則干擾觀測器要得出觀測的估計(jì)值。本節(jié)根據(jù)文獻(xiàn)[15]所提出的高階滑模觀測器代入所建立的通信系統(tǒng)中,用于生成估計(jì)值e?1(t),...,e?n-1(t),w?(t)。則觀測的誤差方程為

由于之前為了系統(tǒng)的分析方便,式(6)中做了變量替換,因此在實(shí)際過程中,控制器的控制輸出應(yīng)該為u(t)=u1(t)+PN(t+?t)。
根據(jù)以上分析,總結(jié)設(shè)計(jì)控制器的具體步驟如下:
(1) 設(shè)定系統(tǒng)初值。包括系統(tǒng)的預(yù)測步長,觀測增益,目標(biāo)誤碼率yr等,并設(shè)定系統(tǒng)狀態(tài)平衡點(diǎn)xe,以及仿真的起始,終止時間和計(jì)算步長h;
(2) 通過系統(tǒng)狀態(tài)x(t)代入式(7)求得當(dāng)前時刻系統(tǒng)輸出誤碼率y(t);
(3) 根據(jù)式(30)—式(32)得到跟蹤誤差、控制輸入、目標(biāo)輸入的預(yù)測值e(t+τ) ,uˉ1(t+τ),uˉr(t+τ);
(4) 將當(dāng)前的信干噪比和求解出的控制律式(35)代入到式(7)求出信干噪比變化率x˙(t);
(5) 代入x(t+h)=x(t)+h×x˙(t)求出下一時刻的信干噪比;
(6) 循環(huán)執(zhí)行第(2)步至第(5)步,得到所有采樣點(diǎn)的系統(tǒng)狀態(tài)和輸出誤碼率。
該方法的實(shí)現(xiàn)框圖見圖3。

圖3 所提方法系統(tǒng)框圖
在本節(jié)中,通過MATLAB仿真評估了所提算法在遭遇隨機(jī)脈沖干擾、周期脈沖干擾和持續(xù)恒定干擾時的性能,并與傳統(tǒng)的功率自適應(yīng)等方法進(jìn)行了對比。以BPSK調(diào)制和(2016,504)LDPC碼為例,其誤碼率曲線經(jīng)過擬合后得到直線y(t)=-2.4x(t)-10.8 ,則傳感系數(shù)C=-2.4。圖4為所提算法與傳統(tǒng)功率自適應(yīng)方法在隨機(jī)脈沖干擾環(huán)境下的誤碼率曲線和發(fā)射功率仿真對比結(jié)果。

圖4 隨機(jī)脈沖干擾下,加入穩(wěn)定控制與傳統(tǒng)的功率自適應(yīng)通信系統(tǒng)對比圖
由圖4(a)可知,系統(tǒng)受到功率為5 dBm隨機(jī)脈沖干擾,干擾服從概率為0.01的均勻分布,持續(xù)時間為0.1 s。所提算法能夠迅速應(yīng)對干擾,響應(yīng)速度明顯高于已有方法。從圖4(b)可以看出,在隨機(jī)脈沖干擾環(huán)境下,系統(tǒng)在經(jīng)歷0.05 s的干擾后快速收斂到目標(biāo)誤碼率10–4,即便干擾仍在持續(xù)。相比之下,傳統(tǒng)功率自適應(yīng)方法輸出誤碼率更高,在干擾脈沖的時間間隔呈隨機(jī)分布時,難以收斂到規(guī)定的誤碼率。
圖5為所提算法與基于強(qiáng)化學(xué)習(xí)的智能抗干擾通信方法[6]在周期脈沖干擾環(huán)境下的歸一化吞吐量仿真對比結(jié)果。

圖5 周期脈沖干擾下,加入穩(wěn)定控制與強(qiáng)化學(xué)習(xí)算法的對比圖
圖5(a)環(huán)境中的周期脈沖干擾,其干擾功率為5 dBm,該干擾持續(xù)時間為0.2 s,周期為1 s。從圖5(b)中可以看出,所提算法在應(yīng)對干擾時,無需經(jīng)過繁瑣的迭代訓(xùn)練即可穩(wěn)定地實(shí)現(xiàn)歸一化吞吐量為0.97;相同參數(shù)設(shè)置下的基于強(qiáng)化學(xué)習(xí)的智能抗干擾通信方法經(jīng)過1 000次迭代,歸一化吞吐量最多能收斂于0.89。由上述仿真結(jié)果可知,在周期脈沖干擾的典型干擾環(huán)境下,基于強(qiáng)化學(xué)習(xí)的智能抗干擾通信方法遇到干擾時會選擇靜默避開脈沖干擾;而本文算法可以迅速調(diào)整發(fā)射功率,降低系統(tǒng)誤碼率,從而獲得更高的歸一化吞吐量,可見傳輸可靠性得到了提高。
圖6為所提算法與傳統(tǒng)的功率自適應(yīng)方法和文獻(xiàn)[8]中的算法在持續(xù)恒定干擾下的誤碼率曲線和發(fā)射功率仿真對比結(jié)果。圖6(a)為環(huán)境中的持續(xù)恒定干擾,干擾在2 s時出現(xiàn),功率為5 dBm。

圖6 3種功率自適應(yīng)穩(wěn)定性控制方案的比較
其中,文獻(xiàn)[8]中的算法,選擇了適度的阻尼比以獲得適度的超調(diào)量和較短調(diào)節(jié)時間,同時選擇適度的自然頻率保證較快的響應(yīng)速度和較小的控制量。從圖6(b)可以看出,與比例積分控制系統(tǒng)和傳統(tǒng)的功率自適應(yīng)系統(tǒng)相比,所提算法能夠更快地將輸出誤碼率收斂到目標(biāo)誤碼率,且誤碼率波動較小。
綜上所述,所提算法在遭遇隨機(jī)脈沖干擾、周期脈沖干擾和持續(xù)恒定干擾時性能明顯優(yōu)于已有算法。
本文提出了一種基于干擾觀測的無線通信系統(tǒng)抗干擾控制方法,能夠改善復(fù)雜電磁環(huán)境下通信系統(tǒng)功率自適應(yīng)的穩(wěn)定性問題。仿真結(jié)果表明,該算法在受到突發(fā)干擾時能夠使系統(tǒng)誤碼率迅速收斂到目標(biāo)值,并且相比傳統(tǒng)的功率自適應(yīng)、基于強(qiáng)化學(xué)習(xí)的智能抗干擾通信方法和基于比例積分(Proportional Integral, PI)狀態(tài)反饋控制等方法,具有更好的誤碼率波動情況、更高的歸一化吞吐量和更快的發(fā)射功率響應(yīng)速度。然而,仍然有一些挑戰(zhàn)需要進(jìn)一步解決。例如,考慮實(shí)際通信系統(tǒng)的約束和限制條件,如功率范圍、通信速率等。未來的研究可以結(jié)合機(jī)器學(xué)習(xí)和深度學(xué)習(xí)技術(shù),探索更復(fù)雜的模型和算法,以提高系統(tǒng)的性能和適應(yīng)性。