中圖分類號:TP391.4 文獻標志碼:A 文章編號:1000-5137(2025)02-0215-08
Abstract:A joint estimation method fordirectionofarrval(DOA)and timeof arrival(TOA)was proposed basedonPareto multi-tasklearning,whichtransformedthetraditionalmulti-tasklearningproblemintoamulti-objectiveoptimizationproblemfor solution.Alightweight multi-task network wasdesignedbytheproposedmethod,modelingthejointDOAandTOAestimation probleminmulti-pathenvironmentsasamulti-task,multi-labelregressontask.Furtherly,aParetooptimizationmethodguided bypreferencevectorwasintroduced,decomposingtheproblemintoasetofsub-problemswithdiferenttrade-offpreferences.By solvingtesesub-problemsinparalel,asetofrepresentativePareto-optimalsolutionscouldbeobtained.Experimentalresults showed hat,compared toother multi-task learning methods,the proposedappoachprovidedahigheraccuracyand flexible solution forthejointDOAand TOA estimationproblem.
KeyWords:directionofarrival(DOA);imeofarrival(TOA);jointestimation;multi-tasklearning;multi-tasknetwork; Pareto optimization
0 引言
到達角(DOA)和到達時間(TOA)是信號處理中的核心參數,廣泛應用于定位、導航、通信等領域[],尤其在未來的6G技術中,DOA與TOA的估計被視為關鍵技術之一[2-3].精確的參數估計不僅能夠顯著提升系統性能,還能增強通信與感知一體化的能力,為復雜場景下的應用提供重要的技術支撐[4].
近年來,深度學習技術的快速發展為信號參數估計提供了新的方向[5.與傳統基于物理模型的方法相比,深度學習方法基于數據驅動,具有顯著的計算效率和穩健性,尤其在噪聲、多徑傳播、陣列缺陷或采樣不足等復雜條件下表現尤為突出.目前,大多數基于深度學習的參數估計方法主要基于對單一參數的估計.PAPAGEORGIOU等[6設計了一個卷積神經網絡,將多通道的樣本協方差矩陣數據作為輸人進行DOA估計,并采用基于網格的標簽策略,將DOA估計問題建模為多標簽分類任務,且特別關注了在低信噪比下的性能.然而,由于網格劃分的限制,這種基于分類的建模方法在估計分辨率方面存在局限性.為了提高估計的分辨率,ZHENG等提出了一種基于深度學習回歸的DOA估計方法,有效克服了基于分類的方法在處理離網DOA問題上的局限性.WEI等[8提出了一種基于深度學習的TOA估計方法,并結合一種新穎的稀疏編碼方案,以解決由量化誤差和離網效應帶來的問題.然而,這種給參數標簽進行偽譜編碼的預處理方法仍然依賴于偽譜編碼技術的分辨率,并且相較于端到端的方法,需要額外的譜峰檢測步驟.
隨著電磁環境的日益復雜,同時獲取多維的參數信息才能提供更加全面的決策支持,故聯合估計也成為信號處理領域中的重點的研究方向.多任務學習作為深度學習中一種重要方法,已經廣泛應用于計算機視覺、自然語言處理和語音識別等許多領域[9-10].其特點是能夠共享任務間的相關特征,在并行處理關聯任務時展現出良好的泛化能力,同時也為數據驅動的參數聯合估計方法提供了有效的解決思路.PAN等提出了一種基于遷移學習的多任務網絡,通過共享層和任務私有層來實現聯合優化.然而,由于DOA和TOA估計在單位和尺度上存在差異,這使得多任務網絡的性能高度依賴于手動配置的多任務損失權重.這種預設的權重分配方式不僅耗費資源,且缺乏靈活性,難以滿足實際應用場景中多樣化的需求.針對這一問題,KENDALL等[12提出了一種基于均方差不確定性的多任務深度學習方法,該方法能夠動態調整多任務損失函數的權重來平衡任務間的沖突.然而,該方法僅能獲得唯一的平衡解,無法根據具體需求靈活調整任務的偏好.
針對上述問題,本文提出了一種基于帕累托多任務學習的DOA與TOA聯合估計方法,設計了一個輕量化的多任務網絡,將多徑環境下的DOA與TOA聯合估計建模為多任務、多標簽的回歸問題.與此同時,引入帕累托優化策略,通過一組均勻分布的偏好向量生成具有代表性的帕累托最優解,這些解在DOA與TOA估計之間具有不同的權衡,決策者可以很容易地根據實際需求靈活選擇方案.在實驗部分,本文將所提方法與其他多任務學習方法在DOA與TOA聯合估計問題上進行了對比,實驗結果表明,本文所提方法在聯合估計中表現出更高的精度與靈活性.
1信號模型
在DOA與TOA聯合估計問題中,假設陣列系統由 N 個傳感器組成,接收包含 P 條傳播路徑的信號.其數學模型可表示為:
y(t)=Σp=1Pα(θp)s(t-τp)+n(t)=A(θ)s(t-τ)+n(t),t=1,…,K,
式中 ?:A(θ)=[α(θ1),α(θ2),…,α(θp)] 為 N×P 的陣列流形矩陣; θ=[θ1,θ2,…,θp] 是信號在 P 條路徑上傳播的導向向量;
.…, s(t-τp) ]是一個維度為 P×K 的傳輸信號矩陣; K 是信號的快拍數; τ=[τ1 τ2,?? .
是信號在 P 條路徑上傳播的TOA向量; n(t) 表示采樣點 t 處的加性噪聲向量.
式(1)是一個通用的信號模型,與陣列具體的幾何形狀無關.在本研究中,采用了均勻線性陣列作為系統配置,其陣列流形矩陣的每一列表示為:

式中: d 為陣列的陣元間距;λ為信號波長,一般 d=λ/2 .本研究旨在從給定的陣列接收信號 y(t) 中,聯合估計 P 條多徑信號的DOA參數 θ 和TOA參數 τ.
2基于帕累托多任務學習的DOA和TOA聯合估計
在本研究中,多徑環境中的DOA與TOA聯合估計被建模為一個多任務、多標簽的回歸問題.該方法能夠直接預測各估計任務的連續值,相較于基于網格的多標簽分類方法,這種建模方法能夠更好地應對離格場景.總體實現框架如圖1所示.陣列接收信號后,首先通過接收機進行預處理,然后將信號輸入多任務網絡,在參數共享層中提取通用特征后,分別通過DOA和TOA的任務私有層提取特定特征,最終輸出估計的參數.同時,模型引人帕累托優化,進一步將多任務學習建模為多目標優化問題進行求解,該方法通過一組偏好向量引導模型訓練,能夠生成一組具有代表性的帕累托解集,從而在有不同需求的復雜場景中實現靈活且高效的聯合估計.圖1為總體實現框架,其中,LOS表示視距環境,NLOS表示非視距環境.

2.1 輸入預處理
如式(1)所示,陣列接收信號 y(t) 實際上是一個 N×K 維的復值數據矩陣,因此首先需要對其在第 n 個陣列元件上的實部和虛部進行分解,

最終可以獲得兩個 N×K 維的實值矩陣,

因此,網絡的輸入可以表示為一個實值的 2×N×K 矩陣,其中, N 為陣列的陣元數, K 為信號的快拍數.為了提高特征提取的穩定性,輸入數據在進入初始卷積層前進行了歸一化處理.
2.2 多任務網絡架構
為了實現基于數據驅動模型的DOA與TOA的聯合估計,本文提出了一個輕量級的多任務,其結構如圖2所示.本文所提出的多任務網絡由參數共享層和任務私有層兩部分構成:共享層用于學習DOA與TOA的通用特征,私有層則分別學習DOA與TOA的固有特征.

初始卷積層用于對輸入數據進行初步的特征提取,該層包括一個卷積核為 3×3 步長為1的二維卷積層(Conv2d),一個批量歸一化層(BatchNorm2d),以及一個ReLU激活函數層.共享層由兩個自定義的殘差塊堆疊而成,并在末尾添加了通道注意力模塊,以增強特征提取的穩健性和表現力.DOA和TOA估計的私有層均引入了多頭注意力模塊以進一步提升特征提取的能力.兩者的私有層均由4個自定義殘差塊堆疊構成,最后通過自適應平均池化層(AdaptiveAvgPoo2d)、展平層(Flatten)、Dropout層和全連接層輸出 P 條路徑的DOA與TOA的估計結果.其中,AdaptiveAvgPool2d的輸出尺寸為 (1,1) ,作用為聚合每個通道的全局信息,減少后續計算的參數量和復雜度;Dropout的丟棄率參數為0.4,作用為減少模型過擬合.
每個自定義殘差塊由2個卷積核為 3×3 、步長為1的Conv2d構成,每個Conv2d后依次連接批量歸一化層和ReLU激活函數,以確保特征提取的穩定性和非線性表達能力.殘差塊采用殘差連接機制,將第二個卷積層的輸出與原始輸入相加后,再經過ReLU激活函數處理.這種設計使原始輸入特征能夠沿著殘差路徑有效傳播至更深層網絡,從而顯著提升模型的訓練效率和特征表達能力.
2.3 帕累托多任務學習
現有的大多數多任務學習方法通常只能生成一個固定的折中解.然而,在實際應用中,不同場景對方位信息和距離信息的需求往往各不相同,決策者更需要一組靈活多樣的解,以便根據具體需求進行選擇.為此,本節針對DOA與TOA聯合估計問題,提出了一種基于帕累托優化策略[13]的多任務學習方法,將多任務學習轉為一個多目標優化問題進行求解.
首先,將DOA與TOA的目標損失函數定義為:
L(?)=(LDOA(?),LTOA(?))T,
式中: ? 為多任務網絡待優化的參數; LDOA 和 LToA 分別衡量DOA與TOA估計的誤差.
接下來,在二維目標空間 R+2 中選取一組偏好向量
每個 uk 定義了一個子問題的可行域:

對每個偏好向量 uk, 有相應的子問題:
min?L(?)s.t.L(?)∈Ωk.
具體而言,不同的 uk 將目標空間劃分為不同的偏好區域,如圖3所示,每個子問題在各自區域內尋找滿足帕累托最優條件的解,最終,由偏好向量所得到的這些帕累托解在聯合估計的二維誤差空間里可以組成一條近似的帕累托前沿.
在求解受約束的多目標子問題前,首先需要找到一個可行的初始解 ?0 ,即 L(?0)∈Ωk. 從隨機初始參數 ?r 出發,定義激活約束索引集


式中: (uj-uk)rL(?) 可被視為約束函數 Gj(?) ,表示當前解在與偏好向量 uk 對比時,對其他偏好向量 uj 的偏離程度.為使 ?r 向可行域方向移動,可通過求解下面的優化問題以獲得下降方向 dr 和輔助變量 ar

式中: ar 為輔助變量,用于同時控制滿足激活函數的約束及更新步長的大小.然后,使用梯度下降更新規則:
?rt+1?rt+ηrdrt,
重復迭代,直到找到滿足 L(?r)∈Ωk 的可行初始解 ?0 業
在獲得可行初始解 ?0 后,對子問題進行受約束的多目標優化.為找到受約束的帕累托臨界點,在每次迭代時求解:


式中: I*(?t) 是 ?i 處的激活約束集合.若 dt=0 ,則 ?t 為子問題的受約束帕累托臨界點,停止迭代;否則,更 新參數 ?t+1=?t+ηrdt, 直到收斂.
最后,對全部 K 個子問題并行進行上述過程,分別得到與不同偏好向量 uk 對應的一組受約束帕累托臨界解
, ?2 ,…,
這些解在DOA與TOA誤差構成的二維目標平面上形成一條帕累托前沿,為DOA與TOA聯合估計任務提供多樣化的解決方案.
3實驗
3.1 實驗數據集
本文所構建的數據集中的陣元數量 N=10 ,考慮的多徑數量 P=3 .為了提高本方法在不同噪聲環境下的穩健性,使用不同信噪比(SNR)條件下的陣列接收信號,以及對應的參數標簽來構建訓練樣本.其中,輸入為陣列接收信號 y(t) 的實部和虛部數據矩陣,輸出為多徑信號對應的DOA和TOA參數
具體來說,分別在SNR為 -15,-10,-5,0 和 5dB 的情況下生成了30000個樣本,總共生成了150000個樣本作為本實驗的數據集.每個樣本的D0A范圍在 -60°~60° 內,時間延遲在 0~2× 10-6 s內.劃分該數據集, 80% 的樣本用于訓練, 10% 用于驗證, 10% 用于測試.
3.2 訓練環境
本文所提出的多任務學習網絡基于PyTorch 2.1框架搭建而成,其參數規模僅為4.26MB,是經典的小規模網絡Resnet-18的三分之一.在網絡的訓練優化過程中,采用了 AdamW 優化器,設定學習率為0.001,權重衰減系數為 10-4 ,以此來調整網絡參數并防止過擬合現象.為有效提升網絡的收斂速率,引入了學習率調度器,其相關參數設定如下:耐心值設定為10,調整因子設定為0.1,即當連續10個周期評價指標未見改善時,學習率改為0.0001.網絡一共經歷50個訓練周期,在訓練過程中,每個批次的數據量大小設定為32,以確保在有限的計算資源下,網絡能夠充分學習數據特征并逐步優化模型參數,從而實現網絡性能的有效提升與優化.
3.3 評價指標
本節介紹了本實驗的評價指標.評估模型估計準確性的主要指標是均方根誤差(RMSE).在評價聯合估計DOA和TOA的模型時,通常分別計算兩者的RMSE,其定義如下:


式中:L代表測試樣本的數量; P 代表信號的多徑數量; θp 和 τp 分別代表DOA和TOA的真實值;
和
分別代表DOA和TOA的估計值.
3.4 實驗結果與分析
將本方法與單任務學習、基于固定權重搜索的多任務學習方法,以及基于不確定性的多任務學習方法在DOA與TOA聯合估計問題上進行了比較,其中,固定權重搜索和本方法受到參考向量的引導優化,固定權重搜索的參考向量為加權權重配置,本方法的參考向量為二維目標空間中的偏好向量.本實驗隨機抽取了200個測試樣本在SNR為 5dB 的噪聲條件下進行聯合估計,實驗結果如表1示所示.實驗結果表明:由于單任務學習無法利用任務間的共享信息,效果最差.基于固定權重搜索的多任務學習方法雖能生成不同權衡的解,但其表現依賴于預設的權重分配,如在(0.3,0.7)的加權方式下,TOA的估計精度較高,而在(0.7,0.3)的加權方式下,DOA的估計精度較高,但極端權重的分配又會傾向于單任務學習,往往效果較差,并且一個滿意的權重配比一般需要人為多次嘗試,這不僅缺乏靈活性且浪費資源.基于不確定性的多任務學習方法適合整體優化多任務學習,效果優于單任務學習和固定權重搜索,但僅能生成唯一的解,無法根據具體場景靈活調整對DOA和TOA估計精度的偏好.相比之下,基于帕累托多任務學習的方法能夠生成分布更廣的解,且能根據偏好向量選擇任務優化的傾向,特別是在極端偏好向量 (0,1) 和 (1,0) 下,DOA和TOA的估計精度達到了最佳,RMSE分別為 0.15° 和 1.2×10-9s. 而當偏好向量為
時,所提供的解能夠更好地平衡DOA和TOA估計任務.將本方法的結果呈現在二維誤差空間內,如圖4所示,其通過3個偏好向量獲得的結果近似生成了一條帕累托前沿.實驗結果表明,本方法為DOA與TOA聯合估計問題提供了更靈活的解決方案.

4結語
本文針對DOA與TOA聯合估計中,現有方法存在任務權衡與靈活性方面不足的問題,提出了一種基于帕累托多任務學習的聯合估計方法,設計了一個輕量化的多任務網絡,將聯合估計問題建模為多任務學習,并通過引人帕累托優化策略,進一步將多任務學習轉化為多目標優化問題進行求解,從而有效解決了DOA與TOA估計任務間的權衡問題,同時能獲得一組帕累托解.實驗結果表明,與其他多任務學習方法相比,本文所提方法不僅提升了DOA和TOA聯合估計的精度,而且更加靈活.
參考文獻:
[1]PANMG,LIUP,LIUSH,etal.Eficient jointDOAandTOAestimationforindoor positioning with5G picocelbase stations[J].IEEE Transactions on Instrumentation and Measurement,2O22,71:1-19.
[2]彭木根,劉喜慶,劉子樂,等.6G通信感知一體化理論與技術[J].控制與決策,2023,38(1):22-38. PENG MG,LIU XQ,LIU ZL,et al.Principles and techniques incommunicationand sensing integrated 6G system[J]. Control and Decision,2023,38(1):22-38.
[3] MOGYOROSIF,REVISNYEIP,PASIC A,et al.Positioning in 5G and 6G networks:a survey[J].Sensors,2022,22(13): 4757.
[4]DENG ZP,MINR,LIJ,etal.TOA and DOA estimationof MIMO OFDM signals for uniform linear aray radar based on music [C]/ International Geoscience and Remote Sensing Symposium. Athens: IEEE,2024: 9404-9407.
[5] LECUNY,BENGIO Y,HINTON G.Deep learning[J].Nature,2015,521(7553):436-444.
[6] PAPAGEORGIOUGK,SELLATHURAIM,ELDARYC.Deep networks fordirection-of-arrival estimationinlow SNR[J]. IEEE Transactions on Signal Processing,2021,69:3714-3729.
[7] ZHENG SL,YANG Z,SHEN WG,et al.Deep learning-based DOA estimation [J].IEEE Transactions on Cognitive Communications and Networking,2024,10(3):819-835.
[8] WEIS,PANH,HED,etal.Adeep-learning-based timeof arrivalestimationusing kernel sparse encoding scheme[J]. Signal Processing,2023,209:109047.
[9] ZHANGY,YANG Q.A survey on multi-task learning [J]. IEEE Transactions on Knowledge and Data Engineering, 2021,34(12):5586-5609.
[10] ZHANGY,YANG Q.Anoverview of multi-task learning [J].National Science Review,2018,5(1) :30-43.
[11] PANH,WEI S.A DOA and TOA joint estimation algorithm basedon deep transfer learning[J].Electronics Letters, 2023,59(3):e12719.
[12]KENDALL A,GAL Y,CIPOLLA R. Multi-task learning using uncertainty to weigh loses for scene geometry and semantics[C]//Conference on Computer Vision and Pattern Recognition.Salt Lake City: IEEE,2018:7482-7491.
[13] LIN X,ZHEN HL,LI Z H,et al.Pareto multi-task learning[C]// Conferenceon Neural Information Processing Systems.Vancouver:NIPS,2019:1-21.
(責任編輯:包震宇,顧浩然)