摘要:針對多無人機輔助邊緣卸載場景下的能量約束問題,本文研究了一種基于博弈論的無人機與地面節點動態組網方案,旨在優化無人機系統能耗。首先,搭建了無人機為地面節點提供任務卸載服務的網絡模型,提出了一種基于全局最優的聯盟形成博弈(global optimumcoalition formation game, GOCFG)算法,通過優化聯盟組網方案實現無人機系統能耗最小化,并證明了納什均衡的存在。其次,在聯盟崩潰的情況下,將斷聯節點與幸存聯盟的鏈路重構問題建模為多對一匹配博弈,提出了一種基于效用優先的匹配博弈(utility prioritymatching game, UPMG)算法,提升了系統效用,并證明了該算法的收斂性。最后,對比傳統算法,仿真結果驗證了所提方案能夠形成穩定的聯盟組網,具備及時重構鏈路能力,并且在降低系統能耗、提高系統魯棒性方面具有更優的性能表現,為緊急復雜場景下無人機群的應用研究提供了有力支持。
關鍵詞:無人機;邊緣計算;任務卸載;動態組網;博弈論
中圖分類號:V19;TN929.5
文獻標志碼:A
第六代(the sixth generation, 6G)移動網絡近來受到越來越多的關注。隨著移動設備的日益普及和發展,越來越多計算密集型和延遲敏感型的新型移動應用程序噴涌而出,它們需要大量的資源,這與移動設備本身有限的電池電量和計算資源相矛盾[1]。移動邊緣計算(mobile edge computing, MEC)將服務器擴展到網絡邊緣,移動設備通過將其任務卸載到臨近的MEC服務器上,可以有效緩解上述約束限制[2]。無人機輔助的MEC系統憑借其靈活性和可擴展性[3],廣泛應用于軍事、民用等場景中[46]。當地面缺乏通信設施或原有通信基礎設施遭到破壞后,無人機可作為搭載小型基站的平臺,在任務區域上空為地面用戶提供更好的服務。
上述場景中,為了保證任務的服務質量,不可忽略無人機自身有限的計算和能量資源帶來的影響。MAO等[7]為了降低系統總能耗,部署多天線無人機執行安全的任務傳輸和計算方案,優化了無人機軌跡和功率分配。KUANG等[8]基于凸優化理論,通過優化無人機資源分配來提高任務卸載調度方案中的用戶服務需求。CHIGULLAPALLY等[9]研究了傳輸數據吞吐量的最大化問題,在多個約束條件下,提出了一種多變量迭代算法來獲得最優無人機軌跡和資源調度方案。然而,上述文獻并未考慮到在無人機集群或者無人機與地面節點協同系統中,有效的組網策略可以對任務的完成效率和系統效用起到明顯的優化作用。
目前,已經有許多學者對無人機及其輔助系統的組網問題開展研究工作。游等[10]從體系架構和任務場景等方面對無人機集群組網的研究現狀和未來方向進行分析總結。WANG等[11]研究了無人機自組織網絡中的資源分配問題。DUAN等[12]研究了無人機輔助的多車輛協作系統,設計一種基于離散雙積分模型和聯合優化模型的排控制器,用于空地通信資源調度。
然而在緊急場景下,組網形成后也面臨著分崩離析的風險,某個網絡斷裂會對任務的結果產生嚴重的影響,因此高效的鏈路重構策略至關重要。WEI等[13]研究了動態節點鏈路中斷所帶來的額外通信開銷問題,提出一種基于最優鏈路狀態協議路由的優化方案。CAIVOFULLANA等[14]建立一種自組網的無人機系統,該網絡具有動態重新配置自身的能力,以滿足并保持所需的通信質量。此外,博弈論也常被用來解決網絡組成和服務分配等問題。LYU等[15]引入聯盟博弈來解決復雜的任務卸載問題,實現納什均衡的解決方案。HAN等針對衛星資源不足的情況[16],以及干擾環境下的部署和組網方法[17],分別提出了基于博弈論的算法進行優化。MI等[18]通過三邊匹配博弈求解衛星接入收益最大化問題。博弈論作為一種分布式決策方法,為無人機群聯盟組網選擇及鏈路重分配問題的解決帶來了啟發。
本文研究了多無人機輔助邊緣卸載場景下的動態組網與鏈路重構聯合策略。首先,搭建了空地協同網絡模型,根據系統能耗最小化的優化目標設計了效用函數,將無人機與地面節點的組網問題表示為聯盟形成博弈,提出了一種基于全局最優的聯盟形成博弈(global optimumcoalition formation game, GOCFG)算法,在降低系統能耗的前提下優化組網方案。其次,在部分聯盟瓦解場景下,將斷聯的地面節點重新尋找并加入幸存聯盟的過程建模為多對一匹配博弈,提出了一種基于效用優先的匹配博弈(utility prioritymatching game, UPMG)算法,在鏈路重構的同時保證最優系統效用。仿真結果表明,本文所提方案比傳統算法有較大的性能提升,能夠有效降低無人機系統能耗,增強系統魯棒性和可靠性。
1系統模型與問題建模
11網絡模型
如圖1所示,本文研究了一個應急情況下多無人機為地面節點提供任務卸載服務的場景。其中,每個無人機上搭載了小型服務器,可以接收并處理來自地面節點緊急繁重的任務,地面節點的集合表示為M={1,2,…,m},無人機集合為N={1,2,…,n}。
為了保持任務的完整性,每個地面節點只能選擇1個合適的無人機進行任務卸載,而每個無人機在最大配額nmax范圍內,可以根據各自偏好選擇與多個地面節點組網聯盟,由此形成多個不重疊的聯盟集合,表示為S={s1,s2,…,sn}。無人機作為聯盟內的簇頭,負責協調聯盟內任務、資源的分配和處理;各個聯盟中的地面節點作為聯盟成員,共享簇頭無人機提供的通信和計算資源。應急場景下執行任務往往充斥著許多不可預見性,例如惡劣天氣或者能量耗盡的發生會導致聯盟的瓦解,為了保證任務能夠順利完成,斷聯節點與幸存無人機應及時重構鏈路,形成新的穩定聯盟S′={s1′,s2′,…,sk′},k≤n。
12通信模型
在笛卡爾坐標系中,將地面節點m與無人機n的坐標分別記為{xm,ym,0}和{xn,yn,h},其中,h為無人機的高度。本文假設任務卸載過程中無人機與地面節點的位置恒定不變,則二者之間的距離為
基于良好的通信條件,無人機與地面節點的通信鏈路視為視距(lineofsight, LoS)信道,則其信道增益可以定義為
式中:ρ0表示參考距離為1 m的信道增益;α為路徑損耗因子。同一聯盟內部的通信鏈路之間不可避免地存在同信道干擾,則同一信道內用戶的干擾總量表示為
式中:pi和gi,n分別表示地面節點i的發射功率和與簇頭無人機間的信道增益。由此,信噪比可表示為
式中:pm表示地面節點m的發射功率;Bn表示無人機n提供的帶寬;η0表示信道噪聲。定義Cm×n為地面節點與無人機聯盟之間的關聯矩陣,其中,cm,n∈{0,1}是該矩陣中第m行第n列的元素,它表示地面節點的任務卸載選擇。cm,n=1表示地面節點m將任務卸載到無人機n上;反之,cm,n=0。因此,每個地面節點到無人機的傳輸速率為
則地面節點m將其任務卸載到無人機n的時間為
因此,無人機n在接收此任務時的懸停能耗為
式中:phover表示無人機單位時間內的懸停能耗。無人機處理任務后將結果傳回地面節點,由于計算結果的大小比原始數據小得多,因此下行鏈路的延遲和能耗可以忽略不計[19]。
13計算模型
不同無人機的計算容量Qn存在一定的差異性,當地面節點m將任務qm卸載到無人機n時,無人機n上邊緣服務器的計算時間可表示為
式中:fn表示無人機的單位計算能力。則無人機n的計算能耗可表示為
式中:pcomp表示機載服務器的單位計算功率。
14問題公式
在本文中,我們的目的是優化無人機與地面節點的組網方案Cm×n,使無人機系統的總能量損耗最小化。無人機的能耗包括升降、飛行、懸停、數據計算與傳輸[20],由于本文研究無人機靜態下的性能,且下行鏈路的時延和能耗忽略不計,則無人機在1個時隙內的能耗只包括懸停和邊緣計算兩部分。因此,優化問題可表述為:
其中:約束(10a)和(10b)表示地面節點采用二進制卸載,并且只能將任務卸載到1個無人機上;約束(10c)表示無人機接納的節點數量不能超過其最大配額;約束(10d)表示所有地面節點卸載至無人機n的任務量總和不能超過該無人機的計算容量;約束(10e)表示無人機n為地面節點分配的帶寬不能超過最大限額。
2博弈建模
每個地面節點可以選擇離開當前的聯盟,而加入1個新的聯盟,從而獲得更優的任務卸載結果;無人機作為聯盟簇頭也可以選擇是否接納該節點,以期達到最低的系統能耗。本文將無人機與地面節點的動態組網過程表述為聯盟形成博弈,如圖2所示。穩定聯盟形成后,無人機在提供服務期間可能會受到能量耗盡、強電磁干擾或是打擊摧毀的問題,簇頭失效從而導致聯盟破裂,其聯盟成員需要重新尋找合適的聯盟加入以重構鏈路。在斷聯節點尋找新聯盟的過程中,幸存聯盟也要以提高系統效用為目標來接納合適的節點,這個過程可以用多對一匹配博弈來表示,如圖3所示。因此P1中的優化問題在上述場景下可以分別建模為聯盟形成博弈和匹配博弈來求解。
21無人機與地面節點的聯盟形成博弈
根據第1章構建的系統模型,本節將無人機與地面節點的動態組網過程表述為聯盟形成博弈,即對于集合S={s1,s2,…,sn},如果同時滿足si,sj∈S,si∩sj=,i≠j且S=∑nk=1sk,則稱集合S為一個互不重疊的聯盟形成。
對于m∈M,給定兩個聯盟si,sj∈S,如m更傾向于成為聯盟si的成員,而不是sj的成員,則m的偏好表示為simsj。每個地面節點m都有自己的聯盟偏好順序,其偏好列表可表示為X={1,2,…,n}。聯盟si中的系統能耗為
當地面節點m從當前聯盟si離開,選擇加入另一個聯盟時,用E(si\m)表示聯盟si失去m后的系統能耗,則其效用定義為
若各地面節點根據傳統的自私準則進行聯盟選擇,即節點m由原聯盟sj離開,選擇加入新的聯盟si時,新聯盟得到m后的系統能耗低于舊聯盟失去m后的系統能耗,則聯盟變更成功。即
其中,每個地面節點m主要關注自身的效用,而不考慮新舊聯盟的當前性能,這樣的選擇很可能會損害聯盟中其他節點的效用。
另外一種帕累托準則定義節點m由原聯盟sj離開,選擇加入新的聯盟si時,新舊聯盟的效用均增加,則聯盟變更成功。即
其中,一旦地面節點m加入1個聯盟,由于聯盟變更的條件十分苛刻,其很難按照帕累托準則再加入1個新的聯盟。
因此,針對聯盟形成博弈問題,傳統的自私準則和帕累托準則并不是最優解決方案,二者表現出兩種極端情況。為了使無人機系統的能耗最小化,本文提出了一種全局最優準則,定義如下:
定義1(全局最優準則)各地面節點根據全局最優準則進行聯盟選擇,若節點m由原聯盟sj離開,選擇加入新的聯盟si時,新舊聯盟的當前系統總效用相比二者的原始系統總效用有所提高,則聯盟變更成功。即
其中,地面節點m不僅要考慮自身,還要從宏觀角度統籌考慮兩個聯盟中其他成員的總效用,從而實現全局最優決策。
定理1(穩定聯盟形成且結果為納什均衡解)根據全局最優準則,當任何節點都不能通過單方面改變聯盟選擇來提高效用時,當前的聯盟形成集合S是穩定的,如式(16)所示,且最終聯盟形成結果為納什均衡解。
式中:s-i表示除聯盟si之外的其他所有聯盟,si′表示節點i變更了聯盟選擇。
證明由于每個地面節點只能選擇1個聯盟加入,即聯盟分區為非重疊聯盟。根據定義1,當聯盟成員進行聯盟選擇時,當且僅當新舊聯盟的當前系統總效用增加時才會發生聯盟變更,因而系統總能耗隨著聯盟成員的策略迭代不斷降低,有限的策略空間會使系統總能耗收斂到最小值,從而證明聯盟形成最終達到穩定狀態。
根據精確勢能博弈理論的定義[21],如果存在博弈模型滿足如下等式,則其為精確勢能博弈。
當地面節點m離開聯盟si加入另一個聯盟si′時,其效用函數變化量為
由于除聯盟si和si′外,其他聯盟的效用并未改變,即
定義勢函數為所有聯盟的系統總能耗:
則勢函數的變化量為
這意味著任何節點m根據全局最優準則進行聯盟變更時,勢函數的變化量與效用函數的變化量相同。因此,該穩定聯盟形成是精確勢能博弈,根據其性質[17],由全局最優準則形成的穩定聯盟結果Cm×nGOCFG即為1個納什均衡解。
22斷聯節點與幸存聯盟的多對一匹配博弈
根據第1章構建的系統模型,本節將斷聯節點與幸存聯盟的鏈路重構過程表述為多對一匹配博弈,即定義1個雙邊匹配建模為Y(m,s,m,s),各元素分別代表博弈雙方和各自的偏好關系,滿足以下條件:
其中,斷聯節點和幸存聯盟的集合分別表示為M={1,2,…,m}和S={s1,s2,…,sn}。條件(22)表示每個地面節點只能選擇1個聯盟接入;條件(23)表示每個聯盟至多選擇nmax個地面節點為其提供服務。
在博弈過程中,匹配雙方為了使自己的利益最大化需要一定的策略,因此它們具有各自的偏好列表。地面節點為了獲得更優的任務卸載質量,偏好能提供更優傳輸速率的聯盟,如式(24)所示;而聯盟在接納斷聯節點時,更加偏好加入后對聯盟系統能耗影響最低的節點,如式(25)所示;效用函數可以表示為系統能耗最小化,如式(26)所示:
在上述多對一匹配模型中,匹配博弈雙方根據決策順序分為申請方與接受方,申請方首先根據自己的偏好列表,依次向接受方提出匹配申請,接受方根據自己的偏好列表對申請方進行排序,在配額范圍內接受附加利益更大的申請者,拒絕其他選擇。經過有限次的雙向選擇,最終可以形成穩定的匹配結果,表示如下:
即對每1個地面節點m,存在1種映射關系C,使得存在1個聯盟s,滿足s=Cm,s(m),即m與s實現匹配選擇。
傳統匹配策略雖然可得到穩定的匹配結果,但它并不一定是最優解。為了解決P1中的系統能耗最小化問題,首先如上式(28)定義系統效用函數,其次優先考慮系統效用在鏈路重構過程中是否優化,提出了基于效用優先的策略,定義如下:
定義2(基于效用優先的策略)在得到穩定的匹配結果之后,不同聯盟間可選擇交換各自的內部匹配節點。如果節點互換聯盟后,得到更高的系統效用U′gt;U,則交換成功;否則,維持原匹配結果。
定理2(匹配結果穩定收斂)經過多次迭代匹配,可以得到穩定的雙邊匹配結果,基于效用優先的博弈策略最終可以得到最優的系統能耗。
證明在每次迭代中,地面節點和聯盟的數量是有限的,所以偏好列表也是有限的,而有限的策略空間可以得到穩定收斂的匹配結果?;谛в脙炏鹊牟┺牟呗灾?,博弈雙方最終均無法通過改變各自策略得到更高的系統效用,因此得到的最終匹配結果Cm×nUPMG是穩定最優解。
3聯盟組網與鏈路重構方案
31GOCFG算法
根據21節中的分析結論,無人機與地面節點的組網問題可建模為聯盟形成博弈。二者之間可以根據各自偏好選擇合適的對象接入,形成多個聯盟分組。組內地面節點將各自的任務數據卸載至簇頭無人機,并通過簇頭無人機實現數據處理與反饋。為了保證任務服務質量和延續性,要盡可能地減少無人機系統的能量損耗。本文提出一種基于全局最優的聯盟形成博弈算法,各無人機根據全局最優準則進行聯盟選擇以提升聯盟效用,在有限的策略空間內,該算法通過迭代優化的方式得到穩定收斂的聯盟形成。具體算法流程如表1所示。
32UPMG算法
穩定的聯盟形成后,無人機的系統能耗通過GOCFG算法可以得到優化。但是一旦某個聯盟被打破,斷聯節點需要重新尋找適合的聯盟接入,而幸存聯盟也會根據各自的偏好接納這些節點。因此,本文提出一種基于效用優先的匹配博弈算法,斷聯節點和幸存聯盟根據22節中定義的策略進行匹配選擇,得到穩定的收斂結果。具體算法流程如表2所示。
輸入:地面節點的當前位置和任務數據量,無人機位置、分配帶寬及計算能力,穩定聯盟矩陣Cm×nGOCFG及瓦解聯盟集合輸出:鏈路重構后的穩定匹配矩陣Cm×nUPMG1)根據傳輸速率大小,構建各斷聯節點對幸存聯盟的偏好列表2)根據節點加入后帶來的系統能耗變化,構建各幸存聯盟針對斷聯節點的偏好列表3)重復下列4)—6)步驟,直到鏈路重構完成,形成穩定收斂的匹配關系4)斷聯節點按照各自的偏好列表向幸存聯盟發起匹配申請5)幸存聯盟按照其偏好列表對收到的匹配申請進行排序,并根據配額容量約束接受最優匹配申請,并拒絕其他申請6)未匹配成功的節點按照偏好順序繼續向列表中的剩余聯盟發起申請,各聯盟按照偏好列表優化匹配選擇7)重復下列8)步驟,直到鏈路重構完成,形成穩定收斂的匹配關系,使得系統能耗最小化8)地面節點和聯盟各自交換匹配對象,若能得到更高的系統效用,則交換匹配;否則不變動
4實驗分析
在本節中,通過Matlab仿真實驗結果驗證了所提方案的有效性能。在仿真中,無人機和地面節點的初始數量分別為4和12個,它們隨機分布在900 m×900 m的任務區域內,主要仿真參數如表3所示。
41聯盟形成性能
在多無人機輔助地面節點進行任務卸載的過程中,以系統能耗最小化為優化目標,博弈雙方通過多次的選擇迭代,最終形成穩定的聯盟組網,如圖4所示。
本文還研究了3種不同聯盟偏好順序下的系統效用表現,包括自私準則、帕累托準則和本文提出的全局最優準則,如圖5所示。自私準則更關注聯盟變更時自身的效用增益,而忽略了對其他聯盟成員的影響。帕累托準則中聯盟的切換受到嚴格的條件約束,使其無法獲得最優的聯盟形成方案。所以從結果可以看出,與基于自私準則和帕累托準則的傳統算法相比,GOCFG算法下聯盟系統能耗隨著迭代次數的增加而降低,并最終收斂,實現系統能耗最小化,驗證了所提出的基于全局最優準則的聯盟形成博弈方案的有效性和優越性。
42鏈路重構性能
聯盟形成穩定后,當某個聯盟的簇頭無人機由于某種原因失效后聯盟瓦解,原聯盟成員為了完成既定任務需要盡快自組織尋找加入新的聯盟,無人機的配額同步增大。通過基于效用優先的匹配博弈算法,斷聯節點與幸存聯盟以分布式的方式,按照各自的偏好列表經過雙邊多對一匹配博弈重建鏈路,得到穩定的匹配結果。圖6展示了聯盟瓦解后鏈路重構形成穩定的結果。
為了驗證所提出UPMG算法的有效性,本文將其與兩種傳統方案進行對比,包括隨機接入(random access, RA)算法和最短距離接入(minimum distance access, MDA)算法。在RA方案中,斷聯節點隨機連接到幸存聯盟,不考慮信道增益和聯盟內部干擾因素。在MDA方案中,斷聯節點只根據通信距離優先原則,距離越近的簇頭無人機享有更高的匹配偏好。圖7顯示了該情況下3種算法的性能對比,其中UPMG方案的系統能耗隨迭代次數的增加而逐漸減小,最終穩定收斂,且明顯優于其他方案。所提出方案能夠兼顧地面節點和無人機的通信需求,有效降低無人機系統的能耗,同時在聯盟瓦解后可以迅速完成鏈路重構,增強了系統魯棒性和可靠性。
此外,本文還比較了在無人機不同配額容量下3種算法的性能表現,如圖8所示。在無人機最大可接納的地面節點數量分別為4、5、6、7的場景下,系統總能耗隨著配額數量的增加而減少。由于配額增大時無人機的選擇范圍也變大,根據本文定義2所提出的基于效用優先的匹配策略,地面節點的交換動作空間增大,因此系統能耗會隨之降低。
5結論
我們研究了應急場景下無人機與地面節點的動態組網和鏈路重構方案。首先,將組網過程建模為聯盟形成博弈,提出了一種GOCFG算法來降低聯盟系統能耗。其次,將鏈路重構過程表述為多對一匹配博弈,提出了一種UPMG算法,在提升系統效用的同時增強了聯盟的魯棒性。仿真結果表明,所提方案能夠形成穩定的聯盟組網,具備及時重構鏈路能力,并且比傳統方法具有更優性能表現。在未來的工作中,我們將探索高維動態場景下無人機集群的智能優化策略,引入多智能體強化學習與多目標優化方法,以解決多無人機的軌跡優化、資源分配等關鍵問題,為緊急復雜場景下無人機群的研究提供有力支持,提高實際應用價值。
參考文獻:
[1]YILMAZ S S, BERNA O. Multihelper NOMA for cooperative mobile edge computing[J]. IEEE Transactions on Intelligent Transportation Systems, 2022, 23(7): 98199828.
[2] DJIGAL H, XU J, LIU L, et al. Machine and deep learning for resource allocation in multiaccess edge computing: a survey[J]. IEEE Communications Surveys and Tutorials, 2022, 24(4): 24492494.
[3] AUNG P S, NGUYEN L X, TUN Y K, et al. Aerial STARRIS empowered MEC: a DRL approach for energy minimization[J]. IEEE Wireless Communications Letters, 2024, 13(5): 14091413.
[4] PANDA K G, WILSON A, SEN D. Energyefficient initial deployment and MLbased postdeployment strategy for UAV network with guaranteed QoS[J]. IEEE Transactions on Aerospace and Electronic Systems, 2022, 58(6): 52205239.
[5] XIE Z G, SONG X, CAO J, et al. Providing aerial MEC service in areas without infrastructure: a tetheredUAVbased energyefficient task scheduling framework[J]. IEEE Internet of Things Journal, 2022, 9(24): 2522325236.
[6] YANG B, CAO X L, YUEN C, et al. Offloading optimization in edge computing for deeplearningenabled target tracking by internet of UAVs[J]. IEEE Internet of Things Journal, 2021, 8(12): 98789893.
[7] MAO W H, XIONG K, LU Y, et al. Energy consumption minimization in secure multiantenna UAVassisted MEC networks with channel uncertainty[J]. IEEE Transactions on Wireless Communications, 2023, 22(11): 71857200.
[8] KUANG Z F, PAN Y H, YANG F, et al. Joint task offloading scheduling and resource allocation in airground cooperation UAVenabled mobile edge computing[J]. IEEE Transactions on Vehicular Technology, 2024, 73(4): 57965807.
[9] CHIGULLAPALLY S, MURTHY C S R. Joint energy and throughput optimization for MECenabled multiUAV IoRT networks[J]. Computer Communications, 2023, 201: 119.
[10]游文靜,董超,吳啟暉.大規模無人機自組網分層體系架構研究綜述[J].計算機科學,2020,47(9):226231.
[11]WANG H J, JIANG B, ZHAO H T, et al. Joint resource allocation on slot, space and power towards concurrent transmissions in UAV Ad Hoc Networks[J]. IEEE Transactions on Wireless Communications, 2022, 21(10): 86988712.
[12]DUAN X T, ZHAO Y H, TIAN D X, et al. Joint communication and control optimization of a UAVassisted multivehicle platooning system in uncertain communication environment[J]. IEEE Transactions on Vehicular Technology, 2024, 73(3): 31773190.
[13]WEI X, YANG H, HUANG W T. Lowdelay routing scheme for UAV communications in smart cities[J]. IEEE Internet of Things Journal, 2023, 10(21): 1883718843.
[14]CALVOFULLANA M, GERASIMENKO M, MOX D, et al. A networked multiagent system for mobile wireless infrastructure on demand[J]. IEEE Transactions on Robotics, 2024, 40: 45984614.
[15]LYU T, XU H T, LIU F F, et al. Computing offloading and resource allocation of NOMAbased UAV emergency communication in marine internet of things[J]. IEEE Internet of Things Journal, 2024, 11(9): 1557115586.
[16]HAN C, LIU A J, HUO L Y, et al. Distributed resource management framework for IoS against malicious jamming[J]. IEEE Transactions on Communications, 2021, 69(12): 82718286.
[17]韓晨,劉愛軍,安康,等.干擾環境下基于博弈論的無人機群部署與組網方法[J].電子與信息學報,2022,44(3):860870.
[18]MI X R, SONG Y B, YANG C G, et al. MAGIC: matching gamebased resource allocation with incomplete information in space communication network[J]. IEEE Transactions on Communications, 2024, 72(6): 34813494.
[19]吳文嬌,郭榮佐,樊相奎.基于DRL的無人機輔助MEC任務卸載算法[J].計算機工程與設計,2024,45(9):26972703.
[20]JIA Z Y, SHENG M, LI J D, et al. LEOsatelliteassisted UAV: joint trajectory and data collection for internet of remote things in 6G aerial access networks[J]. IEEE Internet of Things Journal, 2021, 8(12): 98149826.
[21]LIN X, LIU A J, HAN C, et al. LEO satellite and UAVs assisted mobile edge computing for tactical AdHoc Network: a game theory approach[J]. IEEE Internet of Things Journal, 2023, 10(23): 2056020573.
(責任編輯:曾晶)
文章編號10005269(2025)02008909
DOI:10.15958/j.cnki.gdxbzrb.2025.02.11
收稿日期:20241101
基金項目:國家自然科學基金資助項目(61871464);莆田學院科研項目(2023039)
作者簡介:徐銳睿(1995—),男,助理實驗師,在讀碩士,研究方向:博弈論與強化學習,Email:xurr@ptu.edu.cn.
*通訊作者:曾志強,Email:zqzeng@xmut.edu.cn.
Abstract:
To address the energy constraint issues in scenarios with multiUAVassisted edge offloading, the author proposes a dynamic networking scheme based on game theory between UAVs and ground nodes, aiming to optimize energy consumption of UAV systems. First, a network model is established where UAVs provide task offloading services to ground nodes. A global optimumcoalition formation game (GOCFG) algorithm is proposed, which minimizes the energy consumption of the UAV system by optimizing the coalition networking scheme, then the existence of Nash equilibrium is proved. Second, in the case of coalition collapse, the problem of reconstructing the links between disconnected nodes and surviving coalitions is modeled as a manytoone matching game. A utility prioritymatching game (UPMG) algorithm is proposed, which enhances the system utility and demonstrates the convergence of the algorithm. Finally, compared with traditional algorithms, the simulation results verify that the proposed scheme can form a stable coalition networking, has the capability to reconstruct links in a timely manner, and exhibits superior performance in reducing system energy consumption, hence improving system robustness. All this provides a strong support for the application research of UAV swarms in emergency and complex scenarios.