?
車聯網環境下基于時空類大數據分析的聯盟博弈
車聯網環境下,車輛、傳感器及執行器等收到的信息有著容量大、變化多、速度快等特點,使得傳遞的信息具有時空特性。因此,數據的成功傳遞大部分依賴中繼節點的行為表現。采用合作和非合作貝葉斯聯盟博弈(BCGs)和自動學習機(LA)來分析中繼節點的行為表現。其中,LA安裝在每個車輛上充當博弈者。最初,每個博弈者任意從策略空間選擇某一策略,且任意策略的選擇概率相同。隨著博弈的進行,博弈者會繼續運動(前進、后退或保持不動)。每個自動學習機都定義了3個屬性Cid、V和PU。Cid是聯盟的id,V是由貝葉斯定理確定的條件概率,PU是博弈者使用的支付工具。
合作/非合作聯盟算法是每個博弈者選擇合作或非合作策略。博弈中,用有向非循環圖(ADG)來代表博弈者及博弈者與其它博弈者的關系。每個博弈者的屬性都搭配ADG邊緣,且支付工具由公式計算。支付工具會根據合作和非合作策略的選擇來進行調節。兩種情況下,如果支付比率小于設定的門限值,則博弈者得到獎勵;否則得到處罰。支付工具由此不斷更新。最后,計算出每位博弈者的獎勵和懲罰數量比。篩選出比值最大的那個策略,這有助于建立納什均衡。
合作模式的分析。在使用合作路徑時,每個博弈者共享獎勵和控制策略,從而形成聯盟。基于其它博弈者獲取的信息,每個博弈者選擇控制策略。每個博弈者信息的交換取決于信息傳遞到車輛的概率時間和在中繼節點等待的概率時間。這些概率通過單位時間內成功傳遞的信息占總發送信息的比值來計算得到。
非合作模式的分析。在非合作模式下,每個博弈者的策略目的是,根據置信概率和其它博弈者與行為概率向量有關的策略來獲取PU的最大值。置信度是使用各種動作執行的條件概率來表示的。每個博弈者通過使用貝葉斯定理和其它博弈者行為表現來不斷更新置信度。在所提出的方案里,可以通過使用置信概率來獲得多納什均衡點,這些點可以控制3種信息的中轉傳遞。仿真結果表明,相比空間知識不完整策略,憑借空間知識完整的策略獲得納什均衡點的概率就會增加,而且吞吐量也會增加;所提出的方案在節點行為、商榷時間、學習率和行為數量等方面有較好的表現。
刊名:IEEE Internet of Things Journal(英)
刊期:2013年
作者:Neeraj Kumar et al
編譯:謝秀磊