鄭惠丹 趙昕波 張孟浩 孔 嬋 鮮沐希
(河北建筑工程學院,河北 張家口 075000)
供熱價格是在政府的主持下,供熱企業與熱用戶代表通過協商制定的。由于熱用戶對供熱企業的產熱成本不明朗,而熱力公司對熱用戶愿意付出的供熱費用也不清晰,導致協商過程常常處于僵持狀態。從政府的角度看,要想控制好協商過程,使供熱企業與熱用戶雙方效用達到最高,必須對最后的制定價格有一個大致的估算范圍。本文利用雙邊貝葉斯動態博弈模型,提出一種解決此類問題的方法。
熱價的制定過程并不是一蹴而就的。通常供熱公司與熱用戶都會有各自的保留價格,而雙方并不知道對方的保留價格,兩者通過相互協商,相互博弈,最終得出一個彼此滿意的價格。本文用pc表示供熱公司所能接受的最低熱價,即供熱公司的保留價格;用ph表示熱用戶愿意付出的最高熱價,即熱用戶的保留價格。當供熱價格pl滿足條件pc≤pl≤ph時,雙方可以達成協議,否則只能再次進行協商。在實際報價時,熱用戶會提出比ph低很多的價格,供熱公司則會提出比pc高很多的價格。
該模型中兩位博弈的參與者是學習者,他們根據以往經驗對對方的保留價格有一個預判。并且在相互博弈過程中,要根據對方所提供的報價信息進行學習,進而更新自己的決策。
該模型有五個要素:1)學習對象:熱力公司的學習對象是熱用戶的保留價格,熱用戶的學習對象是熱力公司的保留價格;2)先驗概率:熱力公司的先驗概率是他對熱用戶保留價格的概率分布值的預判,熱用戶的先驗概率是他對熱力公司保留價格的概率分布值的預判;3)貝葉斯信念:指熱力公司或者熱用戶對對方的報價策略的判斷;4)條件概率:指熱力公司或者熱用戶根據貝葉斯信念以及所獲得的對方的報價信息進行分析,得出對方在各種可能的保留價格條件下報得相應價格的概率;5)后驗概率:熱力公司或者熱用戶根據已經獲得的先驗知識及條件概率利用貝葉斯公式計算得到的概率,可以作為下一輪判斷的條件概率。
貝葉斯公式可以定義為:
其中,事件Hi為與事件e相關的n個事件;P(Hi)為事件Hi的先驗概率;P(e/Hi)為條件概率;P(Hi/e)為后驗概率。
1)假設熱力公司首先根據熱用戶的先驗概率進行報價,則其價格為:

2)熱用戶獲得熱力公司的報價后與自己的保留價格進行比較,如果小于自己的保留價格,則終止協商過程,否則,熱用戶要根據熱力公司提供的價格及貝葉斯信念進行學習,利用貝葉斯公式提供新的報價。
3)熱用戶根據熱力公司保留價格的分布概率進行報價,其計算式為:
與初次報價不同的是,熱用戶是對熱力公司的報價情況進行了學習,再做的決策,該決策獲得的信息更充分,決策對博弈雙方都是更好的選擇。
4)若熱用戶的報價低于熱力公司的保留價格,則博弈停止,否則,博弈繼續。以此類推。
則熱力公司的第k次后驗概率為:
熱力公司的第k次報價為:
熱用戶的第k次后驗概率為:
熱用戶的第k次報價為:
直到最后的報價pl滿足條件pc≤pl≤ph時,博弈終止。
假設普通住宅所能接受的最高單位面積的熱價為7.9元/m2,熱力公司所能接受的最低單位面積熱價為6.8元/m2。雙方在政府的主持下進行談判。

表1 第一次、第二次報價情況

表2 第三次報價情況
2)假如雙方不進行貝葉斯學習,假設熱力公司第一次報價為9元,每次博弈失敗后降價5%,熱用戶第一次報價為6元,每次博弈失敗后加價5%,則經過8次報價后達成協議,協議價格為6.946元/m2。
3)利用共用效用函數計算兩種方法所產生的效用:
如果雙方進行貝葉斯學習,效用值為0.23,如果雙方不進行貝葉斯學習,效用值為0.12。
通過以上案例分析可以看出,熱力公司及熱用戶進行貝葉斯學習可以使協商效率得到有效提升,同時也可以提升雙方的效用。