王燕飛
(吉林化工學院 理學院,吉林 132022)
(Be-Nb)模型下的二行動線性決策的抽樣信息期望值
王燕飛
(吉林化工學院 理學院,吉林 132022)
二行動線性決策問題是一類比較普遍的決策問題。文章討論了兩類貝塔分布共軛于負二項分布的決策模型下的二行動線性決策問題的抽樣信息期望值的計算定理。
(Be-Nb)模型;二行動線性決策;抽樣信息期望值;完全信息
在企業經營過程中,做出有利于提高經濟效益的決策對于企業的發展是至關重要的,甚至關及生死存亡。二行動線性決策問題是最為常見的決策問題。對于決策者來說,通過抽樣等手段,可以獲得信息以接近完全信息,從而選取最優決策,獲得最大利益。但抽樣耗時、費力,那么我們有必要推斷抽樣的價值,即抽樣信息期望值(EVSI)。就此問題,文獻[1][2]研究了正態分布共軛于正態分布決策模型下的。文獻[3]討論了分布共軛于普哇松分布模型下的。文獻[4]給出了倒分布共軛于指數分布模型下的EVSI。文獻[5]得出了倒分布共軛于分布模型下的。文獻[6]得出了貝塔分布共軛于幾何分布模型下的。負二項分布又名帕斯卡(Pascal)分布,應用廣泛。比如醫學中的聚集性疾病,保險精算中的非同質性人群的索賠次數,可靠性分析中的導彈飛行試驗數量等,均服從負二項分布,具有一定的研究價值。事實上,幾何分布是負二項分布的特例。本文介紹了對于文獻[6]中更一般的情況,研究了在二行動線性決策問題中,兩類貝塔分布共軛于負二項分布的決策模型(即(Be-Nb)模型Ⅰ和(Be-Nb)模型Ⅱ)下的的計算定理。
二行動線性決策模型,即行動a只有二個:a1,a2;狀態θ可以是離散或者連續的;收益函數對每個行動都是狀態參數的線性函數。即收益函數


不妨設 m1>m2,b1 利用收益函數分別計算a1,a2的先驗期望收益值,由平衡點(2),得: E1-E2=(m1-m2)(Eθ-θ0),根據先驗期望準則,由 m1>m2,有: (1)當 Eθ≤θ0時,a2為最優行動;(2)當 Eθ>θ0時,a1為最優行動。 (3) 由公式,ai的損失函數 L(θ,ai)=maxQ(θ,a)-Q(θ,ai)及(2),有: a 抽樣信息期望值為先驗與后驗期望值的差。 其中,a'為先驗期望準則下的最優行動,δ'(x)為后驗期望準則下的最優決策函數。L為損失函數,由此可見,EVSI是在抽樣前后使用最優行動(或最優決策函數)而使決策者蒙受期望損失的減少量或者由于抽樣給決策者帶來的增益。即抽樣帶給決策者的價值。 負二項分布有兩種形式:設伯努力試驗中,θ為每次試驗成功的概率。 (Ⅰ)X 為恰好成功 r次時的試驗總數,則 P(X=x|θ)=θr(1-θ)x-r,(x=r,r+1,…); (Ⅱ)X 為 r次成功前失敗的次數,則 P(X=x|θ)=θr(1-θ)x,(x=0,1,2,…)。 我們將其分別記為 Nb(r,θ)Ⅰ型和 Nb(r,θ)Ⅱ型。 相應的決策模型記為(Be-Nb)模型Ⅰ和(Be-Nb)模型Ⅱ。下面我們只討論第一種形式,對于第二種形式同理可得。 (Be-Nb)模型Ⅰ:設總體X服從負二項分布Nb(r,θ)Ⅰ型,即 P(X=x|θ)=θr(1-θ)x-r,(x=r,r+1,…)。 θ 的共軛先驗分布為Be(α,β)。 2.2 (Be-Nb)模型Ⅰ下的先驗 EVPI=EθL(θ,a'),其中 a'為先驗期望準則下的最優行動 (1)最優決策函數δ'(x) 利用收益函數(1)分別計算a1,a2的后驗期望收益值,及式(2),有:-=(m1-m2)(E(θ|t)-θ0)。 根據后驗期望準則,由m1>m2,得:(1)當 E(θ|t)≤θ0時,a2為最優行動;(2)當 E(θ|t)>θ0時,a為最優行動。E(θ|x)==θ0時,a1與 a2等效。 故取x0=-α-β,其作用等同于平衡點。 (2)后驗 EVPI=E(θ|x)L(θ,δ'(x))。 求法同先驗 EVPI,得: ②當x>x0時,a1為最優行動, (3)后驗 EVPI期望值 由(11),(12)和(8),用 m(x)對后驗 EVPI求期望,得: 綜上,后驗 EVPI期望值 定理1 (Be-Nb)模型Ⅰ下的二行動線性決策問題的EVSI 在(Be-Nb)模型Ⅰ下,根據公式(6),由(9),(10),(13)及平衡點(2),有: 特別地:當r=1時,負二項分布Nb(r,θ)即為幾何分布G(r,θ)。此時即為文獻[6]中所述的(Be-G)模型下的二行動線性決策問題的EVSI。 定理2 (Be-Nb)模型Ⅱ下的二行動線性決策問題的EVSI在(Be-Nb)模型Ⅱ下,方法同定理1,可得到類似結論。 [1]侯文超.經營管理決策分析[M].北京:高等教育出版社,1987. [2]張雪野.經營決策方法[M].上海:華東師范大學出版社,1996. [3]許麗梅,曾林蕊.(Γ-Ρ)模型下二行動線性決策問題的抽樣信息期望值[J].應用概率統計,2003,(2). [4]王燕飛,宋立新.(IGa-Exp)模型下二行動線性決策問題的抽樣信息期望值[J].運籌于管理,2006,(5). [5]李晶,宋立新.(IGa-Ga)模型下二行動線性決策問題的抽樣信息期望值[J].統計與決策,2007,(21). [6]陳永勝,李晶.(Be-G)模型下二行動線性決策問題的抽樣信息期望值[J].河北大學學報,2009,(3). [7]茆詩松.貝葉斯統計[M].北京:中國統計出版社,1999. [8]Berger.A.Statistical Decision Theory and Baysian Analysis(2ndEdition)[M].New York:Springer-Verlag,1985. O212 A 1002-6487(2011)03-0165-02 王燕飛(1981-),女,吉林四平人,碩士研究生,講師,研究方向:統計學。 (責任編輯/亦 民)
2 (Be-N b)模型下的EVSI的理論分析
2.1 抽樣信息期望值(EVSI)

2.2 (Be-Nb)模型




2.3(Be-Nb)模型Ⅰ下的后驗EVPI期望值






3 結論