999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于決策樹方法的信息價值求解方法

2010-10-18 10:31:44王蕾房俊民
統(tǒng)計與決策 2010年22期
關鍵詞:價值信息方法

王蕾,房俊民

(中國科學院國家科學圖書館成都分館,成都610021)

基于決策樹方法的信息價值求解方法

王蕾,房俊民

(中國科學院國家科學圖書館成都分館,成都610021)

傳統(tǒng)的信息價值求解方法在行動選擇或實驗結果情況很多的情況下,步驟繁瑣,計算量大,引起眾多麻煩。而決策樹方法是輔助行動選擇的重要參考,并且在excel的宏工具容易求解。文章用決策樹的思路和方法求解決策問題中的信息價值,給出了方法合理性的證明,并結合實例演示了求解方法。

信息價值;決策樹;決策分析;貝葉斯分析

1 信息的期望價值求解

1.1 信息價值的概念

在決策過程中,可以通過隨機試驗獲得觀察值x,去改進決策人設定的自然狀態(tài)θ的先驗概率π(θ),從而減少期望損失。但是由于隨機試驗或高或低,所以通常試驗前要考慮試驗的成本與價值。如果通過試驗收集到的新信息所降低的損失還不足以支付試驗費用,則試驗不值得進行,反之,隨機試驗才算獲得額外價值。這種在決策中進行隨機實驗帶來的額外收益(也就是期望損失的減少)稱為信息價值[1]。

1.2 完全信息的期望價值

所謂完全信息的期望價值是指在理想情況下,通過試驗能夠獲得自然狀態(tài)θ的完全信息,那么決策人就可以事先知道狀體θ的確切值,進而根據(jù)這種狀態(tài)來選擇似的損失最小的行動。完全信息的期望價值就是這種獲得自然狀態(tài)完全信息的隨機試驗帶來的期望損失減少量。

1.3 采樣信息的期望價值

因為完全信息的情況幾乎不能實現(xiàn),那么也無法根據(jù)完全信息帶來的價值來評估隨機試驗的效果。所以在一般決策過程中,我們只考慮采樣信息價值。采樣信息價值是通過試驗收集新信息來指導決策后,期望損失比采樣之前的期望損失的減少量。

1.4 傳統(tǒng)采樣信息的期望價值求法

傳統(tǒng)的采樣信息價值求解中,需要先計算采樣之前的貝葉斯風險的期望值:。具體而言,就是在不進行隨機試驗的情況下,僅僅依據(jù)未來狀態(tài)的先驗概率分布,求解每種行動帶來的期望損失Eπ[l(θ,a)]。之后在所有行動的后果的期望損失中取最小值,此時的ai作為行動方案,此時的期望損失作為不進行隨機試驗的期望損失。

1.5 基于決策樹的采樣信息的期望價值求法

但是傳統(tǒng)方法求解,需要根據(jù)不同的貝葉斯規(guī)則分別計算期望損失,當實驗結果較多或者行動選擇較多的情況下,規(guī)則十分多,計算量大,步驟繁瑣重復,帶來眾多麻煩。所以需要尋求快速準確的方法來計算信息價值。

根據(jù)貝葉斯分析的第二擴展型得到,在進行隨機試驗之后,最佳決策規(guī)則應該是等價于對應每一種x∈X,選擇一個a,使得積分r’’=∑l(θ,δ(x))π(θ|x)達到為極小,就能得葉斯葉斯規(guī)則。所對應的a也就是最佳行動的決策方案,得到的Eπ,所以我們在求解時候只需要針對每一個x∈X,選擇最佳行動ai,得到的規(guī)則就是最佳規(guī)則δi(x)——貝葉斯規(guī)則。

這種最佳規(guī)則的決策,與決策樹的思想一致,即在excel的宏treeplan中,選擇決策樹終端為每個分支行動或狀態(tài)對應的損失值(默認終端為求和,此處可以修改為相應損失函數(shù)),每個決策節(jié)點選擇較小的分支作為行動。這樣自動選擇了貝葉斯規(guī)則中對每種實驗結果得到的最佳行動。

這樣在每個決策分支都存在此分支下的期望損失,為了用決策樹計算信息價值,就不要將進行試驗預測的費用寫入決策樹中成本的部分,而是單純計算進行預測和不預測的兩種情況下的各分支期望損失。這樣構造的決策樹在是否進行預測的分支上得出的期望值就是進行預測和不進行預測兩種情況下的期望損失。最后在excel表格中任意空白表格計算進行預測和不進行預測的期望損失之差,就是此預測信息的價值。將得到的信息價值與試驗成本做比較,可以判斷是否進行試驗預測。

2 基于決策樹的信息價值求法實例

2.1 實例

舉個案例說明:某農(nóng)民擬在兩種作物中選擇一種。若旱年θ1占60%,正常年景θ2占40%;種植耐旱作物a1以及不種植耐旱作物a2的后果矩陣如表1所示(單位:萬元)。

表1

設該農(nóng)民的效用函數(shù)為μ(y)=1.156(1-e-0.02y(單位:萬元),并且如果存在天氣預報,并且天氣預報的準確性為0.8,請問農(nóng)民應該采取什么樣的行動,天氣預報的信息價值是多少?

2.2 后驗概率求解

因為天氣預報的準確性為0.8,設x1為預報為旱年,x2為預報為正常年景,P(θ1)=0.6,P(θ2)=0.4。所以P(x1|θ1)= 0.8,P(x2|θ1)=0.2,P(x1|θ2)=0.2,P(x2|θ2)=0.8

得到預報旱災概率P(x1)=P(x1|θ1)P(θ1)+P(x1|θ2)P(θ2)=0.48+0.08=0.56

預報正常年景概率P(x2)=P(x2|θ1)P(θ1)+P(x2|θ2)P(θ2)=0.12+0.32=0.44

得到各種可能的后驗概率為:

預報旱災,發(fā)生旱災概率為π(θ1|x1)=P(x1|θ1)P(θ1)/P(x1)=0.48/0.56=0.857143

預報旱災,正常年景概率為π(θ2|x1)=P(x1|θ2)P(θ2)/P(x1)=0.08/0.56=0.142857

預報正常年景,發(fā)生旱災的概率π(θ1|x2)=P(x2|θ1)P(θ1)/ P(x2)=0.12/0.44=0.2727273

預報正常年景,正常年景的概率π(θ2|x2)=P(x2|θ2)P(θ2)/ P(x2)=0.32/0.44=0.7272727

令損失函數(shù)l(y)=-u(y)

2.3 正規(guī)貝葉斯分析的方法求解

進行正規(guī)性貝葉斯分析,對以下四種策略進行比較:

策略1:收聽天氣預報,若預報旱災則種植耐旱作物,預報正常則種植非耐旱作物。

期望損失為r(π,δ1)=πx1*(π(θ1|x1)*l(a1|θ1)+π(θ2|x1)*l (a1|θ2))+πx2(π(θ1|x2)*l(a2|θ1)+π(θ2|x2)*l(a2|θ2)=0.86*(-0.38) +0.14*(-0.81)+0.27*0+.73*(-1)=-0.57

策略2:收聽天氣預報,若預報旱災則種植不耐旱作物,預報正常則種植耐旱作物期望損失為r(π,δ2)=πx1*(π(θ1|x1) *l(a2|θ1)+π(θ2|x1)*l(a2|θ2))+πx2(π(θ1|x2)*l(a1|θ1)+π(θ2|x2)*l (a1|θ2)=0.56*(0.86*0+0.14*(-1))+0.44*(0.27*(-0.38)+ 0.73*(-0.81))=22-0.38

策略3:忽略天氣預報,不論預報是否旱災,都種植耐旱作物期望損失為r(π,δ3)=Pθ1*l(a1|θ1)+Pθ2*l(a1|θ2) =-0.55

策略4:忽略天氣預報,不論預報是否旱災,都種植不耐旱作物期望損失為r(π,δ4)=Pθ1*l(a2|θ1)+Pθ2*l(a2| θ2)=-0.40

四種策略比較得到r(π,δ1)

所以行動方案一為最佳規(guī)則,即天氣預報預報旱災則種植耐旱作物,預報正常則種不耐旱作物。信息價值

此方法在此例中需要計算四種策略中的期望損失,步驟重復,較為麻煩,如果行動選擇更大,隨機試驗結果更多,策略數(shù)量過多不易窮舉,計算量也將十分大。

2.4 決策樹方法求解信息價值

不考慮天氣預報的成本前提下,不在決策樹中進行預測的成本,并且在決策樹分支末端輸入損失函數(shù)l(y)=-μ(y)=-1.156(1-e-0.02y),并在末端單元格的右側輸入效用函數(shù)和收益。構造決策樹如下,用于比較農(nóng)民是否收聽天氣預報和采取不同策略的后果。

按照上文所述的決策樹方法,決策點1的兩分支的期望損失就分別為收聽天氣預報和不收聽天氣預報的期望損失,二者之差就是天氣預報的信息價值。

這種方法的原理很容易理解,一句話概括就是決策樹的決策選擇方式恰好符合決策問題的貝葉斯規(guī)則。直觀上來看,決策樹在每個決策節(jié)點都選擇在不同未來狀態(tài)下的期望損失最小值,這個思路正與貝葉斯分析第二種擴展型完全符合。決策樹根據(jù)試驗的每種結果,都相應采取是的期望損失最小的行動,那么這種決策規(guī)則就是最佳決策規(guī)則,此時的貝葉斯風險為極小。也等價于取達到為極小,就能得到貝葉斯規(guī)則正規(guī)性中采取不同決策規(guī)則中得到的期望損失極小值而上圖決策樹中決策節(jié)點1的的上面分支,求出了進行預報后的貝葉斯風險最小值;下面一支中,恰好求出了不進行試驗的貝葉斯損失最小值。所以二者的差值就是信息價值。

3 關于決策樹方法的思考

正如前文所述,決策樹方法之所以可以十分方便地求解信息價值,是因為決策樹的判斷規(guī)則與貝葉斯分析的第二種擴展型一致。那么我們就用應用第二種擴展型求解此實例,并與決策樹方法比較。

A:當取x1(預報旱災)

采取行動a1:r1’’=l(θ1,a1)π(θ1|x1)+l(θ2,a1)π(θ2|x1) =(-0.38)*0.86+(-0.81)*0.14=-0.4402

采取行動a2:r2’’=l(θ1,a2)π(θ1|x1)+l(θ2,a2)π(θ2|x1) =(0)*0.86+(-1)*0.14=-0.14

采取行動a1

B:當取x2(預報正常)

采取行動a1:r3’’=1(θ1,a1)π(θ1|x2)+l(θ2,a1)π(θ2|x2)=-0.69

采取行動a2:r4’’=l(θ1,a2)π(θ1|x2)+l(θ2,a2)π(θ2|x2)=-0.73

所以采取行動a2

所以貝葉斯規(guī)則δπ:a1=δπ(x1),a2=δπ(x2)

這里面不同決策的期望損失恰好與下圖決策樹分支的四種情況完全一致。可見決策樹方法與貝葉斯分析第二種擴展型的思路的一致。

4 結論

傳統(tǒng)信息價值的求法公式復雜、計算費時,而決策樹是求解效用問題的實用方法,因此用決策樹方法求解信息價值,在excel中自動計算,具有應用意義。在計算中,只需確定要求解哪項信息的價值,并求出各種情況的后驗概率,進而構造決策樹,就可十分方便地計算出決策問題中的信息價值。所有計算都可由excel自動完成,沒有重復步驟。在處理行動選擇很多、實驗結果很多的實際問題中,仍可以很好的應用。

[1]岳超源.決策理論與方法[M].北京:科學出版社,2006.

[2]王宏.基于屬性約簡的決策樹構建[J].統(tǒng)計與決策,2006,(7).

[3]孟飛翔,帥立國,姜昌金.決策樹在客戶價值分析中的應用[J].計算機技術與發(fā)展,2007,(7).

[4]Quinlan J R.Induction of Decision Trees[J].Machine Learning,1986, (4).

(責任編輯/亦民)

F224

A

1002-6487(2010)22-0054-03

猜你喜歡
價值信息方法
訂閱信息
中華手工(2017年2期)2017-06-06 23:00:31
一粒米的價值
“給”的價值
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
捕魚
展會信息
中外會展(2014年4期)2014-11-27 07:46:46
健康信息
祝您健康(1987年3期)1987-12-30 09:52:32
健康信息(九則)
祝您健康(1987年2期)1987-12-30 09:52:28
主站蜘蛛池模板: 国产精品第页| 中文字幕av一区二区三区欲色| 国产成人1024精品下载| 成人国产小视频| 亚洲国产精品日韩欧美一区| 亚洲日本中文综合在线| 国产成人精品日本亚洲| 亚洲精品无码久久久久苍井空| 国产一区二区丝袜高跟鞋| 成人第一页| 亚洲无卡视频| 日韩大乳视频中文字幕| 114级毛片免费观看| 波多野结衣久久精品| 精品無碼一區在線觀看 | 人妻少妇久久久久久97人妻| 伊人成人在线| 国产精品任我爽爆在线播放6080| 91小视频在线观看免费版高清| 香蕉蕉亚亚洲aav综合| 国产91特黄特色A级毛片| 亚洲美女高潮久久久久久久| 亚洲综合激情另类专区| 亚洲女同一区二区| 免费在线看黄网址| 亚洲日韩AV无码精品| 国产资源站| 国产视频你懂得| 中文国产成人久久精品小说| 亚洲欧美日韩中文字幕在线| 无码国产伊人| 久久精品视频一| 亚洲69视频| 99精品国产高清一区二区| 3344在线观看无码| 最新无码专区超级碰碰碰| 婷婷综合缴情亚洲五月伊| 日本黄色不卡视频| 日韩黄色大片免费看| 91破解版在线亚洲| 99re经典视频在线| 原味小视频在线www国产| 国产免费一级精品视频| 欧美日本不卡| 三区在线视频| 日本免费一级视频| 国产成人精品在线1区| 波多野结衣亚洲一区| 国产成人无码久久久久毛片| 国语少妇高潮| 日韩av手机在线| 欧美激情视频二区| 在线免费无码视频| 蜜臀AV在线播放| 日韩亚洲综合在线| 波多野结衣中文字幕久久| 麻豆国产在线观看一区二区| 激情六月丁香婷婷| www.91中文字幕| 国产色网站| 久久无码av一区二区三区| 99re视频在线| 日韩国产一区二区三区无码| 国产乱人视频免费观看| 91在线丝袜| 国产一区二区三区在线观看视频 | 黄片一区二区三区| 久久人搡人人玩人妻精品一| 亚洲人成影院在线观看| AV网站中文| 亚洲欧美日韩中文字幕一区二区三区 | 美女一区二区在线观看| 亚洲一区二区三区在线视频| 91成人试看福利体验区| 国产欧美日韩精品综合在线| 欧美日韩在线成人| 色男人的天堂久久综合| 亚洲高清中文字幕在线看不卡| 波多野结衣中文字幕久久| 五月婷婷综合在线视频| 亚洲久悠悠色悠在线播放| 免费无码又爽又黄又刺激网站|