何楠 韓瑞 魏含笑
摘要:多屬性決策一直是管理科學領域中的一個難題,現有的理論針對這個問題給出了很多方案優選的方法和模型,但均有各自的優勢與不足。多屬性決策的難點在于難以明晰多屬性決策中各個屬性的量化指標與決策方案的優劣的非線性關聯,而神經網絡的擬合能力與泛化能力決定了其在多屬性決策中廣闊的應用前景。將可拓理論的相關思想作為基礎,創造性地對多屬性決策矩陣進行處理從而構建出徑向基函數(Radial Basis Function,RBF)網絡模型的學習樣本,結合RBF網絡模型優秀的擬合能力和泛化能力,最終通過訓練后的RBF網絡模型得到較優的決策方案。
關鍵詞:可拓理論;RBF網絡模型;多屬性決策
一、引言
多屬性決策問題往往表現為方案選優問題,即在有限個評價指標下對各個方案的優劣進行排序的問題。但是,在面對這種問題的時候,我們往往并不知道每個評價指標的權重應當如何確定。根據決策者是否帶有主觀傾向,可以將賦權法分為主觀賦權法和客觀賦權法,典型的主觀賦權法有專家調查法、層次分析法、二項系數法等;典型的客觀賦權法則有熵權法、AHP等。主觀賦權法易使決策方案帶有較大的主觀性影響,而客觀賦權法則往往無法體現決策者的合理傾向,無論是主觀賦權法還是客觀賦權法,均難以克服其自身的局限性。
對于RBF網絡模型而言,其自身的結構、算法主要決定了模型處理問題的能力和性能,而學習的樣本,則最終決定了RBF網絡模型擬合能力和泛化能力的具體體現。現有理論已經證明,具有單隱層的前饋網絡可以影射所有的連續函數,只有當學習不連續函數時,才需要兩個隱層。對于有限的多屬性方案優選問題,在不知道具體的方案評價規則時,神經網絡作為最有效的函數逼近工具,其非線性、自學習、自適應等特點使得其在解決此類問題方面中具有其他方法無法比擬的優勢。但是,RBF網絡模型并沒有在決策領域充分發揮其應用潛力,原因之一就是難以獲得足夠數量的學習樣本。
本研究基于可拓理論中關于將方案的優劣評級轉換為方案在決策屬性下的不同等級值域的思想,創造性地構造出RBF網絡模型的學習樣本,使得RBF網絡模型具備了對方案的優選能力,并最終通過RBF網絡模型的評價得出了方案的優劣順序。這種方法避開了廣受爭議的賦權過程,形成了既能反映出決策者合理傾向又能在相當程度上避免較大主觀影響的方案優選方法。
二、基于可拓理論的RBF網絡模型構建
面對多屬性決策問題,將決策方案直接與方案的優劣等級相關聯是比較困難的。可拓理論通過建立經典物元矩陣,以可拓距離描述決策方案的現實屬性與經典物元之間的遠近關系,并計算關聯函數值,最終結合各決策屬性的權重計算每個方案與不同決策評級值域的綜合關聯度。綜合關聯度的大小體現了決策方案與各個方案優劣等級之間的相符程度,值越大說明決策方案越應當被評價為該優劣等級。
本研究正是基于這樣的問題解決策略,提出了如下神經網絡的學習樣本構建方法。
(一)確定決策矩陣
其中,Rk為第k個方案優劣等級的經典物元矩陣(k=1,2,…,l);Sk為所劃分的第k個優劣等級;Ij為第j個評價指標(j=1,2,…,n);Xjk為第j個指標在第k個優劣等級的量值范圍;ajk、bjk為第k個優劣等級下第j個指標值域的下限值和上限值。
(三)確定神經網絡學習樣本
根據經典物元矩陣構建神經網絡學習樣本的輸入矩陣P以及期望輸出矩陣Q。
輸出矩陣Q是指當決策方案的各項屬性指標達到最優等級的上限值時,RBF網絡模型輸出為1,表示當前為最優決策方案;當各項屬性指標達到最劣等級的下限值是,RBF網絡模型的輸出為0,表示當前為最差決策方案;而當各項屬性指標為其他等級的相應上下限值時,RBF網絡模型的輸出則按照等級的相應順序以線性內插法確定。
通過以上三個步驟,最終建立起RBF網絡模型的學習樣本,從而使訓練后的RBF網絡模型具備了評價現有決策方案優劣的泛化能力。
三、實證分析
目前,計算機已經相當普及,隨著社會節奏的加快,網絡購物業已成為了人們尤其是工薪階層的首選消費方式。但是,網絡購物在帶給人們便利的購物體驗的同時,也在無形中增加了人們的決策難度。網絡購物使得人們在購物的時候能夠跨越空間的距離,無視本地商品庫存狀況,增加了人們購物選擇的多樣性。與此同時,這也使得人們更加容易陷入難以抉擇的困境——我到底應該買哪一個商品?
人們在通過網絡選擇商品時,只能通過網頁圖片、商品參數等信息來判斷商品的優劣。網絡商品的用戶評價在相當程度上也能給予人們一定的決策指導,但是這些通過網絡所獲得的信息在某種意義上來說是一種間接獲取的信息,這種信息獲取形式往往讓除了賣家以外的人難以確定哪些信息是真實的而更應當被重視,從而使人們在這種典型的多屬性決策中,從觀念上的主觀偏好變為了事實上的無主觀偏好。在這種情況下,網絡購物的決策者們發現,他們比以往任何時候都更加難以確定各個決策屬性的權重。既然權重問題成為了網絡購物多屬性決策困境的主要原因,是否有一種可行的方法讓決策者們避開權重呢?
本研究以2015年6月10日某購物網站上的五種不同型號的熱銷筆記本電腦作為研究樣本,并將一切可以從網頁中提取的量化指標作為決策屬性,具體包括價格、CPU性能指數、顯卡性能指數、凈重、性價比指數、外觀指數和散熱指數作為決策指標,以基于可拓理論的RBF網絡模型進行多屬性決策,從而得出方案優選的結果,并將優選結果與各電腦型號的實際評價狀況進行比較,最終證明該方法的合理性、有效性和便捷性。
將統計數據以式(1)的形式進行整理得到決策矩陣如表1所示。其中,CPU性能指數與顯卡性能指數通過專業跑分軟件對電腦硬件進行測試得到;凈重則為實際的重量,單位為千克;性價比指數、外觀指數、散熱指數則由商品買家評論中相對應的指標評論數比上累計評論數得到。
以每個評價屬性的最劣值作為該屬性節域的下限值,最優值則作為該屬性節域的上限值。并建立從優到劣I、II、III、IV、V五個級別,故對節域進行五等分從而得到5個經典物元矩陣。根據表1和式(2),將5個經典物元矩陣進行整合,得到如表2所示的經典物元矩陣。
在Matlab 2012b環境下,調用newrb函數生成一個結構為7-6-1的RBF網絡模型,即輸入層神經元數目為7,隱含層神經元數目為6,輸出層神經元數目為1的三層前饋神經網絡模型。根據多次試湊,將RBF的擴展速度設置為5,以使RBF網絡模型在擬合性與網絡性能之間取得平衡。將輸入矩陣P進行歸一化處理后對RBF網絡模型進行訓練,訓練到第5次時達到最小網絡均方誤差s=3.59804×10-26。繪制RBF網絡模型的均方誤差曲線如圖1所示。
整理表2所示的決策矩陣,得到RBF網絡模型測試樣本的輸入矩陣X。
將輸入矩陣進行歸一化處理后通過學習完畢的RBF網絡模型中進行評價,得到輸出矩陣Y。
整理輸出矩陣Y,得到如表3所示的方案優選結果。
由于優劣等級是以所有方案的屬性最優值和最劣值作為該屬性節域的上限值和下限值并等分為五級而確定的,且所有方案均為該購物網站上的熱銷機型,因此各個方案必然密集在一個中等的等級即等級III上。事實上,也正是因為每個方案均為熱銷機型,才給購物者帶來了相當的決策難度,這也說明了得到如表3所示的結果是符合實際情況的。而在所有的決策方案中,C方案的綜合指數最高,說明其為最優的購買選擇;而E方案的綜合指數最低,在對各個評價屬性沒有明顯偏好的情況下,其各項指標的綜合影響難以在該評價體系下形成優勢,為最劣的購買選擇。將各個方案以綜合指數從大到小的順序排列可得:C>B>A>D>E。
整理2015年6月10日某購物網站中各個電腦的實際評價情況并制成表4,將滿意的購物解讀為不會給予差評的購物,則購物方案應以差評率由小到大的順序進行排序,即:C>B>A>D>E,與模型評價結果相符。因此,本方法是一個行之有效的多屬性決策方法。
四、結語
賦權方法的選擇一直在多屬性決策中備受爭議,而基于可拓理論的RBF網絡模型憑借其自身特性可以跳過賦權過程,直接使輸入數據與相應評級建立映射關系,該方法邏輯清晰明了、操作簡單可行,既能在建立經典物元矩陣和評價等級的過程中反映出決策者合理傾向,又能在相當程度上避免較大主觀影響。由基于可拓理論的RBF網絡模型得出的結果與實際的評價情況相符,說明該方法有效、可行,能夠為其他類似的多屬性決策問題提供案例與參考。
參考文獻:
[1]梵治平,趙萱.多屬性決策中權重確定的主客觀賦權法[J].決策與決策支持系統,1997(04).
[2]施彥,韓力群,廉小親.神經網絡設計方法與實例分析[M].北京郵電大學出版社,2009.
[3]Wang J, Malakooti B. A feedforward neural network for multiple criteria decision making[J].Computer Operations Research,1992(02).
[4]蔡文,楊春燕.可拓學的基礎理論與方法體系[J].科學通報,2013(13).
[5]胡興俊,嚴小麗.建筑施工方案安全性的熵權可拓綜合評價[J].上海工程技術大學學報,2014(02).
[6]馬永紅,王曉彤.基于熵權物元可拓的區域創新系統成熟度評價[J].統計與決策,2014(22).
(作者單位:華北水利水電大學管理與經濟學院)