李偉偉,易平濤,郭亞軍
(東北大學工商管理學院,遼寧沈陽110169)
信息集結是將多種來源的信息融合為一個整體的過程,是多屬性決策領域一項重要的研究內容.迄今為止,關于信息集結方法的研究在眾多學者的共同努力下已取得了豐碩的理論成果[1-8].進一步,為提升理論方法解決實際問題的能力,在理論研究中考慮決策者的需求也十分必要.眾所周知,激勵是一種重要且常見的管理手段,在信息集結過程中準確而自然地融入決策者的激勵偏好,能夠對被評價對象的發展(尤其長期發展)起到持續有效地引導作用.
目前,已有部分學者對體現激勵特征的信息集結方法展開研究.易平濤等[9]用直線型的激勵控制線表達決策者的激勵偏好,對被評價對象的發展趨勢進行激勵,提出了一種基于雙激勵控制線的動態信息集結方法,并進一步將其拓展至泛激勵控制線的情形[10].劉微微等[11,12]在體現被評價對象發展趨勢的基礎上,融入對被評價對象變化速度的考慮,在雙激勵控制線的基礎上提出了兼顧發展速度的動態信息集結方法.文獻[13]在雙激勵的基礎上,提出了按層級激勵的信息集結方法.馬贊福等[14]考慮被評價對象在不同時刻發展水平的差異,提出了一種基于屬性值增益水平的信息集結方法.張發明[15]在文獻[14]的基礎上做了進一步的拓展,以顯性激勵為基礎,加入隱性激勵,提出了雙重激勵的信息集結模型.
總結上述信息集結方法,發現一個共同的特點,即上述方法多是對被評價對象發展趨勢或狀態的“整體激勵”,這種激勵模式能夠對被評價對象的發展起到一定的引導作用,但決策者的激勵偏好卻通常被隱藏于激勵模型的計算中,且模型的數值過程一般都比較復雜,因而會導致被評價對象對決策者激勵偏好的感知與反饋比較籠統,落實到被評價對象的行為引導上,就會出現被評價對象大多選擇模糊地提升自身在各方面(屬性)的取值,卻不明白如何采取最優的行動方案以獲取最大程度的激勵成果.
針對上述問題,本文給出了采用“分段激勵”的方式對被評價對象進行誘導性激勵的解決思路.論文的主要創新之處是以分布分位數的方式衡量被評價對象的相對發展水平,并以分布分位數為基礎,對決策者的激勵偏好進行細化描述,提出了有序分位加權集結算子的方法.進一步采用隨機模擬的思路分析了理想激勵點的求解方法,以算例的形式驗證了該方法的有效性,并得出當采用正向雙點激勵方式時,不僅能夠實現對被評價對象的獎懲并重,且能夠通過獎懲凸顯被評價對象之間差異的結論.與已有文獻中“整體激勵”的方式相比,本文給出的“分段激勵”和有序分位加權集結方法,能夠更加細膩地刻畫決策者的激勵偏好,同時能使被評價對象對決策者的激勵偏好有著更清晰的認識,從而實現對被評價對象系統性發展的良性引導.
該部分首先對衡量被評價對象在各屬性上相對發展程度的分布分位數進行求解,然后基于分布分位數構建有序分位加權集結算子,在此基礎上研究體現激勵特征的屬性權重(稱之為“分位權重”)的計算方法.
對由n個被評價對象(o1,o2,...,on)及m個屬性(x1,x2,...,xm)構成的n×m維決策矩陣為[xij]n×m,不失一般性,令m,n≥3.通常,實際問題中被評價對象關于某屬性xj,j=1,2,...,m的取值存在一個理想的上限和可接受的下限,分別記為Mj和mj.參照無量綱化方法中的“極值處理法”[16],下面對分布分位數的定義進行界定.
定義1對被評價對象oi在屬性xj上的取值xij,稱

為與屬性值xij對應的分布分位數,有qij∈[0%,100%].
由定義1可知,qij的取值越大,代表被評價對象oi在屬性xj上的相對發展程度越高.除用于衡量被評價對象的相對發展程度之外,分布分位數的另一個作用是為決策者激勵偏好的表達提供了便利.下面以圖1為例,對其進行簡單說明.圖1中,黑色圓點表示某被評價對象屬性值的分布分位數,α1和α2為決策者給出的兩個激勵點,其取值介于0%~100%之間.因而可將圖1視為由兩個激勵點區分的3段激勵子區間,即[0%,α1),[α1,α2),[α2,100%].不失一般性,決策者的激勵偏好可表述為,對分布分位數分布于[0%,α1)子區間內的屬性值給予懲罰;對分布于[α1,α2)內的屬性值不懲罰也不獎勵;對分布于[α2,100%]內的屬性值給予獎勵.

圖1 基于分布分位數的激勵偏好示意圖Fig.1 Diagram of incentive preference based on quantile
定義2對被評價對象oi在m個屬性上的取值(xi1,xi2,...,xim),按其對應的分布分位數由小到大的順序進行排序,得到有序數對則有稱

為被評價對象oi的有序分位加權集結值,其中為與有序數對〉對應的分位權重,滿足且

定義3對屬性值xij,設其對應的分布分位數分布于激勵子區間[αt,αt+1),t=0,1,...,k,則屬性值xij的分位權重系數為


式(3)的構建保證了發展程度分布于同一激勵子區間內的屬性值所獲獎懲幅度相同,但可依據(qij-αt)/(αt+1-αt)進一步調整不同屬性值對應的分位權重系數的大小.此外,由式(3)可以看出,分布于不同激勵子區間內的屬性值的分位權重的取值區間也不盡相同.因而,通過式(3)可在實際應用中實現對不同發展程度的屬性值的差異獎懲.
由定義3可知,分位權重的求解與激勵系數相關,而對激勵系數的求解可借鑒Yager[2]提出的orness系數的測度方法,這里將其定義為激勵偏好系數(記為Ip),則有

其中Ip∈[0,1].
為保證激勵偏好的一致性,激勵系數h0,h1,...,hk+1之間的大小應依次遞增或遞減,即當激勵系數之間大小關系依次遞增時,有ht+1>ht,t=0,1,...,k,表明決策者偏好于相對發展程度較高的屬性值,此時有Ip∈(0.5,1],這里稱此種情形為“正激勵”;相反地,當ht+1<ht時,Ip∈[0,0.5),表示決策者偏好于相對發展程度較低的屬性值,此種情形被稱為“負激勵”;除此之外,當ht+1=ht=1/(k+2)時,Ip=0.5,表示無論屬性值的相對發展程度如何,決策者給出的激勵偏好相同,此種情形被稱為“無方向均等激勵”.由上述分析可以看出,式(4)的構建思路是通過激勵系數大小關系的設置將決策者不同程度及不同方向的激勵偏好融入同一表達式中,從而使得實際應用中決策者激勵偏好的表達更具靈活性.
基于上述分析,依據適度激勵原則,可通過以下規劃模型求解激勵系數,然后將求解得到的激勵系數代入式(3)即可得到對應的分位權重.
規劃模型為
上述規劃模型的合理性體現于,目標函數的設置使得激勵系數的均方差最小,目的是為了縮小不同激勵子區間激勵系數之間的差異,從而實現適度激勵的效果;約束條件通過激勵偏好系數和激勵系數大小關系的設定,兼顧了正激勵和負激勵兩種情形,從而提升了運用該模型解決實際問題的應用空間.
對有序分位加權集結算子用于解決激勵問題的基本過程進行總結,具體如下.
步驟1對某決策矩陣,依據式(1)求解被評價對象在各屬性上的分布分位數;
步驟2決策者提供激勵點,據此分析各被評價對象在不同激勵子區間內的分布情況;
步驟3基于決策者的激勵偏好(系數),依據式(4)~式(6)求解激勵系數,將求解得到的激勵系數代入式(3)求得各被評價對象的分位權重;
步驟4將(規范化處理后的)屬性值、對應的分布分位數及分位權重代入式(2),計算得到帶有激勵特征的集結值,并依據集結值大小對被評價對象進行擇優或排序.
實際應用中,激勵措施的采用,除能夠通過分段激勵的方式讓被評價對象清晰明白自身的發展水平從而對其起到直接引導作用外,激勵措施的另一個作用就是為了凸顯被評價對象之間的差異,從而使得被評價對象看清自身與其他被評價對象之間的差距,以對其發展起到間接的引導作用.由上述有序分位加權集結算子的應用步驟可知,在這一過程中起關鍵作用的是決策者給出的激勵點的位置.理想的激勵點應分布于所有被評價對象分布分位數的取值區間內,從而實現對被評價對象發展的“直接引導”(或“內部激勵”),同時也應能夠最大程度地區分不同被評價對象集結值之間的差異,實現對被評價對象的“間接引導”(或“外部激勵”).基于此,下面給出確定理想激勵點的兩條基本原則.
原則1內部激勵.決策者給出的激勵點應分布于所有被評價對象分布分位數的取值范圍內.
原則2外部激勵.決策者給出的激勵點應使所有被評價對象最終集結值之間的差異最大.
對原則1,設被評價對象oi關于m個屬性的分布分位數集合為{qi1,qi2,...,qim},則理想激勵點αl,l=1,2,...,k的取值范圍為αl∈[min(qij),max(qij)],i=1,2,...,n;j=1,2,...,m.
對原則2,設集結值之間的差異用兩個集結值之間的偏差衡量,因而理想激勵點的給出應使集結值之間的最小偏差最大化,即激勵點αl的給出應使min(|yi-yk|),i≠k最大.
基于尋找理想激勵點的兩條原則,下面給出求解理想激勵點的基本過程.
步驟1對某決策矩陣,求解對應的分布分位數矩陣;
步驟2決策者給出激勵偏好系數Ip及激勵點的個數;
步驟3在分布分位數的最大值與最小值之間隨機取定激勵點,依據激勵偏好系數Ip、式(3)~式(6)求解分位權重,將屬性值和分位權重代入式(2)計算得到被評價對象的集結值;
步驟4計算所有被評價對象集結值之間的最小偏差,重復步驟3,尋找能使該最小偏差最大的激勵點.
由上述理想激勵點的求解過程可知,理想激勵點的尋找是在分布分位數的最大值與最小值之間“隨機尋優”的過程,因而隨機模擬仿真的方法可作為獨立組件融入到該尋優過程中,不僅可提升該過程的可操作性,同時可節約求解的時間成本.下面對理想激勵點的隨機模擬求解步驟進行歸納.
步驟1對決策矩陣[xij]n×m,計算其分布分位數,并將分布分位數矩陣中的最大值和最小值分別記為qmax和qmin;
步驟2設置仿真次數監控變量count(初始值為0),設置存儲變量σ0(初始值為0),αl,α2,...,αk(設決策者給定k個激勵點,初始值為0);
步驟3count←count+1,在區間[qmin,qmax]內按均勻分布的方式隨機生成k個隨機數(激勵點),記為r1,r2,...,rk;
步驟4基于決策者給出的激勵偏好系數Ip計算各被評價對象的分位權重,并按有序分位加權集結算子的方式對(規范化處理后)決策信息進行集結,得到被評價對象的集結值yi,并計算集結值之間兩兩偏差的最小值,記為σ;
步驟5若σ>σ0,則σ0←σ;α1←r1,α2←r2,...,αk←rk;
步驟6若count=sum(sum為決策者給出的仿真總次數,一般[qmin,qmax]區間范圍越大,sum值越大),轉入步驟7,否則轉入步驟3;
步驟7保存σ0和α1,α2,...,αk的數值,退出程序.
通過上述模擬仿真得到的激勵點α1,α2,...,αk即為理想激勵點.
對某公司5名員工在出勤情況(x1),銷售業績(x2),工作積極性(x3),學習能力(x4),客戶滿意程度(x5)和工作創新性(x6)的表現進行績效評價.5名員工的績效數據見表1.
由問題描述可知,6個考核項均為效益型屬性,依據式(1)求得員工在各考核屬性上的相對發展程度(分布分位數)如表2所示,其中各考核屬性得分的理想上限為10分,可接受的下限為1分.

表1 員工在各考核屬性上的績效得分Table 1 Performance score of employees in each assessment attribute

表2 員工在各考核屬性上的分布分位數Table 2 Distribution quantiles of employees in each assessment attribute
1)激勵點求解
依據理想激勵點的模擬仿真步驟,激勵點的隨機取值區間為[34%,76%].下面分別就決策者給出1個和2個激勵點的情形進行模擬仿真(單激勵點仿真10萬次,雙激勵點仿真100萬次),仿真結果分別如表3和表4所示.需要說明的是,由于員工在各考核屬性上的得分區間相同(為[1,10]),所以無需對得分值進行標準化處理.

表3 單激勵點情形下的模擬結果Table 3 Simulation result under single incentive point

表4 雙激勵點情形下的模擬結果Table 4 Simulation result under double incentive points
2)結果分析
(a)不同激勵偏好系數下的激勵點的變化分析
為便于觀察,繪制不同激勵偏好系數下激勵點的變化趨勢圖,見圖2.需要說明的是,為作圖方便,圖2中Ip=0.5時的激勵點取其他激勵偏好系數下激勵點的均值.

圖2 不同激勵偏好系數下激勵點的變化趨勢Fig.2 Variation tendency of incentive points under various incentive preference coefficients
觀察兩種激勵情形下激勵點的變化情況,可以發現無論是單點激勵還是雙點激勵,“負激勵”(Ip<0.5)時,不同激勵偏好系數下激勵點的變化幅度均大于“正激勵”時激勵點的變化幅度,表明負激勵時激勵點對決策者激勵偏好系數的敏感程度大于正激勵時的敏感程度.
(b)不同激勵偏好系數下各員工集結值的變化分析
當激勵偏好系數在0.1~0.9之間變動時,分別繪制單點激勵和雙點激勵情形下員工集結值的變化趨勢,如圖3所示.

圖3 單、雙點激勵情形各員工集結值的變化情況Fig.3 Change of aggregations of alternatives under single and double incentive points respectively
觀察圖3可以發現,單點激勵情形下,隨激勵偏好系數的變化,各員工集結值的變化趨勢基本一致(變化幅度略有不同),說明單點激勵情形下,決策者激勵偏好系數對各員工獎懲結果的影響是同方向的,即激勵偏好系數的變化能夠對所有員工實現同時獎勵(集結值變大)或懲罰(集結值變小);雙點激勵時,員工2、員工3和員工5的集結值變化趨勢一致,隨著激勵偏好系數的增加,集結值基本呈上升趨勢,但員工5的上升趨勢不明顯,而員工1和員工4的集結值變化趨勢一致,隨著激勵偏好系數的增加,集結值基本呈先上升再下降的趨勢,說明雙點激勵情形下,決策者激勵偏好系數的變化能夠對各員工實現獎懲并行.
(c)不同激勵偏好系數下員工之間集結值的對比分析
為分析激勵措施的采取是否對員工起到獎懲作用,這里將不同激勵偏好系數下員工的集結值與采用算術平均方法(代表無激勵情形)得到的員工集結值(分別為5.60,6.23,5.80,5.42,6.23)進行比較分析,見圖4.

圖4 單、雙點激勵情形員工之間集結值的對比圖Fig.4 Comparison of aggregations of alternatives under single and double incentive points respectively
觀察圖4可以得出,比較Ip=0.5的集結值和平均集結值,發現無論單點激勵還是雙點激勵,Ip=0.5時各員工的集結值均大于其平均集結值,且集結值之間的差異變大(參照表4和上述平均集結值),原因是有序分位加權集結算子中分位權重加和不等于1,即相比于平均集結方法,有序分位加權集結算子中Ip=0.5時分位權重之和的增加拉大了集結值及其差異,因而本文將Ip=0.5的情形定義為“無方向的均等激勵”而非“無激勵”;單點激勵時,無論在何種激勵偏好系數下,員工集結值均大于平均集結值,而雙點激勵時,存在員工集結值小于平均集結值的情形,說明單點激勵多體現的是對員工的獎勵,而雙點激勵是對員工的獎懲并行;當激勵偏好系數Ip≥0.3時,員工之間的集結值變化趨勢基本一致,但隨著激勵偏好系數的增加,各員工集結值之間的變化幅度也有所增大,而激勵偏好系數較小時(Ip=0.1,0.2),員工之間的集結值變化趨勢與Ip≥0.3時的差異較大,表明負激勵且激勵程度越大時,能夠對員工之間的排序產生影響,而正激勵雖然對員工之間排序影響不大,卻能夠拉大員工集結值之間的差異.
綜上可知,在本文給出的算例中,建議選用正向雙點激勵(且激勵偏好系數應盡可能大)的方式對被評價對象進行激勵,因為這種激勵方式不僅能夠實現對被評價對象的獎懲并重,又能夠通過獎懲凸顯被評價對象之間的差異.上述求解理想激勵點的方式適用于以下兩種情形:一是決策者能夠給出激勵方向和激勵程度的判斷,卻不能明確把握激勵位置;二是決策者意圖通過分段激勵最大程度地實現獎懲并拉大被評價對象之間的差異.
本文面向管理決策中的激勵問題,提出了有序分位加權集結算子這一新的集結方式.該集結方法具有以下特點:1)以分布分位數的方式衡量被評價對象的相對發展程度;2)決策者通過提供激勵點的方式實現對被評價對象的分段激勵,這種激勵方式能夠更加細膩地刻畫被評價對象之間的發展差異;3)分位權重的設置擴大了權重系數的取值范圍,從而提升了獎勵或懲罰的幅度.進一步將研究有序分位加權集結算子在動態獎懲評價問題中的集結理論及應用.