廖志高,詹 敏,徐玖平
(1.廣西科技大學 管理學院,廣西 柳州 545006;2.四川大學 商學院,成都 610064)
無量綱化方法是將原有單位、屬性值等不同的指標數據進行規范化,便于不同指標間數據相互進行比較。任一種線性無量綱化方法其變換函數均可表示為:ξij=f(Xij)=kXij+b,i=1,2,...,n的形式,其中k、b為待定系數。原始指標數據經函數變換后計算得規范化值,其規范化值與原始數據之間的關系始終都是線性關系。雖然線性無量綱化方法使用比較方便,研究成果也相對較多,但其仍存在先天局限性。因為在實際生活中并非所有的規范化值與原始指標之間的關系均是線性關系的,線性關系只是無量綱化方法中的一種特殊形式,其中更多的則是非線性關系,如“邊際效用遞減”規律等[1]。在無量綱化過程中全部用線性關系的無量綱化方法對原始指標進行無量綱化處理,那所得到的綜合評價結果很難說是客觀、科學的。且當指標數據中出現異常極值點時,由于異常點對線性無量綱化數據的穩定性產生嚴重影響,當增加或減少某個異常點后,無量綱化結果可能會發生很大變化,這時就需要對異常點進行判斷識別甚至是修正,而不是簡單的直接使用線性無量綱化方法。所以在無量綱化處理過程中對異常點的考慮及根據實際情況采用非線性無量綱化方法進行處理非常必要。而目前對于異常點及非線性無量綱化的處理仍然還非常少,因此進行此類研究已變得非常必要。
與常用的線性無量綱化方法不同,非線性無量綱化方法的特點是其變換函數的變化率不是恒定的。即對于同一指標,其不同指標數據的斜率是不恒定的,因此指標值的變化對評價值的影響是不等比例的。現有的非線性無量綱化方法主要有如下幾種:效用函數型、折線型無量綱化處理、基于曲線擬合的無量綱化方法處理和強“獎優罰劣”算子處理等[2~7]。
1.1.1 效用函數型
戴文戰、鄒立華、汪建章等(2000)所寫《一種基于獎優罰劣原則的多階段多目標決策模型》一文,其中提出了一種新穎的效用函數,并據此將具有不同量綱、不同物理意義、不同指標類型的決策矩陣歸一化轉換到相應的效用矩陣,該效用函數以指標的平均值為參考點,突出了“獎優罰劣”原則,提高了分辨精度,物理概念更加清晰,并應用實例說明了該方法的合理可行性。同時為轉換系數,該效用函數為由于是一條S型曲線,bij反映了原始數據偏離平均值的關系,當原始數據大于4倍以上平均值或小于-4倍平均值時,效用函數接近“飽和”,這樣處理防止了因某些分指標出現特大或特小等異常點左右整個綜合評價的取值,其本身對“異常點”有一定的削弱作用[2]。
本文對其效用函數:y=(1-e-x)/(1+e-x),進行分析試圖找出其對指標數據的影響。我們對其進行求導,分析其不同指標值時的變化率。

易知0<y'<1恒成立,因此其效用函數只對x進行縮小而無放大作用。且在x=0附近其斜率最大,隨著|x|>0,其斜率越來越小直至趨近于0。其主要適用于數據在平均值附近比較集中的數據。
但該文的不足之處是在計算轉換系數時沒有考慮平均值為0以及區間上界或下界為0的情形,此時轉換系數計算公式分母為0分式無意義需要作特殊考慮。解決方案:對于平均值為0的情形,需要對數據進行具體分析,若數據分布均勻且數值相對較小可不進行轉換,此時;當區間上界為0或下界為0時,需要對數據進行具體分析,可利用先進行簡化處理等。
1.1.2 折線無量綱化方法
蔡輝、丁昌慧(2003)在《綜合效益評價中數據的非直線化無量綱化方法》一文中,考慮了轉折點,即每條線段都是直線,但是它們的直線方程是不一樣的,主要表現為斜率的不相同并連接在一起。其適用條件為指標變動不均衡,或在指標的不同值域內,實現指標值的綜合效益評價難易程度不同。此時宜采用非線性無量綱化方法。同時其還指出模糊數學中的隸屬函數也是分段函數,用這種方法處理實質上也屬于指標的折線型無量綱化方法[3]。
該種方法其難點在于如何確定轉折點,這需要根據實際情況做具體分析,同時對于某些情況轉折點位置不明確或存在多個轉折點時更需詳細考慮。并且很多時候數據間不是突然的質變而是緩慢變化的,此時沒有明確的轉折點但其斜率的變化還是存在,此時則需要進行非線性無量綱化,而折線型無量綱化已不再適用。但非線性無量綱化方法相對于純線性無量綱化方法而言是一種進步。
1.1.3 基于曲線擬合的無量綱化方法處理
溫洪濤,任傳鵬(2010)在《企業績效評價指標的無量綱化方法的改進》一文中,運用曲線擬合的無量綱化方法從各類指標的核心特點出發,分別制定了各類指標的歸一化方法,使處理后的數據更能保留原始信息,最大限度地減少了信息損失和信息失真。同時經變換后得到的規范化值向兩端聚集,即“優者更優”、“劣者更劣”。從而起到了“激勵先進,懲罰落后”的效果[4]。
需要指出的是,其曲線擬合均是運用指數函數擬合且底數均為e,其擬合精度有一定的局限性適用范圍非常有限。
1.1.4 強“獎優罰劣”算子
宋捷、黨耀國、王正新(2010)在《基于強“獎優罰劣”算子的多指標灰靶決策模型》一文中,其提出強“獎優罰劣”算子,在傳統“獎優罰劣”算子賦值范圍擴展到負值基礎上,通過使用非線性變換將平均值水平附近的“平庸”指標賦值的絕對值減小,這樣將各指標賦值范圍進一步擴大,以便于決策者進行決策分析[5]。
根據常用函數類型及我們可將以上幾種非線性無量綱化方法分為以下三種類型。
通過對以上四種非線性無量綱化方法進行分析可知,非線性無量綱化方法其變換函數的變化率不是固定的,即變換函數的斜率k或者稱之為原函數的導數其是變化的。對于正向化指標k>0,規范化數據隨著原始指標數據的增長而單調遞增。變換函數具有如下三個特點:(1)當k>1時,變換函數表現為對變換數據進行放大;(2)當0<k<1時,變換函數表現為對變換數據進行縮小;(3)當k=1時,變換數據既不被放大也不被縮小。對于區間型指標和逆向化指標均需要先正向化然后再進行函數變換。

表1 非線性函數分類
關于異常點,不同的定義規則對其定義不同。但一般均有如下表現:第一,除該點或該幾個點之外的其他數據過分集中,并且明顯偏低或偏高,因而在評價過程中降低了被評價對象的信息量使得較集中的數據識別度較低;第二,這類點的存在使得預處理后的數據極不穩定,增加或減少該異常點對于指標預處理的結論影響很大。對于異常點的處理,一方面希望異常點越少越好,盡量保持評價值的原貌;另一方面則希望挑出較多的異常值,使得評價結果更加準確。在實際問題處理過程中,有時還需要對異常點進行特殊考慮加以分析找出其存在的原因并做出相關合理解釋。
1.2.1 上下異常點處理
郭亞軍、易平濤(2008)在《線性無量綱化方法的性質分析》一文中關于異常點的影響進行了研究。其定義了上異常點和下異常點,并提出了保留信息率、改進度和協調值等概念,通過對異常點的識別和循環調整來修正異常點改進無量綱化方法。此為人為直接識別之外較為規范的“異常點的數值確定方法”。同時還指出,非線性無量綱化方法中如半正態分布、半哥西分布等方法本身對“異常點”有一定的削弱作用[6]。
1.2.2 基于正態區間估計的改進型無量綱化方法處理
何乃強、惠曉斌、周漩(2012)在《基于正態區間估計的改進型無量綱化方法》一文中,提出了一種基于正態區間估計的改進型無量綱化方法,利用正態區間估計的方法給出異常評價值的定義規則和處理規則,按照規則對評價值異常點進行辨識和修正,采用標準化方法對評價值進行無量綱化,提高評價值之間的區分度,經算例分析表明,該方法可行有效[7]。
從已有的關于異常點的處理方法可知,主要是定義規則找出異常點并進行修正。最終使評價結果更加真實明朗便于決策。而對于某些非線性函數則對異常點有減弱的作用。

圖1 四種反角函數基本圖象
圖1為反正弦函數、反余弦函數、反正切函數和反余切函數的基本圖象,其具體表達式定義域、值域導數、單調性和奇偶性如表2所示。

表2 反三角函數簡介
從表2可知,反正弦函數和反余弦函數的導數的絕對值均大于等于1,其對x有放大作用,而反正切函數和反余切函數起導數的絕對值均小于等于1,其對x有縮小作用。將反余弦函數和反余切函數的圖象向下平移,使各函數的值域相同。從而可以利用其性質,將其作為一種無量綱化方法進行無量綱化。
設有m個樣本,每個樣本都有n個指標,則第i個樣本的第j個指標的指標值為Xij,其中i=1,2,…,m;j=1,2,…,n。
2.2.1 反正弦函數和反余弦函數的無量綱化方法。
用表示m個樣本中第j個指標的均值,則

轉換系數為Zij則

若Pj為效益型指標,則變換函數為:

若Pj為成本型指標,則變換函數為:

若Pj為區間型指標Xij∈[A,B](包括固定型,此時A=B),則
當Xij<A時,其轉換系數Zij為:

變換函數:

當Xij>B時,其轉換系數Zij為:

當Xij∈[A,B]時,則其轉換系數Zij=1,變換函數:

2.2.2 反正切函數和反余切函數的非線性無量綱化方法
若Pj為效益型指標,則ξij=arctanw*Zij;
若Pj為成本型指標,則ξij=arccotw*Zij-π/2;
若Pj為區間型指標uij∈[A,B](包括固定型,此時A=B),則
當Xij<A,其轉換系數Zij為:

當Xij>B,其轉換系數Zij為:

當Xij∈[A,B],則ξij=π/2。
其中w的取值,可以根據不同的實際需要進行伸縮變換調整,以便更好的進行無量綱化運算。

表3 各特殊點的取值
根據百分比可知,反正切函數和反余切函數可以有效減弱異常點的影響。一般來說,當現象總體中有異常點(極大或極小值時),宜計算和應用中位數和眾數,因為它們可以消除極端值的影響,比算術平均值更能代表總體的一般水平。
無論哪一種統計指標,都有它自身的優勢,也有局限性。總量指標能夠反映事物發展的總規模和總水平,卻不易看清事物差別的程度;相對指標反映了現象之間的數量對比關系和差異程度,卻又將現象的具體規模和水平抽象化了。因此,將相對指標和總量指標相結合起來使用,才能克服認識上的片面性,達到對客觀事物全面正確的認識。
樣本數據一般可分為離散型和連續型兩類。對于離散型數據在數理統計中我們一般使用基本統計量包括:平均數、眾數、中位數、極差、方差、標準等來描述數據的特征;而對于連續型數據,我們一般將其作為函數處理,包括連續函數、分段函數,以及特殊的區間數等,此時我們常計算其特殊點如最大值、最小值、極值點、拐點、端點值等來更好的描述數據。當然在對原始數據進行數據處理的過程中,我們還可根據實際需求進行一些特殊處理。基于各統計量及特殊點思想,以及上述綜合評價方法的不足,本文提出一種基于插值分類的綜合評價方法,在此插值分類一般分為:算術平均分類法、極差分類法、幾何平均分類法以及根據其他特殊需求而進行的特殊點分類法等。
方法步驟為:
首先,將逆向指標和適度指標的原始數據進行正向化;
其次,根據數據特點選擇插值分類方法進行插值分類,并對分類數據進行無量綱化;
最后,利用綜合模型進行綜合評價。
(1)算術平均分類法
先將樣本數據中單個指標的正向化數值進行降序排列,然后進行求和,最后分別找出其最小值、最大值,再計算其算術平均值及所需要的分類插值。
對于第j個指標,共有m個樣本則,

(2)幾何平均分類法

(3)極差分類法
若將第j個指標的最大值與最小值作差得極差dj=max{Xij}-min{Xij},利用公式ξj=min{Xij}+q*dj/n,q<n,q、n∈z+即得第j個指標的各分類點。例如,當n=3,q=1時則計算出的ξj值為第j個指標的1/3極差分類點,當n=3,q=2時,則計算出來的ξj值為第j個指標的為2/3極差分類點。
(4)特殊點分類法
根據實際需求插值,例如老師在看某班50名學生考試成績時還可取每科排序前10位的平均值作為成績優秀的標準,前25位的平均值作為成績良好的標準等,也可以取特定的某一值作為標準插值求綜合分類排名。
將各不同指標的相同分類點組成一個樣本即可得一個分類樣本。將不同分類點組成的多個分類樣本進行評價即可進行插值分類。
例如,將處于先進算術平均數樣本評價值與最大值樣本評價值間的評價值分為第一類;將處于算術平均數樣本評價值與先進平均數樣本平均值間的評價值分為第二類;以此類推可分為第三類、第四類。
以文獻[4]中的應用實例作為本文的案例,利用反正弦函數和反余弦函數的無量綱化方法進行數據分析處理,并采用極差分類法進行插值分類,并用多指標靶決策模型進行評價。由于靶決策模型在文獻[4]中有敘述在此不作熬述。
為開發新產品,擬定了五個投資方案 S1、S2、S3、S4、S5。樣本插入值分別為最大值樣本S6、3/4極差樣本S7、1/2極差樣本S8、1/4極差樣本S9、最小值樣本S10,見表4。其中,期望凈現值和風險盈利值為正向化指標,投資額和風險損失值為逆向指標。

表4 各方案的效果樣本值及插入值

表5 經反正弦函數和反余弦函數無量綱化后決策數據

表6 數據處理結果
由Si的從小到大進行排列可知:S1>S3>S4>S5>S2。
且通過分類可知:S6處于第一類優于3/4極差樣本;S3處于第二類在3/4極差樣本和1/2極差樣本之間;S4處于第三類,其低于1/2極差樣本但高于1/4極差樣本;而S5和S2最差,處于1/4極差樣本以下。
通過對已有線性無量綱化方法的研究,及對異常點的分析,指出線性無量綱化方法的不足,同時結合現有非線性無量綱化方法,歸納出非線性無量綱化方法的三種類型并說明了其三個特點。同時提出了一種新的非線性無量綱化方法,即基于反三角函數的無量綱化方法,并且還提出一種插值分類方法,在綜合評價的同時還進行了分類集群定位,對此均進行了案例論證。
[1]謝銘杰,韓兆洲.線性無量綱化方法的局限性[J].統計與決策,2005,(3)
[2]戴文戰,鄒立華,汪建章等.一種基于獎優罰劣原則的多階段多目標決策模型[J].系統工程理論與實踐,2000,(6).
[3]蔡輝,丁昌慧.綜合效益評價中數據的非直線化無量綱化方法[J].中國醫院統計,2003,10(1).
[4]宋捷,黨耀國,王正新.基于強”獎優罰劣”算子的多指標灰靶決策模型[J].系統工程與電子技術,2010,(6).
[5]溫洪濤,任傳鵬.企業績效評價指標的無量綱化方法的改進[J].經濟問題,2011,(6).
[6]郭亞軍,易平濤.線性無量綱化方法的性質分析[J].統計研究,2008,(2).
[7]何乃強,惠曉濱,周漩.基于正態區間估計的改進型無量綱化方法[J].計算機工程與應用,2012,48(5).
[8]黨耀國,劉國峰,王建平等.多指標加權灰靶的決策模型[J].統計與決策,2004,(3).