許旺土,文琰杰
(1. 廈門大學 建筑與土木工程學院,福建 廈門 361005; 2. 中南大學 軌道交通安全教育部重點實驗室,湖南 長沙 410075)
交通信用是指在交通運輸領域中的信用,按照評級對象不同,包涵個人交通信用和交通運輸企業信用。目前針對交通信用的研究還很少,尚未形成完整的交通信用評級體系。
計算交通信用評級的核心是計算各評級指標間的權重,大致可分為3類方法。① 主觀賦權法,即根據決策者意圖確定權重。XIN Zhongliang等[1]利用層次分析法對配電網規劃方案進行了綜合評價;胡又詠等[2]采用層次分析法結合三標度法確定了地鐵站火災風險評價指標體系及各評價指標權重;趙星等[3]采用層次分析法對城市交叉口信號控制策略進行了綜合評價。主觀賦權法能反映出決策者對不同指標的重視程度,但客觀性差,結果受異常數據的影響較大。② 客觀賦權法,即基于數據結構特征對各指標進行權重計算。ZHANG Zundong等[4]采用快速中間熵值法分析了運輸網絡的結構穩定性;BAI Pengrui等[5]采用因子分析法對陜西省道路客運影響因素進行了研究;李海蓮等[6]基于區間數、模糊分析及粗糙集不完備系統建立了一種用于高速公路瀝青路面使用性能的客觀評價模型??陀^賦權法不依賴決策者的主觀性,只依賴單一模型,所計算的權重結果有可能與實際情況相反。③ 基于機器學習的賦權方法,該方法能將高維指標映射為非線性關系,從而得到合理的結果。M.J.SHAW等[7]采用決策支持系統對商業貸款模式進行了評估;A.LASISI等[8]采用決策樹模型對混凝土結構的無損檢測進行了評估;劉杰[9]采用支持向量機對軌道司機的駕駛水平進行了評價?;跈C器學習的賦權方法為理解高維度空間下的數據關系提供了對策,為了獲得性能優異的模型需要大批量的先驗數據訓練模型,然而交通信用評級數據不存在標簽值,故該方法也不適用。
針對以上研究的不足,筆者引入客觀賦權法避免了主觀因素對權重結果的影響;同時考慮基于不同客觀賦權法對交通信用指標權重結果帶來的差異性,將多類賦權方法組合得到的評級指標權重體系,并結合連續式3-sigma準則確定了各項指標的信用得分;通過區間式3-sigma準則確定評級區間,獲得交通運輸企業的評級結果。
交通信用評級的流程如圖1。根據《部省交通運輸信用信息交換指標(2020版)》的規定,交通信用評級指標可分為基本信息、履約能力和行業行為這3個大類,包含9項子指標,如表1。

圖1 交通信用評級流程Fig. 1 Flow chart of traffic credit rating

表1 交通信用評級指標Table 1 Traffic credit rating indicators
表1中的2級指標說明如下:屬性完整度為運輸企業的基本信息(如地址、郵箱、簡介、營業執照等),單位為%;企業行政許可數量為運輸企業獲得與道路運輸相關的行政許可;企業監督檢查為運輸企業接受監督檢查中獲得優良的次數;企業信譽考評AAA、AA、A的數量分別為在一定時間內對交通運輸企業進行考評結果優良的數量,該數值越大說明企業的交通信用越好;企業信譽考評B數量為運輸企業進行考評結果較差的數量,該值越大則表示信用越差;一般行政處罰數量與嚴重處罰數量為一定時間內交通運輸企業受到的行政相關處罰的條數。表1中一共包含考評指標9項,其中正序指標6項,逆序指標3項。
考慮不同指標之間存在的量綱差異及數據中的異常點(可能存在極大極小的情況)會對權重計算結果產生影響,在計算權重前應先對數據進行標準化處理,如式(1)。
(1)
式中:x為對應屬性的數據集;u為均值;σ為標準差。
標準化處理后的數據集標準差為1,均值為0,如此可使得權重結果不被某些維度過大的特征值影響[10]。
客觀賦權法根據不同原理可以分為:基于信息濃縮的賦權法、基于數據信息量的賦權法和基于數據波動性的賦權法。
1)基于信息濃縮的賦權法:因子分析法。因子分析法利用信息濃縮的思想,通過共性因子觀測變量,同時通過觀測變量也能表達共性因子[11],其計算如式(2):
Xi=γi1F1+γi2F2+…+λinFn+εi
(2)
式中:下標i為交通信用評價指標索引,i=1~9;F為對應x的公共因子;γ為公共因子系數,即因子載荷矩陣中的元素。
2)基于數據信息量的賦權法:熵值法。熵值法根據數據攜帶信息量大小進行權重計算,熵值是不確定性的度量,信息量越小則不確定性越大,對應的熵值越大[12]。其計算如式(3)~式(6):
(3)
(4)
gi=1-ei
(5)
(6)
式中:j為交通運輸企業指標數據;z為企業數量。
首先計算第j條數據的第i項指標比重〔式(3)〕;再計算第i項指標的熵值〔式(4)〕;最后計算第i項指標的差異系數并求出權重〔式(5)〕。其中:gi越大說明指標越重要,通過歸一化即可求得各項指標的權重〔式(6)〕。
3)基于數據波動性的賦權法:CRITIC權重法。該方法是基于評價指標的對比強度和指標之間沖突性來衡量指標的客觀權重,在考慮指標變異性大小的同時兼顧指標之間的相關性。通過指標的標準差σ反映指標的變異性,標準差越大則差異越大,對應指標包含的信息也越多,應該分配更多的權重[13]。指標沖突性用相關系數表示,如式(7):
(7)
式中:rv為指標v與其他指標的沖突性,相關性越強則值越小,分配的權重越低;riv為指標的i、v的相關性系數;i、v分別為不同的評級指標索引。
通過變異性和沖突性可計算信息量cv=σv×rv,則根據式(8)可求得各個信用評級指標的權重。
(8)
綜合上述3類基于不同原理的客觀賦權法可以求得不同交通信用評級指標之間的權重,如式(9)。
(9)
式(9)中:每一行代表不同客觀賦權法的各個交通信用指標權重,每一列代表在該指標下的不同客觀賦權法得出的權重。
為獲得合理的交通信用得分,通過式(10)求得各項指標權重,其中下標i為權重算法索引,下標j為指標索引。
(10)
根據相關管理部門對交通信用等級得分的規定:總分為950分,基本分為600分,加分項為350分。加減分法則參照3-sigma法則,其概率密度函數如式(11)。
(11)
式中:u、σ2分別為對應交通信用指標數據的均值與方差。
一般而言,數值分布在(u-3σ,u+3σ)之間的概率為0.997 4[14],在該區間外則被認為是奇異點,需要對該企業對應的信用指標進行重新評定。
筆者將3-sigam準則分為區間式和連續式準則。區間式3-sigma準則根據企業信用得分確定企業信用評級區間,如圖2。

圖2 交通信用評級區間示意Fig. 2 Schematic diagram of traffic credit rating interval
由圖2可知:若得分落在指定區間有99%的置信度則被認為該數據正常。連續式3-sigma準則用于確定企業各項指標加減分,考慮區間算法會導致中間信息損失,各正序指標得分按照式(12)得出,對于逆序指標需將S取負數。
(12)
考慮對稱性,筆者將信用評級分為6級(A~F),其中信用評級A最好,信用評級F最差。
以廈門市為例,采集了7 601家交通運輸企業的相關指標數據,其中包括上述指標數據的客觀賦權算法在不同算法下各個指標權重,如表2。

表2 不同賦權方法下的交通信用指標權重結果Table 2 Weight results of traffic credit index under differentweighting methods
由表2可知:① 對不同客觀賦權算法可得到交通信用指標存在的差異;② 基于因子分析法的賦權結果中行政處罰數量所占權重最高,而企業信譽考評A數量權重最低;③ 基于熵值法的賦權結果中企業基本信息完整所占權重最低,企業監督檢查權重結果最高;④ 基于CRITIC權重的賦權結果中各個指標間的權重無明顯差異;⑤ 組合賦權算法獲得各項指標組合權重,根據權重大小,企業信譽考評中AAA數量依次高于AA和A的權重,行政處罰中,嚴重處罰數量權重高于一般處罰權重,表明組合客觀賦權法獲得的權重與實際主觀理解相符。
以600分的得分為基礎分并結合350分的加減分作為企業的最終得分。為確定不同企業各項指標的加減分數值,需對各個指標進行連續式3-sigam準則運算。各指標加減總分情況如表3,部分指標數據分布見圖3。由圖3可以確定對應指標參數u、σ;根據式(12)可以求得各企業不同指標的詳細加減分,最后結合基礎分就可以獲得該企業交通信用得分。

表3 信用指標加減總分情況Table 3 Total scores of credit indicators


圖3 部分指標數據分布Fig. 3 Data distribution of some indicators
基于企業交通信用得分分布可獲得企業得分相關參數(u,σ)=(598, 20),結合區間式3-sigma準則對交通信用進行評級區間確定,評級區間見表4。限于篇幅,筆者以5家運輸企業為例(5家運輸企業分別編碼為a, b, c, d, e),其指標值見表5。

表4 交通信用評級區間Table 4 Traffic credit rating range

表5 運輸企業信用評級指標取值Table 5 Credit rating index values of transportation enterprises
根據組合權重結合評級準則可得出各企業的交通信用得分及評級,結果見表6。
由表6可知:① 對于企業a,其正序指標對應值均為0,而逆序指標均較大,因此信用得分較低,對應信用評級為F;② 對于企業b,其逆序指標信譽指標評級為B的數量為0,信用得分略高于a,對應評級為F;③ 對于企業c,其正序指標數值為0,逆序指標較少,評級為D;④ 對于企業d,其正序指標信譽評級為A的數量為1,逆序指標值較少,評級為C;⑤ 對于企業e,其正序指標較多,逆序指標數值少,評級為A;⑥ 基于組合客觀賦權的方法結合評級準則對企業交通信用進行評級,其結果符合各項指標數值大小分布。

表6 交通運輸企業交通信用得分與評級Table 6 Traffic credit score and rating of transportation enterprises
筆者對交通運輸企業的信用評級進行了研究。對無標簽數據提出了組合客觀賦權法,考慮不同賦權算法性能存在差異性,通過融合權重能獲得符合數值標稱意義的權重結果,將權重結合相關管理部門的打分規則,映射為各個指標的加減分總分;通過連續式3-sigma準則獲得企業每項指標加減分情況,進而獲得各企業的交通信用總得分,最后通過區間式3-sigma準則獲得企業的評級結果。
此外,筆者提出的算法已運用于廈門交通運輸信用管理系統,評級結果較為合理。但本研究也存在一定局限性,如采用單一客觀賦權方法導致與主觀決策不相符,在未來研究中考慮將主觀賦權與客觀賦權相融合,以此獲得更加理想的權重結果。