史永樂,陳 兵,周發明
(1.中國鐵路廣州局集團有限公司 信息技術所,廣州 510088;2.中國鐵路廣州局集團有限公司 貨運部,廣州 510088)
隨著我國鐵路建設的不斷發展,特別是客運專線的陸續建成投入運營,人們的出行條件和服務得到了極大改善,鐵路貨運能力也逐年提高。與此同時,隨著高速公路的快速發展,鐵路貨運市場面臨的競爭越來越激烈,營銷壓力也越來越大,亟需在貨運營銷方面不斷創新。企業要生存和發展,就必須認清形勢,找準并鎖定目標客戶,通過個性化的定制服務,更好地滿足客戶需求,最大限度地開辟市場,創造更大的效益[1]。如何對客戶價值進行綜合評價是貨運營銷工作人員經常面對的問題,根據經典的客戶生命周期理論,鐵路大客戶的生命周期按階段可分為考察期、形成期、穩定期和退化期[2]。因此,部分目標客戶,如果給予足夠的關注和培育,可為鐵路創造更大的價值。
本次客戶價值綜合評價分別從主觀和客觀的角度,采用科學的分析方法構建客戶價值評估模型,使用Python 語言對數據進行計算并確定各因素權重,再對客戶進行綜合評價,通過對中國鐵路廣州局集團有限公司(簡稱:廣州局集團公司)貨票實際數據進行驗證,評估模型的應用效果。
裝車數、發送量、運費是對貨運客戶價值進行評價的3 個重要指標,也是鐵路企業統計、考核時常用的3 個指標。各鐵路局集團公司貨運客戶數量不等,主要發送品類不同,如果僅僅使用一個指標對客戶進行評價,結果是不科學、不全面的。表1是廣州局集團公司某時期裝車數前20 名客戶貨票數據統計結果(已經隱去客戶真實名稱。本文中數據計算時包含所有客戶,表格中只取前20 名。下同)。

表1 廣州局集團公司某時期裝車數前20 名客戶
從表1 中可以看出,裝車數最多的是客戶01,其發送量為7 301 810 t,運費為162 208 724.9 元。從表1中還可以看出該客戶雖然裝車數最多,但是其發送量和運費都不是最多的。
由于裝車數、發送量、運費3 個指標中的任何單一指標都不能實現對客戶科學、全面的評價,因此,需要同時考慮所有指標,這就是綜合評價方法。綜合評價的應用十分廣泛,適用于各個領域。綜合評價的步驟,如圖1 所示。

圖1 綜合評價步驟
評價指標就是指決策者比較關心的一些因素或維度。以鐵路貨運客戶為例,鐵路企業比較關心的是裝車數、發送量、運費。當然還可以增加其他指標,比如噸公里收入、協議兌現率等。選取評價指標時,應盡量選取無顯著關聯性且又能反應鐵路貨運業務績效的指標。如果選擇有顯著關聯性的指標,最終的評價結果可能達不到決策者的預期。比如,選擇了裝車數、發送量、運費3 個無顯著關聯性指標后,再增加關聯性指標“噸收入”指標,由于噸收入=運費/發送量,因此,最終的評價結果中發送量、運費2 個指標占據的權重會比較高,會導致評價結果結構性失衡,達不到決策者的預期。
在多指標綜合評價體系中,不同的指標通常具有不同的量綱和數量級,當各個指標間的水平相差很大時,如果直接使用原始數據進行分析,數值較高的指標在綜合評價中所起的作用會很大從而削弱數值較低指標的作用。因此,為了保證綜合評價結果的可靠性,需要對原始數據進行標準化處理。數據標準化就是去除數據的單位限制,將其轉化為無量綱的純數值,再將其按比例縮放,使之落入一個指定的小區間,便于不同單位或數量級的指標能夠進行比較和加權。數據標準化的方法很多,最典型的是對數據進行歸一化處理,即將數據統一映射到[0,1]區間。常見的數據歸一化方法有min-max 標準化法、arct 反正切函數轉換、z-score 標準化法,本文使用min-max 標準化法。
min-max 標準化,也叫離差標準化,是對原始數據進行線性變換,使結果落到[0,1]區間。假設有n個客戶m個指標,具體做法是使用客戶各個指標的實際數據構造原始矩陣A。

其中,ai j為第i個客戶第j個指標的數值。
線性歸一化處理后得到矩陣A'。

根據上述算法對廣州局集團公司某時期貨票數據統計結果的裝車數、發送量、運費進行歸一化處理,并取裝車數前20 名客戶,如表2 所示。

表2 廣州局集團公司某時期裝車數前20 名客戶歸一化后的數據
對指標數據進行歸一化處理后,下一步就是確定各個指標的權重。在多指標綜合評價中,科學合理分配權重是評估的關鍵,其方法分為主觀賦權評估法和客觀賦權評估法2 類。
2.3.1 主觀評估法
2.3.1.1 直接確定權重
由決策者直接給出具體的權重值,比如裝車數所占權重33.3%、發送量所占權重33.3%、運費所占權重33.3%,就表示3 個指標權重相同、同等重要。或者裝車數所占權重30%、發送量所占權重30%、運費所占權重40%,就表示運費相比裝車數、發送量權重更高。
2.3.1.2 層次分析法
層次分析法(AHP 法)是一種定性與定量相結合適用于多指標復雜問題的確定權重方法。該方法將定性分析與定量計算相結合,由決策者根據經驗判斷各指標之間的重要程度,并合理地給出每個標準的權數,利用權數求出各方案的優劣次序[3]。層次分析法確定指標權重的基本思路如下。
(1)采用兩兩比較法建立判斷矩陣。即將參與比較的2 個指標的重要程度,賦予1~9 的標度值,并寫成判斷矩陣(1 表示2 個指標同等重要,3 表示一個指標比另一個指標稍微重要,數字越大則表示越重要)[4]。以裝車數、發送量、運費3 個指標為例,假設裝車數與發送量相比其重要程度是3(稍微重要),裝車數與運費相比其重要程度是2(介于同等和稍微重要之間),運費與發送量相比其重要程度是2(介于同等和稍微重要之間),如果反過來比較則取其倒數,可以寫出判斷矩陣,如表3 所示。

表3 裝車數、發送量、運費判斷矩陣
如果用矩陣來表示上述判斷矩陣,則可表示為:

(2)計算判斷矩陣的最大特征根及對應的特征向量。最大特征值用于判斷矩陣一致性檢驗,當通過一致性檢驗,可對特征向量進行數學處理,從而得出指標權重[5]。按照以上思路,計算出所有指標兩兩比較的判斷矩陣最大特征根與特征向量,最終得出各級指標的權重系數。
使用Python 語言編寫矩陣計算模塊,通過計算上述矩陣,可得最大特征根λ=3.009 19,特征向量w=(1.623 819,0.491 762,0.893 609)T。
為了進行判斷矩陣的一致性檢驗,需計算一致性指標CI:

查詢隨機一致性指標RI表可知,當n=3時,RI=0.52,則隨機一致性比率CR為:

由于CR<0.1,因此認為矩陣A的不一致性在允許范圍內[6],根據權重計算公式,可得各因素權重,如表4 所示。
至此,利用層次分析法,根據對裝車數、發送量、運費3 個指標重要性的假設,得到了3 個指標具體的權重值。

表4 層次分析法確定的各指標權重
層次分析法為定量計算多個指標的權重值提供了一種簡潔實用的建模方法,對我們的思維過程進行了加工整理,提供了一套科學的計算方法。但是,層次分析法也有其局限性,主要表現在:(1)它在很大程度上依賴于人們的經驗,受主觀因素的影響很大,無法排除因決策者個人喜好造成的結果誤差;(2)當指標過多時,兩兩比較可能難以準確確定各個指標的重要程度。
2.3.2 客觀評估法
客觀評估法主要包括變異系數法和熵值法,下面分別對這兩種方法進行介紹。
2.3.2.1 變異系數法
變異系數又稱為標準差率(Coefficient of Variation),變異系數法是直接使用各指標的原始數據通過計算得到指標權重的方法,不涉及人為因素,因此是一種客觀的確定權重的方法[7]。
(1)求出各個指標的變異系數。由于各個指標的量綱一般都不同,不宜直接比較其差別程度,需要使用各個指標的變異系數衡量它們的差異程度。假設有n個客戶m個指標,第i個客戶(i=1,2,3,···,n)的第j項指標(j=1,2,3,···,m)的數值為ai j,計算各個指標的變異系數。

其中,Vj為第j項指標的變異系數,也稱為標準差系數。
σj為第j項指標的標準差:

為第j項指標的平均數:

(2)計算各個指標的權重。

根據上述步驟,廣州局集團公司2019 年貨票數據統計結果裝車數前20 名的客戶裝車數、發送量、運費計算出的權重結果,如表5 所示。

表5 變異系數法確定的各指標權重
2.3.2.2 熵值法
在信息論中,熵是對不確定性的一種度量。信息量越大,不確定性就越小,熵也就越小;信息量越小,不確定性越大,熵也越大。根據熵的特性,通過計算熵值判斷一個事件的隨機性及無序程度,也可以用熵值來判斷某個指標的離散程度,指標的離散程度越大,該指標對綜合評價的影響越大[8]。假設有n個客戶m個指標,具體實現過程如下。
(1)根據客戶指標構造數據矩陣。

其中,ai j為第i個客戶第j個指標的數值。
(2)對原始數據進行處理。由于熵值法計算采用的是各個方案某一指標占同一指標值總和的比值,因此不存在量綱的影響,不需要進行標準化處理。但是,為了避免求熵值時對數的無意義,需要進行數據平移。

其中,為第i個客戶第j個指標的平移后的數值。
(3)計算第j項指標下第i個客戶占該指標的比重Pij。

(4)計算第j項指標的熵值。

(5)計算第j項指標的差異系數。

熵值ej越小,差異系數gj就越大,表示該指標對于研究對象所起的作用越大。
(6)計算第j項指標的權重。

根據上述步驟,廣州局集團公司2019 年貨票數據統計結果裝車數前20 名的客戶裝車數、發送量、運費計算出的權重結果,如表6 所示。

表6 熵值法確定的各指標權重
前面已經對原始數據進行了歸一化處理,又根據層次分析法、變異系數法、熵值法計算出了裝車數、發送量、運費的權重,再進一步計算便可得到層次分析法、變異系數法、熵值法確定權重后客戶的綜合分數和排名。其中,大部分客戶的排名與根據裝車數所做的原始排名相比都發生了變化,有的客戶排名下降達到10 多個名次,也有客戶排名上升了9 個名次。
通過分析看出,決策者對指標的關注程度不同,得到的客戶排名就不同。層次分析法是由用戶或專家根據經驗確定指標的重要程度并按重要程度賦值,計算出權重和綜合得分進行排名,是一種主觀的綜合評價方法,最終結果主觀因素較大。變異系統法和熵值法對原始數據進行加工處理,計算出各個指標的權重,計算出綜合得分,是一種客觀的綜合評價方法。在系統設計時,通過Python 語言將3 種方法都加以實現,由用戶根據需要進行選擇。根據目前鐵路行業統計工作實際,選擇層次分析法的用戶較多。3 種綜合評價方法的特點總結,如表7 所示。

表7 3 種綜合評價方法的特點
根據測算,獲取一位新客戶的成本是留住一位老客戶的5~6 倍[9]。因此,對貨運客戶進行分類和綜合評價,再對排名明顯下降的客戶制定行之有效的挽留方案和營銷策略,這是貨運客戶關系管理的有效手段。本文提出了一種主觀綜合評價方法和兩種客觀綜合評價方法,分析了3 種綜合評價方法的適用場景,并通過大數據處理技術對客戶原始數據進行計算分析,得出了綜合評分結果,對于鐵路貨運營銷工作從經驗支撐轉向數據支撐、客戶評價從單一指標評價到綜合評價轉變具有一定的借鑒意義[10]。