徐 穎,江 熾,陳登翔,劉許文言
(1.武漢理工大學 自動化學院,湖北 武漢441000;2.武漢理工大學 土木工程與建筑學院,湖北 武漢441000)
無車承運人作為國家探索發展“互聯網+物流”的新模式,對整個物流行業的發展具有重要的意義。該模式下主要由三個主要的參與角色,分別為貨主、無車承運人平臺以及承運人[1]。但作為一種新業態與模式,其在發展過程中仍面臨諸多問題及困境。當前階段無車承運人平臺較為關注的目標是快速促進成交以及較低的承運成本。為實現無車承運人平臺和承運司機利益雙贏,如何對承運線路進行科學定價是目前無車承運人平臺亟待解決的問題[2]。
本文以mathorcup2020年數學建模A題的源數據為例展開分析,以無車承運人視角對貨運線路定價的主要因素展開研究。該無車承運人平臺面向承運端司機,將需要承運的線路任務以一定價格提前發布到網絡平臺上供承運端的司機瀏覽并決定是否承運該運輸任務。承運端的司機將根據平臺所發布的線路任務及價格決定是否接單,一旦接單(即交易成功)則任務下架。若無司機接單,平臺可調價(價格發布限3次),若任務未被承運將給平臺帶來損失。
回歸分析[3]的作用大體分為三種,分別如下:①識別以及判斷真正影響平臺貨運線路定價(稱之為因變量Y)的指標(稱之為自變量X),即實現所謂的變量篩選;②判斷自變量X與因變量Y的相關關系的正負性;③求解不同的回歸系數以反映各變量之間的相對重要性,可用于權重的估計。
由mathorcup2020年數學建模A題的源數據可知,各類指標既存在定量指標,如總里程、線路總成本等,同時也存在定性指標,如業務類型、成交對象、緊急程度、打包類型、車輛類型、地區等。其中,以定性指標居多。針對因變量Y以及自變量X中存在的定量變量,利用Stata軟件中的summarize指令進行描述性統計,結果如表1所示。

表1定量變量統計分析結果
針對自變量X中存在的定性變量,可引入虛擬變量。利用Stata軟件中的tabulate指令返回對應變量的頻率分布表并生成虛擬變量。
最小二乘法[4]主要通過將誤差平方最小化以及匹配最適合數據的函數進行擬合,常用于多元線性回歸分析。利用Stata中的regress指令運用最小二乘法進行回歸分析,觀察到變量存在多重共線性,即其之間存在很強的相關性,此時,利用常規最小二乘法進行回歸分析將使參數估計值的方差增大,變量的顯著性檢驗將失去意義,可能將重要的解釋變量排除在模型之外。
為解決這一問題,考慮采用主成分分析[5-7]盡可能消除多重共線性。
首先,對所有研究樣本進行總體描述性統計分析。描述性統計分析結果如表2所示,可發現成交對象主要為B(即承運商),調價比例較低且續簽率高。
將16 008個樣本以及10個指標構成大小為n×p的樣本矩陣(n為樣本數,p為指標數),首先對10個特征變量做標準化處理,步驟為按列(各變量)計算均值以及標準差Sj,計算得到標準化數據xij,即:

進一步對標準化后的數據進行相關性分析,計算樣本矩陣的相關系數矩陣R,即:


表2總體描述性統計分析結果
繪制出相關系數矩陣R圖如圖1所示。
圖中,顏色越深代表相關性越顯著。由圖1可發現,總里程與線路總成本相關性強,X7相對X1的相關系數為0.997;業務類型與調價比例相關性強,X9相對X2的相關系數為0.501;車輛類型與線路總成本相關性強,X7相對X4的相關系數為0.557。

圖1相關系數矩陣R圖
再計算相關系數矩陣R的特征值λp和特征向量ap,根據特征值計算結果算出主成分貢獻率以及累計貢獻率,即:

上述所計算的特征向量、特征值、貢獻率以及累計貢獻率匯總如表3所示,由表3可知,前四種主成分的累計貢獻率達74.3%,由此可以考慮選前四個主成分,它們能夠很好地概括原始變量。
由表3對四個主成分進行分析可得出如下結論:①第一主成分F1在X1、X4、X7上有中等程度的負載荷,而在其余變量上的載荷都較小,可稱第一主成分為貨運線路成分;②第二主成分F2在X10上有中等程度的正載荷,而在X2、X9上有中等程度的負載荷,而在其余變量上的載荷都較小,可稱第二主成分為司機對價格的評價成分;③第三主成分F3在X6上有中等程度的正載荷,在X3上有中等程度的負載荷,而在其余變量上的載荷都較小,可稱第三主成分為運輸端與地區成分;④第四主成分F4在X5上有中等程度的正載荷,在X8上有中等程度的負載荷,而在其余變量上的載荷都較小,可稱第四主成分為訂單要求成分。

表3主成分分析計算結果
為進一步直觀地展示各樣本的分布情況以及聚類過程,利用SPSS軟件繪制出聚類分析樹狀圖,如圖2所示。
由圖2可知,當分類數取4時,即此時總里程以及線路總成本為第一類,可描述為貨運線路里程及成本;成交對象和打包類型為第二類,可描述為平臺指派對象;車輛類型、需求緊急程度、業務類型以及調價比例為第三類,可描述為訂單要求;地區以及是否續簽為第四類,可描述為司機評價。

圖2聚類分析樹狀圖
由于多元線性回歸分析時,變量存在多重共線性,因此采用主成分分析。經過標準化處理后,通過對各變量進行相關性分析,可發現變量間的相關程度,并對特征向量、特征值、貢獻率以及累計貢獻率進行計算,便于后續主成分分析。同時,繪制出聚類分析樹狀圖可視化表示聚類過程。由于聚類時采用的參數以及方法不同,因此聚類結果與主成分分析結論略有差異,但通過分析可發現分析出來的影響因素大體相同,因此權衡后本文采用主成分分析結果描述平臺貨運線路定價的主要影響因素。
綜上所述,影響無車承運人平臺進行貨運線路定價的主要因素為貨運線路里程及成本、司機對價格的評價、運輸端與地區、訂單要求,共計四種,其中,貨運線路里程及成本這一因素占最重要地位。