孫 琦,戢守峰,董 明
(1.東北大學工商管理學院,遼寧 沈陽 110169;2.上海交通大學安泰經濟與管理學院,上海 200030)
電商平臺長期累積的數據資源蘊含豐富的需求信息與商業價值亟待挖掘。Dey和Kumar[1]指出最優策略應依賴于搜集到的數據,消費者反饋的信息影響策略的選擇。因此,電商如何利用大數據優化配置配送資源,通過個性化方案提升配送服務質量,已成為國內外學術領域和企業界高度關注的熱點問題與前沿課題。
收貨方的配送服務質量滿意度是衡量企業服務質量水平的重要依據,近年來的研究主要集中在配送服務質量提升的驅動力。內部驅動力指通過企業內部結構調整提升服務質量,如Yee等[2]通過LMX理論發現,服務密集型企業充分注重員工協調,則提升服務質量并不會受到服務人員工作滿意度的影響;Dong等[3]通過改進Erlang-A模型分析質量-效率驅動機制,發現當系統負荷敏感度低時,系統達到質量量-效率驅動參數,反之系統參數在質量-效率驅動范圍之間波動;Baron等[4]在復雜服務網絡中通過設置預留閑置服務點減少客戶在服務點等待的概率,進而提升服務質量的感知;Debo和Veeraraghavan[5]發現服務等待入隊概率是單調遞減的,等待時間越長的隊列,消費者加入越少,最終使服務質量的差距減少;Debo等[6]同時認為:如果消費者對產品質量先驗概率知情度低,高服務質量的企業為降低技術成本,可能選擇比低質量服務企業更慢的服務速率;Xu等[7]探討單服務器排隊系統中的靜態服務差異化策略,在注重服務質量的群體中,消費者更關注服務時間,提供差異化服務可以提升服務系統性能的5%。
另一方面,對于最后一公里配送服務質量優化的研究主要集中在配給和路徑優化方面。Muoz-Villamizar等[8]以配送能力約束下車輛路徑局部優化為切入點求解隨機需求下城市系統中最后一英里配送問題,構建配送節點相互合作與非合作的規劃模型,對比發現相同的服務水平下協同運輸策略可以降低運輸成本,提高資源配置效率;Rancourt等[9]通過數學規劃的方法解決糧食援助背景下最后一公里分銷點選址問題,得到總投入成本與運輸食品區和倉庫配送中心之間距離關系;Fatnassi等[10]針對智慧城市的個人快速交通(PRT)和貨運快速運輸(FRT),提出使用高質量城市內域交通,替代空車再分配,促進城市配送可持續發展;Starr和Wassenhove[11]指出嵌入最后一公里參數的HO決策模型中,魯棒性是必須考慮的;Ghiani和Guerriero[12]從配送中心選址的角度,采用模糊多屬性群決策技術,通過二元數組混合有序加權平均排序,評估城市潛在可替代配送中心,并通過實例驗證該方法可減少主觀因素對城市配送中心決策的影響;Noyan等[13]構建兩階段隨機規劃模型,結合不同的公平分配供應策略,采用分支-切割法解決最后一公里的分銷網絡設計問題;曹杰和朱莉[14]針對城市資源緊缺問題構建多層超級網絡,考慮決策者對多種應急方式有選擇偏好時的城市群協調理論模型,指出考慮模糊需求信息對資源調配決策的影響值得進一步深入研究。
電商配送服務質量的相關研究可以看出,優化方法上逐漸從各要素驅動表現為數據驅動,而數據驅動下電商配送服務質量的研究卻鮮有見到,已有的相關研究,如Levi等[15]研究報童問題輸入需求數據分布形式未知的情況,采用樣本平均近似方法求解這種數據驅動報童模型,并且找到了對于該方法精確求解的邊界;Lee[16]指出經濟學領域的有限容量的規劃問題注重生產函數的特征,而運營管理領域更關注從銷售和庫存的損失較少的角度取得利潤最大,進而通過數據包絡分析約束設置一種多目標算法實現有限容量的隨機優化;Soyster和Murphy[17]研究數據驅動矩陣的不確定性魯棒線性規劃問題,即通過定義矩陣的行、列、系數將有限數量的矩陣嵌入到魯棒線性規劃,實現一個嵌套矩陣組原始線性程序預見不同的優化目標的價值量。此外,陳云翔等[18]提出一種基于信息熵的群組聚類組合賦權法,通過分析閥值變化率選取最優聚類閥值,對相似程度較高的排序向量給出合理的聚類。
綜上所述,迄今為止的研究表明:配送服務質量影響運作方案制定;最后一公里的配送服務質量規劃的有效執行對決策目標影響也非常顯著。但其研究也存在三方面不足:首先,對于配送服務質量的研究大多設定在隊列或者網絡結構中研究,以消費者在結構中的等待時間作為服務質量衡量標準,忽略了消費者歷史評價對于配送服務質量的優化意義及數據處理中多維度挖掘算法對決策方案的優化[2-7]。其次,對于配送服務質量研究通常從高質量和低質量兩種角度考慮,而現實中的質量分類是較為復雜的,存在一定的模糊區間,忽略了配送服務過程中積累的歷史數據蘊含更合理的分類,造成數據資源浪費[8-11]。最后,對于最后一公里配送問題的研究意義得到各方共識,但是已有研究尚未結合收貨方的歷史數據和配送服務質量偏好的分析,忽略個性化規劃解決方案更有利于提升收貨方體驗[12-18]。
針對以上三點,本文提出一種電商配送服務質量優化模型,以收貨方反饋歷史數據解析為出發點,從收貨方對配送服務質量偏好的角度進行聚類分析和模型優化。在收貨方配送服務質量偏好約束下決策者以優化質量成本為目標,對可用配送資源進行非線性混合整數規劃。根據統計學“記憶性”概念將聚類分析的結果按收貨方偏好歸納為“無記憶”型收貨方、“記憶”型收貨方、“總體”收貨方以及“不確定”型收貨方四種逐級放松的特征類型,得到質量偏好約束下的收貨方完備性分類。這些均是已有文獻未涉及到的。
考慮一個時間長度為T的規劃周期,電商在這一周期內需要解決配送服務質量的資源規劃問題,即何時采用何種配送服務資源更容易滿足收貨方的質量需求。考慮有N種不同的配送服務資源,每種資源為一種配送方式和一種服務方式的集成。本文受馬爾可夫過程和指數分布中無記憶性含義的啟發,根據質量敏感收貨方完備性集合研究四種類型的質量需求約束:(1)“無記憶”型收貨方(2)“記憶”型收貨方(3) “不確定”型收貨方(4)收貨方的總體 (圖1)。
圖1描述了本文對歷史數據處理框架:收貨方與電商交互過程中產生大量歷史數據,如運輸工具、交付方式、交付時間和滿意度等。按照質量偏好的記憶性特征進行聚類分析得到四種類型的數據集合A、B、A∩B和A∪B。值得注意的是,電商企業通過人力、物力資源的協調運作形成消費者服務質量評價的客觀基礎,直接影響其忠誠度水平,已有研究通過假設檢驗證明質量感知與忠誠度之間存在密切關系[19-21],據此,本文將收貨方對配送資源的質量感知度融入到電商企業物流優化建模之中。忠誠度的高低在一定程度上可預知消費者再購物的概率,直接影響電商企業的市場占有率。然而,忠誠度作為概率描述方式對應到現實空間只表現為“買”或“不買”兩種結果。基于這兩種結果的界限,引入描述質量最低容忍程度的變量,即超過收貨方的最低容忍度,則造成電商企業的收貨方消費者流失。

圖1 質量偏好與配送資源規劃關系圖
參數變量:
Dt: 單位階段t內的配送訂單需求;
ht(x): 電商持有成本;




決策變量:
xt:單位階段t內電商庫存數量


電商企業為優化資源配置,高效滿足收貨方需求,最直接的方式是以收貨方的需求進行服務配置。實際上,平臺硬件升級以及網絡覆蓋率擴大,目前的電商企業已突破技術瓶頸,后臺搜集到更多關于消費者購買習慣、行為偏好、敏感特征等方面的時間序列。為充分利用數據的價值,可將更新的數據進行動態聚類,提取到收貨方的質量敏感特征,再與電商企業內部服務資源數據庫進行個性匹配,達到精準高效服務的目標。
由于配送服務質量受到配送市場價格,配送距離,配送物品屬性等多因素影響,接受同等配送服務質量的不同的收貨方對配送服務質量敏感程度是不同的。通過模擬投票結果形成過程得到數據的記憶性特征,即為每一個投票者選擇合適的目標簇,而投票者心中可以有若干個不同目標簇,但是這些簇在投票者心中呈現不同目標強度的概率。根據文獻[22]提出投票聚類融合算法:
算法1:“確定”簇
步驟1:隨機選擇一個分區Ui∈U分配到U0;

步驟3:Vi=UiWi;

步驟5:得到更新的集合U0。
算法2:“不確定”簇
步驟1:降序排列Ui分配到U0;

步驟3:Vi=UiWi;

步驟5:得到更新的集合U0。
“確定”簇算法確定“無記憶”型和“記憶”型兩種類型收貨方集合。為求解模型,首先要證明“無記憶”型收貨方的質量約束下配送服務資源規劃問題能夠在多項式時間內求解。考慮傳統配送服務資源規劃問題的時間規模O(N2T),即標準的資源規劃組合算法可以解決這一問題。
掌握消費者需求的驅動力能夠讓企業在競爭中處于絕對優勢。隨著互聯網時代數據量的豐富,這種優勢在電商競爭中逐漸顯現。電商有能力搜集到消費者的年齡、性別、職業和收入等自然屬性,以及消費者習慣、行為、情感和偏好等社會屬性,進而能夠通過技術分析判斷特定消費群體的需求和行為特征。電商的配送服務質量通過外部驅動和內部驅動共同作用,即數據驅動力,滿足個性化需求,調整內部組織結構與決策方案,達到服務質量升級的效果。
如圖2所示,以固定時間窗寬度內數據作為分析觀測窗口,抽取時間窗內消費者配送系統數據為歷史數據;最新時間窗外的后續新增消費者數據形成增量數據。數據預處理過程主要分析數據規律以及確定異常值與缺失值:首先搜索數據屬性(表1)列中的空值、最大值和最小值;清理數據為空或異常數據的記錄;將數據轉換為適合聚類算法的屬性。抽取生鮮超市便民生鮮O2O平臺2014年1月31日-2016年1月31日收貨方8200條歷史數據,包括收貨方標簽、收貨時間、訂單級別、配送地點和配送成本等35個屬性。得到圖3穩定性測度(S)=觀測時間窗的結束時間-初次收貨時間(單位:天),鄰近測度(L)=最后一次收貨時間至觀測時間窗末端長度(單位:天),配送里程(K)=觀測時間窗內總配送公里數(單位:公里),收貨次數(G)=觀測時間窗內收貨次數(單位:次),平均折扣系數(C)=平均折扣率。提取目標屬性,進行數據標準差標準化,降低數據量綱差異化影響。

圖2 數據驅動過程

表1 數據清理結果

圖3 標準化屬性規約數據
根據用戶在線行為長效記憶性[23]以及行為數據聚類分析,將收貨方通過電子商務平臺留下多屬性多周期的足跡數據從時序特征變化角度進行完備性分類。從現實角度看,四種特征分類方式具有合理性:并不是所有消費者在購物中都注重收貨質量,而是更關注商品質量,那么這類收貨方的服務質量表現出“無記憶”,電商企業有機會以最低的運營成本滿足收貨方的質量需求;面對配送服務質量要求很高的消費者,電商企業的服務質量直接影響到這類消費者整個購物體驗,則這類收貨方的質量敏感屬性“記憶”性較強,需要電商企業根據該類收貨方已有歷史數據呈現的偏好,給予相對個性化的配送方式;有些消費者的質量感知特征刻畫不明顯,數據屬性時序規律表現出“不確定”,對配送服務質量的關注程度呈波動趨勢,為滿足這類收貨方配送服務的需求,電商企業可從數據總體呈現的特征進行配送資源規劃,雖然失去一定的靈活性,但是基于總體收貨方得到的決策效果不會出現損失過大的情況。據此,根據收貨方的質量感知數據聚類特征分組,將質量感知嵌入到傳統模型。
傳統配送服務資源規劃主要從需求和配送過程的角度進行決策:
(1)
(2)
(3)
(4)
其中,式(1)表示T周期內N種配送資源的固定投入成本、使用成本以及持有成本最小化;式(2)表示電商供貨的持續性;式(3)表示如果沒有選擇第n種配送資源則不會提供配送服務(<),若選擇則配送(=);式(4)表示決策變量的正則性約束。
構建約束集(6)、(7)、(9)和(10)組成服務質量約束下的配送資源規劃模型。依據收貨方的反饋數據得到配送服務質量的聚類,通過下列集合關系表示收貨方完備性質量需求的感知空間。
4.2.1 “無記憶”型收貨方
“無記憶”型收貨方(對應集合A):對配送服務質量無需求,t階段配送服務的質量不影響該類型收貨方在t+1階段對產品的忠誠度,配送服務質量對收貨方的影響呈現周期性,表現出收貨方對質量的要求無記憶性的特點。得:
(5)
即每個周期內的配送服務質量需求大于收貨方對質量需求的最低容忍度。形式可寫成:
(6)

4.2.2 “記憶”型收貨方
“記憶”型收貨方(對應集合B):對配送服務質量有需求,t階段配送服務的質量影響該類型收貨方在t+1階段對電商的忠誠度,并且持續影響下去,配送服務的質量在該類收貨方心中呈現累積的效應(可正可負)。得:
(7)
在未來周期t′,收貨方對電商的配送服務質量信任度:
(8)
4.2.3 收貨方總體
收貨方總體(對應集合A∪B)的約束是對式(7)擴展得到整個規劃周期的情況,具有松弛性。得:
(9)

4.2.4 “不確定”型收貨方
“不確定”型收貨方(對應集合A∩B):對配送資源的服務質量表現出隨機“記憶性”,在t階段配送資源服務質量可能影響該類型收貨方在t+1階段對電商的忠誠度。
假設僅有M個規劃周期,該類收貨方具有配送服務質量記憶的不確定性,與T無關。有:
(10)
其中,式(6)為式(10)中M=1的情況;式(7)為式(10)中M=t的情況;式(9)為式(10)中M=T的情況;信任度式(8)依然成立。
5.1.1 特征分析



定理1在單位周期內至少使用兩種配送資源得到規劃最優解,即一種服務質量有效配送資源,或者增加一種服務質量失效配送資源。

(11)
(12)
(13)
(14)
(15)
(16)

(17)
(18)
(19)

(20)

由定理1的性質,“無記憶”型收貨方的規劃問題對于配送方來說相當于周期性約束,共計N2種配送資源。
定理2對“無記憶”型收貨方的配送資源種類為N2,且規劃的時間規模O(N2T)。

(21)
(22)
(23)
(24)

(25)
根據定理1,以上單周期規劃問題轉化為最優化問題:
(26)

5.1.2 “無記憶”型收貨方求解

定理3“無記憶”型收貨方的質量需求約束下配送資源規劃問題等價于電商的零庫存策略最優解問題。
根據已有性質和定理,用動態規劃方法解決“無記憶”型收貨方的問題,得到關系式如下:
(3)階段t內的成本G(t),t=1,…,T為“無記憶”型收貨方質量需求約束下電商配送資源問題的一個最優解,G(t+1)=0;
(4)H(t,t')記為單位階段t內服務Dtt′的總成本函數(固定成本和可變成本)。根據定理1,在周期t至少使用兩種配送資源滿足需求Dtt′。
(5)目標函數重新形式化為

C(t)=
(27)


預處理過程可通過不等式Y≤al+blQ來確定二元多項式的極值點,確定每個時期t的斷點和斜率,時間復雜度O(NlogN)。因此,對于每個單位周期t,都能在時間O(N2logN)內找到所有斷點及t≤t′≤T時H(t,t′)的最優值,且計算時間復雜度O(TN2logN+T2) 最后分析動態規劃的時間復雜性。上述證明H(t,t′)的值可計算,C(t)的值在每個周期t內求得,即時間復雜度為O(T),故能在時間O(T2)確定C(1)的值。動態規劃的總時間復雜度小于O(TN2logN+T2)。 定理4“記憶”型收貨方約束的配送資源規劃問題在每個周期內至少使用兩種最優配送資源:一種服務質量有效配送資源,或者一種服務質量失效配送資源。 明顯地,在某些情形下“記憶”型收貨方模型與“無記憶”型收貨方模型是非常相似的。但是,“記憶”型收貨方的問題比“無記憶”型收貨方的問題更難解決。與定理3對比,發現零庫存目標性質并不適用于“記憶”型收貨方問題。對于“記憶”型收貨方問題,最優零庫存策略的成本可能遠高于最優策略的成本。 基于以上結論得到“記憶”型收貨方的問題是NP-hard。將該問題歸納為一種特殊情形子集和問題,即額外的對所選集合大小存在勢約束:有n份訂單的收貨方對電商提供商品的質量 “記憶”,每份訂單都有一個質量比重wi,其和為w。在一個周期內,對“記憶”型收貨方進行k次配送服務,對每次購物的配送服務質量存在容忍度累積,每次配送提供的質量權重使總比重達剛好到w。換言之,有一個n維整數矢量(α1…αn),∑iwiαi=w且∑iαi=k。不存在k的基數約束,則這個問題為NP-hard完全背包問題。完全背包問題中物品是無限的,其求解復雜度可以轉為0-1背包問題,此時k是確定的有限值。接下來證明0-1背包問題是一個非確定多項式(NP-complete)。 引理1:完全背包問題復雜度相當于0-1背包問題,是非確定性多項式問題[24](NP-complete)。 定理5“記憶”型收貨方的問題是NP-hard。 證明:設k≥2,并假定所有配送訂單的質量權重W>wi。不失一般性,假定所有配送訂單質量權重wi≥1。根據引理將0-1背包問題轉換為“記憶”型收貨方的問題: (2)有T=k+1個階段,每個階段都有單位需求要滿足。 (3)對所有資源來說,持有成本設定為h=kW。 (4)要求一個解的權重至多為2W+1。證畢。 相反地,假定所有質量需求都能夠以至多2W+1的權重得到滿足。首先,在t=1時,初始階段有必要使用資源N去滿足質量需求約束。由于總權重不能超過2W+1,有效的配送策略即正好使用一次資源N。其次,令持有成本的值為ε=∑tst且1/k<1,即有效配送策略必須在每個周期進行配送以滿足單位需求。因此,只有資源N是有效時,在每個階段恰好使用一個資源。令S為從階段2到階段T=k+1的所配送資源的集合,可以稱S為完全背包問題的一個有效解。由此可得,S正好含有k個元素,其總權重等于從階段2到階段T的總配送資源準備成本,得PN+hε+w(s)≤2W+1,即w(s)≤W-hε=W(1-kε)。 (28) (29) 由ε=0,有W(S)≤W(1-ε),即有效的策略會在每個周期配送一單位產品。即W(S)=W。 收貨方總體質量約束下電商配送資源規劃問題比“記憶”型收貨方的問題約束更松弛。收貨方總體有(T-1)個約束經過轉移,僅(9)起作用。收貨方的總體仍然是一個NP-hard問題。證明同定理5。 表2 四種聚類方法對比結果 圖4 聚類過程與效果 軟聚類投票法(Vote-soft)與經典K-Medoids、K-Means和Clarans聚類法的效果進行對比實驗,結果表明精度和運行時間顯示出較好的優越性(表2)。主要原因是Vote-soft更符合本文模型構建的邏輯結構特征。 圖4(a)表示經過3次迭代訓練達到中止,中止過程均方誤差的最佳性能參數為0.168;圖4(b)顯示三次迭代中止時,隨著梯度下降,學習率降低,當梯度達到2.4825×10-8時,結束訓練;變量mu確定學習過程是根據牛頓法還是梯度法來完成,mu隨著迭代逐漸降低說明學習過程主要根據梯度下降法,當mu下降到1×10-6時學習過程停止;錯誤次數穩定在0附近;圖4(c)圖顯示隨著訓練錯誤率的降低,各門店聚類回歸過程,圖中R值為相關系數,橫坐標為訓練的目標值(target),縱坐標為輸出值(output),將數據劃分成三份:訓練(training)、驗證(validation)、測試(test),其中training數據參加訓練,validation和test數據不參加訓練,僅用于檢驗;剛開始時validation和target之間的誤差也會變小,可隨著訓練的增加,test的誤差繼續變小,validation的誤差反而會有所上升;訓練進行時,目標(target)和訓練(test)數據目標之間的誤差會越來越小;當validation的誤差連續上升3次時訓練就停止了,防止聚集過程的擬合過度。經過訓練后得到的門店(表3)聚類結果為C、D、E、F、G樣本屬于“無記憶”型簇,即動態規劃求解; A、H、I屬于“記憶”型;B、J屬于“不確定”型收貨方,采用文獻[25]MOPSO算法近似求解,實驗結果如圖5所示。 表3 10家門店服務需求情況 圖5 實驗對比結果 由圖5知,傳統整數規劃方法從成本角度出發盡可能選擇配送成本低的配送服務資源,這雖然表面減少成本,但是忽略了收貨方的服務感知會影響收貨方再次購買的需求量,故在t=3以前,傳統規劃方法是統一配送,成本一直處于上升趨勢。而非線性混合整數規劃得到的平均成本在最初階段高于傳統方法,因為配送資源的準備需要一定的成本投入,但是t=3以后,非線性混合整數規劃成本出現下降,優于傳統整數規劃;在資源利用率方面,非線性混合整數規劃使得配送資源也同樣在t=5以后得到充分利用,資源利用率基本穩定在0.65,而傳統規劃方法由于缺乏一定的靈活性,資源利用率基本穩定在0.2。通過對比可以看出,對消費者進行聚類分析后,有利于成本節約和資源利用效率的提升。 本文利用“互聯網+數據資源”優化電商配送服務質量,以收貨方數據為驅動源,通過對收貨方數據特征進行解析,構建電商配送服務質量的非線性混合整數規劃模型,對收貨方歷史數據進行聚類分析,挖掘不同收貨方的質量需求穩定性。電商決策者提出配送方案前,先對收貨方的質量敏感性進行聚類分類,根據收貨方不同質量敏感性提供相對個性化服務,更高效進行配送資源規劃,提升最后一公里配送服務的質量,優化電商的配送服務質量的決策。本文對收貨方的服務質量偏好程度進行完整分類: “無記憶”型收貨方、“記憶”型收貨方、“不確定”型收貨方及收貨方總體,進一步地,給出四種類型求解空間的復雜度推導;設計“無記憶”型收貨方服務質量約束下電商企業配送資源的動態規劃算法;證明其他三種特征類型為NP問題,并給出近似求解算法。 本文得到如下管理啟示:第一、數據驅動力使得電商更容易通過收貨方質量偏好提供相對精準的配送服務方案,使得不確定服務需求得到有效滿足,質量投入成本的利用率更高。第二、收貨方數據的日益豐富雖然為電商提供了更多維度的市場數據,但是增加了挖掘方法的難度。本文詳細分析四種收貨方分類模型的時間復雜度及NP屬性,為大數據解決方案提供合理的模型描述和實施前提。第三、在具體的解決方案中,決策者通過優化設計數據處理流程,抽取收貨方歷史數據的質量敏感相關屬性進行聚類分析,增強數據預處理環節的優化,能夠提升企業資源規劃過程的精準度;第四、求解過程發現,大規模NP問題通過模型分類后能夠縮減NP規模,進而增加解決方案的靈活性,提升大規模問題的求解精確度。粒子群算法作為傳統啟發式算法,通過優化粒子參數能夠在大規模數據求解中發揮作用。 在未來的研究中,利用數據驅動力深入挖掘數據預處理的方法,如聚類算法等,使得收貨方的類型更加明確,設計更加精確的算法解決“記憶”型收貨方、“不確定”型收貨方和收貨方整體的NP-hard問題,或者對于收貨方行為偏好的特征進行精細劃分,使得企業可以提供精準服務,都將是非常有前景和價值的研究方向。5.2 “記憶”型收貨方



5.3 “不確定”型收貨方與收貨方總體



6 數值與算例分析


7 結語