郭鵬
(貴陽學院經濟管理學院,貴陽550005)
在近40年的收益管理(RM)理論和實踐發展使需求無約束估計得到了廣泛重視[1],其計算結果是預測模型的重要輸入,能幫助收益管理系統(RMSs)制定更準確的優化控制策略。考慮到現代服務業的網絡化特征從根本上使產品預售時間窗和乘客預訂用時大幅縮減,公司中央預售系統(CRSs)中的短期需求數據具有高度不確定性,不同“預售提前期間隔”中的乘客需求能被擬合為不同的分布形式,比如正態、對數正態、威布爾、伽瑪和泊松分布等[2]。
郭鵬等[3]僅考慮了乘客需求在同一航班不同艙位間的“再現”效應,未對短視型和策略型乘客在整個航空客運網絡O-D航程產品間的當期和跨期轉移購買行為進行描述。已有仿真研究結果表明,無約束估計方法分布形式假設的選擇不當會對公司收入造成1.5%的相對影響,對于一般大型航空公司而言,其絕對經濟損失可達上億元[4]。
因此,為提高網絡環境下多分布需求無約束估計的準確性,提出一種基于威布爾和對數正態分布的改進參數回歸模型。由于Liu等[2]的研究僅考慮需求“溢出”效應,在模型構建和參數估計等方面均無法滿足網絡環境下需求無約束估計的應用要求,本文所提模型不僅考慮了航空網絡乘客需求分布形式、“隨機獨立截尾”機理以及數據收集條件等信息,還同時針對網絡需求的“溢出”和“再現”效應、以及乘客取消預訂和no-shows行為,分別提出了基于截尾樣本數據的模型參數估計和需求無約束估計值計算方法,在提高計算準確性的同時,有效避免了現有方法對歷史乘客真實“初始需求”的高估問題。
本文的研究重點不包括模型擬合優度檢驗和參數假設檢驗,相應內容可參見Lawless[5]的研究。本文的研究對象主要針對完全競爭網絡市場環境下的航空客運公司,由于“受截尾數據分析”不局限于RM實踐行業,本文所提方法同樣能為酒店、汽車租賃、庫存管理、零售生產規劃、現代旅游服務供應鏈管理、生命可靠性測試和疾病預測等領域提供參考。根據文獻[6]提出的RM研究分類,本文的研究對象如表1所示。

表1 本文的研究對象
由于能夠考慮與乘客“初始需求”相關的所有信息,相較于數據驅動類的非參數模型,參數回歸模型通常更具魯棒性,在計算過程中顯得更為實際[2]。
本文所提方法的符號及變量定義如下:
(1)Ο:出發地集合;
(2)nod:出發地數量;
(3)Rm:以出發地m為起點的O-D航程集合,R={R1,R2,???,Rm},m=(1,2,???,nod);
(4)rm:Rm中的O-D航程數量,j=(1,2,???,rm);
(5)C:所有航班票價家庭所構成的艙位集合,C={C1,C2,???,Cm},Cm={C1,m,C2,m,???,Cjm};
(6)cjm:Cjm中的票價等級數量,i=(1,2,???,cjm);
(7)t:預售提前期中觀察點t=(0,1,2,???,T),當t=0時,艙位預售開放,當t=T時,航班起飛;
(8)Δt:時刻t和t-1之間的“預售提前期間隔”;
(9)n:從一個給定的出發日期集合中相同“預售提前期間隔”中抽樣到的、代表相同歷史票價艙位的乘客需求量樣本觀察值數量,即樣本容量:k=(1,2,???,n);
(23)X:以艙位i為初次購買首選的乘客“初始需求”量隨機變量;
(24)x:乘客成功預訂可觀察樣本需求量,x=(x1,x2,…,xn);其中,可將第k個樣本需求量定義為xk=B
(25)z:參數回歸模型中解釋變量的行向量,z=(z1,z2,???,zp);zk表示與第k個樣本需求相關的1×p維解釋變量行向量,zk=(zk,1,zk,2,???,zk,p);
(26)θ:參數回歸模型中與解釋變量z相對應的需要被估計的p×1維參數列向量,θ=(θ1,θ2,???,θp)′;
(27)f(x|z;θ):X的概率密度函數;
(28)F(x|z;θ):X的分布函數,F(x|z;θ)=P{X≤x|z;θ};
(29)S(x|z;θ):X的生存函數,S(x|z;θ)=P{X≥x|z;
(30)h(x|z;θ):X的危險函數,h(x|z;θ)=X<x+Δx|X≥x)Δx=f(x|z;θ)S(x|z;θ);
(31)Uxk:考慮“溢出”效應下B的無約束估計量,可用uk表示;其中,當k∈Q時,Ux=B=xk;當k∈時,Uxk=B+CXYD+CFWX;
本文所提方法的計算過程有如下四個步驟:
(1)O-D航程艙位預售開放狀態檢查
基于從CRSs中所獲得的某一“聚合水平”下的樣本數據,可得到O-D航程中的各
(2)基于某種參數回歸模型形式建立f(x|z;θ)
為正確建立f(x|z;θ),需要在對X的分布形式、z對f(x)的作用、以及建立模型和參數估計的難易程度進行綜合考慮的基礎上,選擇一種合適的參數回歸模型形式。其中比較常用的主要有兩類:比例風險模型(PHM)和位置尺度模型(LSM)。
建立f(x|z;θ)后,可采用極大似然估計法對回歸模型中的未知參數θ進行估計,然后通過計算獲得U。考慮到從CRSs中所獲得的B是D在“溢出”和“再現”綜合效應作用下的結果,因此,本文分別定義引起上述兩種效應、以及取消預訂和no-shows行為的解釋變量zk,并采用如下兩個步驟分別對θ、Uxk和U進行估計和計算。
①考慮乘客需求“溢出”效應下的估計和計算
②考慮乘客需求“再現”效應、取消預訂和no-shows行為下的估計和計算:
(4)模型的擬合優度檢驗和參數的假設檢驗
一些一般化的擬合優度檢驗方法可被用來檢驗模型的擬合程度。比如,針對連續型需求分布的改進后的Kolmogorov-Smirnov檢驗。諸如概率密度圖、危險函數圖或殘差圖等圖形方法也經常被用到。對于模型參數θ的假設檢驗及其置信區間的獲取,可通過Fisher信息矩陣和對數似然比統計檢驗法來進行。如未通過上述兩類檢驗,則需返回相應步驟重新建立模型。有關該問題更加深入的討論參見Lawless[5]。
2.3.1威布爾分布
(1)f(x|z;θ)的建立
本文考慮基于雙參數威布爾分布建立參數回歸模型,若允許其尺度參數α依賴于回歸解釋變量z,而位置參數δ則與z無關,在給定z后,有:

其中,x≥0,α(z)是z的函數,并含有一些未知參數β。考慮到δ與z無關不僅保證了上述模型屬于PHM模型,還使乘客“初始需求”對數的方差相等,因此,在給定z的情況下通過研究=lnX的分布也能對式(1)進行考察,便得到基于極值分布的參數回歸模型:


其中,Y服從標準極值分布:f(y)=exp[y-exp(y)],-∞<y<∞。式(3)為LSM模型,其誤差項為Y。式(1)中δ的不變性對應于式(2)中σ的不變性,故lnX具有共同方差。因此,式(2)可寫為:

①考慮乘客需求“溢出”效應



由極值分布與威布爾分布的關系可知:

②考慮乘客需求“再現”效應、取消預訂和no-shows行為
在將上述步驟得到的Uxk替換樣本中的B后,便可得到新樣本中的獨立觀測值,zk)。其中,=lnuk=lnUxk。則對數似然函數為同理,似然方程?lnL?βl=0(l=1,???,p)和?lnL?σ=0用Newton-Raphson方法或其他迭代方法求解也是沒有困難的。令={,}和z=zR。則:


2.3.2對數正態分布
(1)f(x|z;θ)的建立

①考慮乘客需求“溢出”效應

V(y)是標準正態分布的危險函數,λ(y)則是它的導數。由式(11)和式(12)可得:

如Lawless[5]所述,對式(13)和式(14)采用首先由Sampford和Toylor[7]提出的迭代法,后經Wolynetz[8,9]修改和推廣,該迭代方法相較于Newton-Raphson迭代算法能夠更好和更加方便地獲取和。假設→N(zSβ,σ),那么:



求解可得:


(c)利用式(19)和式(20)計算β(q)和σ(q)。
本質上,該方法是一種EM算法[5]。令={,}和z=zS,利用式(15)計算k,可獲得:

②考慮乘客需求“再現”效應、取消預訂和no-shows行為

則:

此時,對式(24)和式(25)采用Newton-Raphson迭代以獲得

可得到:

假定國內某航空公司有如圖1所示的航空網絡,以北京、西安、青島和貴陽為出發地m={1,2,3,4}的O-D航程集合中,nod=4,r1=6,r2=4,r3=5,r4=7。該公司從西安到青島于2015年6月7日起飛的所有航班具有相同艙位設置,i={1,2,3,4}。其預售提前期劃分為8個階段。現使用本文所提方法對上述航空網絡中西安→北京→青島中轉聯程航線(m=2,j=3)商務艙(i=2)在第4個“預售提前期間隔”Δt(t=4)中行無約束估計,z如表2所示(n=6)。

圖1航空網絡示意圖
表2 的訂購情況以及參數回歸模型解釋變量示例

表2 的訂購情況以及參數回歸模型解釋變量示例
zS k zRk k 123456 B3,2 2,4,k zS I3,2 2,4,k k,1 zS k,2 k,1 zR k,2(xk)BL3,22,4,k P3,2 2,4,k100 14.40 8.50 10.20 9.70 6.80 9.50 P2,2 2,4,k100 9.50 11.70 10.20 15.20 9.30 11.70 DL3,2 zR 537546 111011 777577 k 010011

表3 考慮乘客需求“溢出”效應的參數估計和無約束估計結果

表4 考慮乘客需求“再現”效應、取消預訂和no-shows行為的參數估計和無約束估計結果
本文所提方法能更加全面地對網絡環境中歷史無約束需求與歷史乘客“初始需求”之間的正相關關系進行估計,可將其作為大數據時代下RMSs中無約束需求預測子系統的關鍵核心,在分析網絡環境下的需求聚合水平與具體分布形式之間相關關系的基礎上,將大數據倉庫中的結構化和非結構化需求信息用解釋變量進行描述,能為優化模型提供更加準確和魯棒的無約束需求預測結果,RMSs的整體可靠性和實施成功率可顯著提高[1,10]。
參考文獻:
[1]郭鵬.網絡環境下收益管理系統需求無約束估計綜述[J].計算機工程與應用,2017,53(19).
[2]Liu P H,Smith S,Orkin E B,et al.Estimating Unconstrained Hotel Demand Based on Censored Booking Data[J].Journal of Revenue and Pricing Management,2002,1(2).
[3]郭鵬,蕭柏春,李軍.基于多需求分布的收益管理多艙位無約束估計模型[J].系統科學與數學,2013,33(10).
[4]郭鵬,蕭柏春,李軍.收益管理中多分布無約束估計方法的仿真比較[J].計算機仿真,2014,31(2).
[5]Lawless J F.Statistical Models and Methods for Lifetime Data[M].New York:John Wiley&Sons,2003.
[6]Weatherford L R,Bodily S E.A Taxonomy and Research Overview of Perishable-Asset Revenue Management:Yield Management,Overbooking,and Pricing[J].Operations Research,1992,40(5).
[7]Sampford M R,Taylor J.Censored Observations in Randomized Block Experiments[J].Journal of the Royal Statistical Society,1959,21(1).
[8]Wolynetz M S.Algorithm AS 138:Maximum Likelihood Estimation From Confined and Censored Normal Data[J].Journal of the Royal Statistical Society,1979,28(2).
[9]Wolynetz M S.Algorithm AS 139:Maximum Likelihood Estimation in a Linear Model From Confined and Censored Normal Data[J].Journal of the Royal Statistical Society,1979,28(2).
[10]郭鵬.收益管理中基于大數據倉庫的需求無約束估計——框架與挑戰[J].大數據,2017,3(3).