劉亞暉 林 駿 林 勁 薛曉慶
1(同濟大學軟件學院 上海 201804)2(邁創智慧供應鏈股份有限公司 上海 200120)
隨著大數據和數據科學技術的興起,基于數據驅動的方法,研究有效的預測方式,為備件庫存的控制和智慧供應鏈的建設提供了全新的思路。本文基于灰色模型建立灰色故障率公式,并基于故障率曲線中的澡盆曲線原理提取不同手機型號的故障率特征值,進而通過歷史機型故障數據來評估新機型完整生命周期中的故障率水平和分布,根據新機型銷售計劃以預測新機型的故障數量,相應地制定產品投入市場之前的合理備件采購方案。
本文中術語的定義:
手機故障數FC(Fault Count):是指手機在保修期內,由于手機使用或手機本身的質量問題,導致的手機無法工作或部分功能失效后,手機用戶通過保修網絡提交并經確認的手機故障的數量。
手機故障發生有相當大的隨機性,同時手機銷量巨大,使用的人群和環境差別很大,因此其受隨機因素的影響較大。另外,手機故障發生與手機報修之間也存在一定的時間關系。比如從數據分析中明顯可看到周末(含周六和周日)故障數量極少,接近零,這應該是與周末為休息時間,即使發生故障,一般也是工作日才去報修,這也會帶來一些時間上的人為偏差。這類偏差并非隨機偏差,屬于周期性偏差,可通過按周統計來消除。
手機在保量TC(Total Count):是指手機銷售后仍在保修期內的樣本數量。手機銷售后都有保修期,一般為15個月,超出保修期后,維修成本較高,同時也面臨手機更新換代,很少有用戶會去維修,因此,手機故障主要體現在手機保修期內。由于具體銷售數據較為敏感無法精確獲取,目前通過實際批次發貨數據進行銷售進度評估并累加計算手機在保量。
手機故障率FR(Fault Rate):是指單位手機數量上發生故障的比例,一般會隨著時間變化而變化,相應得到的故障率曲線。手機故障率計算公式為:
FR=FC/TC
(1)
考慮到一般機電設備的故障率曲線都符合U型,即澡盆曲線,見圖1。它表示前期設備故障率一般會偏高,隨著生產的穩定,故障率會下降并穩定在某個水平上,隨著時間的偏移和元器件的老化,設備故障率還會再次變高。手機的生產分為手機試生產、小批量生產和大批量生產,其故障率會在前期試生產和小批量生產時出現一些故障率上的波動,后期大批量生產后,其故障率也會穩定在一個相對固定的水平上。由于手機保修期的原因,超出保修期的手機一般不再維修,即澡盆曲線的末段一般不會達到,手機故障率一般會體現在澡盆的前半段,后續的故障率分析會體現這一特點。

圖1 設備故障曲線示意圖
灰色模型GM(Grey Model),由于系統被噪聲污染,原始數據呈現離亂的情況,離亂的數列稱為灰色數列,或者灰色過程,對灰色過程建立的模型,便稱為灰色模型[1]。灰色模型是相對于白色模型和黑色模型而言的,白色模型是指系統中所有數據和變量均為明確的模型,黑色模型則指所有數據和變量均不明確的模型。灰色模型則是指數據和變量部分明確的模型,其中就有噪聲污染或隨機誤差導致的灰色模型。灰色模型是大部分系統對應的模型。灰色序列生成是灰色系統的一個基礎方法,灰色系統理論認為:原始數據是雜亂無章的,通過數據生成,能得到隨機性弱化和規律性強化的生成數列,最常用的是累加生成和累減生成[2]。本文中主要針對手機故障數量進行累加處理。灰色模型的研究中,也有很多論文針對灰色模型進行多種改進以提高灰色模型預測的精度和效果[3-5]。灰色模型的改進主要是針對預測目標的不同特性及原始灰色模型的不足,結合其他預測方法或數學模型進行改進。針對本文中的手機故障,原始的灰色模型體現了非常好的預測效果,結合手機故障問題進行相應的公式推演和轉化分析,取得了較好的預測精度。
Wu等[6]針對灰色模型應用的規模進行一些研究。Cui等[7]、Mao等[8]和楊杰等[9]則提出了一些改進的累加方法來提高灰色模型的預測效果。劉思峰等[10]總結了灰色模型近10年的研究綜述,列舉了灰色模型應用于各種場景及其改進模型。劉思峰等[11]則對最新的灰色系統研究進行了系統總結。本文嘗試結合灰色模型和統計數據來進行預測。
下面給出采用灰色模型時所使用的術語:
隨機誤差也稱偶然誤差或不定誤差,是由于在測定過程中一系列有關因素微小的隨機波動而形成的具有相互抵償性的誤差。隨機誤差的大小和正負都不固定,但多次測量就會發現,絕對值相同的正負隨機誤差出現的概率大致相等,因此它們之間常能互相抵消。
灰色模型GM與隨機誤差灰色模型GM中就有專門針對隨機誤差或稱噪聲污染的機制,即通過累加原始數列,即可利用隨機誤差的相互抵償性,最大程度地減弱隨機誤差的影響。本文中主要針對原始數列采用累加方式產生新的灰色數列。
考慮N個變量X1,X2,…,Xn,有N個數列:
式中:i=1,2,…,N。

(2)
此時,根據原始數列經過一次累加,可以得到一個新的灰色數列。由于新的灰色數列已通過累加抵消了大部分的隨機誤差,新數列將更接近真實的數列。
故障率預測一般分為個體預測和整體預測,整體預測中一般包含大量的個體,因此個體帶來的隨機性會在整體預測上帶來非常大的影響。基于灰色模型針對隨機誤差的抵消作用,本文嘗試定義灰色故障數FCgm和灰色樣本數TCgm:
(3)
(4)

基于式(1)、式(3)、式(4),定義了灰色故障率公式:
(5)

考慮到灰色模型的應用,手機故障率采用累加的故障數量/累加的在保量來得到一個灰色故障率曲線。此時,累加的在保量和累加的故障數量是在同一級別,灰色故障率曲線將接近真實的灰色故障率曲線。
為了驗證灰色模型的預測效果,從公司的數據庫中選取某品牌銷量最大的三個機型的長達3年的歷史數據進行相應的數據分析和預測。手機故障數量根據不同機型的時間序列分布,可以畫出相應機型的故障散點圖,見圖2。其中可以看出手機故障數量是在較大范圍內寬幅振蕩,即隨機誤差影響較大,同時,也會出現一些明顯接近零的故障日期,大部分是周末。

圖2 三種機型的故障數量散點圖
為了減少隨機誤差的影響,通過式(3)累加得到灰色模型下的灰色故障數(灰色累加故障數)曲線則要平滑得多,見圖3。

圖3 三種機型的灰色累加故障數折線圖
通過計算相應手機型號的在保量,可形成相應的在保量折線圖。如圖4所示。

圖4 三種機型的在保量折線圖
從圖4可見,在保量的折線圖呈現明顯的山峰形狀,即開始銷售時,在保量開始增加,形成山峰的上坡段,銷售完畢部分先期銷售的機型退出保修期,開始山峰的下坡段。通過式(4)累加得到灰色模型下的灰色樣本數(灰色累加在保量)圖形如圖5所示。

圖5 三種機型的灰色累加在保量折線圖
根據式(5)將上述三種機型的累加故障數量和在保量累加值相除,得到相應機型的灰色模型下的手機灰色故障率,并畫出曲線,如圖6所示。

圖6 三種機型在灰色模型下的灰色故障率曲線
其中可見三種機型前期有一定波動,后期都穩定在一個波動很小的水平線附近。相應的解釋為:隨著手機生產廠商手機型號成熟和大批量采購和生產,其批次質量隨時間越來越穩定,同時灰色模型的抵消隨機誤差的作用隨時間越來越大,前期累加的數量較小,隨機誤差作用仍較明顯,后期累加數量較大,隨機誤差抵消充分,故障率能穩定在一個非常平穩的水平線上。因此,此時的故障率可視為該手機型號的實際故障率水平,從邏輯上可以取相應機型最后6個月內的故障率最低值作為該機型的故障率特征值。
上述手機故障率分析,能得到歷史機型的故障率分析結果及相應的故障率特征值。
針對新機型的故障率特征值,可通過聚類分析,基于不同機型的廠商、主要部件型號和故障率分析、機型的定位(旗艦機型、中檔機型、入門機型等)、機型的功能定位(拍照手機、音樂手機、老人機等)等機型具體信息進行聚類,并選定同一聚類類型中的典型機型的故障率特征值作為新機型的故障率特征值。
定義故障率倍數R,并代入式(5)推導得出:

(6)
式中:R為新機型故障率特征值對舊機型故障率特征值的比值;上標new或old分別表示新舊機型的灰色故障率、灰色故障數和灰色樣本數。
(7)

為了驗證灰色故障率模型的預測效果,三個機型A、B、C中,選定機型A作為標準機型,即用于預測的新機型,機型B和C作為參照機型,即已知故障完整信息的歷史手機。在已知機型A的故障率特征值的基礎上,利用參照機型B和C的故障率特征值,進行相應機型A的故障預測,實際和預測出來的數據的時間序列顯示在同一張散點圖中。如圖7所示。

圖7 三種機型中實際故障數量與預測故障的散點圖
從圖7中所示,可以看到相應的故障點的分布體現出較大的隨機性,雖然有一些分布上的分散,但三個散點圖的整體重合度較高。
為了集中顯示預測與實際的故障數,借助灰色模型原理,針對上述故障分布按2周為單位進行累加,得到2周為周期的灰色故障分布,并匯總在圖8中。本文也嘗試過使用1周和4周作為周期進行統計,其結果與2周的分析非常類似,沒有明顯不同。圖8中可以看到相應的曲線的重合度相對較高,但由于隨機性影響,偏差還是較大。

圖8 三種機型中2周為單位的實際與預測故障折線圖
為此,針對上述數據進行了進一步的數據分析,結果見表1。可以看到以2周為單位的預測時,其平均標準差分別為73和53個,占比分別為28.21%和20.56%;但考慮正負值的平均值,則誤差急劇下降為0.60個,占比為0.23%,這也非常符合隨機誤差能相互抵消的特性;另一機型的預測分析結果類似,總生命周期預測偏差僅為0.19%。

表1 基于機型B和C來預測機型A的預測數據分析
為了更明顯地顯示灰色預測與實際故障的對比,將標準機型A與參照機型B和C針對標準機型A的灰色預測故障數量進行累加并繪制在圖9中。

圖9 標準機型A與參照機型B、C預測與實際故障數對比圖
圖9中,機型A的實際累計故障數為12 689個。而參照機型B和C針對機型A的灰色預測的故障數累計值分別為12 723.66和12 433.51,其誤差為+0.273%和-2.01%,誤差范圍非常小。
最基本的預測方法是移動平均的預測,也是目前實際預測手機故障率所采用的方法。采用的前4周作為移動平均來進行后4周趨勢分析來預測后面的故障率。為了對比,將按預測周期分為1周、2周、4周和6周進行預測,相關圖形見圖10和圖11。隨著預測周期的延長,預測值與實際值的偏差也在明顯放大,超過6周的預測已經偏差到無法使用。

圖10 移動平均預測1周(左)和2周(右)的對比

圖11 移動平均預測4周(左)和6周(右)的對比圖
本文還嘗試利用多元多次回歸方程針對不同手機型號的故障數據進行回歸分析,并對其他機型故障進行擬合預測,由于手機故障隨機性較強,擬合效果很不理想。
趨勢預測限于其本質特征只適應于短期預測,無法適應全局預測,周期太短預測意義較小,周期太長,偏差太大,預測意義也有限。本文中的灰色故障預測則能針對預計的產品銷售進度進行全生命周期的有效準確的預測,有著很高的現實應用價值。
本文基于灰色模型和故障率曲線的研究,建立了灰色故障率定義及公式,通過分析手機故障率曲線特征,提出手機故障率特征值概念。通過新舊機型特征值概念得出新機型故障灰色預測的新方案。新預測方案通過實際手機故障數據予以驗證,取得三年全生命周期預測偏差2%左右的精確效果。
以上分析是針對已知機型數據的驗證,對于全新的機型,由于沒有歷史故障信息,其真實的故障率水平仍是未知。但這可以通過機型廠商、機型的主要部件等相似性進行聚類分析,得到全新機型與已知機型的相似程度,從而評估其故障率水平。同時,隨著新機型的銷售和售后數據的更新,實際發生的故障率數據可對估計故障率進行修正,從而得到更為精確的預測。
本文中的手機故障有著較為特別的屬性,包括周期性很弱,數量巨大,隨機性很強,預測更側重為較長周期的準確性,這都為灰色模型的直接應用提供了堅實的基礎。有了較為精準的故障預測模型,就可以針對新產品進行故障率水平的評估和故障數量的評估,并進而制定合理的備件采購計劃。然后基于最優庫存模型,以最經濟的批量和采購方式,解決全生命周期的故障備件采購,從而優化手機售后服務的質量和成本。
[1] 鄧聚龍. 灰色系統綜述[J]. 世界科學, 1983(7):3-7.
[2] 陳勇明. 基于統計視角的灰色系統的幾個基本問題的研究[D]. 成都:西南財經大學,2008.
[3] 馬良荔,李剛,陶道強.基于灰色GM(1,1)模型的故障預測方法[J].計算機應用與軟件,2013,30(4):198-200.
[4] 李夢婉, 沙秀艷. 基于GM(1,1)灰色預測模型的改進與應用[J]. 計算機工程與應用, 2016, 52(4):24-30.
[5] 王璐,沙秀艷,薛穎. 改進的GM(1,1)灰色預測模型及其應用[J]. 統計與決策,2016(10):74-77.
[6] Wu L, Liu S, Yao L, et al. The effect of sample size on the grey system model[J]. Applied Mathematical Modelling, 2013, 37(9):6577-6583.
[7] Cui J, Liu S, Zeng B, et al. A novel grey forecasting model and its optimization[J]. Applied Mathematical Modelling, 2013, 37(6):4399-4406.
[8] Mao S, Gao M, Xiao X, et al. A novel fractional grey system model and its application[J]. Applied Mathematical Modelling, 2016,40(7):5063-5076.
[9] 楊杰,翁文國. 基于改進無偏灰色模型的燃氣供氣量的預測[J]. 清華大學學報,2014,54(2):145-148.
[10] 劉思峰,楊英杰. 灰色系統研究進展(2004—2014)[J]. 南京航空航天大學學報,2015,47(1):1-17.
[11] Liu S, Yang Y, Xie N, et al. New progress of Grey System Theory in the new millennium[J]. Grey Systems, 2016, 6(1):2-31.
[12] Yang Y, Liu S, John R. Uncertainty representation of grey numbers and grey sets[J].IEEE transactions on cybernetics, 2014,44(9):1508.