劉位龍,楊 爽 LIU Weilong, YANG Shuang
(山東財經大學 管理科學與工程學院,山東 濟南250014)
目前醫藥零售行業的庫存管理多數只是按照GSP 標準分開擺放或按單一ABC 分類標準管理。近年來多指標庫存分類的研究越來越多,Keskin 等人運用模糊聚類方法進行多規則庫存管理[1];呂杏放等人用ABC—CVA 矩陣分類法對藥品進行分類[2];Kartal 等人首先使用三種不同的多準則決策技術,然后用機器學習對初始確定的庫存項進行分類并驗證其可行性[3];Lolli 等人提出了從項目總體中提取樣本進行分類,再運用機器學習方法按照分類標準對樣本外項目實現分類的方法[4]。對庫存分類指標較多且沒有明確邊界時選用模糊聚類分析會更為合適。機器學習進行分類需要有預分類的樣本集,通常訓練樣本集是不易獲得的。
本文運用多準則決策與機器學習相結合的分類方法,不但彌補了單一屬性分類的不足,還能在SKU 數目不確定的情況下快速、精準地識別藥品類別。
為了改善傳統ABC 分類準則單一的局限性以及快速識別出在庫藥品的類別,運用基于多準則決策與機器學習相結合的庫存分類策略。該策略的三個步驟為:
1.1 分類準則選取及權重確定。根據藥品特征、供給及需求特性確定7 個分類準則。正向指標有出庫量、出庫頻次、提前期、價格,表示正向越大越需要重點管理。負向指標有供應商數量、可替代性、產品保質期,表示正向越小越需要重點管理。由于分類準則都是可獲得的客觀數據,故采用熵權法根據各指標的變異程度來確定權重。
1.2 基于多準則分類的學習集確定。避免FCM 算法把所有指標都認為同等重要的缺陷,采用加權模糊C 均值聚類(WFCM) 算法對抽取樣本分類。基于目標函數的WFCM 算法,是將n 個樣本劃分為c 類,不斷修改聚類中心和隸屬度矩陣實現樣本分類,把隸屬度最大的類別作為最終的輸出類別。dik為樣本xi與第k 類中心vk的加權距離,指標熵權為ws,加權歐式距離為:

庫存樣本分類后,采用輪廓系數S(i )評價聚類效果[5]。a(i )是藥品i 到同類別其他藥品的平均距離,b(i )為藥品i 到不同類別藥品的平均距離,數值越大分類效果越好。

1.3 分類模型的建立。KNN 分類算法指導思想是由鄰居推斷樣本的類別,該算法不用調參訓練,易于實現,樣本容量較小時比較容易產生誤分;樸素貝葉斯分類是求解各個類別出現的概率,概率最大的認為待分類項屬于的類別,該算法假設屬性值是獨立的,在實際情況中是不成立的;BP 神經網絡通常適用于大型和不精確的數據集,該算法是通過樣本數據的訓練,由輸出層開始逐層計算各層神經元的輸出誤差,然后根據誤差梯度下降法來調節各層的權值和閾值,使修改后的網絡的最終輸出能接近期望值;支持向量機在處理樣本數量少、非線性等實際問題中發揮重要作用,通過將原始特征空間映射到更高維度的特征空間,使原數據的映像具有線性關系,然后在高維度的特征空間進行學習、分類,本文選取徑向基核函數實現非線性分類,多分類可在每兩類樣本間訓練一個分類器的“一對一”多分類算法。
2.1 實例背景及相關數據獲取。S 醫藥企業是醫藥零售行業的龍頭企業,目前在庫藥品近3000 種,企業經營規模在不斷擴大。按照等距抽樣每間隔10 個SKU 抽取一個樣本為本文選取要研究的對象,共選取273 條庫存項目數據。得到的原始數據如表1 所示:

表1 藥品分類指標原始數據
2.2 指標權重確定。熵權法確定各指標權值,標準化處理后的數據見表2:

表2 藥品指標的標準化數據
指標的熵值:es= (0.777;0.740;0.947;0.900;0.850;0.919;0.937 );
指標的熵權ws= (0.240;0.279;0.058;0.108;0.161;0.087;0.067 )。
2.3 加權模糊C 均值算法確定訓練樣本。數據標準化及權重確定后,給定迭代終止條件ε=1e-5,按cmax=2ln(n ),聚類數取值為2≤c≤11。當c=3 時,模糊聚類中心見表3,選取編號1~5 及252~256 的數據列出模糊隸屬度矩陣見表4。

表3 c=3 模糊聚類中心

表4 c=3 模糊隸屬度矩陣
c=2,4~11 結果不再逐個列出,不同的聚類數采用輪廓系數進行有效性分析得到圖1,確定最佳的聚類數目是3。最終的分類數目A 類35 種,占12.82%;B 類93 種,占34.07%;C 類145 種,占53.11%。
2.4 機器學習分類模型的建立
(1) 數據預處理及訓練模型。先要對數據處理成相應軟件所規定的數據格式。KNN 中K 取5 確定分類精度;樸素貝葉斯對每個類別確定先驗概率、每個特征屬性計算劃分的條件概率來實現訓練;BP 神經網絡是通過激勵函數Logsig 以及梯度下降算法Traingdx 來實現訓練;SVM 運用Grid.py 搜索最優懲罰系數c 和徑向核函數自帶的參數g 來實現模型訓練。
(2) 應用模型。從表5 可以看出S 醫藥企業庫存分類結果表明SVM 得到的分類正確率是最高的。圖2、圖3 為SVM算法的預測精度。訓練出的加權SVM 分類模型精度很高,能達到庫存分類管理的標準,可以在企業實際管理中運用。

圖1 聚類數目的平均輪廓值

表5 各分類模型正確率對比

圖2 Wdata 數據集訓練結果圖
本文針對醫藥零售企業的藥品庫存分類問題,提出了將多準則決策與機器學習相結合的分類策略。以S 企業的數據進行實證分析,在分類基礎上對AB 類采用(R, Q )庫存控制策略,C 類采用(T, S )庫存控制策略。與企業現有的傳統ABC 庫存控制策略進行對比,庫存周轉率由0.89 提高至1.32,庫存周轉天數由33.57 天降低至22.81 天,表明該分類策略能夠增加庫存周轉、降低庫存成本,證明了該分類策略的有效性及合理性。

圖3 wdata 數據集訓練結果圖