王丹玥,王 艾,王雪媛
(1.中國運載火箭技術研究院物流中心,北京100076;2.北京科技大學,北京100083;3.北京林業大學,北京100083)
2016-04-24,首個“中國航天日”習近平作出重要指示,“探索浩瀚宇宙,發展航天事業,建設航天強國,是我們不懈追求的航天夢”。航天作為服務經濟社會發展的重要手段,60年來,中國長征系列運載火箭,形成了較為完備的運載火箭型譜,廣泛涉及海洋維權、交通運輸、教育醫療、城市建設等經濟社會發展的各個領域,2017年共發射運載火箭18次。隨著發射需求的增加以及研制任務的緊迫,物資供應的及時性以及生產成本的控制問題被擺在了突出的位置。
金屬物資作為型號物資采購中較重要的一部分,很大程度上影響著型號用物資供應,目前金屬物資管理分為通用料管理與非通用料管理,金屬物資通用料指面向多型號、質量性能穩定、物資交付周期可控、存貨損失風險小、使用頻率高的物資。而目前金屬物資通用料管理存在以下問題:缺乏準確判定金屬物資通用料的規則,導致在識別通用料的過程中易摻雜管理者主觀印象,影響識別的準確性;通用料的管理沒有實現動態管理,通用料清單內的金屬物資沒有準入及準出機制,沒有與金屬物資采購規律建立強關聯。
本文通過數據挖掘手段識別金屬物資通用料在采購供應方面顯示出的“數據”特征,建立合理且符合實際業務的金屬物資通用料分類器,提出合理的金屬物資通用料識別及確定方法,為后續通用料的實際管理決策提供理論支撐并提升管理水平。
航天型號用金屬物資通用采購業務流程如圖1所示,其中需求申請為用戶通過系統提交至采購計劃員,采購業務流程的開始即為新采購需求申請的提交。

圖1 金屬物資采購流程圖
與非金屬物資通用料采用“一單一采”方式進行采購不同,金屬物資通用料系統有“補充訂貨量”和“再訂貨點”的屬性,當金屬物資通用料的現存量低于再訂貨點時,計劃員可直接通過自制請購單的方式提交新的采購需求。
目前按照物資類別、型號規格、技術條件等統計,物流中心現采購的金屬物資共有4384項,而被定義為通用料的金屬物資共有486項,占金屬物資總數的11.1%,按照金屬物資分類統計,其中各類金屬物資內的通用料項數如表1所示。經統計,金屬物資近3年平均采購額約為2.9億元,通用料物資采購額約占總采購額的12.6%。

表1 各類金屬物資內通用料項數統計表
ERP系統包含金屬物資基本屬性和采購屬性,基本屬性包含存貨名稱、規格、型(牌)號、質量等級、技術條件、物資狀態、尺寸等;采購屬性包含需求數量、到貨周期、實出數量、銷售成本、需求單位等205個屬性。
根據ERP系統內的數據顯示,2015年至今系統內共保存了31萬余條采購數據,共用業務數據表30余個,數據規模及數據量滿足使用數據挖掘手段的要求。由系統導出的采購原始數據基本包含了需要用于識別金屬物資通用料特征的所有信息,但還存在如下問題:數據量大,導致業務數據表處理難度較大;較多業務數據表存在構成表內每條數據唯一標識的屬性較多的問題,難以快速建立數據倉庫以便進行分析數據;數據中某些屬值缺失或存在無效值(不符合實際,如負值)。
通過對ERP系統原始數據的清洗與整理,將金屬物資采購業務數據分為物資描述類數據、物資數量類數據、采購流程內周期類數據、方差類、財務類數據以及物資應用類數據六大類數據。
金屬物資通用料的特征將按照原始通用料定義中的條件信息,即“面向多型號,質量性能穩定,物資交付周期可控,存貨損失風險小,使用頻率高”,在六大類數據中提取關鍵字段如需求數量、用戶單位等,剔除非關鍵字段如采購員、庫位信息等屬性后,通過統計分析的方法識別出金屬通用料物資的特征重新對通用料物資進行定義,并完成構建分類器的工作,從而確定新的金屬物資通用料清單。
將200余個金屬物資屬性進行關鍵屬性識別提取、綜合計算后,將滿足通用料特征識別的23個關鍵屬性分別分類匯總,具體分類情況及其相關屬性的數據字典如表2所示。

表2 金屬物資關鍵屬性數據字典
對關鍵屬性數據進行統計分析處理后,選用2015年與2016年的采購數據作為訓練集,并主要使用兩種方式進行金屬物資通用料特征識別工作。
數據分布對比分析法:通過繪制柱狀曲線圖分析通用料與非通用料屬性數據的顯示出的差異程度來判斷該類屬性信息是否為通用料重點特征。
帕累托分析法:依據“關鍵的少數和次要的多數”原理,將影響判斷是否為通用料的眾多影響因素按其對重點特征的影響程度大小用直方圖順序排列,從而確定金屬物資通用料的重點特征。
3.2.1 數據分布對比分析法
物資需求申請類屬性中的“型號工程種數”,采用數據分布對比分析法進行通用料的特征識別,通用料“型號工程種數”數值分布和非通用料“型號工程種數”數值分布如圖2和圖3所示。

圖2 通用料“型號工程種數”分布圖

圖3 非通用料“型號工程種數”分布圖
通用料應用的型號工程種數平均值為10.21,說明每一種通用料大約應用于10種型號工程,85%的型號工程種數集中在[1,20]區間內。
非通用料的型號工程種數平均值為3.08,說明每一種非通用料大約應用于3種型號工程,91%的工程種數集中在[1,8]區間內。
若某金屬物資應用于少于8種的型號工程,則為非通用料的比例較大;若該金屬物資應用于多余20種的型號工程,則為通用料的比例極大。
綜上所述,通用料的型號工程種數與非通用料型號工程種數差異較大,因此可將“型號工程種數”作為通用料的重點特征之一。
3.2.2 帕累托分析法
由于物資需求申請類屬性中的“領用總頻次”字段數據區間為[0,13716],范圍較大,使用數據分布對比分析法效果不明顯,此類數據選擇帕累托分析法,“領用總頻次”帕累托分析如圖4所示。

圖4 “領用總頻次”帕累托分析圖
根據圖4可知,鋼棒類通金屬物資用料在“領用總頻次”數據上顯示為占比最多,與實際業務中鋼棒類金屬物資通用料項數占總通用料物資項數58%的情況較為相符,所以“領用總頻次”類數據判斷效果較好,可作為重點特征之一進行考慮。
在討論了23個業務屬性后,最后確定通用料重點特征共有7個,分別為型號工程種數、領用總頻次、實出數量、請購次數、領用總頻次方差、需求單位個數、月份數量。
分類問題的本質是當給定這樣一個數據集后,要求訓練出(或建立)一個模型,當出現一組新的特征向量時,可以預測(或判斷)擁有這樣一組特征向量的對象應當屬于哪個類別。
由于C4.5算法的分類規則易于理解、準確率較高,所以選擇基于C4.5算法構建金屬物資通用料分類器,對金屬物資通用料進行分類篩選,并使用確定的通用料物資重點屬性作為分類器的分類標簽,將2015-01-01—2017-12-31的金屬物資通用料的采購數據作為訓練集,決策樹結果如圖5所示。經驗證,此決策樹判別的準確率為89.8%。
由該決策樹生成的四條判定規則如下:當型號工程種數小于等于5時,此物料為非通用料;當型號工程種數大于5、月份數量小于等于16時,此物料為非通用料;當型號工程種數大于5且小于等于31、月份數量大于16、請購次數小于等于7時,此物料為非通用料;當型號工程種數大于31、月份數量大于16時,此物料為通用料;當型號工程種數大于5且小于等于31、月份數量大于16、請購次數大于7時,此物料為通用料。

圖5 金屬物資分類決策樹
在金屬4384項物資中,按原來的分類,其中通用料項數為486,非通用料項數為3898。通過本研究工作,利用2017年至今的采購數據,對金屬物資重新分類后,得到的結果如下:新生成的通用料清單金屬物資通用料總數為496;在新生成的496個金屬物資通用料中,211個是穩定通用料,即原本是通用料,經新判定評價體系判定后仍是通用料;在新生成的496個金屬物資通用料中,新準入通用料285個,即原本不是通用料,經新的判定評價體系判定后成為通用料;準出通用料為275個,即原本是通用料,經新的判定體系判定其成為非通用料。
其中275個物資由通用料變為非通用料的原因主要如下:37項物資其型號工程種數值為空,即無相應的型號使用記錄;59項物資的領用月份數量為空,即僅一年來沒有領用記錄;179項物資的三年請購次數為空,即僅一年來沒有用戶單位發起需求申請記錄。
本次研究提出了一種能夠更合理、更準確的識別型號用金屬物資通用料的方案,實現了金屬物資通用料的動態管理,提升了通用料的采購效率及管理水平,避免了通用料判定的主觀性,給出了金屬通用料的動態管理模式。研究成果未來可以動態調整補充訂貨量、再訂貨點等管理參數,提升了金屬物資采購管理水平。
目前軍工企業的物資采購主要為計劃導向而非市場導向,而計劃具有不確定性和突發性,在管理方面存在較大的難度。所以依靠數據挖掘技術分析歷史采購數據,更加科學地掌握采購規律才是未來軍工企業采購領域的主要研究方向。