張立 郭珊珊 姚楠 劉鴻洋 儲勝


摘 要:國網于2016年提出并開始實施電商化采購模式。當前的目標是要形成科學合理的物資判別規則,因此立足于相關工作文件規定,從其物資的規格型號、國家法律規定、需求頻次以及年度需求數量幾個業務特征出發。將近兩年采購記錄數據與決策樹算法相結合,得出了決策樹模型,總結出了電商化物資判別的規則。并將相應規則轉化為了易于理解和操作的“IF—THEN”語言,使得該研究能夠應用到實際的電商化采購業務中,得到了新的二級電商目錄。
關鍵詞:決策樹算法;電商化采購;電力物資
中圖分類號:F25 文獻標識碼:Adoi:10.19311/j.cnki.1672-3198.2020.01.023
0 引言
近年來,互聯網在各行各業中得以廣泛的應用,移動互聯網技術也得到了極大的發展,國家《2016 年電子商務和信息化工作要點》提出要深入實施“互聯網+ 流通”行動。國網響應國家的號召,順應發展的潮流,于2016年開始實施電力物資的電商化采購。電商化采購是指通過適用的采購策略確定一定時期內的供應商,明確物資的品類(或規格型號)、單價(或雙方認可的計價規則)、配送及服務標準,并在零星物資采購管控平臺開展請購,實現操作界面簡單直觀、采購過程規范快捷、配送服務高效優質的目標。雖然電商化采購模式相較于傳統采購具有獨特的優勢,但并不是所有的電力物資都適合電商化采購模式,所以確定電商化采購目錄非常重要。而確定適合電商化的物資,需要先確定其判別規則,然后將規則應用到電力物資判別中,最終形成電商化采購專區目錄。
決策樹算法是一種逼近離散函數值的方法。它是一種典型的分類方法,首先對數據進行處理,利用歸納算法生成可讀的規則和決策樹,然后使用決策對新數據進行分析。該方法被廣泛應用于遙感圖像、疾病、林業等各方面的分類,更有學者將其應用于協議庫存物資的判別上,但尚未有人將其應用于電商化采購物資。本文將是否適合電商化采購看作兩類物資,利用決策樹算法進行歸納,得出判別規則,篩選出適合電商化采購的新物資,最終形成新的二級專區目錄。
1 指標及數據的獲取
1.1 特征指標選取
根據電商化采購特點總結得出的電商化采購判別決策樹模型,決策節點都是定性的判斷,不適合大量而復雜的物資小類判別,需要進一步量化。而規格品種多、需求頻次高、數量無法準確等業務特征無法從零星物資基礎采購數據中獲取,需要將其特點轉化為適用的數據指標。
其中,零星物資一種定義是指的生產耗值較低的物資;另一種定義是指零星采購的物資,零星采購指的是一些金額小、零散的采購行為。《國家電網公司零星物資電商化采購和供應工作規范(試行)》中指出,零星物資包含辦公用品、辦公電器、辦公家具、辦公日用、化工、儀器儀表、信息化通信設備、低壓電器、生產工器具、勞保用品、五金建材、配件等。由上可知,零星物資的劃分可以從所屬“大類”以及物資自身的價值(即單價)入手。即將該部分指標選取為“物資大類”和“單價”。
電力物資的基礎劃分是以大類、中類、小類三級標準進行的。本文研究的目標主體是二級專區的物資目錄,最終確定的物資屬于物資小類,同一個小類的物資編碼(物料ID)是相同的。所以“采購規格品種多”可以從物資小類下的物料描述中的規格種類數和同一小類物資的供應商數來確定。該部分的業務特征細化的數據指標為“規格品種數”。
“需求頻次高”這一條件來源于,電商化采購相較于傳統集中采購(招標采購等)能夠做到隨需隨采,能夠有效減少單次采購的組織成本。從采購周期和相應部門工作周期的角度考慮,該部分指標的選取應選擇年度業務特征指標,且在考慮整體需求頻次的同時還需要考慮需求在時間上的分布。綜合考慮以上因素,最終數據指標確定為“年需求頻次(年度需求申請訂單數)”。
“數量無法準確預測”的要求是由于電商化采購相較于集中采購,沒有采購的組織成本限制,在單次采購的數量上更加靈活。數量無法準確預測的物資進行集中采購,就容易造成“缺貨”或者“贅余”的現象,從而導致成本的增加。數量無法準確預測可以理解為年度需求不穩定,數據指標可以選擇“采購數據的變異系數”或者“年均采購數量”和“年采購數量標準差”。最終考慮決策樹及判別規則的實用性和簡化性,選取“采購數據的變異系數”作為模型分類指標。
將初步生成的電商化采購判別決策樹模型與指標選取的可得性原則、有效性原則相結合,進一步細化得出4個數據指標,指標選取情況如表1所示。
1.2 指標數據獲取
決策樹算法應用在的判別特征為是否屬于電商化物資,業務特征指標數據需要覆蓋到已有電商化專區數據和未加入電商化采購物資的ERP系統數據。其中屬于電商化采購的物資采用電商化二級專區數據,不屬于電商化采購的物資采用ERP專區訂單數據,此次需要重新進行判別的物資不納入原始模型的建立數據采集。
綜合考慮決策樹算法本身對于數據量的要求,模型建立所用數據從17年76000余組采購記錄和2018年437541組數據中總結提取,一共包含658個小類2年的數據。
2 量化決策樹判別模型
國網現在實行的二級電商化目錄中將一次設備、二次設備、智能變電站二次設備、裝置性材料、輔助設備設施、工器具、建筑材料、勞保類用品、配件、燃料化工、五金材料、儀器儀表、辦公類用品、低壓電器14個大類中的部分物資劃分為零星物資。又在《658標準內小類采購策略分析》中建議將金屬材料和信息設備的部分小類納入電商化采購。二級采購目錄中一共包含一次設備、二次設備、智能變電站二次設備、裝置性材料、通信設備、輔助設備設施、工器具、建筑材料、金屬材料、勞保類用品、配件、燃料化工、五金材料、軟件、信息設備、儀器儀表、辦公類用品、低壓電器18個大類,除去上文提到的16個大類還剩下軟件和通訊設備兩個大類。從統計的數據分析,軟件大類品種規格少、單價普遍偏高、需求頻次少,且軟件系統的技術要求高,不適合納入電商化采購;《國網河南省電力公司2019年度二級采購目錄》中關于軟件大類給出的建議采購方式均為公開招標。通過同樣方式的分析,通信設備大類中仍有部分小類可能適合電商化采購,所以將零星物資的大類要求定為除軟件大類外的17個大類。此外,通過對電商專區采購的2017年、2018年以及2019年的部分數據分析可知,2017年二級電商專區采購的物資中,單價最高的是大類為儀器儀表,中類為型式試驗設,小類為電氣性能試驗設備的HVDKJ-35型空心電抗器匝間絕緣檢測裝置,價格為1584000元;2018年二級電商專區采購的物資中,單價最高的是大類為儀器儀表,中類為電氣標準器及檢測裝置,小類為綜合自動化系統校驗儀的綜合自動化系統校驗儀,價格為1050000元;2019年部分二級電商專區采購的物資中,單價最高的是大類為儀器儀表,中類為大地測量、測距儀器,小類為激光指向儀的激光器,價格為594224.14元。故而,將零星物資的單價節點定為三年來的最高值1584000元,即單價低于1584000元的小類屬于零星物資。
通過對采集到的數據進行統計分析得知,品種規格數多集中在8種以下,可見品種規格在8及8種以上屬于不常見情況,可將其劃分為“采購規格品種多”的情況。因此,指標“品種規格數”的劃分節點可以定為8種,即品種規格在8種及以上(7種以上)的物資適合電商化采購。
電商化采購優于集采的一大特點就在于其敏捷性,克服了集采的流程較長、響應需求的能力遲鈍,造成采購時效性較差的不足。所以從需求頻次這一指標來區分集采和電商化采購,可以立足于該特點——通過對國網陽光電子商務平臺發的公告可知,國網河南電力每年有三批公開招標的物資。表明零星物資如果需求頻次在三次以上就肯定需要等待招標的時間,需求的滿足會滯后,受到了集采采購時效性差不足的約束,從而該部分物資可以納入電商化采購,利用電商專區采購的靈活性、敏捷性來解決該部分物資需求頻次高的問題,即將年需求頻次在3次之上的納入電商化采購的范圍。
年采購數量難以預測的特征用年采購數量的變異系數來衡量,變異系數是綜合考慮了年均采購數量以及年采購數量標準差之后的指標,變異系數越大說明年度采購數量的波動越大,也就是數量預測的難度越大。當該指標取值為0.5時,表明該小類物資2017與2018年的采購數量差距在1倍以上,該種情況的波動性已屬于較大的情況,可將其劃分至年采購數量難以預測的部分。
量化后決策樹模型如圖1所示。
3 判別規則落實
研究最終形成電商化采購二級專區目錄,需要從ERP導出數據、電商專區數據以及國網河南電力的二級采購目錄意見出發,涉及的物資達18個大類,近2000個小類。如果以人力按照生成的決策樹判別模型逐一進行判別,不僅會因為數據量龐大而耗時耗力,還會由人力的不可控性導致誤判。為解決這一難題,需要將生成的決策樹判別模型轉化為可用軟件操作的機器語言或是可以批量判別的簡單規則。
決策樹模型的相較于其他分類模型的優點之一就是,決策樹模型能夠轉化為易于理解和操作的“if—then”規則,該類型規則既可以轉化為Access數據庫中常用的SQL語言進行操作,也可以轉化為Excel中的多重if條件進行判別。所以,為了解決涉及判別物資小類過多的問題,下面將模型轉化為判別規則。
將決策樹判別模型轉化為“if—then”規則如下所示:
if“大類”=“軟件”,then print “非電商物資”,
elseif 單價>1584000,then print “非電商物資”,
elseif 品種規格數>7,then print “電商物資”,
elseif 年需求頻次>3,then print “電商物資”,
elseif 年需求變異系數>0.5,then print “電商物資”,
else ,print “非電商物資”。
論文將形成的判別規則與2017與2018年的ERP采購數據相結合,最終形成了新的有科學依據的電商二級專區目錄。
4 結論
本文研究了符合當下“互聯網+”趨勢的電商化采購模式中的物資判別。從該目標“采購規格品種多、需求頻次高、數量無法準確預測且不屬于國家法定必須招標”的業務特征出發,結合2017和2018年兩年的電商化采購專區數據和ERP系統數據,運用決策樹算法,研究得出了電商化物資判別的規則決策樹模型,并將其轉化為可執行的機器語言。最終將模型轉化成了可實際操作的判別方法,實現了科學合理的電商化物資判別,形成了新的有科學依據的電商二級專區目錄。
參考文獻
[1]羅來平,宮輝力,劉先林,等.基于決策樹算法的遙感圖像分類研究與實現[J].計算機應用研究,2007,24(1):207-209.
[2]吳生根,陳武,歐劍鳴,等.福建省2008-2013年手足口病重癥病例危險因素的分類決策樹分析[J].中國衛生統計,2015,32(6):1040-1041.
[3]雷光斌,李愛農,譚劍波,等.基于多源多時相遙感影像的山地森林分類決策樹模型研究[J].遙感技術與應用,2016,Issue(1):31-41.
[4]李爽,張二勛.基于決策樹的遙感影像分類方法研究[J].地域研究與開發,2003,22(1):17-21.
[5]彭汐單,羅華清,袁宏波,等.基于決策樹算法的協議庫存采購策略研究[J].江西電力,2018,(7).