許挺 姚力
摘要:目前,企業(yè)信息設(shè)備的全壽命生命周期過程涉及數(shù)據(jù)量大、數(shù)據(jù)種類多,通過利用大數(shù)據(jù)技術(shù)以及機器學(xué)習(xí)算法構(gòu)建科學(xué)合理的過程評價機制,提高企業(yè)管理信息設(shè)備的運行水平。
關(guān)鍵詞:信息設(shè)備;大數(shù)據(jù);機器學(xué)習(xí);評價指標
引言
在當前大數(shù)據(jù)技術(shù)蓬勃發(fā)展的背景下,如何對數(shù)據(jù)進行整合、交換,以及在分析過程中定位敏感信息、準確有效地保護敏感信息,在信息安全的前提下挖掘數(shù)據(jù)價值成為當下數(shù)據(jù)管理者亟待解決的關(guān)鍵問題。
1、產(chǎn)品平臺生命周期概念
目前,對于產(chǎn)品平臺學(xué)術(shù)界還沒有一個統(tǒng)一、權(quán)威的定義,但其核心是相同的,即能夠被通用或共享的所有資源都可以視為產(chǎn)品平臺。從動態(tài)發(fā)展的角度,在原有產(chǎn)品族中新增產(chǎn)品,構(gòu)建新的產(chǎn)品族架構(gòu),然而產(chǎn)品平臺的升級更新要比產(chǎn)品族更迭更深入,可以使企業(yè)創(chuàng)造新的細分市場,擴大企業(yè)的市場空間。
技術(shù)系統(tǒng)的生命周期理論主要強調(diào)技術(shù)系統(tǒng)的演化過程,該理論是以需求生命周期、技術(shù)生命周期、競爭生命周期為基礎(chǔ)的。產(chǎn)品平臺作為一個復(fù)雜的技術(shù)系統(tǒng),在演化進程中產(chǎn)品平臺可以通過創(chuàng)新獲得新生并向更高層次進化。其研究意義在于:產(chǎn)品平臺不斷地創(chuàng)新和升級為企業(yè)提供了持續(xù)生存的基礎(chǔ);揭示了產(chǎn)品平臺演化過程所具有的類似生命曲線的規(guī)律;提供了一種對產(chǎn)品平臺規(guī)劃、評價與決策模式的依據(jù)。本文將產(chǎn)品平臺生命周期(ProductPlat-formLifeCycle,PPLC)定義為在企業(yè)內(nèi)、外部各種因素的影響下,企業(yè)核心產(chǎn)品技術(shù)發(fā)展所經(jīng)歷規(guī)劃、開發(fā)、成熟和衰退四個階段的過程,這一核心產(chǎn)品技術(shù)可以包括用于產(chǎn)品共享和配置的產(chǎn)品零部件結(jié)構(gòu)平臺及其相關(guān)的工藝平臺等。在這一過程中,由產(chǎn)品平臺派生出來的一個或多個產(chǎn)品族及其復(fù)雜的結(jié)構(gòu)體系都是隨著時間動態(tài)地發(fā)展。在動態(tài)發(fā)展的同時,產(chǎn)品平臺根據(jù)市場的需要進行擴展和升級,從而由在新的產(chǎn)品平臺上發(fā)展出新的產(chǎn)品族來滿足市場需求。
2、問題及解決方式
根據(jù)引言中提到的問題,確定主要研究解決的方向有三。建立多維度指標評價模型,清楚企業(yè)信息設(shè)備現(xiàn)有運行維護管理方式,提煉對不同類別下信息設(shè)備運行狀況、經(jīng)濟狀況以及偏好使用狀況的多維分析指標,對每臺在運設(shè)備構(gòu)建量化的等級評價模型。
信息設(shè)備采購預(yù)測分析,在多維度評價模型基礎(chǔ)上,結(jié)合企業(yè)信息設(shè)備管理規(guī)定,對信息設(shè)備需要退役的情況進行預(yù)判,從而形成信息設(shè)備采購的預(yù)測。
推送信息設(shè)備采購建議,基于信息設(shè)備采購預(yù)測分析的基礎(chǔ),對歷史信息設(shè)備退役情況和推薦退役情況進行多維度對比,重點分析經(jīng)濟指標,關(guān)注歷史退役情況是否合理。對未來需要退役的信息設(shè)備推薦采購建議。
3、實現(xiàn)關(guān)鍵
(1)提煉指標,源業(yè)務(wù)數(shù)據(jù)存在質(zhì)量問題,不同類型設(shè)備提煉特性指標難度和工作量極大,故對數(shù)據(jù)進行清洗,并提煉設(shè)備共性指標,主要根據(jù)設(shè)備運行時長、正常運行時長、故障時長、故障次數(shù)綜合判定設(shè)備運行質(zhì)量。
其中,提取和清洗數(shù)據(jù)的過程尤為重要,直接關(guān)系到后續(xù)應(yīng)用的使用可信度。在提取數(shù)據(jù)階段中,應(yīng)按照需求總線矩陣中構(gòu)建的星型模型,快速建立維度表和業(yè)務(wù)行為表,以信息設(shè)備被提煉出來的業(yè)務(wù)行為為主線,關(guān)聯(lián)維度表,形成設(shè)備業(yè)務(wù)行為明細表,方便后續(xù)不同角度分析數(shù)據(jù),形成最終分析應(yīng)用成果。在清洗源端數(shù)據(jù)過程中,發(fā)現(xiàn)源業(yè)務(wù)系統(tǒng)字段存在很多空值、異常、不符合業(yè)務(wù)規(guī)則的情況,基于此,我們參考統(tǒng)計學(xué)規(guī)則,對于遴選有效信息空值列大于80%的行進行剔除,其余空值情況,對列值分布情況進行分析,在不改變其分布的情況下,填充符合統(tǒng)計學(xué)意義的數(shù)值。對于異常值的情況,判定是否為無效數(shù)據(jù)類型,若為無效數(shù)據(jù)的情況,將其賦予一個無意義的標識值,對于其是有效的狀況,繼續(xù)分類標識,確定其具體的業(yè)務(wù)含義。對于不符合業(yè)務(wù)的情況,建立數(shù)據(jù)關(guān)聯(lián)匹配規(guī)則,根據(jù)具體業(yè)務(wù)邏輯做動態(tài)可修改的窗口,標記數(shù)據(jù)點位,做相關(guān)業(yè)務(wù)確認動態(tài)回填數(shù)據(jù),保證數(shù)據(jù)的有效性。以上提取以及清洗工作完成后,對處理完成的數(shù)據(jù)是否對應(yīng)用分析有效進行量化評價,根據(jù)評價值迭代數(shù)據(jù)提取和處理過程,動態(tài)調(diào)節(jié)使得最終量化評價分數(shù)達到一個閾值后,輸出應(yīng)用分析的結(jié)果。
(2)用L-M算法改進的BP人工神經(jīng)網(wǎng)絡(luò)BP(BackPropagation,反向傳播)人工神經(jīng)網(wǎng)絡(luò)是一種按誤差逆?zhèn)鞑ニ惴ㄓ?xùn)練的多層前饋網(wǎng)絡(luò),是目前應(yīng)用最廣泛的神經(jīng)網(wǎng)絡(luò)模型之一。BP人工神經(jīng)網(wǎng)絡(luò)能學(xué)習(xí)和存貯大量的輸入-輸出模式映射關(guān)系,而無需事前揭示描述這種映射關(guān)系的數(shù)學(xué)方程。它的學(xué)習(xí)規(guī)則是使用最速下降法,通過反向傳播來不斷調(diào)整網(wǎng)絡(luò)的權(quán)值和閾值,使網(wǎng)絡(luò)的誤差平方和最小。BP神經(jīng)網(wǎng)絡(luò)模型拓撲結(jié)構(gòu)包括輸入層、隱藏層和輸出層。BP人工神經(jīng)網(wǎng)絡(luò)具體工作原理就是通過始末非線性變換,獲得輸出值,每個神經(jīng)元的狀況會影響下一層對應(yīng)的神經(jīng)元,使誤差最快速度下降,通過不斷反復(fù)學(xué)習(xí)訓(xùn)練,致使誤差達到合適的范圍內(nèi),訓(xùn)練就可以停止,若是期望值誤差值與得到的值相差較大,就將誤差轉(zhuǎn)移到逆向傳播過程,方向為輸出層——隱含層——輸入層3層,通過這兩個過程往返交替實行,同時修正各層神經(jīng)元的閾值和權(quán)值,收縮誤差,直至輸出值逼近期望值,網(wǎng)絡(luò)訓(xùn)練至此結(jié)束,從而完成信息索取和記憶過程。在實際應(yīng)用中,傳統(tǒng)BP人工神經(jīng)網(wǎng)絡(luò)算法很難勝任,因此出現(xiàn)了很多改進算法。比如:利用動量法改進BP算法、自適應(yīng)調(diào)整學(xué)習(xí)速率算法、動量-自適應(yīng)學(xué)習(xí)速率調(diào)整算法、L-M(Levenberg-Marquardt)算法等。本文采用L-M算法,L-M算法比前述幾種算法要快得多,不過對于復(fù)雜問題,這種方法需要相當大的存儲空間。但是,隨著以大數(shù)據(jù)、云計算、人工智能等為代表的新一代信息技術(shù)的飛速發(fā)展,計算機高速度運算、海量存儲技術(shù)飛速發(fā)展,為L-M算法改進的BP人工神經(jīng)網(wǎng)絡(luò)方法的實用化提供了保證。
4、模型數(shù)據(jù)處理
4.1質(zhì)量標準指標數(shù)量化
對于通用的產(chǎn)品質(zhì)量標準數(shù)據(jù)指標有產(chǎn)品適用壽命、產(chǎn)品功能完善程度、產(chǎn)品外觀新穎程度等指標,對洗衣機產(chǎn)品來說,除了這些通用的質(zhì)量標準指標外,還有用途分類、容量、洗凈比、洗衣方式、對織物的磨損率、耗水量、耗電量、洗滌噪音值、脫水噪音值、材質(zhì)等質(zhì)量標準。
因為產(chǎn)品質(zhì)量標準數(shù)據(jù)的有些指標,比如:產(chǎn)品功能完善程度、產(chǎn)品外觀新穎程度等屬性難以用準確的數(shù)字來表述,所以得先采用一個恰當?shù)脑~匯集合來進行表述。本研究采用的詞匯集合為{高,較高,一般,較低,非常低}五級。接下來需要對詞匯集合做數(shù)量化轉(zhuǎn)換。通常采用模糊數(shù)學(xué)中的模糊集理論來轉(zhuǎn)換。
4.2質(zhì)量標準指標數(shù)據(jù)標準化
每個質(zhì)量標準屬性指標實際代表的涵義往往不一樣,其數(shù)量級以及量綱往往也不一樣。所以,需要用標準化函數(shù)做標準化轉(zhuǎn)換。
結(jié)語
此分析應(yīng)用采用大數(shù)據(jù)技術(shù)手段對數(shù)據(jù)進行提取、清洗、分析并利用機器學(xué)習(xí)算法對指標因子進行動態(tài)調(diào)整,對企業(yè)信息設(shè)備維護和購買行為進行預(yù)判,同時為企業(yè)提供信息設(shè)備采購依據(jù),實現(xiàn)降低企業(yè)成本、提質(zhì)增效的目的。使用維度模型建立數(shù)據(jù)模型的方式也可為除信息設(shè)備之外的其他設(shè)備建模進行橫向擴展,適配度強,對不同行業(yè)設(shè)備全壽命周期過程的管控有借鑒和推廣意義。
參考文獻
[1]樊峰峰.大規(guī)模數(shù)據(jù)清洗關(guān)鍵技術(shù)研究[D].西北工業(yè)大學(xué)博士學(xué)位論文,2018.
[2]王兆君,岳良文.產(chǎn)品質(zhì)量標準數(shù)據(jù)清洗模型及應(yīng)用研究[J].標準科學(xué),2020(4):88-95.
[3]林森,但斌.面向大規(guī)模定制的產(chǎn)品平臺管理模型[J].管理工程學(xué)報,2005,19(1):51-55.