薛 亮,盛步云,蕭 箏,汪星剛
(武漢理工大學(xué) 機(jī)電工程學(xué)院,湖北 武漢 430070)
基于MR-C4.5的產(chǎn)品配置管理方法研究與應(yīng)用
薛 亮,盛步云,蕭 箏,汪星剛
(武漢理工大學(xué) 機(jī)電工程學(xué)院,湖北 武漢 430070)
在大規(guī)模定制市場(chǎng)不斷擴(kuò)大的環(huán)境下,產(chǎn)品配置信息管理顯得尤為重要。為此,提出將C4.5決策樹算法高效應(yīng)用于大數(shù)據(jù)量的產(chǎn)品配置信息管理中,挖掘配置間潛在的規(guī)則。基于Hadoop2.X的系統(tǒng)架構(gòu),將產(chǎn)品配置信息存入HDFS,利用MapReduce分布式計(jì)算框架,結(jié)合C4.5數(shù)據(jù)挖掘算法,得到并行化的MR-C4.5。產(chǎn)品配置實(shí)例研究結(jié)果表明:采用MR-C4.5管理產(chǎn)品配置信息有良好的執(zhí)行效率和集群拓展性。
產(chǎn)品配置管理;C4.5;Hadoop
產(chǎn)品配置設(shè)計(jì)的概念由FREEMAN等提出,認(rèn)為設(shè)計(jì)分為兩部分:識(shí)別和選擇[1]。20世紀(jì)80年代初,第一套產(chǎn)品配置系統(tǒng)XCON被用于大型計(jì)算機(jī)的配置,人們正式開始了產(chǎn)品配置技術(shù)的研究[2]。祁國(guó)寧等研究模塊化產(chǎn)品的建模方法,提出面向大規(guī)模定制的配置建模方法[3-4];LEE等[5]提出一種基于映射規(guī)則的方法,通過用戶需求功能與模型功能屬性的匹配,從而達(dá)到配置的目的;艾輝等[6]建立包含產(chǎn)品信息的基本模塊,基于約束的配置規(guī)則,以實(shí)現(xiàn)配置過程;陸長(zhǎng)明等[7]就獲取的初衷與實(shí)際輸出之間的差距進(jìn)行研究,構(gòu)造了基于映射關(guān)系的最優(yōu)匹配思想過程。
配置信息管理為大規(guī)模定制產(chǎn)品配置提供了基礎(chǔ),面對(duì)大數(shù)據(jù)量的產(chǎn)品配置信息,高效率地處理這些有價(jià)值的數(shù)據(jù)顯得尤為重要。然而普通的系統(tǒng)框架和分析軟件在性能上逐漸暴露出了弊端,不適用于TB級(jí)大數(shù)據(jù)集的處理[8]。……