趙茜茜 張洋溢 聶焱


摘要:現(xiàn)針對一種實用新型指紋鎖拉鏈,研究其市場需求,即客戶收入、喜好、年齡等對于該產(chǎn)品的需求度。使得該產(chǎn)品在投入市場之前,能有一個較準確的定位。現(xiàn)采用集成學習的思想,將兩個基礎預測模型,集成成一個較強的預測、分類模型,能夠為數(shù)據(jù)集建立一個較為出色的分類模型和預測模型,能夠用于預測一個新的案例是否對指紋鎖拉鏈產(chǎn)品有需求。
關鍵詞:需求預測;集成學習;指紋鎖拉鏈
中圖分類號:TN919.5 文獻標識碼:A 文章編號:1007-9416(2019)07-0050-02
0 引言
日常生活中人們使用的背包上的拉鏈基本上都是沒有加鎖的,或者是旅行箱上使用的密碼鎖,但是這種密碼鎖有兩個明顯的缺點,其一是經(jīng)常會出現(xiàn)忘記密碼的情況,給人們帶來生活的不便,其二是會出現(xiàn)人們因為密碼鎖麻煩而很少去使用的情況,因此很多這樣的密碼鎖沒有起到其本質(zhì)加強防盜系數(shù)的作用,成為一種擺設。
因此推出一種安全、便捷的指紋鎖拉鏈裝置。延伸加工拉鏈產(chǎn)業(yè)鏈,降低指紋鎖成本,提高產(chǎn)品附加價值,切實提高箱包安全性能。該產(chǎn)品推向市場之前,需要對其進行市場需求分析。
目前對于需求預測的方法多采用單一預測算法。但是任何算法都有優(yōu)劣,無法達到完美效果。因此可采用構建并結合多個學習器來完成學習任務的思想,即集成學習,來對調(diào)查問卷獲得的數(shù)據(jù)集進行分類訓練、學習。能夠為數(shù)據(jù)集建立一個較為出色的分類模型和預測模型,能夠用于預測一個新的案例是否對指紋鎖拉鏈產(chǎn)品有需求。
1 數(shù)據(jù)特性描述
1.1 數(shù)據(jù)來源
數(shù)據(jù)來源于調(diào)查問卷。問卷調(diào)查采用重點對象的抽樣調(diào)查形式,通過對城市的經(jīng)濟、人口、社會習俗、箱包消費、消費觀念等方面分析,將大學生群體作為本次調(diào)查的代表人群。發(fā)放問卷800份,回收521份,回收率為65.1%,可利用125份,可利用率為15.6%。
數(shù)據(jù)集的全名為對于帶有指紋鎖拉鏈的背包(包括斜挎包)的需求調(diào)查。可利用實例共計125個。
1.2 具體數(shù)據(jù)闡述
數(shù)據(jù)集數(shù)據(jù)來自用戶通過線上、線下問卷形式的調(diào)查。共有七個問題,分別如表1。
現(xiàn)將前六個問題回答結果用0和1表示,第七個問題回答結果用YES和NO表示。
2 采用個體學習器進行預測
2.1 基于誤差逆?zhèn)鞑ニ惴ǖ亩鄬痈兄獧C模型
多層感知機(Multi-Layer Perception,MLP),也叫前饋神經(jīng)網(wǎng)絡,后文簡稱為神經(jīng)網(wǎng)絡模型。模型通常由一個輸入層、一個或多個隱層和一個輸出層構成。
使用100組數(shù)據(jù)訓練,25組數(shù)據(jù)測試。訓練的過程就是對參數(shù)進行不斷的調(diào)整和優(yōu)化,通常標準是均方根誤差RMSE低于0.1或是訓練達到一定的總周期數(shù)。經(jīng)過不斷學習訓練,選取的隱層個數(shù)及其節(jié)點數(shù)、學習率和動量如表2,訓練次數(shù)均為5000次。
當前BP算法訓練并測試的結果顯示有兩個錯誤。該算法測試結果的混淆矩陣如表3。
2.2 向量機(SVM)
SVM(Support Vector Machine)中文名為支持向量機,是一個有監(jiān)督的學習模型,通常用來進行模式識別、分類以及回歸分析。SVM方法是通過一個非線性映射p,把樣本空間映射到一個高維乃至無窮維的特征空間中(Hilbert 空間),使得在原來的樣本空間中非線性可分的問題轉化為在特征空間中的線性可分的問題。
同樣使用100組數(shù)據(jù)訓練,25組數(shù)據(jù)測試。該算法的均方根誤差如表4。
SVM算法用于此例,效果也不是很好。測試結果顯示有4個錯誤。該算法測試結果的混淆矩陣如表5。
3 集成學習
集成學習基于反向傳播算法的多層感知機和邏輯回歸模型在測試集的效果表現(xiàn)欠佳,不能作為理想的需求預測模型。現(xiàn)在使用集成學習的思想來處理。集成學習就是訓練多個模型,按照一定的結合策略進行集成。
當然并不是所有的模型都可以用于集成學習,基本條件是要個體模型有較高準確率,個體學習器間的相關性小。文中已經(jīng)使用了BP神經(jīng)和支持向量機模型對指紋鎖拉鏈產(chǎn)品市場需求進行了預測,預測效果都較高,但是沒有達到理想條件,且兩個模型之間沒有相關性,故可以用來集成。
現(xiàn)使用一種集成學習方法為預測融合法,通過基礎模型分別進行一次預測,會產(chǎn)生兩種不同的預測結果,將預測結果用來訓練一個新模型來進行預測,從而生成一個最終的預測結果。新模型采用的算法是隨機森林。表6給出模型集成后的結果。
融合后,測試發(fā)現(xiàn),該模型測試結果準確達到100%。測試結果0個錯誤。新模型測試結果的混淆矩陣如表7。
4 結語
該集成學習的思想,將兩個基礎預測模型,集成成一個較強的預測模型,提高了預測結果的準確性。由測試結果看出,該新模型能較好的學習兩個基礎模型的正確預測結果,規(guī)避錯誤結果,使得最后分類結果正確率達到100%。因此通過基于集成學習的預測融合法能夠較好地對案例進行預測得到更為準確的結果。
由測試結果分析發(fā)現(xiàn),該方法仍存在很大改進空間,可以在具體的實施中可根據(jù)不同的實際背景對模型進行修改,根據(jù)模型的核心方法,能較為方便地解決問題。
參考文獻
[1] Ferreira R P , Martiniano A , Ferreira A , et al. Study on Daily Demand Forecasting Orders using Artificial Neural Network[J]. IEEE Latin America Transactions,2016,14(3):1519-1525.
[2] 殷峻暹,陳守煜,邱菊.基于遺傳與BP混合算法神經(jīng)網(wǎng)絡預測模型及應用[J].大連理工大學學報,2002,42(5):594-598.
[3] 齊志成.基于BP神經(jīng)網(wǎng)絡模型的商洛市卷煙需求預測[J].湖南農(nóng)業(yè)科學,2017(1):86-89.
[4] 劉帥,曹國忠,張鳳偉,等.基于多方法融合的需求預測與分析[J].包裝工程,2019(4):221-226.