王洛濤
[摘要]近幾十年來,信息技術有著跨越式的發展,家紡行業與互聯網等信息新技術的融合也不斷深入。這也直接導致了有關家紡行業、企業以及產品等不同層次的“信息”呈現爆炸性增長,這些數據信息也具有復雜、多樣的特點。在利用這些數據做相關分析時,莊往存在難以處理大量、“關系復雜”數據的難題,使得由互聯網等信息新技術得到的數據無法快速、準確的轉化為有用信息。為了有效解決上述難題,本文試圖構建一種基于大數據分析的家紡行業發展預測定量研究。
[關鍵詞]大數據方法 家紡行業 發展預測
一、引言
隨著互聯網技術手段的不斷發展以及信息技術的廣泛普及,基于信息技術而產生的數據量,隨時間呈現指數增長的態勢,這類“爆炸性”的海量數據被學界稱為大數據。大數據的主要5個特點可以用“5V”來表示,即Volume(數據規模大)、Variety(數據的種類多樣)、Velocity(高速的數據)、Veracity(數據的真實性)以及Value(數據的價值)。也正式由于大數據具有上述五個特點,其在家紡行業的分析、預測中具有極大應用前景,可以有效解決家紡行業定性分析、預測的不準確性擠以及片面性。
本文首先利用大數據平臺處理家紡數據,進而對預測對象的確定和量化,最后詳細介紹時間序列分解方法、回歸分析法、BP神經網絡方法以及灰色系統方法,為大數據方法在家紡行業發展預測中的應用提供了一定參考。
二、利用大數據平臺處理家紡數據
利用大數據平臺處理家紡數據主要分為以下幾個步驟:1、搭建Hadoop平臺;2、采用HDFS系統分級分層次存儲數據;3、利用Map Reduce架構計算相關的“大數據”;4、將有用數據提取出來。其中,HDFS系統存儲數據以及數據的提取是主要難題。
HDFS的是Hadoop Distribute File System的縮寫。它一種基于Hadoop的分布式文件系統。HDFS主要是通過網絡連接的方式,存儲并高速閱讀TB級別的文件。HDFS方法對文件的寫操作一次性完成,可以多次讀出。其缺點也很明顯,即相關文件一旦“寫”好以后就難以修改。一般來說,家紡行業相關數據存儲的“橫坐標”通常為時間(即流行趨勢),采用Map過程會從HDFS數據中獲取研究對象有關數據并進行預處理,然后將其傳遞給系統預定的reduce函數進行充分的計算以后,輸出與研究對象有關的結果。
三、預測對象的確定和量化
影響家紡流行的因素形形色色、多種多樣,比如家紡的色彩、各地風俗以及款式設計等相關因素以及天氣等無關因素。前人的研究表明,色彩是家紡行業流行中最明顯的一個因素,一方面是因為服飾等潮流對家紡行業印象最直接的就是顏色,另一方面是因為消費者往往第一眼看到的就是顏色。為此,本文以色彩作為研究因素的代表。
關于家紡的顏色分類,不同國家、不同研究機構、不同廠家具有不同的分類模式、方法。比如在市場所處的國家方面,美國、歐洲(主要是法國和意大利)、日本以及中國每年的流行顏色具有一定的差異,甚至同一國家不同地區在每年的流行色方面都具有一定的差異。比如基于CNCS色彩體系的流行色趨勢數據(中國發布)、基于PANTONE色彩體系的流行色趨勢數據(美國發布)等等。
為了更加全面、快速、有效的借助大數據方法定量分析家紡行業色彩趨勢,具體顏色分類以及數據的選擇應該根據研究的范圍來確定。比如,研究國內的家紡行業色彩趨勢,就應采用由中國發布的家紡流行顏色相關數據。
四、家紡流行趨勢預測模型
家紡流行趨勢預測模型的選擇和構建,是借助大數據方法定量分析家紡行業色彩趨勢方法中的核心問題。預測模型是否準確、合理,直接關系到能否從海量數據中找到與研究問題有關的數據信息。目前可以借鑒的方法主要有以下四種:時間序列分解方法、回歸分析法、BP神經網絡方法以及灰色系統方法。本節將重點闡述四種方法的基本原理和優缺點。
4.4時間序列分解方法
基于時間序列分解法的預測模型,主要是將可能的影響因素根據作用時間的長短關系分成四大類:短期因素、長期因素,周期因素以及隨機因素。由于各因素之間的相互關系、相互作用復雜,于是該方法不考慮各個因素之間影響,重點研究每個因素和時間之間的單一作用關系。
4.2回歸分析法
回歸分析方法,主要對收集到的數據采用數學統計的方法建立不同變量之間的相互影響關系,進而完成有關預測的。常用的數學回歸模型很多,比如直線方程、指數方程等。但是,回歸分析方法存在一個嚴重的弊端,就是需要提供的各因素的數據都是“有效數據”,而實際有關家紡色彩的海量數據絕大部分都是無效數據,即該方法的魯棒性差。
4.3 BP神經網絡方法
BP(Back Propagation)神經網絡法中的BP是“BackPropagation”的簡稱。BP神經網絡法,與回歸分析方法截然想法,它可以在不確定各因素之間的相互作用關系的前提下,可以模擬人腦的思維,通過“學習”的方式獲得輸入量與輸出量之間的邏輯關系。BP神經網絡的判斷方式是使網絡的誤差平方和最小來確定最有可能的相互作用關系。一般來說,一個完整的BP體系應該包括以下三個層次:輸入層、隱含層以及輸出層。BP方法有較高的容錯能力,在部分“神經元”出現錯誤或者部分信息缺失時,仍然能進行學習,推斷未來的趨勢并進行判斷。但BP法也存在部分不足,主要表現為:1、計算時可能陷入局部最小化而無法尋找到全局最優解;2、BP網絡結構的選擇不同導致預測結果出現一定的差異;3、BP方法仍然存在一定程度的樣本依賴問題。
4.4灰色系統方法
灰色預測法是用灰色系統模型對未知系統進行的定量預測。運用灰色預測法,首先要對比各影響因素之間變化發展的差異性,然后對原始數據進行處理來發現變化規律,重新排列生成有新的數據序列,隨后建立相應的微分方程模型,最終達到預測某研究因素隨時間的變化規律。與BP神經網絡方法不同的是,灰色系統模型對收集到的數據的數量以及數據關系木有特殊要求。
五、結論
伴隨著信息技術的大發展,家紡行業與互聯網等信息新技術的融合也不斷深入。使得學者們有機會利用大數據來定量分析家紡行業發展預測,以避免傳統的定性預測方法預測結果不準確、過于片面的難題。但是使用大數據來定量分析時,也有由互聯網等信息新技術得到的數據無法快速、準確的轉化為有用信息的巨大困難。為了有效解決上述難題,本文試圖構建一種基于大數據分析的家紡行業發展預測定量研究方法,首先利用大數據平臺處理家紡數據,進而對預測對象的確定和量化,最后利用時間序列分解方法、回歸分析法、BP神經網絡方法以及灰色系統方法等預測模型完成預測分。本文提供的思路,對大數據方法在家紡行業發展預測中的應用提供了一些有益的思考,具有一定的參考價值。