喬富強 天津中德應用技術大學
數據挖掘在育嬰市場中的應用分析
喬富強 天津中德應用技術大學
隨著市場經濟的不斷深入,育嬰市場在我國各個城市中所占的比例越來越高,同時還面臨著潛在的網絡商店的威脅,我國企業的競爭越來越激烈,使得我國企業間的利潤空間不斷下降。為了提高市場競爭力,讓企業獲得更好的發展前景,就需要對育嬰市場的運營各個環節做優化處理。本文將探討數據挖掘在育嬰市場中的應用分析。
數據挖掘 育嬰市場 數據預測
當前育嬰市場的運營模式主要還是從采購到運輸、管理、營銷和服務等進行運轉的。而在這運轉過程中就會產生大量的各類數據,對這些數據的分析和利用,將會是企業最大的寶貴財富。數據庫系統能快速的實現對數據的錄入、查詢和統計等功能,但是要對這些數據不能實現關聯,根本就不能通過現有的數據預測企業未來的發展方向。因此就需要對數據里的關聯規則算法做分析研究,以構建起關聯規則算法模型,可以說有了數據挖掘技術,就可以從大量數據中提取出潛在的、有價值的知識,實現數據應用于育嬰市場。
數據挖掘又叫做數據庫中的知識發現,是與計算機相關的學科,包括人工智能、決策數算法、機器學習、數據庫知識、神經計算與統計分析等各類學科領域和方法的相互交叉學科。其定義就是指從海量數據里發現數據之間的聯系和規則,獲取事先并不知道,潛在的知識,從而提取有用的信息,其目的就是為數據庫理解和應用提供自動化、智能化的手段。關聯規則挖掘是數據挖掘過程中所能挖掘的一類重要的模式或知識,也是數據挖掘研究的一個重要分支??梢杂脕韺で笫挛镏g在特定環境條件下存在的某種積極和消極的相關性聯系。也就是說首先要找到所有支持度大于最小支持度的頻繁項集,也就是頻集。其次是使用第一步找到的頻集產生期望的規則。如在藥店購買了外套的,75%的人還買內衣,這樣的關聯規則很有價值,育嬰市場管理人員可以根據這些規則更好地進行規劃,把外套和內衣這樣的商品擺放在一起,就能夠提高銷售量。
關聯規則挖掘算法有很多類型,包括層次算法、搜索算法、抽樣算法和數據集劃算法等。這些算法存在兩個問題就是減小了IO操作以及降低需要計算支持率項目集數量,對于數據挖掘的效率影響十分大。Apriori算法作為一種關聯規則經典算法,是一種基于兩階段頻集思想的算法,假設某一項不是頻度集,它的所有超集就不會是頻度集。反之就是任一頻度集的所有子集一定都是頻度集。該算法主要是先找出全部支持度都超過了最小支持度的項集,然后把這些項集成為頻集,最后再從頻集中去找出期望的規則。
算法流程:

在零售業合理的商品布局是提高商品銷售的一種手段,合理的布局可以刺激顧客的購買沖動,還可以節約顧客的購物時間,這對提高育嬰店的服務水平與利潤都有積極的促進效果。通過數據挖掘能夠分析出以往顧客購買行為,包括購買數據、選擇路線、購買喜好、購買習慣、暢銷商品的類別、生產企業等數據,通過對顧客購買模式和趨勢的研究,可以改進服務質量,建立起最佳的貨架布局,從而提高貨品銷量比率,減少商業成本。下面是對某育嬰店的顧客購買商品的事務數據庫中的數據分析。數據挖掘過程如下:
首先計算出表中每類商品的關聯規則支持度,根據定義得出:

其次根據設定的最小支持度閥值,將大于或等于最小支持度閥值的商品挑選出來,設最小支持度閥值為0.3,可挑選出商品外套、內衣、鞋子與奶粉。


為了直觀明了,把其余的數據采取X=>Y的信任度表示,

再次依據設置的最小信任度閥值,設最小信任度閥值為0.6,得到下面規則:

最后,依據上面分析得到的規則,可以得到在育嬰店的消費者的購買習慣與喜好,私人老板就可以采取這樣的措施,一是調整貨架,將商品外套、鞋子放在一起,便于消費者選購,甚至可考慮將商品外套、鞋子和奶粉;二是在廠庫儲存進貨方面可以將關聯商品統購統存;三是商品的促銷廣告可以進行相關聯印發,可以增加商品的支持度與信任度;四是在網上進行商品銷售時把關聯商品放在同一頁面或增加關聯商品間的鏈接。在采取以上措施后,育嬰店可以擴大銷售額,提高了服務水平,顧客可以擴大交叉購買,提高其消費。
[1]一種基于組合方式改進的頻繁項集挖掘算法[J].計算機系統應用,2010,19(68-71
[2]基于數據挖掘的商業銀行客戶關系管理研究[D].牛勝利.財政部財政科學研究所2013
[3]大數據下第三方物流企業客戶關系管理研究[D].尤翠翠.沈陽工業大學2015
[4]數據挖掘在高職院校就業信息管理中的應用研究[D].黃榮喜.廣西大學2015
[5]基于數據挖掘的高校圖書館差異化閱讀推廣系統開發[D].胡杰.湖南大學2015