

摘 要:信息技術時代,海量的數據呈現爆炸式增長。網購已逐漸成為人們購物的主要方式,特別是在“互聯網+”戰略推動下,營銷模式也發生了重大的轉變,新零售模式逐步興起并得到發展。這就對企業的營銷策略提出了更高的要求,為了能夠全面了解消費者需求、消費者購物習慣,從而實現個性化營銷和精準營銷,更加需要企業掌握和利用好大數據。通過闡述互聯網時代,依托粗糙集,以消費者的大量行為軌跡數據挖掘出客戶的隱性知識,從而能夠更好地為企業的營銷服務提供助力。
關鍵詞:互聯網;隱性知識;新零售
中圖分類號:F27? ? ? 文獻標志碼:A? ? ? 文章編號:1673-291X(2019)20-0081-02
引言
信息技術時代,知識管理已經成為更多企業來謀求競爭優勢的重要手段。知識管理理論認為,企業能夠獲得持續競爭力的前提是能夠對自己現有知識進行有價值的知識創新。Polanyi認為,知識可以分為顯性知識(Explicit Knowledge)和隱性知識(Tacit Knowledge),相比顯性知識來說,隱性知識因其極強的主體承載性、不可替代性和稀缺性更具有創造性。因此,企業在進行知識創造時,可以從大數據中挖掘出難以格式化描述、難以編碼的隱性知識,從而挖掘出消費者的隱性知識,使企業更好地利用這些知識,快速地應對日益加劇的激烈的市場競爭環境。
一、理論基礎
(一)新零售的內涵
馬云在2016年杭州云棲大會上提出了“新零售”的概念[1]。2018年4月《2018“美好生活”智慧零售白皮書》中曾提到,我國正在進行著一場以技術為驅動,線上線下一體化的變革。2017年《中國“家·生活”用戶消費行為專題分析報告》中指出,消費者不再單純地滿足于購買產品或服務,產品或服務所帶來的心理效益開始占據越來越重要的位置。因此,越來越多的企業開始采用體驗式營銷模式,注重開展各種溝通活動,增強顧客體驗感受,使消費者在物質上和精神上得到雙重滿足,促進消費者做出購買決策。未來的十年將是新零售時代,互聯網技術能夠很好地運用大數據、云計算等,逐步去發掘出客戶的需求,傾聽客戶內心的聲音,保持并且持續改進與消費者的關系,進而對消費者實施精準營銷、有效營銷才是未來零售企業制勝之道。
(二)粗糙集
1982年波蘭學者創立了粗糙集(Rought Sets,RS)理論,它是用來進行數據挖掘和分析的一種軟件計算方法。自創立以來,越來越得到更多的關注,尤其是人工智能的興起[2]。RS以收集到的原始數據的分類能力為基礎,然后對樣本數據進行分析,從而去發現其中所隱藏的規則知識。這種計算方法不需要任何的先驗知識,能夠處理不完整(Incomplete)、不精確(Imprecise)、不一致(Inconsistent)的[2]數據,并且操作起來簡單、方便。目前,已經在許多領域得到了廣泛的應用,如地震預報、機器學習、人工智能、臨床醫療診斷、故障診斷、模式識別、圖像處理等。
粗糙集的知識表達系統(Knowledge Representation System, KRS)可以表示為:四元組,其中:
二、消費者隱性知識獲取的過程
新零售實質上是利用大數據和互聯網重建人、貨、場,在互聯網上,消費者的瀏覽記錄和消費記錄等形成了龐大的數據庫,哪怕一個微小的行為都會影響著大趨勢[3]。由于網民越來越多、基數越來越大,我們正處于海量的數據之中。大數據本質就是通過某些特定的計算方法和技術,將收集到的顧客的消費數據進行匯總、整理、分析,從而判斷出消費者的消費趨勢,喜歡哪一類產品,即將會有什么樣的產品需求,總結起來即是對消費者數據進行分析?;ヂ摼W技術的高速發展為我們獲取消費者隱性知識提供了很多的便利條件。互聯網是一個動態地、分布式、大規模的,囊括了多種數據(結構化、非結構化、異構數據)的信息源?;诖植诩碚摰臄祿诰蚩梢詮谋ㄊ皆鲩L的海量數據中挖掘出消費者行為和企業潛在顧客之間聯系的規則知識,有效地去指導企業的一些措施和方案。
(一)數據預處理
粗糙集能夠處理多種類型的數據,但在具體的應用過程中是以等價關系為基礎的,處理對象是離散化數據。因此,需要對原始數據進行規范化處理。在互聯網上搜集到的數據可能并不規范,因而,在數據預處理階段,需要多搜集到的數據進行規范化處理,對原始數據中一些缺失數據、不一致數據、噪聲數據等進行清理;在互聯網收集到的客戶知識中不僅有離散性數據,而且還存在連續性數據,要對連續性數據進行離散化。本文使用信息熵的離散化方法對連續性數據離散化,它是對原始數據的屬性本身進行劃分,來使信息熵的減少和區間數達到最小,以尋求熵損失和適度區間數的平衡,使離散值最佳[4-5]。經過數據預處理以后,使數據更加完整、干凈、具有針對性。
2.屬性約簡
在搜集到的數據中,有些屬性對決策是沒有用的,冗余屬性的的存在會增加系統的數據量,一方面使計算機計算速度變慢,另一方面會產生更多的規則,影響最后的決策[6]。屬性約簡的前提是不影響原有信息表,剔除一些不相關屬性,最后得出的就是最小屬性集,計算起來運行速度加快,相應的挖掘出來的無用規則就少了,規則獲取的速度就提高了。文中使用遺傳算法對離散化后的屬性值進行約簡,我們想要得到最準確、精簡的規則集,就必須使屬性值最少。使用遺傳算法進行約簡可以降低復雜性,提高運行效率。
(三)提取規則知識
建立決策系統DT=〈U,A,V,f〉,使用RS生成規則,這時令?琢表示c(c∈C)的描述合取,?茁表示決策表,D決策屬性,粗糙集計算結果得出的規則表明條件屬性和決策屬性之間關系,可以用“IF-THEN”的形式表示。此時得出的規則,并不能作為最終的規則集,需要去粗糙集得出的眾多規則進行篩選,篩選指標為支持度和精確度。
1.規則的精確度Accuracy(α→β)可以表示為[6]:
2.規則的支持度
其中,決策表為DT=〈U,A,V,f〉,A=C∪D,U表示論域,U中對象的總數目為N;生成的規則是dr;xC是滿足這個規則前件的對象數目。
Accuracy值越大,正確得出決策對象的個數越多;Support反映的是論域中可以與規則集中規則匹配的比例大小,Support越大,表明示例數據在實際應用中出現頻率就越大,也即是規則應用型強。
三、算例分析
用一個例子來說明本文隱性知識獲取的過程。首先,通過各種平臺收集客戶數據,并基于所收集到的客戶數據集,假定收集到的客戶數據為:條件屬性為3個方面構成、決策屬性由1個方面組成,分別記為C={I1,I2,I3}和D=g0gggggg,建立知識表達系統KS=(U,A,V,f),如表1所示。
本算例中數據較少,使用離散化算法以后依然是原來表達系統,上圖所示,然后用遺傳算法進行屬性約簡,結果如表2所示。
屬性約簡的支持度為100,約簡后得到兩個決策表,根據這兩個決策表生成規則,結果如表3所示。
在生成規則以后,如果規則過多,可以用精確度和支持度兩個指標對規則進行篩選,經過篩選以后的規則精確度和支持度都很高,在實際應用中通過這些規則進行預測時準確率會比較高,篩選以后的規則就形成了規則集。如表3所示,I2特征為1,I3特征值為1時就可以做出決策為D2。
結語
信息技術高速發展的時代,作為電子商務企業一定要緊跟時代的步伐,根據企業自身性質,利用好消費者數據特征,從大數據中挖掘出對企業競爭有力的信息,為企業的持續發展奠定基礎。本文介紹了從消費者大量數據中獲取隱性知識的方法,通過對原始數據進行清理、離散化、屬性約簡,然后生成規則,最后用一個算例來驗證方法的可行性。由于算例數據較少,可能會影響結果的精確性,后續會用案例來進行說明消費者隱性知識獲取的過程。
參考文獻:
[1]? 朱春曉.新零售模式下電子商務的現狀及趨勢分析[J].現代營銷:經營版,2019,(6):133.
[2]? 曹悅.電子商務背景下客戶隱性知識獲取機制研究[D].鄭州:鄭州大學,2017.
[3]? 袁佳玲,王海盈,陳麗媛,秦旖旎,張穎.“新零售”發展前景及關鍵問題研究[J].現代商貿工業,2019,(15):53-55.
[4]? 周凡程.粗糙集理論在數據離散化中的應用研究[D].長沙:中國人民解放軍國防科學技術大學,2012.
[5]? 王舉范,陳卓.基于信息熵的粗糙集連續屬性多變量離散化算法[J].青島科技大學學報:自然科學版,2013,(4):423-426.
[6]? 趙茜.自動化技術、計算機技術[J].中國無線電電子學文摘,2011,(5):167-246.