梁亮
[摘 ? ?要] 在強調大數據、互聯網、實體經濟與人工智能充分融合的當下,電子商務成為人們關注的焦點。本文以深度學習為切入點,在簡單介紹核心理論內涵的基礎上,從電商平臺的角度出發,對客戶數據進行了分析,并綜合考慮多方因素,提出了可使數據分析結論更加精準的方法,希望能夠給相關人員以啟發,為電子商務注入前進所需的動力。
[關鍵詞] 電子商務;客戶;深度學習;數據分析
doi : 10 . 3969 / j . issn . 1673 - 0194 . 2020. 21. 062
[中圖分類號] F713.36 ? [文獻標識碼] ?A ? ? ?[文章編號] ?1673 - 0194(2020)21- 0141- 02
0 ? ? ?前 ? ?言
電商的出現使生活更加便利,卻也帶來了一系列問題,對數據進行挖掘和分析,可使相關企業在面對挑戰時擁有更大的勝算。在此背景下,相關人員選擇以深度學習為切入點,針對電商客戶數據制定有別于過去的分析方法,所取得效果也十分令人矚目。由此可見,本文所研究課題擁有較為突出的社會價值,應當引起重視。
1 ? ? ?理論概述
1.1 ? 電子商務
近幾年,以京東和淘寶為首的電商品牌,給人們生活帶來了極大便利,電商平臺的特征,主要表現為低于實體經濟的運營成本,還有更符合預期的消費模式。深度學習理念的提出,使相關人員意識到,以客戶數據為依托,充分利用深度學習和數據挖掘法,對客戶所做出購買等行為進行分析,為電商平臺提供對體驗進行升級的方向,確保電商平臺對客戶擁有更為強大的吸引力。
電子商務指的是以互聯網為載體對商貿活動進行開展的運營模式,強調網上購物與電子支付。2013年至今,電商企業紛紛將提供高效服務視為工作重心,在電子商務得到大力推廣的背景下,將其視為交易首選平臺的人員數量不斷增加,數據信息逐年增加,這部分信息主要由購買行為、客戶評價和反饋構成,如何對相關數據加以應用,準確把握客戶行為所呈現出規律,自然成為相關行業討論的重點,這是因為客戶行為有助于電商對潛在消費群體加以識別,促使瀏覽者向消費者進行轉變,其經濟價值及現實意義均有目共睹。
1.2 ? 客戶數據分析
針對電商客戶所開展數據分析工作,強調以客戶瀏覽記錄、歷史訪問和服務器日志為依據,對行為規律進行提煉,以此來達到實時預測客戶購買傾向與行為的目的。從電商平臺的視角來看,這樣做有助于自身對客戶行為加以掌握,并有針對性地推薦商品,調整進貨和出貨的具體數量,另外,在對營銷策略進行制定時,數據分析所得結論,同樣有無法被替代的作用。早在20世紀90年代,部分學者就已將網絡數據視為研究重點,并成立了對電商客戶所涉及數據進行分析的機構。信息時代的到來,加快了電子商務推廣和普及的速度,可被用來分析客戶數據的方法也不斷增加,其中,具有代表性的有神經網絡法、決策樹法和貝葉斯分類法。上述方法存在較為明顯的共性特征,即驅動力為數據,將客戶信息和行為視為切入點,從中對特征設計所需因素進行篩選,再經由計算機學習法,對模型進行訓練。另外,上述過程又被稱為深度學習,這點應引起重視。
2 ? ? ?數據分析
2.1 ? 分析方向
近幾年,在飛速發展的科技的加持下,深度學習模型逐漸走向成熟,其中,本文研究的CNN、RNN,還有DNN、DBN均已在語音識別、信息處理等領域得到應用,所取得效果也十分顯著。在對電商客戶數據進行分析時,相關人員應做到以客戶數據為依據,根據分析結果,對其行為進行預測,當然,這也是電商平臺的主要工作。在深度學習得到推廣的背景下,電商平臺對客戶數據的掌握愈發全面,數據庫的形成,使預測工作擁有了更加理想的針對性和實時性,這便是智慧化預測的開端。由此可見,可被用來進行數據分析的體系,通常要滿足以下要求:第一,以統計學、數據挖掘和機器學習為切入點,完成提取數據特征的操作;第二,根據所提取特征,對相關知識庫進行構建,確保數據輸入、行為預測等內容均被納入所構建體系。
2.2 ? 數據處理
第一步,以電商交互系統為載體,對交互日志進行抽取,搜集客戶分析所需數據;第二步,對數據進行預處理,例如,清洗數據,將異常值去除,以及對缺失值進行填充,確保數據滿足唯一性的要求,使行為預測及后續工作的開展,擁有全面且有效的保障。
2.3 ? 特征提取
以原始數據為依托,對客戶購買行為所表現出特征進行提取,再利用現有分類方法,將特征劃分為動態/靜態或原始/拓展,通過對不同類別特征進行整合的方式,形成有別于過去的全新特征。研究表明,要想使預估效果達到預期,關鍵是參考數據與特征,對模型預估上限加以明確,并對模型進行調整,由此可見,如何增強所構建特征的科學性,已成為使客戶數據得到精準分析的保障,在未來一段時間內,該項工作將成為研究的主要內容。
2.4 ? 模型構建
預測模型是否準確,通常會給數據分析帶來直接影響,甚至對分析結果的有效性有決定作用。現階段,大量預測模型被投入使用,但現有模型的準確性,普遍和預期存在較大差距,如何以數據分析為依據,對客戶行為進行預測,成為了電商平臺關注的重點。眾所周知,電子商務的特點,主要表現為數據量大和處理難度高,現有模型均不具備對全部問題加以解決的能力,其中,大部分模型都符合理論模型的特征,強調對影響因素進行定性分析。研究表明,在很長一段時間內,Logistic回歸法均占據著主導地位,從本質來說,該回歸法屬于線性分類模型之一,其特征表現為對輸入所提出要求相對嚴格,例如,目標對象應滿足線性可分條件,而隨機森林法、Badding法的性能,普遍會受到一定程度的限制。基于此,本文以深入學習為切入點,對分析電商客戶數據的方法進行探究,具體內容如下:
2.4.1 ? 理論概述
Hinton是首位提出深度學習概念的學者。作為機器學習研究全新方向,深度學習主要被用來對神經網絡較易受到學習能力制約的問題,以逐層貪婪學習為原則,通過對非線性網絡進行深入學習的方式,獲得機器學習所需特征,為預測結果所具備精準性提供保障。
從本質上說,深度學習強調的是對數據表征進行學習,旨在對完善模型進行創建,并以未標記數據為依托,對表示方法加以掌握。現階段,針對深度學習所展開研究,主要涉及以下方面:其一,以卷積運算為核心的神經網絡,即CNN;其二,以多層神經元為核心的神經網絡,通常分為稀疏編碼和自編碼;其三,以自編碼網絡為載體,通過開展預訓練的方式,對深度置信網絡加以優化。
2.4.2 ? 特征構建
特征構建主要由三個階段組成,分別是選擇特征、對樣本測試集與訓練集進行劃分和特征處理。從某個層面來說,選擇特征是確保預測模型得到有效構建的前提,要求相關人員以現有數據集為依托,確定分類所需特征集,通過提升模型精準度的方式,將運行時間控制在合理長度。由于不同維度對特征量綱、單位所提出要求,通常有較為顯著的差異存在,評估特征所擁有權重也會受到影響,因此,要想避免預估效果受到影響,關鍵是通過特征管理的方式,達到歸一化處理的目的。
2.4.3 ? 確定并驗證模型
深度學習強調以算法為依托,在現有假設空間中對最優假設進行確定,而預測方法要求相關人員從多個角度對分析工作進行開展,在所處理數據不同的基礎上,利用現有方法對客戶所開展活動進行預測,通常會取得不同的結論,可以說,任何學習問題都有相應的算法,但是,并不存在適用于全部領域的算法,在此背景下,學者紛紛將目光轉向對單一算法進行整合,形成擁有良好普適性的模型的方面,希望能夠通過相關研究的開展,確保算法可發揮出應有作用,而合成算法所應用方法,也因此而成為對算法準確率起決定作用的因素。
待上文所提及工作告一段落,相關人員便應對模型進行確定并驗證。一方面,利用CNN和RNN對模型框架進行構建,以此為基礎,隨機抽取數據負樣本并對網絡層數加以調整,在明確損失函數后,經由BP算法對輸出誤差進行反向傳播,并以Adam算法為依托,完成模型參數的優化處理。另一方面,利用尚未經過訓練的客戶數據,對模型所具備泛化能力進行驗證,若預測結果和預期相差較遠,相關人員應對模型進行重新設計與訓練。
3 ? ? ?結 ? ?論
通過分析文章內容可知,以數據分析所得結論為依據,對客戶行為進行預測,現已成為電商領域所研究的主要內容,在深度學習模型逐漸趨于完善的背景下,對客戶行為進行預測的精準度不斷提升,但是黑盒特征的存在,導致深度學習無法為基于特征提取所開展定性研究工作提供支持,因此,未來一段時間內,由深度學習延伸出的可視技術將成為研究的重點。
主要參考文獻
[1]孫曉凱,倪卿元,陳文強.圖像增強方法在深度學習圖像識別場景應用中的可行性研究[J].電信科學,2020,36(z1):172-179.
[2]戴成華,宋偲皓,薛繼待,等.基于人工智能視頻深度處理技術的景區智慧化管理探索研究[J].科技通報,2019,35(4):108-114.
[3]曹曉明,張永和,閆海亮,等.人工智能視域下的學習參與度識別方法研究——基于一項多模態數據融合的深度學習實驗分析[J].遠程教育雜志,2019,37(1):32-44.