




摘 要:文章利用了人工神經(jīng)網(wǎng)絡(luò)模型,通過(guò)被調(diào)查者的基本信息、手游時(shí)長(zhǎng)、消費(fèi)態(tài)度等方面,預(yù)測(cè)被調(diào)查者是否存在長(zhǎng)期消費(fèi)的現(xiàn)象,以期更容易辨認(rèn)出氪金玩家與平民玩家,使得開(kāi)發(fā)者的宣傳以及策劃更具有目的性和有效性。
關(guān)鍵詞:長(zhǎng)期消費(fèi)行為;手機(jī)游戲消費(fèi);人工網(wǎng)絡(luò)模型
中圖分類號(hào):F49 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1005-6432(2022)05-0123-02
DOI:10.13939/j.cnki.zgsc.2022.05.123
1 引言
如今的社會(huì)中,科技迅速發(fā)展,手機(jī)也變成人手一個(gè)的生活必需品,網(wǎng)上支付的便捷性和安全性也使手機(jī)從20年前的聯(lián)系工具,變成了人們移動(dòng)的錢(qián)包。對(duì)于公司而言,能從龐大的玩家群體尋找出未來(lái)可能存在長(zhǎng)期消費(fèi)行為的人群,會(huì)使其策劃、宣傳的過(guò)程中的對(duì)象更加集中,對(duì)于手游公司來(lái)說(shuō)百利而無(wú)一害。宋子健等[1]通過(guò)構(gòu)建二元Logistic回歸模型消費(fèi)者的游戲意愿和消費(fèi)意愿進(jìn)行實(shí)證分析得到“年齡”“平均每天游戲時(shí)長(zhǎng)”“接觸手機(jī)游戲時(shí)間”對(duì)消費(fèi)者的消費(fèi)意愿均起到正向作用這一結(jié)論。洪晶[2]考慮通過(guò)神經(jīng)網(wǎng)絡(luò)算法預(yù)測(cè)出每一位客戶最終所屬的消費(fèi)模式類別,能夠幫助客戶服務(wù)人員按照每一類客戶群體消費(fèi)行為的特點(diǎn)提供相應(yīng)的服務(wù)和采取針對(duì)性的營(yíng)銷策略。本文采取人工神經(jīng)網(wǎng)絡(luò)模型,通過(guò)玩家的基本信息、游戲時(shí)長(zhǎng)等方面對(duì)玩家是否存在長(zhǎng)期消費(fèi)行為進(jìn)行預(yù)測(cè),使得游戲開(kāi)發(fā)商能夠針對(duì)不同的玩家采取不同的策劃宣傳方式。
2 理論概述
人工神經(jīng)網(wǎng)絡(luò),就是人們利用計(jì)算機(jī)模仿生物的神經(jīng)網(wǎng)絡(luò),解決信息分類處理的模型[2]。神經(jīng)元大致可以分為樹(shù)突、突觸、細(xì)胞體和軸突。神經(jīng)元在神經(jīng)系統(tǒng)中,起著接收信息、傳遞信息、處理信息的作用。而人工神經(jīng)網(wǎng)絡(luò),將輸入數(shù)據(jù)看成是接收信息,而激活函數(shù)則是神經(jīng)元處理信息的能力,輸出數(shù)據(jù)則是經(jīng)過(guò)神經(jīng)元多層處理傳出的信息。經(jīng)過(guò)一層層神經(jīng)元的處理之后,便可以由原始的輸入數(shù)據(jù)得到對(duì)應(yīng)的輸出數(shù)據(jù)。由于迭代的次數(shù),神經(jīng)元的層數(shù)比較多,相比于大多回歸模型,預(yù)測(cè)精度可能會(huì)更高,擬合效果會(huì)更好。
本文經(jīng)過(guò)多層神經(jīng)元處理所得到的神經(jīng)網(wǎng)絡(luò)模型:
其中的g(i),i=1,2,3,…,n指的是每一層的激活函數(shù),在每一層中神經(jīng)元處理數(shù)據(jù)所遵循的函數(shù)。而b(i),i=1,2,3,…,n代表了每一層的閾值,在生物神經(jīng)元中,只有足量的信息輸入神經(jīng)元后,達(dá)到一定的閾值之后,神經(jīng)元才會(huì)向下一層神經(jīng)元傳遞信息,這里用bi表示第i層的閾值。W(i),i=1,2,3,…,n指的是每一層神經(jīng)元中的權(quán)重,用來(lái)說(shuō)明每一層對(duì)應(yīng)分量的影響程度。上述模型,就是模擬了輸入數(shù)據(jù)經(jīng)過(guò)一層層神經(jīng)元激活函數(shù)的作用后,輸出對(duì)應(yīng)y的過(guò)程。
3 變量選取
本文中所研究的問(wèn)題存在12個(gè)自變量,所以設(shè)X=(x1,x2,…,x12)為輸入數(shù)據(jù),而調(diào)查中所得到的數(shù)據(jù)中存在缺失的問(wèn)題,倘若學(xué)生并沒(méi)有進(jìn)行過(guò)手機(jī)游戲的消費(fèi)行為,那么手機(jī)的消費(fèi)體驗(yàn)以及更傾向的消費(fèi)模式的數(shù)據(jù)就會(huì)缺失,設(shè)計(jì)問(wèn)卷時(shí),有意將y=0看作是玩家無(wú)消費(fèi)行為。因此,筆者將缺失的部分?jǐn)?shù)據(jù)用0進(jìn)行對(duì)應(yīng)的補(bǔ)齊。輸入數(shù)據(jù)X包括性別、收入、游戲時(shí)間、手機(jī)內(nèi)游戲數(shù)量、最近所玩游戲的游戲時(shí)長(zhǎng),以及對(duì)于游戲品質(zhì)、社交系統(tǒng)等屬性偏好,共12方面,通過(guò)被調(diào)查者的選擇,預(yù)測(cè)被調(diào)查者是否大概率存在消費(fèi)狀況。
y為問(wèn)題中的輸出數(shù)據(jù),由于筆者感興趣的是消費(fèi)玩家的是否存在長(zhǎng)期穩(wěn)定的消費(fèi)行為,所以如果玩家存在氪金的情況,筆者設(shè)y=1,若玩家不氪金,設(shè)y=0,相當(dāng)于筆者將其看成了一個(gè)二分類的問(wèn)題。由于數(shù)據(jù)本身并非如上的表示方法,所以筆者對(duì)數(shù)據(jù)y進(jìn)行了一定的處理,方便后續(xù)模型的建立。
4 模型的建立
由于解釋變量X存在12個(gè)分量,所以在設(shè)計(jì)第一層神經(jīng)元時(shí),遵從規(guī)律,設(shè)計(jì)約為變量個(gè)數(shù)的百分之七十五,第一層的神經(jīng)元個(gè)數(shù)設(shè)置約為8個(gè)。在構(gòu)建模型之時(shí),所選用的激活函數(shù)是“relu”函數(shù):
相比于其他函數(shù),經(jīng)過(guò)測(cè)試發(fā)現(xiàn),“relu”函數(shù)的迭代次數(shù)更少,并且更快地達(dá)到了所需要的精度。由于問(wèn)題最后的輸出數(shù)據(jù)為二分類型,為了能更好地映射到0,1上面,輸出層的激活函數(shù)使用“sigmoid”,公式如下所示:
通過(guò)以上兩種形式激活函數(shù),便可以將輸入數(shù)據(jù)進(jìn)行有效的分類,使得最后的輸出數(shù)據(jù)對(duì)應(yīng)想得到的0,1。
為了驗(yàn)證模型的準(zhǔn)確性,將數(shù)據(jù)集分為三個(gè)部分,從理論上說(shuō),訓(xùn)練集、測(cè)試集、驗(yàn)證集的比例為8∶1∶1,根據(jù)所得到的數(shù)據(jù)數(shù)量共792組,將其分為訓(xùn)練集634組,測(cè)試集79組,驗(yàn)證集79組。首先,利用634組訓(xùn)練集的數(shù)據(jù),對(duì)神經(jīng)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練構(gòu)建好模型,利用測(cè)試集的數(shù)據(jù),對(duì)模型的擬合度等進(jìn)行測(cè)試。
在本文中,筆者利用loss函數(shù),以及模型的精度,對(duì)模型進(jìn)行檢驗(yàn)。所采取的loss函數(shù)是可以度量預(yù)測(cè)值與實(shí)際值之間的差異的二分類交叉熵公式:
筆者先分別在訓(xùn)練集、測(cè)試集中計(jì)算其loss函數(shù)。訓(xùn)練集中損失函數(shù)的值越大,說(shuō)明訓(xùn)練集中預(yù)測(cè)的差異與真實(shí)情況越大,驗(yàn)證集中的損失函數(shù)同理。
如圖1的上方圖所示,點(diǎn)集代表訓(xùn)練集的loss函數(shù)值,線條代表驗(yàn)證集的loss函數(shù)值。隨著迭代次數(shù)的增加,兩者都在逐步減小,可見(jiàn)迭代的次數(shù)增加,模型的預(yù)測(cè)效果會(huì)更好。當(dāng)訓(xùn)練集和測(cè)試集的loss函數(shù)值在迭代了20次時(shí),兩者接近重合,可見(jiàn)其擬合的效果。最為重要的是,隨著迭代的次數(shù)增加到80次后時(shí),訓(xùn)練集和驗(yàn)證集的loss函數(shù)值已經(jīng)無(wú)限的趨近于0,可見(jiàn)在兩者中,模型的預(yù)測(cè)值與真實(shí)值的差異逐步減少,甚至是消失。如圖1的下方圖所示,就算是迭代的次數(shù)不超過(guò)20,訓(xùn)練集所訓(xùn)練的模型的精度也高達(dá)0.6,而隨著迭代的次數(shù)逐步增加,在迭代次數(shù)達(dá)到40時(shí),不管是訓(xùn)練集,還是驗(yàn)證集,產(chǎn)生的模型精度都高達(dá)0.9以上。筆者為了測(cè)試模型的精度,繪制訓(xùn)練集與測(cè)試集的精度圖。為了確保模型的準(zhǔn)確性,利用測(cè)試集對(duì)模型進(jìn)行了同樣的測(cè)試,結(jié)果如圖2所示。
如圖2所示,當(dāng)?shù)螖?shù)足夠時(shí),測(cè)試集的loss函數(shù)足夠小,精度也同樣足夠高,所以可以說(shuō)本文所提到的模型通過(guò)了檢驗(yàn)。也可以根據(jù)測(cè)試集的數(shù)量,將數(shù)據(jù)分為10組,每組79份,每組都進(jìn)行精度的計(jì)算,得出精度分別為0.9744、0.9465、0.9487、0.8077、0.8846、0.8846、0.9872、0.9615、0.6538、0.6538,算出其平均值約為0.8703,在多次訓(xùn)練的模型精度的平均水平達(dá)到了0.8703,可見(jiàn)相比于logistic回歸模型,神經(jīng)網(wǎng)絡(luò)的模型預(yù)測(cè)的能力之強(qiáng),結(jié)果之準(zhǔn)確。除已有的數(shù)據(jù)外,又收取了10份問(wèn)卷,將其數(shù)據(jù)處理之后,代入到已經(jīng)訓(xùn)練好的模型中,發(fā)現(xiàn)在迭代多次后,最多只會(huì)出現(xiàn)一次錯(cuò)誤,大多數(shù)情況甚至沒(méi)有出現(xiàn)預(yù)測(cè)錯(cuò)誤的情況。
5 結(jié)論
倘若對(duì)數(shù)據(jù)使用Logistic回歸模型,預(yù)測(cè)的正確率只有60%左右,神經(jīng)網(wǎng)絡(luò)的精度高達(dá)90%,其預(yù)測(cè)的效果有著極大差距。神經(jīng)網(wǎng)絡(luò)模型所訓(xùn)練出的模型,其精度較高,預(yù)測(cè)出錯(cuò)的概率在迭代次數(shù)較高時(shí),非常低,利用神經(jīng)網(wǎng)絡(luò)構(gòu)建的模型,可以通過(guò)玩家的一些基本信息,平時(shí)游戲的時(shí)長(zhǎng),還有其對(duì)于游戲內(nèi)一些消費(fèi)內(nèi)容的偏好性,很好地預(yù)測(cè)玩家是否存在消費(fèi)行為。玩家如果經(jīng)過(guò)神經(jīng)網(wǎng)絡(luò)的檢測(cè)之后,輸出的數(shù)據(jù)為1時(shí),可以認(rèn)定玩家存在著長(zhǎng)期的、穩(wěn)定的手機(jī)游戲消費(fèi)行為,是未來(lái)游戲盈利的主要對(duì)象,可以針對(duì)其游戲偏好設(shè)置一些更新內(nèi)容,道具,促使消費(fèi);當(dāng)輸出結(jié)果為0時(shí),玩家被認(rèn)定為平民玩家,消費(fèi)的潛在可能性較低,在策劃運(yùn)營(yíng)過(guò)程可以不用太過(guò)于迎合其心理需求。綜上而言,本文所得出的神經(jīng)網(wǎng)絡(luò)模型,可以有效且高精度地判斷學(xué)生是否為一個(gè)有著長(zhǎng)期穩(wěn)定消費(fèi)行為的群體,可以方便游戲開(kāi)發(fā)商針對(duì)這些長(zhǎng)期穩(wěn)定的消費(fèi)群體做出合理的游戲運(yùn)營(yíng)策略。
參考文獻(xiàn):
[1]宋子健,陳家樂(lè),趙家悅.手機(jī)游戲廣告對(duì)消費(fèi)者游戲意愿和消費(fèi)意愿的影響因素:基于Logistics回歸和SEM模型[J].現(xiàn)代經(jīng)濟(jì)信息,2019(13):129-131.
[2]洪晶. 聚類和神經(jīng)網(wǎng)絡(luò)算法研究及其在電信業(yè)客戶消費(fèi)模式中的應(yīng)用[D].景德鎮(zhèn):景德鎮(zhèn)陶瓷學(xué)院,2007.
[作者簡(jiǎn)介]朱文瑞,男,漢族,江西南昌人,研究生學(xué)歷,研究方向:數(shù)理統(tǒng)計(jì)。