手機(jī)游戲消費(fèi)潛在現(xiàn)象的預(yù)測(cè)

2022-03-25 16:27:01朱文瑞

中國(guó)市場(chǎng) 2022年5期

摘要：文章利用了人工神經(jīng)網(wǎng)絡(luò)模型，通過(guò)被調(diào)查者的基本信息、手游時(shí)長(zhǎng)、消費(fèi)態(tài)度等方面，預(yù)測(cè)被調(diào)查者是否存在長(zhǎng)期消費(fèi)的現(xiàn)象，以期更容易辨認(rèn)出氪金玩家與平民玩家，使得開(kāi)發(fā)者的宣傳以及策劃更具有目的性和有效性。

關(guān)鍵詞：長(zhǎng)期消費(fèi)行為;手機(jī)游戲消費(fèi);人工網(wǎng)絡(luò)模型

中圖分類號(hào)：F49 文獻(xiàn)標(biāo)識(shí)碼：A 文章編號(hào)：1005-6432（2022）05-0123-02

DOI：10.13939/j.cnki.zgsc.2022.05.123

1 引言

如今的社會(huì)中，科技迅速發(fā)展，手機(jī)也變成人手一個(gè)的生活必需品，網(wǎng)上支付的便捷性和安全性也使手機(jī)從20年前的聯(lián)系工具，變成了人們移動(dòng)的錢(qián)包。對(duì)于公司而言，能從龐大的玩家群體尋找出未來(lái)可能存在長(zhǎng)期消費(fèi)行為的人群，會(huì)使其策劃、宣傳的過(guò)程中的對(duì)象更加集中，對(duì)于手游公司來(lái)說(shuō)百利而無(wú)一害。宋子健等[1]通過(guò)構(gòu)建二元Logistic回歸模型消費(fèi)者的游戲意愿和消費(fèi)意愿進(jìn)行實(shí)證分析得到“年齡”“平均每天游戲時(shí)長(zhǎng)”“接觸手機(jī)游戲時(shí)間”對(duì)消費(fèi)者的消費(fèi)意愿均起到正向作用這一結(jié)論。洪晶[2]考慮通過(guò)神經(jīng)網(wǎng)絡(luò)算法預(yù)測(cè)出每一位客戶最終所屬的消費(fèi)模式類別，能夠幫助客戶服務(wù)人員按照每一類客戶群體消費(fèi)行為的特點(diǎn)提供相應(yīng)的服務(wù)和采取針對(duì)性的營(yíng)銷策略。本文采取人工神經(jīng)網(wǎng)絡(luò)模型，通過(guò)玩家的基本信息、游戲時(shí)長(zhǎng)等方面對(duì)玩家是否存在長(zhǎng)期消費(fèi)行為進(jìn)行預(yù)測(cè)，使得游戲開(kāi)發(fā)商能夠針對(duì)不同的玩家采取不同的策劃宣傳方式。

2 理論概述

人工神經(jīng)網(wǎng)絡(luò)，就是人們利用計(jì)算機(jī)模仿生物的神經(jīng)網(wǎng)絡(luò)，解決信息分類處理的模型[2]。神經(jīng)元大致可以分為樹(shù)突、突觸、細(xì)胞體和軸突。神經(jīng)元在神經(jīng)系統(tǒng)中，起著接收信息、傳遞信息、處理信息的作用。而人工神經(jīng)網(wǎng)絡(luò)，將輸入數(shù)據(jù)看成是接收信息，而激活函數(shù)則是神經(jīng)元處理信息的能力，輸出數(shù)據(jù)則是經(jīng)過(guò)神經(jīng)元多層處理傳出的信息。經(jīng)過(guò)一層層神經(jīng)元的處理之后，便可以由原始的輸入數(shù)據(jù)得到對(duì)應(yīng)的輸出數(shù)據(jù)。由于迭代的次數(shù)，神經(jīng)元的層數(shù)比較多，相比于大多回歸模型，預(yù)測(cè)精度可能會(huì)更高，擬合效果會(huì)更好。

本文經(jīng)過(guò)多層神經(jīng)元處理所得到的神經(jīng)網(wǎng)絡(luò)模型：

其中的g（i），i=1，2，3，…，n指的是每一層的激活函數(shù)，在每一層中神經(jīng)元處理數(shù)據(jù)所遵循的函數(shù)。而b（i），i=1，2，3，…，n代表了每一層的閾值，在生物神經(jīng)元中，只有足量的信息輸入神經(jīng)元后，達(dá)到一定的閾值之后，神經(jīng)元才會(huì)向下一層神經(jīng)元傳遞信息，這里用bi表示第i層的閾值。W（i），i=1，2，3，…，n指的是每一層神經(jīng)元中的權(quán)重，用來(lái)說(shuō)明每一層對(duì)應(yīng)分量的影響程度。上述模型，就是模擬了輸入數(shù)據(jù)經(jīng)過(guò)一層層神經(jīng)元激活函數(shù)的作用后，輸出對(duì)應(yīng)y的過(guò)程。

3 變量選取

本文中所研究的問(wèn)題存在12個(gè)自變量，所以設(shè)X=（x1，x2，…，x12）為輸入數(shù)據(jù)，而調(diào)查中所得到的數(shù)據(jù)中存在缺失的問(wèn)題，倘若學(xué)生并沒(méi)有進(jìn)行過(guò)手機(jī)游戲的消費(fèi)行為，那么手機(jī)的消費(fèi)體驗(yàn)以及更傾向的消費(fèi)模式的數(shù)據(jù)就會(huì)缺失，設(shè)計(jì)問(wèn)卷時(shí)，有意將y=0看作是玩家無(wú)消費(fèi)行為。因此，筆者將缺失的部分?jǐn)?shù)據(jù)用0進(jìn)行對(duì)應(yīng)的補(bǔ)齊。輸入數(shù)據(jù)X包括性別、收入、游戲時(shí)間、手機(jī)內(nèi)游戲數(shù)量、最近所玩游戲的游戲時(shí)長(zhǎng)，以及對(duì)于游戲品質(zhì)、社交系統(tǒng)等屬性偏好，共12方面，通過(guò)被調(diào)查者的選擇，預(yù)測(cè)被調(diào)查者是否大概率存在消費(fèi)狀況。

y為問(wèn)題中的輸出數(shù)據(jù)，由于筆者感興趣的是消費(fèi)玩家的是否存在長(zhǎng)期穩(wěn)定的消費(fèi)行為，所以如果玩家存在氪金的情況，筆者設(shè)y=1，若玩家不氪金，設(shè)y=0，相當(dāng)于筆者將其看成了一個(gè)二分類的問(wèn)題。由于數(shù)據(jù)本身并非如上的表示方法，所以筆者對(duì)數(shù)據(jù)y進(jìn)行了一定的處理，方便后續(xù)模型的建立。

4 模型的建立

由于解釋變量X存在12個(gè)分量，所以在設(shè)計(jì)第一層神經(jīng)元時(shí)，遵從規(guī)律，設(shè)計(jì)約為變量個(gè)數(shù)的百分之七十五，第一層的神經(jīng)元個(gè)數(shù)設(shè)置約為8個(gè)。在構(gòu)建模型之時(shí)，所選用的激活函數(shù)是“relu”函數(shù)：

相比于其他函數(shù)，經(jīng)過(guò)測(cè)試發(fā)現(xiàn)，“relu”函數(shù)的迭代次數(shù)更少，并且更快地達(dá)到了所需要的精度。由于問(wèn)題最后的輸出數(shù)據(jù)為二分類型，為了能更好地映射到0，1上面，輸出層的激活函數(shù)使用“sigmoid”，公式如下所示：

通過(guò)以上兩種形式激活函數(shù)，便可以將輸入數(shù)據(jù)進(jìn)行有效的分類，使得最后的輸出數(shù)據(jù)對(duì)應(yīng)想得到的0，1。

為了驗(yàn)證模型的準(zhǔn)確性，將數(shù)據(jù)集分為三個(gè)部分，從理論上說(shuō)，訓(xùn)練集、測(cè)試集、驗(yàn)證集的比例為8∶1∶1，根據(jù)所得到的數(shù)據(jù)數(shù)量共792組，將其分為訓(xùn)練集634組，測(cè)試集79組，驗(yàn)證集79組。首先，利用634組訓(xùn)練集的數(shù)據(jù)，對(duì)神經(jīng)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練構(gòu)建好模型，利用測(cè)試集的數(shù)據(jù)，對(duì)模型的擬合度等進(jìn)行測(cè)試。

在本文中，筆者利用loss函數(shù)，以及模型的精度，對(duì)模型進(jìn)行檢驗(yàn)。所采取的loss函數(shù)是可以度量預(yù)測(cè)值與實(shí)際值之間的差異的二分類交叉熵公式：

筆者先分別在訓(xùn)練集、測(cè)試集中計(jì)算其loss函數(shù)。訓(xùn)練集中損失函數(shù)的值越大，說(shuō)明訓(xùn)練集中預(yù)測(cè)的差異與真實(shí)情況越大，驗(yàn)證集中的損失函數(shù)同理。

如圖1的上方圖所示，點(diǎn)集代表訓(xùn)練集的loss函數(shù)值，線條代表驗(yàn)證集的loss函數(shù)值。隨著迭代次數(shù)的增加，兩者都在逐步減小，可見(jiàn)迭代的次數(shù)增加，模型的預(yù)測(cè)效果會(huì)更好。當(dāng)訓(xùn)練集和測(cè)試集的loss函數(shù)值在迭代了20次時(shí)，兩者接近重合，可見(jiàn)其擬合的效果。最為重要的是，隨著迭代的次數(shù)增加到80次后時(shí)，訓(xùn)練集和驗(yàn)證集的loss函數(shù)值已經(jīng)無(wú)限的趨近于0，可見(jiàn)在兩者中，模型的預(yù)測(cè)值與真實(shí)值的差異逐步減少，甚至是消失。如圖1的下方圖所示，就算是迭代的次數(shù)不超過(guò)20，訓(xùn)練集所訓(xùn)練的模型的精度也高達(dá)0.6，而隨著迭代的次數(shù)逐步增加，在迭代次數(shù)達(dá)到40時(shí)，不管是訓(xùn)練集，還是驗(yàn)證集，產(chǎn)生的模型精度都高達(dá)0.9以上。筆者為了測(cè)試模型的精度，繪制訓(xùn)練集與測(cè)試集的精度圖。為了確保模型的準(zhǔn)確性，利用測(cè)試集對(duì)模型進(jìn)行了同樣的測(cè)試，結(jié)果如圖2所示。

如圖2所示，當(dāng)?shù)螖?shù)足夠時(shí)，測(cè)試集的loss函數(shù)足夠小，精度也同樣足夠高，所以可以說(shuō)本文所提到的模型通過(guò)了檢驗(yàn)。也可以根據(jù)測(cè)試集的數(shù)量，將數(shù)據(jù)分為10組，每組79份，每組都進(jìn)行精度的計(jì)算，得出精度分別為0.9744、0.9465、0.9487、0.8077、0.8846、0.8846、0.9872、0.9615、0.6538、0.6538，算出其平均值約為0.8703，在多次訓(xùn)練的模型精度的平均水平達(dá)到了0.8703，可見(jiàn)相比于logistic回歸模型，神經(jīng)網(wǎng)絡(luò)的模型預(yù)測(cè)的能力之強(qiáng)，結(jié)果之準(zhǔn)確。除已有的數(shù)據(jù)外，又收取了10份問(wèn)卷，將其數(shù)據(jù)處理之后，代入到已經(jīng)訓(xùn)練好的模型中，發(fā)現(xiàn)在迭代多次后，最多只會(huì)出現(xiàn)一次錯(cuò)誤，大多數(shù)情況甚至沒(méi)有出現(xiàn)預(yù)測(cè)錯(cuò)誤的情況。

5 結(jié)論

倘若對(duì)數(shù)據(jù)使用Logistic回歸模型，預(yù)測(cè)的正確率只有60%左右，神經(jīng)網(wǎng)絡(luò)的精度高達(dá)90%，其預(yù)測(cè)的效果有著極大差距。神經(jīng)網(wǎng)絡(luò)模型所訓(xùn)練出的模型，其精度較高，預(yù)測(cè)出錯(cuò)的概率在迭代次數(shù)較高時(shí)，非常低，利用神經(jīng)網(wǎng)絡(luò)構(gòu)建的模型，可以通過(guò)玩家的一些基本信息，平時(shí)游戲的時(shí)長(zhǎng)，還有其對(duì)于游戲內(nèi)一些消費(fèi)內(nèi)容的偏好性，很好地預(yù)測(cè)玩家是否存在消費(fèi)行為。玩家如果經(jīng)過(guò)神經(jīng)網(wǎng)絡(luò)的檢測(cè)之后，輸出的數(shù)據(jù)為1時(shí)，可以認(rèn)定玩家存在著長(zhǎng)期的、穩(wěn)定的手機(jī)游戲消費(fèi)行為，是未來(lái)游戲盈利的主要對(duì)象，可以針對(duì)其游戲偏好設(shè)置一些更新內(nèi)容，道具，促使消費(fèi);當(dāng)輸出結(jié)果為0時(shí)，玩家被認(rèn)定為平民玩家，消費(fèi)的潛在可能性較低，在策劃運(yùn)營(yíng)過(guò)程可以不用太過(guò)于迎合其心理需求。綜上而言，本文所得出的神經(jīng)網(wǎng)絡(luò)模型，可以有效且高精度地判斷學(xué)生是否為一個(gè)有著長(zhǎng)期穩(wěn)定消費(fèi)行為的群體，可以方便游戲開(kāi)發(fā)商針對(duì)這些長(zhǎng)期穩(wěn)定的消費(fèi)群體做出合理的游戲運(yùn)營(yíng)策略。

參考文獻(xiàn)：

[1]宋子健，陳家樂(lè)，趙家悅.手機(jī)游戲廣告對(duì)消費(fèi)者游戲意愿和消費(fèi)意愿的影響因素：基于Logistics回歸和SEM模型[J].現(xiàn)代經(jīng)濟(jì)信息，2019（13）：129-131.

[2]洪晶. 聚類和神經(jīng)網(wǎng)絡(luò)算法研究及其在電信業(yè)客戶消費(fèi)模式中的應(yīng)用[D].景德鎮(zhèn)：景德鎮(zhèn)陶瓷學(xué)院，2007.

[作者簡(jiǎn)介]朱文瑞，男，漢族，江西南昌人，研究生學(xué)歷，研究方向：數(shù)理統(tǒng)計(jì)。

中國(guó)市場(chǎng)2022年5期

中國(guó)市場(chǎng)的其它文章: 制造業(yè)企業(yè)財(cái)務(wù)管理信息化建設(shè)研究; 大數(shù)據(jù)時(shí)代下事業(yè)單位內(nèi)部控制的優(yōu)化與建議; 信息技術(shù)在人力資源管理中的應(yīng)用探究; 基于用戶行為的地方圖書(shū)館個(gè)性化信息服務(wù)研究; 多種支付模式下的醫(yī)院財(cái)務(wù)風(fēng)險(xiǎn)與對(duì)策探究; 物聯(lián)網(wǎng)技術(shù)在醫(yī)院后勤部門(mén)的應(yīng)用分析