巫 芯 宇
西南大學 圖書館,重慶 400715
2016年,被稱為知識付費元年,自2016年以來,我國知識付費行業始終保持快速增長趨勢.艾媒新經濟產業研究中心報告顯示,2019年我國知識付費行業用戶規模達3.6億人,行業市場規模達278億元,估計2020年會突破392億元人民幣,其中18~30歲的人群占比超過50%[1].然而,知識付費行業在保持快速增長的同時,也出現了市場競爭加劇、產品同質化、產品價格不合理、廣告泛濫、缺乏知識產權保護等問題[2],這對知識付費行業的持續發展帶來了不利影響.此外,盡管我國知識付費行業規模持續增長,但其同比增速卻在下降.
目前,我國知識付費行業已進入到精細化運營時代,需要對用戶群體的差異化進行分類研究.大學生是使用知識付費產品的主要群體之一,但是目前針對該群體的研究主要集中在動機和影響因素等方面,而基于大學生群體知識付費產品使用行為的用戶細分研究還相對較少.因此,本文基于傳統的RFM模型,結合知識付費產品的特點,提出一種改進的FTRM模型,利用K-means聚類算法,將大學生群體聚類為睡眠型(或流失型)用戶、忠實型用戶、未付費轉化型用戶、沖動消費型用戶4類用戶群體,并針對每一類群體提出差異化的營銷建議.
本文以“(大學生 + 高校學生)*知識付費”作為檢索詞對知網數據庫進行主題精確檢索,共檢索到相關文獻66篇.通過對這66篇文獻的分析發現,目前對大學生知識付費產品使用行為的研究主要集中在大學生使用知識付費產品的現狀、付費意愿、影響因素以及知識付費產品的有用性、易用性等方面.有關國內大學生知識付費相關研究主題(前10)如下所示(圖1).

圖1 國內大學生知識付費相關研究主題(前10)
孫曉臻等[3]以青島大學為例,對大學生使用知識付費產品的動機、態度等進行了調研分析,提出了知識分享平臺應堅持內容為王的發展戰略和低收費、多受眾的營銷策略.何慧雪等[4]基于技術接受模型和期望確認理論,提出影響大學生持續使用知識付費產品意愿的8個因素.陳娟等[5]基于修正后的技術接受模型TAM2和感知價值接受模型,構建了知識付費產品使用偏好模型.劉詩卉等[6]以性別、年級、月均消費額(Average monthly consumption,簡稱A)等為自變量,以對知識付費的態度為因變量進行二元Logit回歸分析,認為經濟條件和內容質量是影響大學生知識付費的主要因素,發現大學生知識付費產品使用行為注重實用性和娛樂性等特點.劉瀾等[7]對大學生知識付費產品使用行為、付費需求和付費態度等進行了分析,并結合文化產業政策、數字出版市場、圖書館資源組織和閱讀服務等方面提出了數字付費閱讀使用對策.
此外,筆者以類似的方法對EI數據庫進行檢索,檢索到“online paid knowledge OR pay for knowledge”與“college student OR university student”關鍵詞組相關文獻149篇.通過對這些文獻進行分析發現,外文期刊中對大學生知識付費產品使用行為的研究并不多,且不少文獻是來自中國學者的研究,現有的研究也主要集中在知識付費意愿(Willingness to pay)、使用決策模式(Decision Making)、在線教育(E-Learning)等方面(圖2).盡管知識付費相關概念和模式起源于國外,但是由于知識產權保護等原因,知識付費產品在國外發展并不那么迅速[8].而且,外文期刊中還沒有比較明確的知識付費概念,相關研究成果較少,僅有少量國外媒體采用“online paid knowledge”來報道知識付費相關內容.
Xie Wei等[9]認為知識付費產品的功能價值、情感價值、社會價值均對購買意愿產生積極且顯著的正向影響.Moutaz Khouja等[10]指出不斷提升服務是影響付費成員支付意愿的重要因素.另外,雷兵等[11]在對國內外知識付費研究進展的文獻綜述中指出,國內外現有研究較多關注平臺商業模式及個人行為的影響因素,缺乏更深層次研究,且相關文獻關注點較為集中,使研究存在一定的同質性.
目前,國內外學術界對大學生知識付費主題的研究主要集中在知識付費動機及行為影響因素兩方面.但大學生群體因性別、專業、月均消費額等不同,在知識付費產品使用行為上存在差異.楊舒怡[12]認為,知識付費平臺應開展用戶研究,并深入挖掘用戶需求,而挖掘用戶需求不能單單以年齡、學歷、職業等標簽劃分用戶群,而要找出更具個性化的標簽來區分用戶.因此,本文根據大學生使用知識付費產品的行為差異,將大學生群體劃分為不同類別,并制定差異化的營銷策略,實現精準營銷,有助于進一步推動知識付費行業持續發展.以“(大學生 + 高校學生)*知識付費*(聚類 + 分類 + 細分)”作為檢索詞在知網數據庫中進行檢索,僅檢索到1篇相關論文,該論文對大學生知識付費行為進行了調研分析,并運用SWOT分析方法對知識付費市場需求提出了建議[13].盡管該文使用了K-means聚類算法,但文章聚類的對象是影響知識付費產品的變量,并非大學生用戶群體.

數據由愛思唯爾旗下的Engineering Village數據庫提供.圖2 國外大學生知識付費相關研究主題
綜上所述,通過對當前國內外學者關于大學生知識付費主題的研究現狀進行分析,筆者認為:目前學術界對大學生群體使用知識付費行為進行的用戶聚類、用戶細分等研究相對較少.目前,基于用戶分類的精準營銷、精細化運營已成為各類互聯網產品運營必須采取的措施.因此,本文基于傳統的RFM模型,結合知識付費產品的特點,提出了FTRM模型,并基于該模型利用K-means聚類算法[14],將大學生群體細分為不同類別,并針對不同用戶特點提出差異化的營銷建議,以提高知識付費產品的營銷效率,實現精準營銷.
RFM模型是衡量客戶價值和客戶創利能力的重要工具和手段,被廣泛應用于用戶價值衡量、用戶細分等領域中.在RFM模型中,R(Recency)表示最近一次消費時間到當前時間的時間間隔,R值越大表示用戶價值越低;F(Frequency)表示某段時間內消費的次數,F值越大表示用戶價值越高;M(Monetary)表示某段時間內消費的總金額,M值越大表示用戶價值越高[15].
傳統的RFM模型主要用于直銷產品,通過用戶付費行為對用戶價值進行衡量.然而,知識付費產品作為一種基于互聯網的軟件產品,區別于傳統的消費品,用戶日常活躍行為也是衡量用戶價值的重要指標,在App產品數據分析中,DAU(Daily Active Users,日活躍用戶數)、MAU(Monthly Active Users,月活躍用戶數)也是最重要的分析指標.因此,本文基于傳統的RFM模型,結合知識付費產品的特點,提出針對知識付費產品行為分析的FTRM模型.其中,F,T用于衡量用戶的日常活躍行為,R,M用于衡量用戶的付費購買行為.FTRM具體含義如下:
F(Frequency):使用頻率,表示用戶使用某App的月平均次數.
T(Time Length):使用時長,表示用戶每次使用某App的時間長度(min).
R(Recency):最近一次付費,表示用戶最近一次購買時間到當前時間的時間間隔.
M(Monetary):付費金額,表示用戶在某段時間內付費購買的總金額.
K-means聚類算法是一種經典的、最常用的無監督學習聚類算法.通過K-means算法,可以將數據按照距離分為不同的簇,簇內樣本相似度高,簇間樣本相似度低.其核心步驟如下:
S1:從數據集中選取K個數據對象作為初始聚類中心.
S2:逐一計算數據集中每個樣本到K個初始聚類中心的距離,并根據距離遠近,將每個樣本聚類到距離其最近的聚類中心,形成不同的簇.
S3:計算每個簇中樣本的均值,將均值作為新的聚類中心.
S4:重復S1~S3,通過不斷迭代,直至聚類中心不再變化.
S5:評估聚類效果.由于聚類數量K是人為確定的,不同K值下聚類的結果不同,一般常用的K值確定方法是計算不同K值下的簇內誤方差(SSE)和輪廓系數(Silhouette Coefficient),當K值位于SSE學習曲線變化的“肘部”位置或使得輪廓系數取最大值時,即為最佳K值.
通過FTRM模型對使用行為進行建模,再利用K-means算法對數據進行聚類,對用戶使用情況進行分析,挖掘不同用戶的使用特點.
用戶行為復雜多樣,主要受內在心理和外在環境因素的影響,其研究涉及范圍較廣,囊括了經濟學、傳播學、心理學、計算機技術等學科,課題研究綜合性較強.因此在知識付費用戶行為研究中,對其范圍進行界定也極為重要.董富強等[16]認為用戶行為是指用戶在使用資源時所呈現出的規律.楊善林等[17]對用戶行為進行了細致分類,將其分為消費行為、參與行為和創造行為3類.消費行為是指用戶對知識付費產品購買,參與行為則是用戶與內容生產者的交互,創造行為是指用戶獨立生產和創造一定的內容.目前學術界并未對知識付費行為有一個統一的界定,而是將其統稱為用戶對知識付費產品的購買使用.
基于此,筆者對知識付費產品行為做了一個簡單的歸納:對用戶購買和使用知識付費產品等行為進行搜集和分析,發掘出不同類型的用戶因自身的特點和需求在知識付費產品使用上的不同特點,從而為其打造專屬的營銷策略.本文的用戶僅限大學生群體,用戶使用行為包括付款、購買等消費行為、參與行為和創造行為.而活躍行為則是對使用行為狀態的描述,與潛水行為相對應,具體指用戶在使用知識付費產品時積極或消極的態度.用戶使用知識付費產品越頻繁,體驗感越好,購買欲望則越強.
并不是所有用戶在使用知識付費產品時都存在購買的意愿,因此商家在宣傳時往往會打出“打折”“促銷”等口號,并采用優惠拼團或7天試用等方式,降低用戶感知價值的風險.商家還會提供按篇購買、積分兌換、試讀部分章節等行為,通過較低的入場費促進用戶最終進行購買消費.用戶獲得了優質的知識內容或解決了實際問題后,商家還設置了包月行為、包年行為、普通用戶行為、vip行為等供用戶選擇,最大限度地提升用戶的使用體驗,以便吸引更多的用戶群體.用戶行為實際上是由商家提供的支撐行為決定的,不是獨立存在的,因此這些行為也將被轉換為用戶行為.
為了深入研究大學生使用知識付費產品的情況,本文設計了調研問卷,對大學生基本屬性、動機、認知及行為等方面進行調研,并利用問卷星平臺獲取調研數據(只針對大學生群體進行隨機發放).
基本屬性包括性別、學歷、專業類別、月均消費額等,其中專業類別按照教育部普通高校本科專業類別劃分標準設置;動機主要是使用知識付費產品的原因;認知包括對知識付費產品的認知程度,喜歡哪種類型的知識付費產品,喜歡哪種知識提供者,目前知識付費產品存在的問題等;行為主要包括日常活躍行為和付費購買行為,日常活躍行為包括最近一年內,月均使用頻率和每次使用的平均時長,付費行為包括最近一次付費時間和最近一年付費的總金額.
本次調研共獲得問卷5 219份,數據預處理時首先剔除完全不了解知識付費產品的問卷805份,最終獲得有效問卷4 414份.由于F,T,R,M這4個指標量綱不同,為了避免量綱不同帶來的偏差,在數據預處理時,對這4個指標進行了歸一化處理,歸一化公式如下:
(1)
式(1)中,Xi為各指標樣本集中每個樣本的值,Xmax和Xmin分別為各指標樣本集的最大值和最小值.
在動機層面,大學生使用知識付費產品的主要原因有獲取專業知識,獲取更有價值的信息以及滿足一定的社交需求等,也有少量原因是新鮮感、好奇心、從眾等心理因素(圖3).

圖3 大學生使用知識付費產品動機
在總體認知層面,知識付費產品在大學生群體中普及率達85%,平均熟悉程度為6.74分(總分10分).其中,41%的大學生用戶表示對知識付費產品熟悉程度達到8分及以上.而在不同類型知識付費產品的喜好上,大學生群體更傾向于知識平臺類,如喜馬拉雅、得到、蜻蜓FM、豆瓣時間等,以及付費文檔類,如百度文庫、豆丁文庫、道客巴巴等;而對于社區直播,如知乎Live、荔枝微課、千聊,以及社群類,如知識星球、小紅圈等使用相對較少.此外,對不同類型知識付費內容提供者的喜好上,大學生群體更傾向于專家學者和行業大咖(圖4).此外,針對目前知識付費產品存在的問題,63%的大學生用戶表示知識付費產品定價較高或存在不合理現象;60%的大學生用戶表示知識付費產品內容質量混雜,部分質量較低;也有部分大學生用戶表示知識付費產品廣告較多,降低了用戶體驗度.

圖4 大學生使用知識付費產品傾向與喜好
從動機與認知層面可以看出,知識付費產品在大學生群體中使用率相對較高;從動機和喜好看,知識付費平臺的內容質量、專業程度是其關注的核心.
一般而言,用戶屬性的差異會導致不同的使用行為.因此,本文進一步挖掘了大學生群體的基本屬性與知識付費產品使用行為之間的相關性,即探討性別、學歷、專業、月均消費額A與F,T,M之間的相關性.
1) 性別、學歷、專業與F,T,M的關系分析
由于性別、學歷、專業均為定性數據,而F,T,M均為定量數據,因此,本文使用方差分析方法,分析基本屬性的不同分類(如性別男、女)在特定使用行為指標(如F)下的差異,如表1所示.

表1 性別、學歷、專業與F,T,M的關系分析
表格中P值為某基本屬性的不同分類在特定使用行為指標下的差異,如F項的性別P值,表示性別基本屬性中,不同分類(男、女)在F上是否存在差異.如果p<0.05,則說明差異有統計學意義,即表現出一定的相關性.因此,由表1可知,性別、學歷、專業均對F,T差異無統計學意義,而對M均差異有統計學意義(p<0.05),也就是說,性別、學歷、專業與F,T之間沒有相關性,而與M之間存在一定相關性.進一步分析這種相關性可以發現,大學生群體中,男性知識付費金額比女性高3%,而博士、碩士、本科知識付費金額依次為3%,3%,10%.對不同專業大類,文學、歷史學、醫學等專業知識付費金額相對較高,而工學、理學、經濟學則相對較低(圖5).

圖5 不同專業大類知識付費金額(M值,歸一化后)
2) 月均消費額A與F,T,M的關系分析
月均消費額A與F,T,M均為定量數據,可使用相關性分析方法,分析這4個變量之間是否存在相關性.在進行相關性分析之前,首先對定量數據進行正態性檢驗,本文采用K-S檢驗,經檢驗,A,F,T,M差異有統計學意義(p<0.05),即均不具有正態性特質.
由于Pearson相關系數一般適用于正態數據分布,而以上數據指標均不具有正態性特質,因此,本文采用Spearman系數進行相關性分析.
經過計算,A與F,T,M之間的Spearman系數依次為0.049,0.057,0.073,說明A與F,T,M之間存在較弱的相關性(表2).

表2 A與F,T,M關系分析
通過以上研究發現,大學生用戶的基本屬性,如性別、學歷、專業均與付費金額等付費購買行為之間存在一定相關關系,與使用頻率、使用時長等日常活躍行為不存在顯著關系,而月均消費額與付費金額、使用頻率、使用時長等使用行為均不存在顯著相關關系.因此,知識付費平臺在進行營銷時,可針對特定人群進行差異化營銷.
K-means算法中,SSE和輪廓系數是評估K值最常用的指標.SSE即簇內誤方差平方和,即經過多次迭代后,數據集中每個樣本點到各簇質心的距離平方的總和,一般來說,SSE學習曲線的“肘部”K值最佳.SSE公式如公式(2)所示,其中,x(i)表示樣本點i,u(j)表示第j簇的質心:
(2)
輪廓系數結合內聚度和分離度2種因素,其取值為[-1,1],一般來說,輪廓系數的值越接近1,聚類越好.輪廓系數公式如公式(3)所示,其中,a(i)為樣本i到同簇樣本點的平均距離,b(i)為樣本點i到其他每個簇距離平均值的最小值[16]:
(3)
本文采用sklearn.cluster中的Kmeans類進行K-means聚類分析,并采用sklearn.metrics的silhouette score類計算輪廓系數.然后將K值從2~10逐次循環,并繪制不同K值下的學習曲線.由圖6可知,當K=4時,SSE達到“肘部”,且輪廓系數達到最大值,即表示在2種評價指標下,K取4時聚類效果最佳.

圖6 不同K值下的簇內誤方差(SSE)和輪廓系數
最后,基于FTRM模型和K-means算法對清洗后的數據進行聚類,得到4類數據,然后對每一類數據的F,T,R,M值分別計算均值和標準差,最終所得數據如表3所示,其中樣本數量和樣本比例以N和P′兩個指標代替.

表3 每一類數據的F,T,R,M值的均值、標準差及N,P′
通過對4類群體聚類結果的F,T,R,M值分析可以發現:
1) cluster_1,此分類群體的F,T,M值均較小,R值最大,說明該群體在知識付費產品的日常活躍行為和付費購買行為上都表現 “較差”,尚未真正養成使用知識付費產品的習慣或曾經使用知識付費產品,但基于一些原因已經流失,屬于睡眠型(或流失型)用戶,這類用戶占總體比例的19.44%.
2) cluster_2,此分類群體的F,T值均較大,M值次之,R值較小,說明該群體在知識付費產品的日常活躍行為和付費購買行為上都表現 “優異”,已經養成使用知識付費產品的習慣,屬于忠實型用戶,這類用戶占總體比例的13.82%.
3) cluster_3,此分類群體的F,T,R值均較大,M值很小,說明該群體在知識付費產品的日常活躍行為中表現“較優”,但付費購買行為表現“較差”,即經常使用知識付費產品,但尚未轉換成真正的付費用戶,屬于未付費轉化型用戶,這類用戶占總體比例的49.66%.
4) cluster_4,此分類群體的F,T,R值相對較小,M值最大,說明該群體在知識付費產品的日常活躍行為中表現“較差”,但付費購買行為表現“優異”,即經常付費購買知識付費產品,但并未真正有效使用,屬于沖動消費型用戶,這類用戶占總體比例的17.08%.
1) 睡眠型(或流失型)用戶.針對此類用戶,需要針對其睡眠或流失的原因進一步深入挖掘,然后制定針對性措施.如首先改善其日常活躍行為,再制定促銷措施,刺激其付費購買.
2) 忠實型用戶.針對此類用戶,可以按照其日常活躍行為、付費購買行為等進一步劃分忠實等級,并給予一定的獎勵,運用粉絲經濟、社群經濟的思維進行精細化運營.如B站在UP主達到一定粉絲數量后,會逐次開放一些特權,如頭像加標識、頒發實體勛章等,用以增強用戶的認同感;此外,還可以制定一些轉發、介紹獎勵政策,進一步刺激忠實用戶介紹新的用戶,如拼購、轉發有禮、拉新有禮等.
3) 未付費轉化型用戶.此類客戶是整個用戶群體中占比最大的,達到49.66%,企業應該重點針對此類用戶制定營銷策略,促進其轉化購買,如根據使用時長贈送積分,并采用積分+現金的組合方式優惠購買付費產品;利用Apiorio算法進行付費產品大數據挖掘,發現關聯知識,提高付費單價等.
4) 沖動消費型用戶.針對此類用戶,應該制定有效的活躍政策,提升其日常活躍行為,加強其學習的效果,增強其有用性體驗.否則長期購買但不使用,會使用戶產生產品無用、浪費錢等觀點,不利于品牌口碑傳播,因此需要特別注意.提升用戶日常活躍行為的方法有設置定期、連續打卡,并對打卡行為給予獎勵;一些付費內容設置學習時間期限,到期前定期提醒;日常簽到、學習時長積分,積分換禮等;此外,調研結果顯示,部分大學生群體使用知識付費產品的動機之一是滿足社交需求,因此,可以建立學習社區,社區選拔KOL,建立完善的社區管理機制,加強日常管理,增加用戶活躍度.
此外,大學生用戶的基本屬性,如性別、學歷、專業均與付費金額等付費購買行為之間存在一定相關關系,因此,知識付費平臺在進行營銷時,可針對特定人群進行差異化營銷.
本文首先對大學生使用知識付費產品的動機和認知進行了詳細的分析,通過分析發現,知識付費產品在大學生群體中使用比較普及,從喜好上看,大學生群體最關注的是知識付費平臺的內容質量和專業程度.另外通過分析發現,大學生用戶的基本屬性,如性別、學歷、專業與付費金額等付費購買行為之間存在相關關系,與使用頻率、使用時長等日常活躍行為之間不存在顯著關系,同時發現月均消費額與付費金額、使用頻率、使用時長等使用行為之間均不存在顯著相關關系.最后,運用本文提出的FTRM模型,再采用K-means聚類算法,將大學生群體聚類為睡眠型(或流失型)用戶、忠實性用戶、未付費轉化型用戶、沖動消費型用戶4類用戶群體,并針對不同用戶群體的特點提出差異化的營銷建議.
本文基于傳統的RFM模型,結合知識付費產品的特點,提出了一種改進的FTRM模型,但研究中并未對該模型的權重進行深入探討,因此,模型權重是下一步的研究方向之一.此外,針對睡眠型用戶或流失型用戶產生的具體原因進一步深入挖掘,也是下一步的研究方向之一.