徐 萍
【關鍵字】百度指數;網絡關注度;時空特征;螺螄粉
隨著網絡信息科技的高速發展,互聯網已經逐漸成為人們信息獲取的主要渠道。根據中國互聯網絡信息中心(China Internet Network Information Center,CNNIC)統計,截至2020年12月,我國網民規模達到9.89億,較2020年3月新增網民8540萬,互聯網普及率達70.4%,較2020年3月提升5.9個百分點,這為廣大網民利用網絡搜索獲得商品信息提供了方便快捷的途徑。
近些年,國內外學者基于網絡搜索引擎數據,大量應用到旅游與商品研究中。Onder通過谷歌趨勢數據以及圖像指數數據,對兩個國家和兩座城市的旅游需求進行比較研究。Clark等利用谷歌趨勢數據,建立美國國家公園的客流量模型,并與傳統的自回歸模型進行對比分析等。馬莉研究發現,近距離旅游流量與游客網絡關注度在時間和地理空間上存在很強的關聯性。Li等提出了一種基于百度指數的旅游客流量的預測模型,并驗證了該模型的有效性。
程慧等人基于百度指數,研究了雪峰山旅游景區網絡關注度的時空特征。丁鑫、杜夢珽等基于百度指數,研究了廈門市、重慶洪崖洞旅游目的地網絡關注度的時空特征與影響因素。魏衍增基于百度指數,對大眾汽車銷量建立機器學習模型,證明了搜索指數數據與汽車銷量存在相關性,與基于單一銷量數據的ARMA模型相比,加入百度指數的LSTM模型具有更好的預測能力。黃婭碰基于百度指數與電商評論數據,研究九芝堂營銷策略。
綜上所述,國內外學者利用搜索引擎數據進行大數據分析,對各地旅游需求以及商品銷售進行精確地預測分析。螺螄粉作為這幾年剛興起的網紅食品,怎樣擺脫網紅食品“短命”的命運?本文將基于百度搜索平臺,爬取以“螺螄粉”關鍵詞2015—2020年每日網絡關注度數據,通過對關注度數據的時空分布、搜索人群的年齡與性別分布分析,旨在挖掘潛在的客戶群體,豐富螺螄粉銷售數據分析研究。
百度作為國內最大的中文搜索引擎,百度指數是以百度海量網民行為數據為基礎的數據分享平臺。在這里,你可以研究關鍵詞搜索趨勢、洞察網民興趣和需求、監測輿情動向、定位受眾特征。因此,采用其中的數據研究,具有一定的普遍性和可信度,本文利用百度指數分析平臺,以“螺螄粉”作為關鍵詞,爬取2015—2020年34個省級行政區域每天關鍵詞搜索次數,采用地理空間分析及數理統計方法,從時間和空間兩個維度分別分析螺螄粉網絡關注特征與差異。
季節性集中指數:季節性集中指數(I),又稱季節性時間強度指數,可對商品網絡關注度的季節集中程度加以定量分析,計算公式為:

式(1)中, 表示每月網絡關注度占全年關注度總數的比重。指數值越大,表明網絡關注度的季節集中程度越高,季節性差異越大;相反,指數值越趨于0,表明關注度的季節集中程度越低,季節分布越均勻。本文將用其測算螺螄粉2015—2020年這6年網絡關注度的季節集中程度。
STL(Seasonal and Trend decomposition using Loess)是以魯棒局部加權回歸作為平滑方法的時間序列分解方法。對螺螄粉網絡關注度數據進行STL分解為趨勢項(trend component)、季節項(seasonal component)和余項(remainder component)。由于趨勢項和季節項的穩健性,STL分解不會被異常值所影響。本文將采用STL分解,以探討螺螄粉關注度的季節效應與趨勢效應。
通過爬取的每天關注度數據,計算各年、各月份關注度均值,并計算出增長率、標準差、變異系數、季節性集中指數等結果(表1)。

?
從表1可以看出,螺螄粉網絡關注度年度變化具有以下幾個特征:
(1)從搜索指數日均值和增長率可以看出,2015—2020年螺螄粉的網絡關注度整體上呈增長趨勢,在2018年有小幅的回落;其中2016年、2019年、2020年增長率超過30%,2020年增長率最高達到57.41%,在新冠肺炎疫情下,直播經濟快速發展,出現了大量吃播帶貨,其中不乏也有線上螺螄粉帶吃,這使得螺螄粉的關注度在疫情沖擊全球經濟的情況下不減反增。
(2)從標準差可以看出,2015—2018年螺螄粉的每日網絡關注度比較集中,2019—2020年其差異性陡然上升。
(3)從變異系數與月度集中指數上看,2016—2018年,變異系數及季節性集中指數比較小,說明螺螄粉網絡關注度年內分布比較分散。而2019年、2020年受短視頻、直播帶貨的影響,使得螺螄粉網絡關注度年內分布比較集中。
通過計算獲得螺螄粉2015—2020年各月份的平均網絡關注度,并繪制成折線圖(如圖1)。從圖1可以看出,螺螄粉網絡關注度月季變化具有以下特征:①2015—2020年,同月份的每日平均關注度呈逐年遞增的趨勢;其中2020年增長最為明顯,除1月外,其他月份增幅與往年同期相比都達到最大,說明螺螄粉的知名度正在逐步擴大。②2015—2019年的網絡關注度折線圖均呈現出雙峰的特征,其第一個峰值出現在每年的3月和4月,即這個時候為春節假期結束返崗時段以及學生的主要開學時間,開學季以及上班潮拉動了螺螄粉的消費需求;第二個峰值也是出現在秋季開學季的9月和10月,這也從側面反映出螺螄粉的消費人群大多為年輕人群。③除雙峰特征外,每年的關注最低點集中在每年的1月和2月,這個時段主要是歲末年初,大家都在忙碌,從而導致螺螄粉的關注度較低。

圖1 2015—2020年螺螄粉日平均網絡關注度月度變化圖
為了探討關注度數據的發展趨勢,采用STL時間序列分解方法對數據進行分解。圖2從上到下分別是2015—2020年螺螄粉網絡關注度數據的觀測項、趨勢項、季節項和余項。從圖2季節性變化圖可以看出,關注度確實存在一個春節前低谷,節后高峰的情況。從整體的趨勢變化可以看出,2015—2020螺螄粉網絡關注度在逐漸上升。具體來看,2015—2018年螺螄粉緩慢地進入人們的視野,平均每年增長21%;2018年后隨著小視頻以及美食主播行業的興起,關注度得到快速拉升,平均每年增長43%,即使2020年新冠肺炎疫情的暴發也沒有影響到人們對螺螄粉的關注,這體現了食品的強大韌性。

圖2 2015—2020螺螄粉STL時間序列分解圖
不同地方存在不同的飲食習慣,螺螄粉最受哪些地方的喜愛呢?通過百度指數搜索地域分析,獲取2015—2020年對“螺螄粉”關鍵詞搜索人群在全國各省份的關注度日平均值給出前10名(表2),由表2可以看出:①2015—2020年,各省級行政區對螺螄粉的網絡關注度呈上升趨勢,且在2018—2020年增長速率最大,說明小視頻、吃播等行業興起擴大了螺螄粉的知名度。②各個區域對螺螄粉關注度存在較大的差異,其中關注度最高的10個省份分別為廣東、北京、山東、浙江、廣西、江蘇、上海、河南、四川以及河北,主要集中在兩廣、長三角經濟發達省份以及北京和一些飲食喜辣的四川、河南、河北,統計6年來前10名省份網絡關注度的比重發現,其比重總和超過了51.57%,進一步說明了省份分布的差異較大,集中程度比較高。

表2 各省份網絡關注度日均值
不同的年齡段對不同食品的需求也不同,螺螄粉是一種比較油辣酸爽的食品,在一些中老年人眼中可能會被視為“垃圾視頻”,然而這種酸辣可口的感覺卻深受年輕人的喜愛。根據百度指數平臺2015—2020年“螺螄粉”關鍵詞搜索人群分布比例進行分析,得到搜索人群平均年齡與網民年齡分布對比圖(見圖3)。

圖3 螺螄粉網絡關注度年齡分布圖
圖3中紅色條形圖表示不同年齡段螺螄粉網絡關注度在總人群的占比,綠色為網民不同年齡段分布。從圖3可以知道,螺螄粉的關注人群主要集中在20~39歲人群中,占總人數的67%左右,說明青年人是螺螄粉網絡關注度的主要人群。對比網絡年齡分布來看,螺螄粉口感油辣鮮美受到許多30歲以下青年人的喜愛,而大于30歲的群體關注螺螄粉的人群比例較低。
根據百度指數平臺2015—2020年“螺螄粉”關鍵詞搜索人群性別數據進行分析,得到搜索人群性別占比圖(見圖4)。關鍵字搜索螺螄粉的性別,女性達到56.7%,高于男性。可能女性是家庭食材的購買者,導致螺螄粉網絡關注度中女性比例較大。

圖4 螺螄粉網絡關注度性別分布圖
本文基于百度指數,從不同層次分析了螺螄粉網絡關注度的時空分布特征,根據分布特征得到結論與建議如下:①螺螄粉網絡關注度年際變化正在快速提升,且各年整體變化趨勢具有較高的一致性,全年中網絡關注度最高一般在3月和4月,返校以及復工上班潮拉動了人們對螺螄粉的需求,關注度最低點一般在前一年的11月到后一年的2月。針對這種規律性強的現象,我們可以在關注度地點、時期加大產品研發,豐富不同年齡段、不同地域人群的口味,在春節過后大家返校、返崗期間,開展老客戶新品免費試吃等,通過老客戶的飲食習慣改進新品,提高品質。②地域分布上,螺螄粉網絡關注度人群存在明顯的地域差異,其主要分布在兩廣、長三角、北京、山東等經濟發達省份,以及一些飲食喜辣的四川、河南、河北省份,針對這些省份,我們可以加大螺螄粉在各地的宣傳,舉行免費試吃等活動,讓大家真實體會口感;對于東北、西北等關注度較低的省份,可以根據當地飲食習慣,研發適合當地人的螺螄粉口味。③螺螄粉網絡關注度女性高于男性,我們可以設置情侶套餐、閨蜜套餐等,挖掘已有客戶身邊的潛在客戶群體,或者通過購買獲取積分領取增值服務等。
本研究依然存在不足之處,百度指數解析的數據來源于網民百度搜索行為,數據廣度存在局限性。同時,螺螄粉的銷量數據不易統計,不能客觀地分析螺螄粉網絡關注度數據與真實銷量間的關系。