張子衿
摘 ? 要:2014年5月起,百度推出了外賣平臺,現平臺注冊用戶量已經達到了3 000萬人以上,至今積累了大量的數據。然而這些數據具備很高的實際應用價值。為此,該文隨機抽取了百度外賣平臺上五家外賣餐館的數據,分別從商家訂餐量、訂餐用戶、用戶評價和訂餐時間4個維度進行了數據分析,從而找出百度外賣平臺數據的價值,引發大家對數據使用的思考與關注。
關鍵詞:百度外賣;數據價值;文本分析
中圖分類號:TP399 ? ? ? ? ? ? ? ? ? 文獻標志碼:A
0 引言
2014年5月百度推出了外賣平臺,現平臺注冊用戶量已經達到了3 000多萬人,在白領外賣市場實現份額第一,且平臺上積累了大量的數據。如何合理使用這些數據,是外賣平臺、平臺商家以及外賣用戶值得思考的問題。為此,該文隨機抽取了百度外賣平臺上5家餐館數據,并進行了分析。
1 研究思路及方法
1.1 研究思路
研究按如下思路展開:1)數據采集;2)數據分析,分別從商家訂餐量、訂餐用戶、用戶評價、訂餐時間4個維進行分析;3)數據價值,通過分析結果找到數據價值。
1.2 研究方法
研究主要使用了數據統計分析方法,在用戶評價的文本分析中,使用了社會網絡分析軟件ROST CM 6對數據進行分析,并對用戶評價的文本信息進行自動分詞、高頻詞統計、云圖生成、共詞社會網絡及語義分析。
1.3 數據采集
利用國內網絡爬蟲制作工具——八爪魚軟件獲取數據。從百度外賣平臺上,隨機抽取上海中山公園商圈的5個外賣商家的數據,商家在百度外賣的ID分別為:1645228165、1557526832、15280021074、1439935781、1835243683。
2 數據分析
2.1 商家訂餐量
數據一顯示了2017年5家商家所有訂餐量。由全年數據可以看出,ID號為1439935781的商家經營情況最好。平均年訂餐量為2 160份。按平均每份20元計,一年該商家的外賣營業額在43 200元。如果按行業平均利潤20%計量,平均每家外賣利潤僅為8 640元。由此可見,雖然百度外賣平臺有較大的影響力,但外賣餐館如果僅依托一個百度外賣平臺的銷量,是難以生存的。
數據一。
2017年五家外賣餐館的訂餐量(共計10 841)。
商家ID號:1835243683;訂餐數量:613商家ID號:1645228165;訂餐數量:2438。
商家ID號:1557526832;訂餐數量:2932商家ID號:1557526832;訂餐數量:2932。
商家ID號:1528021074;訂餐數量:1090商家ID號:1439935781;訂餐數量:3768。
2.2 訂餐用戶分析
百度外賣平臺上95%以上的用戶是以手機號作為用戶名注冊的。訂餐用戶的分析得出以下2個結論。
2.2.1 發現外賣餐館的核心用戶
如數據二所示,可以看到用戶尾號831、814、013、557、521為餐飲1439935781最忠誠的客戶,了解這點,便于餐館維護核心客戶,并從核心客戶進行調研及分析,研發更適合客戶需要的菜品及服務。
2.2.2 進行商圈競爭對手的分析
如某用戶在某個時間段內在A餐館訂餐了18次,而在B餐館中訂餐16次,且餐館A與B的用戶重疊度較高,說明A、B餐館具有較大的競爭關系,可以幫助商家了解競爭對手,提升自己的競爭力。
數據二。
訂餐用戶一年訂餐次數。
用戶ID:1391****831/訂餐63次/訂餐餐館ID:1439935781
用戶ID:1391****210/訂餐48次/訂餐餐館ID:1645228165
用戶ID:1391****814/訂餐36次/訂餐餐館ID:1439935781
用戶ID:1391****013/訂餐33次/訂餐餐館ID:1439935781
用戶ID:1861****557/訂餐26次/訂餐餐館ID:1439935781
用戶ID:1381****631 /訂餐25次/訂餐餐館ID:1645228165(1次),1439935781(24次)
用戶ID:1381****521 /訂餐24次/訂餐餐館ID:1439935781
用戶ID:1560****050 /訂餐21次/訂餐餐館ID:1557526832
2.3 用戶評價文本分析
通過分詞發現高頻詞,是文本分析最重要也是基礎的研究。該部分利用ROST CM6軟件,對5家外賣餐館的點評數據進行分詞,得到用戶評價的高頻詞(如數據三所示),從排序表可以看出,與配送相關的詞:配送、服務、保存等都是高頻詞,對于外賣來說,外賣的及時到達是消費者特別關心的問題;其次是食品本身的質量,如味道、好吃等。
數據三。
用戶評價高頻詞。
配送快:336次;服務態度好:311次;保存完好:261次;味道贊:172次;風雨無阻:154次;分量足:128次;味道:122次;很好:117;包裝精美:105次;好吃:100;價格實惠:85次。
通過共詞進行語義分析可以進行文本信息的進一步挖掘,共詞是對每一條點評信息進行分詞后,發現同一條點評信息共同出現的詞,如這家炸雞太難吃,分詞后分出來的結果是炸雞、難吃。通過ROST CM6的社會網絡及語義分析模塊,可分析出炸雞難吃的語義,同時,將炸雞與難吃建立一條連線,連線的粗細表示共詞次數的多寡。對樣本數據中的點評信息進行社會網絡及語義分析。通過分析可以得出,“味道”與“很好”,“外賣”與“小哥”,“態度”與“很好”線條比較粗,說明用戶點評中,評價認為味道很好、態度很好,對外賣小哥的評價比較多。
2.4 訂餐時間分析
百度外賣中顯示了從用戶下單時間、用戶收到外賣的時間以及兩者相減所用的訂餐時間。但是系統顯示的時間信息有錯誤,在該研究樣本數據中顯示,最高的訂餐時出不一致的信息,如顯示訂餐時間是308分鐘的用戶在抱怨:三刻鐘才送到,說明系統顯示的部分訂餐時間并不準確。而用戶收到外賣的時間與用戶下單時間相關得到的數據,有時與系統顯示的訂餐時間也不一致。
3 百度外賣數據價值
通過以上分析可以看到,百度外賣的數據具有極高的應用價值,對于外賣平臺來說,數據能幫助其了解平臺上外賣餐館運營及服務的情況及變化。對于外賣平臺上的商家來說,能了解用戶反饋和需求以及競爭對手的情況;對于普通訂餐用戶來說,能了解商家的排名、推薦菜品、性價比、和配送情況。但目前大多數餐館還沒有真正認識到數據的價值并利用起來。不過相信隨著人們利用大數據的意識以及能力的提高,該數據的價值將會得到更為充分的重視和應用。
參考文獻
[1]蔡溢,楊洋,殷紅梅.基于ROST文本挖掘軟件的貴陽市城市旅游品牌受眾感知研究[J].重慶師范大學學報(自然科學版),2015(1):126-134.
[2]馬向陽,魏文文,白寅.老品牌餐廳感知真實性的線索類型及其作用機理[J].華東經濟管理,2017(8):176-184.