謝紅霞 陳創(chuàng)奇



摘? 要: 抖音作為近年來(lái)新型短視頻社交APP,因其代入感強(qiáng)、參與性高,正發(fā)展成為一種新的旅游營(yíng)銷(xiāo)傳播工具。隨著抖音日活用戶人數(shù)不斷地創(chuàng)出新高,平臺(tái)上的數(shù)據(jù)也迅速、大量地沉淀積累。篩選抖音上有關(guān)“西湖十景”的視頻和評(píng)論信息,通過(guò)數(shù)學(xué)建模創(chuàng)建景點(diǎn)的抖音熱度指數(shù),用百度指數(shù)模擬景點(diǎn)的實(shí)際客流量,研究抖音短視頻對(duì)提升景點(diǎn)客流量的影響力。數(shù)據(jù)分析結(jié)果顯示,各景點(diǎn)的表現(xiàn)不盡相同,希望以此為西湖旅游資源的開(kāi)發(fā)和管理提供依據(jù)。
關(guān)鍵詞: 數(shù)據(jù)分析; 抖音; 旅游; 西湖十景
Abstract: As a new short video social app in recent years, TikTok is developing into a new tourism marketing communication tool due to its strong sense of substitution and high participation. With the number of daily active user of TikTok constantly reaching a new high, the data on the platform also deposited and accumulated rapidly in large quantity. Sieving the video and comment information about "Ten sceneries of West Lake" on TikTok, creating the heat index of TikTok through the mathematical modeling, the actual tourist flow of the scenic spots is simulated with Baidu Index to study the influence of TikTok on the improvement to the tourist flow of the scenic spots. The results of data analysis show that the performance of each scenic spot is different, that is hoping to provide basis for the development and management of West Lake tourism resources.
Key words: data analysis; TikTok; tourism; Ten sceneries of West Lake
0 引言
近年來(lái)短視頻平臺(tái)如雨后春筍般興起,因短視頻短小精煉、傳播速度快、制作門(mén)檻低、社交屬性強(qiáng),成為時(shí)下最流行的社交方式[1]。游客在旅游過(guò)程中隨手拍攝的短視頻經(jīng)網(wǎng)絡(luò)傳播,為旅游景點(diǎn)形象的塑造帶來(lái)新興動(dòng)力。從國(guó)外的YouTube到國(guó)內(nèi)的抖音,短視頻正在發(fā)展成為一種旅游營(yíng)銷(xiāo)傳播工具[2]。
抖音平臺(tái)在競(jìng)爭(zhēng)中異軍突起,在年輕人中迅速傳播和流行,由此也在平臺(tái)上積累了大量原始數(shù)據(jù),利用大數(shù)據(jù)分析技術(shù)對(duì)平臺(tái)上的視頻及評(píng)論進(jìn)行分析,可以幫助旅游行業(yè)更好地服務(wù)于游客,也為旅游主管部門(mén)提供決策依據(jù)[3]。
1 研究?jī)?nèi)容
“西湖十景”是杭州旅游的金名片,通過(guò)數(shù)據(jù)挖掘及數(shù)據(jù)分析的手段研究抖音短視頻與“西湖十景”客流量的相關(guān)性,既從時(shí)間緯度上分析抖音短視頻的熱度與景點(diǎn)客流量的相關(guān)性,也從每個(gè)景點(diǎn)的抖音視頻下的用戶評(píng)論中進(jìn)行情感分析和高頻詞統(tǒng)計(jì),得出景點(diǎn)的游客認(rèn)知意象,并通過(guò)數(shù)據(jù)可視化方法,更好地理解數(shù)據(jù)對(duì)象。研究的內(nèi)容框架如圖1所示。
具體研究?jī)?nèi)容如下。
⑴ “西湖”關(guān)鍵詞下抖音短視頻的用戶群分析。包括:用戶的年齡分布,用戶的性別比率,視頻發(fā)布的時(shí)間分布和評(píng)論的時(shí)間分布。
⑵ 基于文本語(yǔ)義分析方法,從視頻的標(biāo)題信息中提取各景點(diǎn)的高頻詞,從而獲取“西湖十景”游客認(rèn)知意象。
⑶ 基于百度AI平臺(tái)的情感分析接口,要對(duì)“西湖十景”各個(gè)景點(diǎn)的評(píng)論分別進(jìn)行情感值計(jì)算和分類,得到正面評(píng)價(jià)和負(fù)面評(píng)價(jià)的關(guān)鍵詞。
⑷ 數(shù)學(xué)建模,創(chuàng)建抖音熱度指數(shù),根據(jù)每一條視頻的點(diǎn)贊數(shù)、評(píng)論數(shù)、分享數(shù)、轉(zhuǎn)發(fā)數(shù)得到該條視頻的抖音熱度指數(shù),進(jìn)而按景點(diǎn)分類匯總得到每個(gè)景點(diǎn)的抖音熱度指數(shù)。
⑸ 繪制抖音熱度指數(shù)隨時(shí)間變化的趨勢(shì)圖,與百度指數(shù)趨勢(shì)圖進(jìn)行對(duì)比,從而得出抖音熱度對(duì)一個(gè)景點(diǎn)的客流量的相關(guān)性。
2 研究成果
2.1 用戶群體分析
爬取抖音視頻評(píng)論,截止時(shí)間2019年3月底,對(duì)獲取到的用戶信息用“西湖”關(guān)鍵詞篩選,得到6649個(gè)評(píng)論用戶,分析這些目標(biāo)用戶群的分布,分別按性別和年齡分類,如圖2、圖3所示,數(shù)據(jù)顯示性別分布區(qū)別不大,年齡分布則以80、90后為主。
2.2 抖音視頻發(fā)布時(shí)間與評(píng)論發(fā)布時(shí)間分析
爬取1124條西湖視頻信息,數(shù)據(jù)顯示在三個(gè)國(guó)家法定節(jié)假日,國(guó)慶、元旦以及春節(jié)視頻數(shù)量明顯增多,說(shuō)明節(jié)假日為景區(qū)帶來(lái)了流量。
數(shù)據(jù)分析進(jìn)一步發(fā)現(xiàn),評(píng)論發(fā)布的時(shí)間集中在12~14點(diǎn)和19~24點(diǎn)之間。如圖4、圖5所示。
2.3 “西湖十景”游客認(rèn)知意象及情感分析
研究所爬取的1124條有關(guān)西湖的視頻,對(duì)視頻標(biāo)題做高頻詞統(tǒng)計(jì),結(jié)果顯示除了“西湖”、“杭州”、“喜歡”、“美景”這些詞外,“白娘子”、“許仙”、“濟(jì)公”等詞出現(xiàn)頻率也很高,顯示傳統(tǒng)文化或神化傳說(shuō)賦予景點(diǎn)人文藝術(shù)價(jià)值會(huì)使游客印象更深。
繼續(xù)爬取視頻下的評(píng)論,共28474條,用TF-IDF[4]文本分析算法提取“西湖十景”關(guān)鍵詞,并對(duì)這些關(guān)鍵詞用情感字典分析,得到積極和消極兩類關(guān)鍵詞,分別制作詞云[5]。挑選“湖濱晴雨”這個(gè)有代表性的景點(diǎn)進(jìn)行正負(fù)面情感詞云對(duì)照,如圖6、圖7所示。
“西湖十景”正面詞中出現(xiàn)的高頻詞有“風(fēng)景”、“美好”、“愜意”“偶遇”等描述景色的詞。在“平湖秋月”、“龍井問(wèn)茶”景點(diǎn)中出現(xiàn)了“媽媽”、“女兒”、“家人”這些高頻詞。在許多景點(diǎn)出現(xiàn)了高頻詞“去過(guò)”。
“西湖十景”中的負(fù)面詞“小心”、“掉下去”、“危險(xiǎn)”、“護(hù)欄”等出現(xiàn)頻率較高。“收費(fèi)”、“錢(qián)”、“貴”、“騙人”這些詞在“斷橋殘雪”、“蘇堤春曉”、“花港觀魚(yú)”、“龍井問(wèn)茶”這些景點(diǎn)中出現(xiàn)。“游客”、“人人”、“擠”出現(xiàn)在“斷橋殘雪”、“靈隱禪蹤”、“花港觀魚(yú)”這幾個(gè)景點(diǎn)。
這些高頻詞概括了相應(yīng)景點(diǎn)的特征和問(wèn)題所在,有明顯的區(qū)分度且和我們的認(rèn)知基本符合。
2.4 抖音熱度與景區(qū)流量的相關(guān)性分析
通過(guò)數(shù)學(xué)建模計(jì)算抖音熱度指數(shù)。對(duì)所爬取的1124條視頻,根據(jù)每條視頻的點(diǎn)贊數(shù)、評(píng)論數(shù)、分享數(shù)、轉(zhuǎn)發(fā)數(shù)這四個(gè)指標(biāo)衡量該條視頻的受歡迎程度。先對(duì)每個(gè)指標(biāo)作歸一化處理,再求算術(shù)平均得到該條視頻的抖音熱度指數(shù)。通過(guò)抖音熱度指數(shù)可以看出有一些視頻的熱度指數(shù)特別高,可以稱作爆款視頻。圖8顯示“西湖十景”各景點(diǎn)的抖音熱度按時(shí)間的分布圖,其中每個(gè)點(diǎn)代表一條視頻的熱度指數(shù)。
從圖8可看出:“斷橋殘雪”爆款視頻最多(第一排第四個(gè)),“平湖秋月”(第一排第五個(gè))、“花港觀魚(yú)”(第二排第一個(gè))爆款視頻次之。從時(shí)間緯度上看,爆款視頻大部分集中在國(guó)家法定節(jié)假日里。
有了每條視頻的抖音熱度指數(shù),再按景點(diǎn)分類匯總得到每個(gè)景點(diǎn)的抖音熱度指數(shù)。
圖9所示,“三潭映月”、“平湖秋月”、“斷橋殘雪”排名靠前,而“龍井問(wèn)茶”、“靈隱禪蹤”、“湖濱晴雨”這幾個(gè)景點(diǎn)的熱度指數(shù)相對(duì)較低。
由于沒(méi)有“西湖十景”的游客流量的官方數(shù)據(jù),考慮用百度指數(shù)近似代替景點(diǎn)流量。通過(guò)觀察百度指數(shù)的“西湖十景”圖可以發(fā)現(xiàn),除“斷橋殘雪”外,其他景點(diǎn)的百度指數(shù)保持一個(gè)平穩(wěn)的波動(dòng),從2018年3月開(kāi)始到10月為較高的階段,而“斷橋殘雪”景點(diǎn)在2018年1月到2月間百度指數(shù)達(dá)到了10000,原因就是2018年的杭州第一場(chǎng)大雪降臨,游客爭(zhēng)相欣賞“斷橋殘雪”景觀,斷橋上盡是狂歡的人群。如圖10、圖11所示。
對(duì)比、觀察圖12和圖13的抖音熱度曲線可以發(fā)現(xiàn),西湖十景的抖音熱度主要出現(xiàn)在2018年底到2019年初,這和百度指數(shù)始終保持一個(gè)平穩(wěn)的波動(dòng)性不太一致,顯示相關(guān)性比較弱。但是,“斷橋殘雪”在2018年1月到2月的抖音熱度曲線圖和百度指數(shù)圖高度重疊,顯示很強(qiáng)的相關(guān)性。究其原因:①用百度指數(shù)來(lái)模擬景點(diǎn)的客流量比較粗糙,需要用更精確的官方數(shù)據(jù)來(lái)印證。②抖音在杭州旅游方面的市場(chǎng)滲透率不夠,這從2018年與2019年的環(huán)比數(shù)據(jù)可看到。③杭州西湖作為知名旅游目的地,擁有穩(wěn)定的旅客流量,受互聯(lián)網(wǎng)沖擊的波動(dòng)不大。④本研究所用數(shù)據(jù)截止時(shí)間到2019年3月底,而抖音日活人數(shù)和視頻數(shù)量以每月甚至每周的頻率更新,因此后續(xù)研究考慮用更多的數(shù)據(jù)做分析,相信會(huì)有更好的效果。
3 結(jié)束語(yǔ)
目前短視頻正發(fā)展成為一種旅游營(yíng)銷(xiāo)傳播工具,通過(guò)短視頻社交平臺(tái)拉動(dòng)旅游已經(jīng)成為一種新的城市景點(diǎn)宣傳方式,西安和重慶這兩座城市在這方面已經(jīng)有了成功的嘗試[6]。本文通過(guò)大數(shù)據(jù)分析的方法進(jìn)行定量研究,希望從中挖掘抖音短視頻和景點(diǎn)客流量的相關(guān)性,鑒于數(shù)據(jù)量不夠多,時(shí)間跨度不夠長(zhǎng),分析結(jié)果還比較粗糙,但給出了一種新的研究方法和思路,建議杭州旅游管理部門(mén)重視抖音短視頻對(duì)城市文化旅游的影響,參考從抖音評(píng)論中所提煉的游客景點(diǎn)認(rèn)知意向,挖掘景區(qū)內(nèi)的特色與優(yōu)勢(shì),利用多種渠道吸引游客。
參考文獻(xiàn)(References):
[1] 千繼賢.抖音帶來(lái)的“旅游”[J].旅游縱覽(下半月),2018.8:17,19
[2] Reino D, Hay B. The use of YouTube as a tourismmarketing tool[J].Travel and Tourism Research Association,2016.
[3] 歐陽(yáng)效福.基于游客微博“大數(shù)據(jù)”分析的廈門(mén)旅游環(huán)境意象研究[D].廈門(mén)大學(xué),2016.
[4] [美]麥金尼.利用Python進(jìn)行數(shù)據(jù)分析[M].機(jī)械工業(yè)出版社,2014.
[5] 李湘東,高凡,丁叢.Lda模型下不同分詞方法對(duì)文本分類性能的影響研究[J].計(jì)算機(jī)應(yīng)用研究,2017.34(1):62-66
[6] 我是張小神:抖音APP競(jìng)品分析報(bào)告[EB/OL].https://www.jianshu.com/p/d7911958931f