屠陳晨,陳婉茹,潘意靜
(浙江工業大學,浙江 杭州 310000)
伴隨著我國社會經濟穩健發展、科技創新碩果頻結,人民對精神生活的訴求也極大提升。賽事作為人民生活的一部分,在提供賽事觀賞、放松的同時,也傳遞了積極向上生活態度。浙江“努力成為新時代全面展示中國特色社會主義制度優越性的重要窗口”的期待,契合浙江省“十四五”規劃和二〇三五年遠景目標“推動有效市場和有為政府更好結合,加快構建充滿活力的市場經濟體制機制”的要求,借助網絡提取民眾對亞運會的情感傾向和改進建議,對杭州城市的發展具有重要意義。
目前,國內外學者對賽事推廣的研究興趣主要在情感傾向、IP開發、城市品牌等方面,葛霓琳等[1]使用樸素貝葉斯分類和支持向量機對評論情感進行分析,結果表明支持向量機的分類效果較樸素貝葉斯更好;王煜涵等[2]針對Twitter文本建立基于卷積神經網絡的情感分類模型,分類效果對比傳統分類方法有顯著提升;HOCHREITER[3]提出循環神經網絡(recurrent neural network,RNN)模型,通過獲取句子之間的長期依賴關系,了解語義信息,從而分析文本情感。朱建明[4]認為發展我國自主賽事 IP 是一條經市場驗證的正確道路,他通過解構現有體育賽事IP模型,提出提升IP商業價值積累的理想模型;朱洪軍[5]認為在賽事推廣階段可以通過以賽事宣傳為主,以城市宣傳為輔,實現體育賽事與城市的完美結合,并通過各類賽事巡展活動擴大城市品牌認知度。國內學者主要對整體賽事推廣研究較多,但對于大眾的具體情感分析的賽事推廣策略研究較少,故本文基于BERT模型對杭州亞運會的相關微博正文和評論,建立網絡文本法進行詞頻分析和情感分析,為杭州亞運會推廣和體育賽事未來發展方向提供一些建議。此外,杭州市亞運會推廣的探索還將為體育強國、文化強國建設提供地方經驗。
杭州市體育產業初具規模,賽事類型也呈現多元化發展的面貌。經過 33 年培養,有“杭馬”這樣的國內知名賽事;有國內唯一內河沖浪——錢塘江沖浪,具有不可復制性,并已舉辦十年;有以常春藤聯盟等高校為主的“紳士運動”西湖賽艇。可以說,杭州已經擁有了一批格調較高的知名賽事,也有一批口碑較好的群眾賽事,如杭州國際櫻花徒步節、杭州城市定向賽、全國百城千村健身氣功交流展示系列活動(杭州站)、市第十三屆橋牌聯賽、市第十屆羽毛球俱樂部聯賽、市斯諾克排名賽、西湖馬術節暨馬術邀請賽等。新興品牌項目如馬拉松、內河沖浪、城市毅行賽事項目經過多年深耕運作從小眾圈層走向大眾市場,馬拉松、毅行等大型賽事參與人次超10 萬人次,話題度、關注度、參賽熱情激增。杭州正力爭建設成為“世界賽事之城、運動友好城市、活力休閑之都”。
2018年世界游泳錦標賽和即將到來的2022年亞運會等大型賽事的舉辦,在場館建設、賽事組織、市場開發等方面為杭州市體育產業發展帶來新機遇。此外,在推進體育事業和體育產業發展的過程中,杭州市體育產業積極探索“體育+互聯網”的模式,在公共體育場館查詢、導航、體育賽事報名抽簽等事項夸大現代信息技術手段的應用,社會民營體育健身企業也主動運用大數據、互聯網等現代信息技術,通過數據賦能,提高傳統體育健身行業的經營效率。
網絡文本包括互聯網用戶以互聯網為媒介生產和發布的各類文本、音頻、視頻等內容。本文中網絡文本具體指在互聯網交流平臺中的正文、評論以及形成雙向交流的文本。本文采用網絡文本分析法,通過量化網絡文本特征詞,系統性描述互聯網信息內容,并對內容進行情感類分析,推斷文本提供者的特定立場、觀點、價值等。通過運用深度學習算法對獲取的網絡文本數據進行高頻詞分析和情感分析,實現文本分析的目的。
BERT是Google的Devlin· J等人基于Transformer模型對海量語料進行訓練,改進提出的一種自然語言處理(natural language processing,NLP)領域的預訓練模型。其采用雙向Transformer中的Encoder模塊對模型進行搭建,對上下信息進行提取,舍棄了傳統的NLP領域的本文處理方法,通過該層對輸入的文本信息首先進行特征提取,一定程度上有效地解決了模型并行處理限制以及文本的長期依賴問題。
BERT模型的核心構建整體與Transformer模型一致,通過獲取包含上下語義信息的詞向量,將詞與詞之間的聯系顯性表示出來,再結合句子的上下文信息進一步分析句子的語義信息,對其進行深度學習,去除距離的限制,并且達到并行處理的目的,其網絡結構如圖1所示。
圖1 BERT模型結構圖
本文運用python爬蟲技術獲取新浪微博等主流交流互動網站上有關“杭州亞運會”和“杭州亞運會賽事”的正文及評論信息,并對數據進行錯別字糾正、補齊、合并相同評論等預處理,最終共獲得有關“杭州亞運會”485條正文,“杭州亞運會體育賽事”351條正文及共計1155 條網絡評論數據。將預處理好的網絡文本數據存儲在.pyc文件中,運用BERT(bidirectional encoder representations from transformers)預訓練語言模型進行文本情感分析。
調用jieba對收集、整理的文本分詞優化后進行詞頻分析,結合停用詞表、情感分析定義詞表排除部分無意義詞匯后,從文本中共提取出115個關于杭州市亞運會形象感知的高頻詞匯(表1-高頻詞匯)。并將這些高頻詞以詞云圖的形式可視化展示(圖2)。在詞云圖中,詞頻越高的詞語會以較大的形式呈現出來,詞頻越低的詞語會以較小的形式呈現出來。
表1 高頻詞匯
跑 203 平臺 84 標準 57 杭州市 47建設 198 抽簽 84 獎金 57 推進 47城區 189 參加 84 東站 56 開工 47完成 181 關注 82 首批 55 選手 46地鐵 165 5G 82 奔跑 55 迎來 46電子競技 163 文化 78 品牌 55 質量 46城市 132 打造 77 評審 54 組委 46交通 132 信息 76 愛 54 現金 46空氣 131 文明禮儀 75 春節 54 工人 46設計 127 健身 75 參賽 54 主題 46提升 126 服務 72 萬 54 集團 45浙江 121 施工 72 過年 53發布 121 漩渦 71 道路 52啟動 114 擁有 71 試點 52理念 106 元宵 70 新聞 52發展 102 專業 70 創新 51
圖2 詞云可視化
詞云圖中一目了然,網絡媒介平臺中對于“亞運會”“杭州馬拉松”“電競”等項目討論度居高不下,“場館”“地鐵”“交通”等設施建設關注度較高,“房價”“地段”“空氣”等賽后預期討論水漲船高,“5G”“短視頻”等新技術手段、新傳播形態也廣為熱議,也不乏對“上海”“北京”等辦賽名城的討論。總體來看,市民對亞運后城市配套及服務提升、資產增值懷有期待。
基于前文所述的BERT預訓練模型,對爬取的1155條評論信息進行情感分析。將80%的數據作為訓練集,最初將最大長度設置為512,learning rate設置為1e-6,epochs設置為5,batch_size設置為16,此外,為了防止過擬合,增加模型的魯棒性,將dropout設置為0.2,使用標準BERT模型訓練,對預訓練模型做微調,最終獲得本文需要的情感分類模型,部分數據打分結果如表3所示。
表3-數據打分結果
亞運會后會放緩 0.35865266沒想到是杭州的,加油加油亞運會 0.4121791
網友討論杭州亞運會時屢屢提到的“上海”“北京”,它們的共性在于成功地將公眾對賽事的良好形象轉移到了舉辦城市的形象上[6]。可以說它們是賽城融合的范例,持續帶動了觀光旅游、消費購物、商務投資,創造了數額可觀的財富。杭州亞運會推廣也應注重“賽城融合”,可以從特色、趣味辦賽入手,開展配套群眾性賽事活動;同時注意提煉城市精神融入賽事宣傳,形塑城市理念特色,引導群眾持續關注亞運會;此外,注意結合杭州柔性美、詩情山水、三個遺產的城市特點,探索“文旅+”“健康+”服務新模式,細致分析運動員、觀光人員的駐地、參賽及旅游流線,使推廣更具有個性與針對性,塑造城市文化特色讓參賽、觀賽者留下獨特的“杭州記憶”。
“5G”“直播”“電競”等新名詞反復出現,可見網友對新技術手段、觀看形式、賽事內容的期待。作為數字經濟名城,杭州亞運會推廣應充分運用“數字體育”“城市大腦”等智慧服務,借助情感分析,推廣推送網友感興趣的內容,盡量及時準確地調整網友反饋不佳的內容;抓住馬拉松、抓住電子競技、霹靂舞入選本次杭州亞運會正式項目的機遇,打造趣味話題;積極探索線上觀看互動評論新方法,借數字經濟賦能賽事運作,運用VR、AR、3D等技術實現智能媒介多元融合推廣,提升觀賽體驗,擴大賽事傳播。
本文采用文本分析和情感分析方法,首先通過對亞運會相關高頻詞匯進行分析,觀察到網友對城市基建、亞運項目、新技術手段等話題討論熱烈。其次通過BERT深度學習算法對文本評論進行情感分析,了解網民對杭州亞運會的形象感知與情感基調,最終根據上述兩部分的分析提出杭州亞運會推廣策略:應結合城市形象與亞運特點,走賽城融合,技術賦能道路,將杭州打造成“賽事之城”,宜居之城。