江慶偉 劉鉦江
中電鴻信信息科技有限公司
為貫徹落實《中華人民共和國國民經濟和社會發展第十四個五年規劃和2035年遠景目標綱要》和國家“十四五”文化發展規劃,加快推進文化和旅游發展,建設社會主義文化強國,文化和旅游部于2021年4月印發了《“十四五”文化和旅游發展規劃》。規劃中明確提出,積極發展智慧旅游,加強旅游信息基礎設施建設,深化“互聯網+旅游”,加快推進以數字化、網絡化、智能化為特征的智慧旅游發展。加強智慧旅游相關標準建設,打造一批智慧旅游目的地,培育一批智慧旅游創新企業和示范項目。推進預約、錯峰、限量常態化,建設景區監測設施和大數據平臺。以提升便利度和改善服務體驗為導向,推動智慧旅游公共服務模式創新。培育云旅游、云直播,發展線上數字化體驗產品。鼓勵定制、體驗、智能、互動等消費新模式發展,打造沉浸式旅游體驗新場景。
2020年6月江蘇省文旅廳面向全省文旅系統下發《關于推進江蘇智慧文旅平臺建設工作的通知》,并召開《江蘇智慧文旅平臺省市部門聯動工作會議》,進一步明確了全省數據共享要求,以期在全省形成“省-市-區縣-企業”多級聯動的智慧文旅體系,實現資源共享、優勢互補、協同并進。
江蘇電信作為省內最大的數據服務商,擁有涵蓋個人價值、生活習慣、身份特質在內的54個數據種類10PB以上容量數據,全省部署200多個大數據計算節點,計算處理速度達分鐘級,可面向各行業輸出四大標準化產品及平臺架構能力。
本文將依托中電鴻信大數據處理能力,利用中國電信基站數據,從數據獲取、分析、展示等方面討論其在文旅行業中的應用。
數據來源于用戶234G網絡開機、關機、位置變化(基站切換)、周期性位置更新、通話、短信、手機上網行為的記錄;并在秒級傳送到后臺,后臺數據處理最短可在5分鐘內呈現數據。
數據源基于電信基站定位的位置更新數據,且24小時不間斷信令數據采集。基站定位只要用戶開機,即可進行數據采集,并且是實時不間斷的,對軌跡、行為的分析更加可靠,且不受終端本身制約。
數據源種類及傳輸方式、數據源字段如表1所示。

表1 數據來源信息
從底層獲取的數據較為詳細,為其上層的數據清洗、分析提供了基礎保障,以下僅對其中部分數據字段展開討論,A口位置更新數據如表2所示。

表2 A口位置更新數據
(1)樣本數與精確度分析
由于中國電信手機市場占有率在30%左右,其樣本的可用性,樣本的估計值的精確度是作為分析成果的基礎。一般認為,樣本量越大,其樣本的估算值精確度越高,但兩者的關系并不是一種線性關系,而是一條曲線關系,也就是說,樣本值與精確度并不是簡單的正比關系,當樣本量達到一定程度時,誤差雖然還會隨著樣本量的增加而減少,但其減少的幅度會越來越緩慢,當靠近尾部時,基本上就是一條水平線。因此,在實際抽樣過程中,抽樣的樣本量是總體的30%(電信的市場占有量),抽樣準確度達到99.9%。樣本量和精確度的關系:30%(電信市場占有量)與55%的樣本量(友商市場占有量),抽樣誤差無顯著差別。如圖1所示。

圖1 樣本量和精確度關系
(2)電信市場占比
電信用戶占比即為電信在各市級粒度的網間系統全網用戶占比。目前可整合的小粒度電信用戶占比包括全國各個省份及江蘇省的各地市。通過數學模型反推,可獲取全量用戶,并且精確值控制高于98%。
反推公式:

其中,N0為指定區域全量用戶;Mi為當前地市用戶量;θ為常駐及工作人員數量、停留時間過短、過路的用戶數量;pi為所在地市電信用戶占比,按月調整;Mj為本省除當前地市外的其他各地市用戶量;pj為其他各地市電信用戶量占比;Mk為其他省各地市用戶量;pk為其他省各地市電信用戶占比;φ為其他用戶(如未能匹配到地市的用戶);ω為調節因子。
(1)接待訪客分析
針對全域范圍內的訪客,進行訪客總量、訪客屬性、停留時長及過夜情況等進行分析,具體分析維度包括以下方面:
訪客總量與構成分析:展示訪客總量、省外訪客量、省內跨城市訪客量;
訪客量變化趨勢:展示近七天訪客總量數據;
訪客來源分析:展示訪客的省內城市、省外省份來源地分析;
訪客屬性分析:訪客年齡、性別占比分析;
省外訪客平均停留時長:展示省外各省份訪客平均停留時長;
省內跨城市訪客平均停留時長:展示省內跨城市訪客平均停留時長;
訪客過夜構成分析:展示過夜和非過夜訪客占比;
省外訪客過夜量排行:展示省外各省份訪客過夜量占比;
省內跨城市訪客過夜量排行:展示省內跨城市訪客過夜量占比;
過夜分布分析:展示過一夜、過兩夜、過三夜、過四夜及以上的訪客占比。

圖2 接待訪客分析
(2)居民出游分析
針對居民出游客流量、出游客流變化趨勢、出游客流屬性等進行分析,具體分析維度包括以下方面:
出游客流量分析:展示本市居民出游外省省份客流量,并進行排行;
停留時長排行:展示居民出游外省省份停留時長排行;
出游客流變化趨勢:按天展示居民出游客流變化趨勢;
出游客流屬性分析:展示居民出游客流屬性占比。
(3)專題分析(文旅產業資源分布)
實現景區景點、酒店、文博遺產、文化娛樂、藝術演出、文體休閑、服務支撐、文旅單位等產業資源通過一張圖進行綜合展示,全面監測文旅產業資源情況,摸清文化和旅游產業家底,具體包括:
產業資源分布:展示產業資源在全市的分布情況及數量統計;
產業資源包括:旅游資源、文博場館、服務支撐、數字文化、創意設計、文體休閑、文化娛樂;
支持點擊產業資源圖標,顯示相關產業名稱、地址等基礎信息;
展示景區景點和酒店好評率、差評率排名;
文體旅產業投資及運營分析:文旅產業項目投資金額、投資進展及運營成果分析。
本文從中國電信海量數據中的一個點出發,以基站數據為基礎,依托大數據能力,實現了數據在生產生活中的變現。中電鴻信作為中國電信集團的旅游行業信息化應用基地,利用中國電信內部大數據,包括中國電信基站數據、消費數據等,通過對數據的匯集、清洗、脫敏等方式,服務于政府行業,在疫情管控、文旅運營、商戶選址等方面提供專業化的服務,尤其文旅方面,結合了中電鴻信的專業開發能力,已經持續為江蘇省文旅廳、安徽省文旅廳、蘇州市文旅局、徐州市文旅局、南京鐘山風景區、張家港雙山-香山風景區等多個政府、景區提供專業化、數據化的智慧管理、智慧運營、智慧服務的信息化系統服務。中電鴻信將會在現有成果基礎上,繼續開展文旅行業精準營銷、精準宣傳等方面的研究,進一步提升通訊行業數據變現能力。