李海龍 曹梅 文鳳潔
(作者單位:李海龍、文鳳潔,深圳市氣象服務(wù)中心;曹梅,廣東省氣象公共服務(wù)中心)
通過對深圳天氣微信公眾號和深圳天氣手機(jī)客戶端2017年9月—2018年9月期間的活躍用戶進(jìn)行用戶行為數(shù)據(jù)進(jìn)行分析,再結(jié)合移動端日常運(yùn)行所需的氣象數(shù)據(jù),建立基于用戶行為數(shù)據(jù)和氣象數(shù)據(jù)相結(jié)合的智能氣象服務(wù)模型,為氣象服務(wù)從傳統(tǒng)的被動獲取向個性化、智能化、主動推送式的大城市精細(xì)化氣象服務(wù)轉(zhuǎn)變提供借鑒。
移動互聯(lián)網(wǎng)目前已經(jīng)成為了公眾獲取天氣信息的主要渠道,利用移動互聯(lián)網(wǎng)的便利性展開個性化的氣象信息服務(wù)將有助于推進(jìn)整個社會的科技創(chuàng)新能力及數(shù)字城市的建設(shè)。
近年來,深圳市氣象局的公眾氣象服務(wù)也已將重心放在深圳天氣微信公眾號和深圳天氣客戶端等移動互聯(lián)網(wǎng)公眾服務(wù)渠道產(chǎn)品。深圳天氣微信公眾號、深圳天氣手機(jī)客戶端是深圳市氣象局在“移動互聯(lián)網(wǎng)+氣象服務(wù)”形勢下的新型氣象服務(wù)模式。本文選用深圳天氣微信公眾號和深圳天氣手機(jī)客戶端2017年9月—2018年9月后臺記錄的用戶行為數(shù)據(jù)信息,通過對其進(jìn)行數(shù)據(jù)分析,得出以公眾需求角度的智能氣象服務(wù)模型,以期為大城市精細(xì)化氣象服務(wù)提供借鑒。
近年來許多氣象部門通過移動軟件來傳遞天氣信息,進(jìn)而改善傳統(tǒng)的公共氣象服務(wù)的傳播方式,充分彌補(bǔ)傳統(tǒng)的氣象預(yù)報信息媒介如廣播電視以及報紙等方式的不足。雖然行業(yè)和公眾獲取氣象服務(wù)的渠道日趨多樣化,但是目前絕大多數(shù)氣象服務(wù)模式仍然是“氣象服務(wù)=天氣預(yù)報+簡單提示”的傳統(tǒng)模式,能夠體現(xiàn)差異化、精細(xì)化的服務(wù)產(chǎn)品少之又少。從2018年5月中國互聯(lián)網(wǎng)信息中心(CNNIC)發(fā)布的《中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計報告》顯示,截至2017年12月我國網(wǎng)民使用手機(jī)上網(wǎng)的比例達(dá)97.5%,較2016年底提升了2.4%,移動互聯(lián)網(wǎng)渠道已經(jīng)成為用戶的主陣地。
在移動互聯(lián)網(wǎng)氣象渠道服務(wù)產(chǎn)品方面,深圳天氣微信公眾號和深圳天氣客戶端在用戶數(shù)量方面始終處于行業(yè)領(lǐng)先地位。自2011年陸續(xù)上線截至2018年10月,深圳天氣微信公眾號粉絲總數(shù)已達(dá)98萬,點(diǎn)擊總數(shù)114.5億;深圳天氣客戶端累積下載量達(dá)1900萬次。在功能方面,深圳天氣微信公眾號和深圳天氣客戶端立足于移動互聯(lián)網(wǎng)的公眾氣象服務(wù)產(chǎn)品,通過GPS定位功能實現(xiàn)顯示用戶所在位置最臨近自動站的實況和臨近預(yù)報,提供以用戶為中心精細(xì)到街道級別的氣象服務(wù)產(chǎn)品。深圳天氣微信公眾號和深圳天氣客戶端(以下簡稱移動端)不僅在深圳市獲得較高公眾的認(rèn)可,也在深圳市氣象局連續(xù)5年獲得廣東省氣象服務(wù)公眾評價第一名,所以選取上述移動端的用戶作為研究對象無論從數(shù)據(jù)上還是從效果上均具有移動互聯(lián)網(wǎng)氣象服務(wù)的代表意義。
目前國外對于大數(shù)據(jù)的主要研究方向是將其作為一種具有更高的處理速度和更優(yōu)處理能力的信息資產(chǎn),它是在密集型數(shù)據(jù)的情況下,對數(shù)據(jù)進(jìn)行更進(jìn)一步的探索和思考的一種新模式。大數(shù)據(jù)分析的核心在于通過一種更加有效的方式來管理龐大的數(shù)據(jù)庫并且從海量數(shù)據(jù)中汲取所需要的價值,它是伴隨著數(shù)據(jù)科學(xué)的發(fā)展而產(chǎn)生的一種最為先進(jìn)的分析思維和方法。目前國外的研究較為重視個性化細(xì)小區(qū)域的數(shù)據(jù)分析,并通過數(shù)據(jù)分析掌握用戶需求達(dá)到提供以用戶為中心的信息服務(wù);而國內(nèi)對于氣象大數(shù)據(jù)的分析絕大部分指的是觀測數(shù)據(jù)的探究,但目前可參考和借鑒的用于氣象服務(wù)的案例相對較少。盡管目前國內(nèi)外對于大數(shù)據(jù)分析有眾多的分析成果,但是在實際應(yīng)用于氣象服務(wù)或基于用戶使用習(xí)慣的氣象服務(wù)更少。氣象行業(yè)本身具有大量的大數(shù)據(jù)資源,目前隨著氣象數(shù)據(jù)量不斷翻番,每年的氣象數(shù)據(jù)已接近PB量級。通過結(jié)合氣象數(shù)據(jù)和用戶行為數(shù)據(jù)進(jìn)行氣象服務(wù)將成為一種新的服務(wù)模式。氣象數(shù)據(jù)主要可分為兩大類:一類是實況數(shù)據(jù),即利用各種觀測手段觀測到的“過去的數(shù)據(jù)”;另一類為模式數(shù)據(jù),利用觀測到的數(shù)據(jù)通過模式計算得到的“未來的數(shù)據(jù)”用于預(yù)測未來天氣。如何有效地將氣象數(shù)據(jù)與用戶行為數(shù)據(jù)相結(jié)合,產(chǎn)生基于用戶行為的氣象數(shù)據(jù)將會為氣象服務(wù)提供一個新的方式。
本項研究通過對2017年9月—2018年9月期間同一天內(nèi)3次或以上訪問移動端且位置在深圳的用戶作為研究樣本主體,共篩選出1072582人次,并定義該樣本主體為移動端過去一年的活躍用戶。通過在移動端后臺各功能模塊插入監(jiān)聽軟件,即設(shè)置“埋點(diǎn)”和借助手機(jī)GPS獲取定位信息來記錄活躍用戶的日活躍時段、點(diǎn)擊習(xí)慣以及所在位置的數(shù)據(jù)形成用戶標(biāo)簽系統(tǒng),建立相應(yīng)的用戶行為數(shù)據(jù)庫,形成精細(xì)化氣象服務(wù)模型。本項研究搜集的用戶數(shù)據(jù)主要基于用戶位置的點(diǎn)擊次數(shù),不涉及用戶敏感信息,如:身份證號、銀行卡號、家庭住址等。研究過程中及研究結(jié)束后未有任何用戶位置信息泄露,不會對用戶隱私以及安全造成影響。
用戶活躍時間段的獲取即通過監(jiān)測同一用戶一天內(nèi)3次或以上訪問移動端的時間段。經(jīng)過統(tǒng)計2017年9月—2018年9月1072582名活躍用戶每天集中訪問時間得出用戶活躍時段分布(圖1),可以看出大多數(shù)活躍用戶獲取氣象信息的時段主要集中在07—08時、12—13時、16—17時、21—22時。現(xiàn)針對不同ID的用戶基于不同活躍時間段記錄為該用戶的活躍時段標(biāo)簽。

圖1 活躍用戶時間段分布
通過在移動端各功能模塊插入監(jiān)聽軟件,即設(shè)置“埋點(diǎn)”來記錄1072582名活躍用戶在一天內(nèi)的點(diǎn)擊習(xí)慣,并針對不同功能模塊用戶的點(diǎn)擊習(xí)慣獲取活躍用戶的日點(diǎn)擊習(xí)慣大數(shù)據(jù)(圖2),可以看出,活躍用戶全天點(diǎn)擊習(xí)慣排名前三的功能模塊是“天氣提示”“交通服務(wù)”“天氣實況”,說明用戶通過移動端獲取“天氣實況”和“天氣提示”等常規(guī)氣象信息的同時,也關(guān)注天氣對交通的影響。而每天12—18時點(diǎn)擊“定點(diǎn)預(yù)報”和“雷達(dá)圖像”的用戶明顯增多,則是因為深圳午后經(jīng)常出現(xiàn)局地短時陣雨,天氣不穩(wěn)定的情況下用戶更關(guān)注短時臨近預(yù)報。現(xiàn)針對不同ID的用戶基于不同功能模塊的點(diǎn)擊習(xí)慣記錄為該用戶的活躍時段標(biāo)簽。

圖2 活躍用戶日點(diǎn)擊習(xí)慣
利用手機(jī)GPS 定位功能選取用戶在一天內(nèi)訪問3次以上移動端的地點(diǎn),根據(jù)經(jīng)緯度選取其所在地半徑1 km范圍以內(nèi)的公共場所如“住宅區(qū)”“車站”“公園”標(biāo)記為該用戶的位置,可以得出活躍用戶一天內(nèi)的位置變化情況(圖3),可以看出大多數(shù)用戶習(xí)慣于早晨或傍晚在車站或公園點(diǎn)擊移動端獲取氣象信息。在住宅區(qū)的活躍用戶數(shù)量從20時起呈明顯增長趨勢,說明用戶習(xí)慣于在家睡前訪問移動端。在商場和餐廳的活躍用戶數(shù)量相較于其他位置的用戶數(shù)量偏少且變化率不大,說明用戶在休閑場所較少關(guān)注天氣信息。而在寫字樓的活躍用戶在16—18時數(shù)量較多,說明用戶在工作場所更加關(guān)注下班天氣。現(xiàn)針對不同ID的用戶基于不同位置記錄該用戶一天內(nèi)基于時間的位置標(biāo)簽。

圖3 活躍用戶一天內(nèi)位置變化
以某一用戶活躍時段標(biāo)簽為“06—07時”,活躍地點(diǎn)在“公園”,日點(diǎn)擊習(xí)慣為“天氣實況”和“環(huán)境氣象”為例,系統(tǒng)判定該用戶較大可能關(guān)注早晨時段公園附近的天氣實況信息,提取時間標(biāo)簽“06—07時”、地點(diǎn)標(biāo)簽“公園”為觸發(fā)條件,并匹配用戶點(diǎn)擊習(xí)慣“天氣實況”功能分發(fā)給該用戶,移動端則會根據(jù)系統(tǒng)判定在06—07時向該用戶推送公園附近天氣實況信息。即用戶標(biāo)簽系統(tǒng)以“提取用戶標(biāo)簽”為觸發(fā)條件,以“匹配特征用戶”為分發(fā)機(jī)制向用戶提供定制化服務(wù),并且在該用戶獲取推送的天氣信息時再搜集該用戶其他的行為數(shù)據(jù),做到提供服務(wù)的同時再次獲取的雙向服務(wù)方式來獲取更多的用戶數(shù)據(jù),形成以移動端為服務(wù)渠道基于用戶行為分析的服務(wù)閉環(huán),從而不斷優(yōu)化和豐富現(xiàn)有的用戶數(shù)據(jù)庫形成用戶標(biāo)簽系統(tǒng)。再以用戶標(biāo)簽系統(tǒng)為服務(wù)基礎(chǔ)、移動互聯(lián)網(wǎng)渠道為服務(wù)載體、標(biāo)簽化處理的用戶為服務(wù)對象,并采用交互式服務(wù)方式,形成基于移動端用戶行為數(shù)據(jù)智能服務(wù)的基本構(gòu)架(圖4)。在上述智能服務(wù)構(gòu)架的基礎(chǔ)上不斷優(yōu)化不同場景服務(wù)過程中記錄到的數(shù)據(jù),獲得具有大量用戶行為標(biāo)簽的氣象服務(wù)產(chǎn)品集合,以此搭建能夠匹配特征用戶的智能氣象服務(wù)產(chǎn)品數(shù)據(jù)庫。通過將該數(shù)據(jù)庫進(jìn)行端口開放,建立能夠依據(jù)用戶標(biāo)簽匹配用戶需求且具有多渠道服務(wù)能力的智能氣象服務(wù)系統(tǒng)。
經(jīng)過對2017年9月—2018年9月期間的活躍用戶行為數(shù)據(jù)的分析得出,大多數(shù)用戶習(xí)慣于在早晨上班前或夜晚睡覺前點(diǎn)擊移動端獲取氣象信息,且移動互聯(lián)網(wǎng)用戶更傾向于獲取所在位置的天氣實況、短臨預(yù)報和交通氣象服務(wù)信息。但為滿足用戶在不同時間、不同地點(diǎn)、不同場景的精細(xì)化氣象服務(wù)的需求,需要將用戶行為數(shù)據(jù)和氣象數(shù)據(jù)進(jìn)行整合并建立基于移動互聯(lián)網(wǎng)的氣象服務(wù)用戶標(biāo)簽。移動互聯(lián)網(wǎng)渠道在借助氣象服務(wù)用戶標(biāo)簽對外服務(wù)的同時不斷搜集用戶行為數(shù)據(jù),形成“邊服務(wù)、邊獲取、邊分析”的智能氣象服務(wù)數(shù)據(jù)庫,并提供可擴(kuò)展的開放式端口,實現(xiàn)多渠道、個性化、智能化的氣象服務(wù)構(gòu)架(圖5)。

圖5 基于用戶行為數(shù)據(jù)的個性化、智能化的氣象服務(wù)模型
氣象行業(yè)本身即是具有大數(shù)據(jù)屬性的行業(yè),每天會產(chǎn)生大量的天氣實況和預(yù)報模式數(shù)據(jù),具有進(jìn)行大數(shù)據(jù)分析和研究的行業(yè)優(yōu)勢。但從現(xiàn)階段來看,龐大的數(shù)據(jù)并沒有得到充分開發(fā)和使用,也未做到基于公眾需求提供。本文采集了過去一年的活躍用戶數(shù)據(jù)并建立基于深圳天氣移動互聯(lián)網(wǎng)的服務(wù)構(gòu)架,但現(xiàn)階段獲取的用戶數(shù)據(jù)仍不足以使智能氣象服務(wù)數(shù)據(jù)庫達(dá)到真正的智慧化,所以用戶的數(shù)據(jù)分析和和精準(zhǔn)度訓(xùn)練需要一個長期的積累過程。通過開放式接口來對接不斷更新的氣象數(shù)據(jù),未來也可新增其他行業(yè)的數(shù)據(jù),如交通、旅游等,隨著第三方數(shù)據(jù)和服務(wù)渠道的不斷增加,最終實現(xiàn)跨行業(yè)、多渠道的智能氣象服務(wù)數(shù)據(jù)庫,提升氣象公眾服務(wù)的整體質(zhì)量,實現(xiàn)基于用戶需求的大城市精細(xì)化氣象服務(wù)。
深入閱讀
姜青山, 2018. 淺談氣象服務(wù)App的開發(fā)與應(yīng)用. 科技風(fēng), (1): 124-124.
劉東華, 張琳琳, 2012. 深圳市氣象信息服務(wù)個性化的設(shè)計與展望.廣東氣象, 34(3): 57-59.
楊承睿, 任芳, 馬楠, 2016. 試論大數(shù)據(jù)在氣象服務(wù)中的應(yīng)用. 農(nóng)業(yè)網(wǎng)絡(luò)信息, (8): 53-55.
Provost F, Fawcett T, 2013. Data science and its relationship to big data and data-driven decision making. Big Data, 1(1): 51-59.
王麗, 李云鵬, 甄熙, 2018. 淺析互聯(lián)網(wǎng)大數(shù)據(jù)在氣象行業(yè)的應(yīng)用.電腦知識與技術(shù), 14(24): 218-219.
Advances in Meteorological Science and Technology2019年3期