999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

鐵路旅客用戶畫像系統設計與應用研究

2018-08-07 01:28:58張軍鋒
鐵路計算機應用 2018年7期
關鍵詞:鐵路用戶分析

張軍鋒

(中國鐵道科學研究院集團有限公司 電子計算技術研究所,北京 100081)

國務院《關于促進大數據發展的行動綱要》強調以企業為主體、以市場為導向,加大政策支持大數據產業發展力度,深化大數據在各行業創新應用,催生新業態、新模式。大數據技術和業態的成熟也為鐵路部門實現數據驅動和業務創新提供了強有力的支撐。目前鐵路部門已經形成了以12306、95306

為代表的一系列互聯網服務平臺[1],在現有基礎之上,采用大數據技術,開展用戶畫像、精準營銷、延伸服務等“互聯網+”產業升級已經具備條件,也是產業發展的大勢所趨。

用戶畫像系統是對現實生活中的用戶行為進行數據建模,以不同的數據維度對用戶進行刻畫。通過對用戶的人口屬性、行為偏好等主要信息進行建模分析,從而抽象出能夠讓人理解的語義標簽,通過標簽來形成一個用戶的信息全貌,為進一步分析

和利用這些信息提供數據基礎。目前在航空、電信、銀行和互聯網行業,許多公司已經建立并應用了用戶畫像系統,在提升用戶體驗、精準營銷、效益提升方面取得了很好的效果[2-3]。

本文針對鐵路行業大數據應用—旅客用戶畫像系統進行了探索:對鐵路用戶的行為、交易等數據進行采集,綜合運用統計學模型、文本挖掘、機器學習等多種技術,把海量數據轉化成簡潔、形象、人機可理解的畫像標簽,通過與應用系統對接,支撐客運產品優化、個性化服務、數據增值服務等業務的開展,從而充分發揮數據的基礎資源作用和創新引擎作用,助力鐵路部門提升客戶服務能力和 核心競爭力。

1 旅客用戶畫像系統架構設計

鐵路旅客用戶畫像系統依托基礎運行環境提供線性伸縮的計算存儲資源,采用基于Hadoop的大數據體系架構[4-6],通過采集、匯聚內部數據和外部數據,為廣告綜合投放子系統、數據分析子系統、在線交易子系統以及客運相關服務提供實時的用戶畫像數據訪問接口,支撐精準廣告投放、客戶推薦服務、客運輔助決策支持等業務,如圖1所示。系統主要包括:

(1)實現系統大數據計算存儲、數據匯聚、數據分析的基礎運行環境;

(2)獲取鐵路客運業務系統數據、網站用戶行為數據的采集系統;

(3)用于實現鐵路用戶畫像標簽定義、管理、計算、分析和呈現的業務平臺;

(4)與外部系統交互的數據服務接口平臺。

圖1 用戶畫像系統總體架構

2 旅客用戶畫像系統實現

用戶畫像即用戶信息標簽化,就是從用戶原始數據到用戶標簽的分析轉換過程——通過對匯聚的海量用戶數據的分析挖掘,形成每個用戶的特征標簽集合,并對外提供基于用戶特征標簽的數據服務的過程。它的核心工作是為用戶打標簽,打標簽的重要目的之一是為了讓人能夠理解并且方便計算機處理。標簽通常是人為規定的高度精煉的特征標識,既能夠很方便地被人理解,也能夠方便機器進行提取和聚合分析。

構建用戶畫像標簽體系包含以下步驟。

2.1 數據源分析

構建用戶畫像是對用戶信息的還原,涉及的數據源盡可能包括用戶相關的所有數據。通過對鐵路客票系統相關數據源的分析,根據標簽的特性將數據分成靜態數據和動態數據。靜態數據包括人口屬性、社會屬性、賬戶屬性等;動態數據包括乘車、購票、支付、查詢、咨詢行為等方面數據。

2.2 設計標簽

標簽和標簽規則需要人為定義,通過對目標的確定和數據的分析,定義出對應的標簽,最終為用戶打上標簽。根據用戶畫像標簽實現方式和應用場景的不同,鐵路旅客用戶畫像系統的標簽可以分成事實標簽、業務標簽、模型標簽等類型,如圖2所示。

2.3 標簽實現

標簽實現是數據建模和流程化的過程,即根據定義好的標簽,確定采用什么樣的方式為用戶打上標簽的過程。鐵路旅客用戶畫像系統在技術上使用了離線的MapReduce/Pig/Hive、準實時的spark/impala、數據挖掘的R/mahout/sparkmllib等數據處理技術,結果存儲到Hbase和Elasticsearch快速檢索引擎上,以供數據服務接口實現快速訪問。鐵路旅客用戶畫像系統建模的方式包括直接取值、統計分析、業務規則、預測模型等幾種類型,流程示意圖,如圖3所示。

3 旅客用戶畫像系統應用

目前,鐵路旅客用戶畫像系統設計并建成了包括事實標簽、業務標簽和模型標簽在內的一整套標簽體系,數量超過1 500個,涵蓋了旅客的基礎屬性(姓名、性別、年齡、常駐地等)、出行行為(出行次數、出發城市、到達城市、席位等級等)、交易行為(線上線下選擇、支付方式、退改簽情況等、出行規律、消費習慣、潛在消費)等多個方面。

圖2 旅客用戶畫像標簽體系

圖3 標簽建立流程示意

建立用戶畫像系統的目的是為了幫助業務部門了解自己的用戶,便于在產品設計、旅客服務過程中做到目標明確、高效和精準。結合目前鐵路業務現狀,旅客用戶畫像系統在下述幾個方面可以進行業務對接和應用。

3.1 旅客行為分析

通過對旅客成分結構、產品選擇行為、購票行為、旅行行為等方面進行分析,可以發現群體旅客特征、個體旅客特征與客運產品的關系。

3.1.1 旅客成分結構

通過分析得到鐵路旅客的組成情況,以做好鐵路產品設計和服務提供的數據支撐。例如:

(1)性別比例;(2)旅客區域(城市)比例; (3)各年齡段比例;(4)各票種的比例。

3.1.2 產品選擇行為分析

旅客在進行產品選擇時,會受多種因素的影響。通過下列分析,有助于分析判定旅客選擇客運產品的影響因素,為產品設計提供依據。

(1)按旅客選擇的列車類型分析;(2)按旅客選擇的鋪別和席別分析;(3)按旅客選擇的票價區間分析;(4)按旅客乘車里程分析;(5)按旅客選擇的列車開點分析;(6)按旅客選擇的列車到點分析;(7)按旅客選擇列車擔當企業分析。

3.1.3 交易行為分析

通過交易記錄的分析,發現旅客在購票交易過程中的行為特點,以針對性的做好售票組織和服務工作。(1)購票渠道分析;(2)互聯網換

票分析;(3)電訂取票分析;(4)自助售票分析;(5)支付方式分析;(6)預售規律;(7)通票、聯程、往返票分析;(8)退票時間規律;(9)改簽時間規律;(10)改簽分類分析。

3.1.4 旅客乘車行為分析

通過對旅客出行行為的分析,可以發現需要重點關注的旅客,從而進行產品推薦或者個性化服務,提升旅客出行體驗。(1)按旅客出行目的分析:通過設計合理的模型進行評判,將出行目的分為旅游、商務、公務、探親、民工、學生、通勤職工等;(2)按旅客出行頻度分析:按出行次數對旅客進行分群分析,得到潛在的常旅客用戶;(3)按旅客出行范圍分析:按行政區劃進行出行范圍分析,如省內客流、省間客流;(4)按旅客出行行程分析:按旅客出行行程進行分析,由聚類模型分析得到旅客行程的合理劃分。

3.2 精準營銷

通過構建的鐵路旅客用戶畫像,為旅客建立了人口屬性、出行行為、交易行為等多維度的標簽,通過對多維度標簽的篩選、聚類,找出符合要求的特定人群,然后在推薦平臺為人群制定對應的營銷策略,并利用廣告平臺實現對用戶群體的精準營銷。

基于鐵路旅客用戶畫像數據的推薦系統利用Elasticsearch強大的組合和聚合搜索能力,提供快速的標簽篩選能力,在此基礎上利用機器學習算法——基于用戶的協同過濾算法,根據用戶的偏好實現用戶聚類,即將相似度較高的用戶分為一個群體,在用戶訪問時進行信息的推送,從而實現產品的精準推薦。

用戶定量標簽的相似度計算方法[7-8]:

式(1)中,wk表示第k個定量標簽的權重;sim(profilek(ui),profilek(uj)),表示用戶ui和用戶uj在第k個定量標簽的相似度。

3.3 數據核驗

央行發布的《非銀行支付機構網絡支付業務管理辦法》于2016年7月1日起正式實施。其要求支付機構為客戶開立支付賬戶的,應當對客戶實行實名制管理。在推行和實施的過程中,第三方支付平臺需要簡化用戶核驗流程,在提高用戶體驗的情況下完成用戶的核驗,故需要借助外部系統提供的核驗服務。目前鐵路互聯網售票系統注冊用戶突破2.5億,乘車旅客信息超過5億,旅客信息基本都是通過實名制核驗的,所有的數據真實可靠,所以鐵路互聯網數據服務平臺可以對第三方支付平臺提供身份核驗服務,助力第三方支付平臺實名制的實施。

因此,數據核驗是鐵路部門實現數據共享、數據共創和數據增值的重要業務。系統基于旅客用戶畫像系統,為第三方系統提供不同查詢條件的服務接口,包括姓名、證件號和手機號的比對。

3.4 互聯網售票系統風險防控

鐵路12306互聯網售票系統為旅客提供便捷購票的同時,也成為部分機構和個人囤票、倒賣的途徑。如何對互聯網售票系統存在的惡意訪問進行有效防控,構造公平、和諧的購票環境是永恒的主題[9]。基于畫像系統對用戶行為進行深入分析挖掘之后,評估存在異常的用戶行為,針對性地研究相關風險控制手段形成風險控制系統,實現應用防火墻(WAF)成為行之有效的方法。

風險防控系統覆蓋了風險識別、風險控制、風險告警等環節,主要功能包括:

(1)用戶風險等級管理。結合業務系統的用戶特點,綜合考慮和分析用戶的各類特征因素并進行分類,通過用戶評級列表可以展現基于風險評估的評級結果。(2)規則管理平臺。規則引擎基于多維度的風險特征、靈活的風控模型,可以準確地分析識別惡意訪問行為,經過規則判斷的每一條數據,綜合各個維度的分數,形成最終的評分,最終建議該條請求拒絕或者通過。(3)統計分析。按照風險性質和類型、業務類型、風險趨勢、風險核查等不同角度進行統計,通過可視化輔助監控人員全面了解當前系統的運行狀況,并將相關統計分析結果運用在優化風險規則上。(4)報警監控。對系統分析出的異常行為,依據規則達到風險告警閥值時進行告警,以便管理人員及時人工介入處理。(5)風險控制。實現通用安全防御、基于IP的流量控制、IP黑白名單、統一資源定位符(URL)黑白名單、用戶名黑白名單、用戶/URL/IP高頻控制、業務流程控制、監控、管理、多樣化的安全管控措施等業務或管理功能。

4 結束語

通過運用大數據技術,設計了鐵路行業的旅客用戶畫像系統,并基于該系統進行了業務應用的探索。目前,旅客行為分析、數據核驗和互聯網售票系統風險控制應用已經部署上線、進入試運行階段,精準營銷相關功能正在開發過程中,后續將在完善現有應用的基礎上,積極探索新的業務模式和方法,通過不斷的完善、優化、豐富,充分發揮鐵路旅客用戶畫像系統在客運產品設計、旅客服務水平提升方面的支撐作用。

猜你喜歡
鐵路用戶分析
沿著中老鐵路一路向南
云南畫報(2021年12期)2021-03-08 00:50:54
隱蔽失效適航要求符合性驗證分析
電力系統不平衡分析
電子制作(2018年18期)2018-11-14 01:48:24
鐵路通信線路維護體制改革探索與實踐
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
電力系統及其自動化發展趨勢分析
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
無人機在鐵路工程建設中的應用與思考
GSM-R在鐵路通信中的應用
主站蜘蛛池模板: 色综合天天综合| 日韩av电影一区二区三区四区| 国产成人AV综合久久| 国产农村1级毛片| 谁有在线观看日韩亚洲最新视频| 国产一区成人| 在线观看精品自拍视频| 91成人免费观看| 四虎国产精品永久一区| 国产91无毒不卡在线观看| 欧美日韩亚洲国产| 亚洲精品无码久久毛片波多野吉| 波多野结衣在线se| 国产在线欧美| 国产色婷婷视频在线观看| 国产高清无码麻豆精品| 日韩一级毛一欧美一国产| 婷婷六月激情综合一区| 国产在线八区| 丝袜久久剧情精品国产| 欧美综合区自拍亚洲综合绿色 | 久久一日本道色综合久久| 国产精品国产主播在线观看| 国产成人综合网| 日韩专区欧美| 亚洲综合中文字幕国产精品欧美| 欧美笫一页| 亚洲av无码牛牛影视在线二区| 亚洲第一网站男人都懂| 国产精品无码久久久久久| 日韩123欧美字幕| 日韩AV手机在线观看蜜芽| 98精品全国免费观看视频| 一级一级一片免费| 亚洲日韩欧美在线观看| 人妻丰满熟妇αv无码| 中文国产成人精品久久| 九色在线观看视频| 日本亚洲成高清一区二区三区| 四虎成人免费毛片| 亚洲国产精品一区二区第一页免 | 婷婷亚洲视频| 波多野结衣无码视频在线观看| 国产美女免费网站| 精品久久国产综合精麻豆| 国产成人高清精品免费| 国产主播在线一区| 青青极品在线| 国产av剧情无码精品色午夜| 午夜欧美在线| 色网站在线视频| 91区国产福利在线观看午夜| 免费观看精品视频999| 午夜免费视频网站| 亚洲国产精品无码AV| 黄色一及毛片| 国产不卡一级毛片视频| 国产一级α片| 久久九九热视频| 国产乱人激情H在线观看| 91国内在线观看| 无码粉嫩虎白一线天在线观看| 在线a网站| 秘书高跟黑色丝袜国产91在线 | 啪啪国产视频| 日韩第一页在线| 亚洲精品国偷自产在线91正片| 精品福利网| 国产91视频观看| 日韩高清无码免费| 国产成人艳妇AA视频在线| 直接黄91麻豆网站| 亚洲成a人在线播放www| 经典三级久久| 亚洲综合狠狠| 欧美A级V片在线观看| 国产99视频精品免费观看9e| 国产毛片片精品天天看视频| 中文字幕2区| 欧美日韩亚洲综合在线观看| 极品av一区二区| 色网站免费在线观看|