劉 潔,王 哲
(1.中國電信股份有限公司廣東研究院 廣州 510630;2.中國電信股份有限公司廣東分公司 廣州 510081)
基于大數據的電信運營商業務精確運營平臺的構建
劉 潔1,王 哲2
(1.中國電信股份有限公司廣東研究院 廣州 510630;2.中國電信股份有限公司廣東分公司 廣州 510081)
大數據作為云計算的一種實際應用,在電信運營商的運營支撐中有著舉足輕重的作用。基于移動互聯網的發展趨勢,首先分析電信運營商面臨的挑戰和建設難題,基于大數據分析的精確運營平臺的重要性和必要性,提出引入大數據精確運營平臺的業務網絡架構和構建大數據精確運營平臺的思路和方法。
大數據;用戶行為分析;云數據庫;分布式計算;并行計算;云計算;業務網絡
移動互聯網的發展呈現明顯的去電信化趨勢,如OTT、電子商務、基于LBS的商業服務和社交應用。越來越多的用戶群體傾向用微信、QQ等社交應用手段滿足溝通和信息傳送需求,電信運營商的傳統業務越來越受到威脅。在此大環境中,電信運營商只有圍繞自身的資源優勢,構建用戶/業務可識別、管理和控制的綜合平臺,實現通信管道的智能化,才能提升核心資源和優勢資源的價值,更好地適應移動互聯網的發展趨勢。
對比電信網絡和互聯網絡的特點,不難看出,電信運營商的優勢在于網絡資源、用戶信息資源和管理支撐體系。電信運營商掌握更為詳細的用戶信息,把控更為深入的用戶使用基礎電信業務和通信管道的行為特征。在“去電信化”的需求下,電信運營商需要結合這些信息和第三方應用使用行為,主動挖掘用戶需求并推薦切合用戶實際的應用。有更好的資源支撐,是運營商相對互聯網服務商的最大優勢,也是運營商構建前后向運營環境的最好切入點。要做到這一點,一個基本的要求就是要有一個支撐精確運營的數據關聯分析的大數據平臺。
什么是大數據?維基百科中將大數據定義為“無法在一定時間內用常規軟件工具對其內容進行抓取、管理和處理的數據集合”。業界用4個V概括大數據的基本特征,即volume(量大)、variety(多樣化)、value(價值密度低)和velocity(處理要求快)。量大是指數據規模至少在TB級;多樣化,一方面指數據有不同的來源,另一方面指數據類型有結構化、半結構化和非結構化等多種形式;價值密度低指這些數據的單一來源或單一維度并不能帶來有效的價值,只有形成一定規模并關聯起來,才能體現大的價值;處理要求快主要指數據分析的實時性要求很高。
運營商建設的業務數據關聯分析平臺是一個大數據平臺,這點不難理解,因為它不僅需要對網絡信令、流量日志、客戶數據、用戶行為數據、用戶地理數據和應用喜好等數據進行分析,更需要對這些動靜態數據進行關聯分析和數據挖掘,數據量是海量的;但只要及時將數據之間的內在關聯挖掘出來,數據的價值將大大提升,帶來很大的商機。海量數據的分析將生成動態控制策略,一方面為智能管道提供網絡控制的數據支撐,另一方面為應用的智能推送和用戶主動服務提供支撐。
電信運營商經過多年的網絡改造和建設,基本上改變了傳統的縱向業務網絡,建成了管理統一、能力明晰、開放的業務網絡架構。業務網絡主要包括業務及能力管理域、能力接入和開放域、基礎能力域以及應用平臺等幾部分。
業務及能力管理域集合各類增值業務平臺的公共管理功能,包括認證、鑒權、話單生成和用戶、CP/SP、業務的管理以及業務訂購等功能;能力接入和開放域提供業務的統一接入功能,開放的業務生成、測試、執行環境,實現能力共享,降低業務生成門檻;基礎能力域提供各種基本業務能力和適配功能,包括話音、短信、彩信、WAP、下載、定位、彩鈴、流媒體、支付等;應用平臺實現各種具體應用、業務邏輯的執行環境和個性化的管理功能。可見,現有的業務網絡架構已經從根本上改變了以往單一業務獨立管理的縱向架構,為業務融合和業務合作提供了良好環境,在一定程度上適應了互聯網時代的通信服務要求;而管理域作為核心的運營支撐部分,實現了業務的統一管理,包括集中的業務訂購、統一的業務認證/鑒權、靈活統一的計費結算和統一的產品和用戶管理等。
在目前的橫向架構中,雖然實現了統一管理,但這種管理是相對靜態的管理,缺乏對業務之間關聯性和用戶使用業務的行為特征的分析,是一種被動服務的方式,不能很好地適應移動互聯網大環境中去電信化和有效開放的運營要求。
基于上文的分析,提出在業務網絡架構中引入基于大數據的業務精確運營平臺(以下簡稱大數據平臺)。引入大數據平臺的業務網絡架構如圖1所示(深灰色陰影部分表示新增內容)。

圖1 業務網絡新架構
新架構中的大數據平臺定位于刻畫用戶的全息視圖,對用戶屬性、承載網絡、用戶行為特征、用戶業務喜好和業務訂購特點及用戶、業務等進行統計分析和關聯分析,同時結合用戶終端和接入業務的特點以及智能管道的承載信息,為智能管道的動態聯動、電信業務和第三方應用的智能推介、用戶接入業務的智能升級推薦等提供有力的數據支撐,從而實現前后向收費的移動互聯網新模式。經過處理的數據加上包裝,可以作為一種能力,提供調用和對第三方開放的功能。
組網方面,大數據平臺與信令網元、終端自注冊平臺、支撐系統、業務管理平臺、承載層信息感知網元和控制網元等均有連接,如與CRM(客戶關系管理)、ISMP(統一業務管理)、AAA(認證授權計費)、CCG/DPI(內容計費網關/深度分組檢測)等網元有連接關系,并從這些平臺中收集靜態和動態信息。特別要指出的是,這些信息包括大量的動態信息,如漫游信息、開關機信息、位置信息等,這些動態信息提供了用戶的行為日志,能夠從中挖掘出更深層次的信息:如感知用戶使用業務的喜好和慣性、用戶使用業務的流量曲線等,從而提高業務精確運營的可能性和業務之間動態關聯的可行性。另外,大數據平臺與推送網關(WAP/push 網關、短信中心等)、OCS(在線計費系統)、PCG(策略控制網關)等網元也有連接,以實現業務的智能推送,根據動態業務情況實現實時計費或者分發網絡控制指令等。
運營商大數據平臺的主要應用場景如下。
·基于用戶上網日志,把握熱點內容和應用,制定流量策略,支撐差異化服務和帶寬控制,以客戶體驗為核心發展流量經營。
·分配客戶標簽,刻畫用戶全息視圖,實現根據用戶喜好、位置、行為等的業務交叉推薦,支撐精確營銷。
·通過對OTT替代性業務的分析,掌握業務發展趨勢,為制定電信業務的發展策略提供數據支撐和依據。
·通過對前、后向流量的關聯分析,實現與合作伙伴的合作定向營銷。
·根據業務和網絡流量對數據進行分析,為IT系統的優化提供依據,使用戶的優惠套餐定制化,改善用戶體驗,減少用戶投訴。
可見,引入大數據平臺的業務網絡架構突破了傳統業務網絡專注于單一業務邏輯的實現和靜態業務提供的局限,從運營的角度出發,重新定位了業務網絡并提高了對業務網絡的整體功能要求。不難理解,隨著更多不同來源數據的引入(如第三方應用平臺的用戶個性化數據),業務網絡可以利用大數據平臺提供更多切合用戶需求的個性化服務。
大數據平臺的組網架構如圖2所示。
從圖2可以看出,大數據平臺作為業務網絡的一個網元,與周邊系統的眾多網元有連接關系,其組網架構已經突破了業務域的范圍,并從運營的角度切入,對業務域、網絡域和IT域實現了有機的關聯。

圖2 大數據平臺的組網架構
根據上面的需求分析,大數據平臺的功能架構如圖3所示。
功能架構包括數據采集層、數據存儲層、數據處理層和數據運營服務層。其中,數據采集層提供到各個原始信息網元的接口,并與各網元實時同步,獲取各類信息。數據存儲層將根據這些海量的基礎信息進行數據識別、分類處理,如對用戶的分類(如企業客戶、家庭客戶、個人客戶等)、對業務的分類(如視頻業務、話音業務、社交類業務、支付類業務等)、對接入手段的分類(如ADSL接入、光纖接入、3G接入、WLAN接入等),并采用云數據庫的方式進行有效存放。數據處理層對靜態數據和動態信息進行分析挖掘,根據關聯性構建關聯模型,生成知識庫和用戶、CP/SP/SI的全視圖。最后,數據運營服務層結合運營層面的要求,一方面實現信息能力的開放和共享,另一方面根據運營策略執行策略指令,將信息提供給網絡控制設備或者業務推送網元。數據運營服務層具備反饋機制和流程,支撐市場營銷策略的修訂和控制策略的靈活動態調整。

圖3 大數據平臺功能架構
基于集中、大容量、多樣化和實時性等特點,大數據平臺目前只能采用云計算的方式實現。具體來說,通過云數據庫構建海量數據的存儲空間,基于分布式計算實現海量的數據分析處理。從技術上,該平臺的軟硬件必須滿足以下條件:
·具備海量的協議識別能力;
·支持多種數據采集工具;
·支持常見和新型的數據挖掘模型;
·兼容結構化和非結構化數據;
·采用分布式海量處理技術;
·支持存儲虛擬化,支持數據的冗錯、負載均衡和靈活擴展;
·支持數據存取和查詢,支持以認證數據等為關鍵字整合用戶數據。
相應地,大數據平臺的設計理念和技術如下。
(1)基于 SOA 理念
基于SOA(面向服務架構)理念,遵循松耦合、模塊化的原則,解除數據和應用之間的耦合性。上層的應用邏輯基于實際的運營策略,調用底層的數據。數據和應用邏輯分離的方式提高了靈活性,同時適應個性化的需求,可以隨時根據運營策略產生新的應用邏輯。
(2)支持多協議識別
考慮不同的應用,通信網絡從低層往上,支持的協議有上千種。理論上,大數據平臺應該支持所有的通信協議,如 SNMP、WAP、DNS、Telnet、P2P、SIP、RADIUS 等。具體操作上可以將數據采集層和數據存儲層的數據采集模塊和數據識別模塊合設,以實現數據的統一和規范化。
(3)支持數據的有效采集
數據采集是指通過網絡爬蟲或標準接口等方式從數據源上獲取數據信息。對于網站等非結構化數據,一般通過網絡爬蟲或者開放的API,該方法可以實現將網頁中的非結構化數據以結構化的方式存儲到本地數據文件,并支持附件與正文的自動關聯。數據采集工具有很多種,目前在電信網絡中采用較多的是DPI或標準接口的方式。
(4)支持數據關系的挖掘
由于數據之間的關聯關系并不遵循一定的模式和規則,大數據平臺要支持各種類型的數據挖掘技術,包括假設檢驗、方差分析、回歸分析、邏輯回歸、聚類分析、因子分析等統計方法和決策樹、向量機、神經網絡、樸素貝葉斯等分析模型和方法。
(5)使用流數據處理技術
使用流數據處理技術,將數據視為流動的,在動態過程中進行分析和計算。流數據處理技術不僅支持結構化數據的處理,同時支持非結構數據的連續流處理。流數據處理由事件或數據觸發,始終在線,結合分布式計算,非常適合大數據平臺的實時性和動態處理數據的需求。
(6)使用云數據庫
傳統電信IT系統的數據為結構化數據,而基于Internet應用的數據多為非結構化數據,如Web、E-mail、SNS、文檔共享等應用產生的數據。正是因為數據量很大,大數據的類型很復雜,如存在結構化、半結構化、非結構化數據,而且數據有不同的來源和標準,數據量大小與實時性要求不同,存放和處理的困難很大。云數據庫提供了基礎條件。云數據庫采用云計算的相關技術,屏蔽了底層存儲的差異,是存儲虛擬化的一種表現形式、云計算的一種SaaS模式;云數據庫支持數據節點動態伸縮與熱插拔,提供數據的容錯機制和安全管理,特別適合大數據的要求;同時兼容非結構化和結構化數據。對于互聯網等需要大容量存儲需求的業務,可使用新型非關系型數據庫技術,進行分布式存儲和處理。云數據庫結合分布式存儲的方式,使數據模式更加靈活,而且提高了可用性和容錯性。
(7)采用并行處理和分布式計算技術
云數據庫存儲了海量的數據,涉及大量的計算,因此需要一種不同于傳統方式的編程方式和數據處理方法來支撐。通常采用分布式計算或并行處理技術。分布式計算在應用上通常結合新型的非關系型數據庫,適合海量數據的存取管理,在支持在線分析處理(OLAP)方面具有較大的優勢。并行處理技術可以支持同時的在線分析處理和在線事務處理(OLTP)。在大數據的場景下,并行處理只有部署在云基礎設施的基礎上,才能具備良好的可伸縮性;不同于傳統意義上的并行處理,更像分布式計算。業界典型的數據處理解決方案架構Hadoop是一種基于新型的非關系型數據庫的大數據處理平臺,采用了分布式計算技術。
以上幾種構建技術是相輔相成的。總之,綜合利用云計算模式、分布式技術和云數據庫,不需要復雜的模型和算法就可以處理大數據。目前大數據平臺的多種技術如何更有效地融匯貫通,業界還在繼續探索,大數據在模型構建、體系架構、安全和性能優化方面還有很多需要深入探討和完善的地方。
這里舉個簡單的例子:某用戶特別喜歡觀看節目,經常在IPTV上看大片,也常關注新的影視產品。根據互聯網上的最新消息,影片《泰囧》馬上就要在影院首映,估計高清版2個月后可以在IPTV上線。通過分析,大數據平臺發現用戶A是一個影迷,經常反復收看喜歡看的電影。大數據平臺還發現,A經常用“院線通”訂購首映影票,并且喜歡看完電影之后訂購附近餐飲或者下載電影彩鈴。據此,大數據平臺針對與用戶A有共同喜好特性的用戶生成一種運營支撐應用,向該類用戶推送影片《泰囧》的放映消息和訂購信息;用戶通過“院線通”訂購電影票之后,在適當的時間和地點為用戶推送大眾點評優惠訂餐信息和彩鈴下載鏈接或彩鈴套餐優惠信息。隨著高清版《泰囧》在IPTV的上線,大數據平臺根據用戶A目前使用ADSL 2 Mbit/s接入的業務信息,推送免費試看8 Mbit/s接入的《泰囧》高清片段的鏈接,并提示用戶A升級網絡接入帶寬到8 Mbit/s,同時提供接入業務的升級手段。
該場景的相關業務流程如圖4所示。
總之,基于大數據的運營商精確運營平臺通過采用大數據技術,精確了解用戶行為及管道流量組成,提供業務分析、用戶建模等基礎能力,為運營商提供業務個性化推薦、用戶行為分析以及精準營銷(動態套餐優化、定向營銷等)運營能力,將助力提升運營商的運營能力,提高移動互聯網環境下運營商的競爭力。

圖4 大數據平臺應用舉例
1 林子雨,賴永炫,林琛等.云數據庫研究.軟件學報,2012,23(5)
2 余長慧,潘和平.商業智能及其核心技術.計算機應用研究,2002(9)
Construction of Carrier Business Precise Operating Platform Based on Big Data
Liu Jie1,Wang Zhe2
(1.Guangdong Research Institute of China Telecom Co.,Ltd.,Guangzhou 510630,China;2.Guangdong Branch of China Telecom Co.,Ltd.,Guangzhou 510081,China)
As a practical application of cloud computing,big data plays a more and more important role in the carrier’s operations.With the high-speed development of mobile internet, the challenges faced by the carriers were analyzed,and then the importance and necessity of constructing a business precise operating platform based on big data was promoted.Also,the new business network architecture with the introduction of such a big data platform was suggested.Some ideas and methods of how to build such a precise operating platform based on big data were suggested as well.
big data,user behavior analysis,cloud database,distributed computing,parallel computing,cloud computing,business network
10.3969/j.issn.1000-0801.2013.03.005

劉潔,女,碩士,中國電信股份有限公司廣東研究院高級工程師、網絡規劃一級工程師,主要從事業務網絡的研究、規劃工作,近兩年主要負責云計算體系架構和基于云的業務網絡架構研究工作。

王哲,女,博士,中國電信股份有限公司廣東分公司高級工程師、網絡發展部副總經理,主要從事電信寬帶、業務及核心網絡技術發展和運營規劃工作,主持中國電信股份有限公司廣東分公司云計算的應用和試點相關工作。
2013-03-05)