
[摘要]文章通過思考“互聯網+”時代的煙草數據價值,運用數據抽取、數據集成、數據分析、數據展現和數據應用服務等方面的新理念新技術,根據地市級煙草商業企業業務場景需求,匯集業務系統相關數據,研究一套數據敏捷應用的智能解決方案,用數據賦能企業,提升企業競爭力。
[關鍵詞]煙草商業企業;大數據分析;數據敏捷應用
[DOI]10.13939/j.cnki.zgsc.2020.04.065
1引言
按照國家局2019年度網絡安全與信息化工作會議上提出的“建立‘用數據說話、用數據決策、用數據管理、用數據創新的機制和全面精準共享的數據管理機制”。文章將以地市級煙草商業企業數據敏捷分析應用為思路,把底層原始數據統一抽取上來,做數據處理、數據拉通和數據服務,向上支撐各個業務數據的運營,思考西安煙草數據集成分析敏捷應用的數據運營新模式。以數據為驅動,貫通營銷、專賣、物流各業務數據體系[1],推進數據資源整合和開放共享,保障數據安全,推動數字業務化、業務數據化,并致力發揮數據的基礎資源作用和創新引擎作用,推動數據智能化在煙草企業的廣泛應用[2]。
2研究背景及意義
目前,根據對地市級煙草商業企業數據業務現狀的洞察,每個崗位都希望得到數據的支撐,卷煙營銷、專賣、物流等業務雖均有各自的應用系統,但數據指標被業務模式割裂,僅限于縱向分析,缺乏數據間的橫向關聯,也缺乏社會第三方數據資源,數據口徑不統一、定義不清晰、視角不一致,致使難以形成真正意義上的大數據分析資源;各自應用系統無法滿足地市級煙草商業企業與時俱進、快速迭代、按需定制的個性化多元化業務數據需求,部分關鍵指標分析仍需要依靠人工操作,且為重復性工作,對人力資源造成較大浪費,影響工作效率;此外,數據價值發掘不夠,用數據指導經營決策與企業管理的情況仍不理想,難以為供應鏈上的相關利益者(包括工業企業、零售客戶、消費者等)增利賦能,難以提升企業管理效能。
基于此,文章的研究旨在身體力行的落實習近平總書記“做大做強數字經濟”的部署要求,及國家局2019年度網絡安全與信息化工作會議上的重要指示。主動探索“互聯網+”時代下的煙草數據價值[3],運用數據抽取、數據集成、數據分析、數據展現和數據應用服務等新理念新技術,根據地市級煙草商業企業各業務場景需求及痛點,以數據為驅動,思考地市級煙草商業企業數據敏捷應用體系建設方法,規范數據抽取、清洗、儲存、建模、應用等標準,深度挖掘數據應用價值,解決企業數據應用的個性化實際需求場景。向下抽取業務數據,包括系統中的用戶數據,內部大數據,外部大數據,進行數據的打通和互聯;向上來做業務支持,進而有效地解決數據的“存——一切業務數據化”,“通——鏈接數據孤島”,“用——一切數據業務化”等難題。賦能企業,為企業決策提供科學參考,為運營提供有效支撐,為監管提供全力保障。
研究的方向既需要有從現在看未來的正向思維,在煙草的各業務領域及管理運營上加快技術升級步伐,推動西安煙草向數字化、網絡化、智能化轉變;也具備從未來看現在的逆向思維,對云計算、大數據、人工智能、移動互聯等新技術在煙草行業的應用和外部網絡電商對傳統卷煙零售的影響[4]等方面進一步加強基礎性、前瞻性研究,為各級領導和業務部門提供豐富多樣、及時準確便捷的信息服務,為供應鏈上的相關利益者增利賦能,為地市級煙草商業企業高質量發展提供數據保障和長遠的謀劃。
3關鍵技術
3.1數據采集技術
數據采集又稱數據獲取,是利用一種裝置,從系統外部采集數據并輸入到系統內部的一個接口。數據采集技術廣泛應用在各個領域。比如攝像頭、智能設備等都是數據采集工具。
3.2數據清洗技術
數據是信息的基礎,好的數據質量是各種數據分析如OLAP、數據挖掘[5]等有效應用的基本條件。人們常常抱怨“數據豐富,信息貧乏”,究其原因,一是缺乏有效的數據分析技術,二是數據質量不高,如數據輸入錯誤、不同來源數據引起的不同表示方法、數據間的不一致等,導致現有的數據中存在臟數據。它們主要表現為:拼寫問題、打印錯誤、不合法值、空值、不一致值、簡寫、同一實體的多種表示(重復)、不遵循引用完整性等。數據清洗(DataCleaning)的目的是檢測數據中存在的錯誤和不一致,剔除或者改正它們,以提高數據的質量。
圖1數據清洗原理
3.3數據分析技術
數據分析是指用適當的統計分析方法對收集來的大量數據進行分析,提取有用信息和形成結論而對數據加以詳細研究和概括總結的過程。這一過程也是進行數據模擬仿真的支持過程。進行數據分析可幫助管理者作出判斷,以便采取適當措施。
對中心數據庫[6.7]中的周期零消、批零卷煙大數據、社會第三方資源數據進行滾動清洗、整理、建模、分析(包括業務的縱向分析和橫向分析),為企業的生產、經營、管理等提供分析報表及決策依據。
典型的數據分析可能包含以下三步:
第一,探索性數據分析:當數據剛取得時,可能雜亂無章,看不出規律,通過作圖、造表、用各種形式的方程擬合,計算某些特征量等手段探索規律性的可能形式,即往什么方向和用何種方式去尋找和揭示隱含在數據中的規律性。
第二,模型選定分析:在探索性分析的基礎上提出一類或幾類可能的模型,然后通過進一步的分析從中挑選一定的模型。
第三,推斷分析:通常使用數理統計方法對所定模型或估計的可靠程度和精確程度作出推斷。
3.4關聯分析技術
關聯分析又稱關聯挖掘,是在交易數據、關系數據或其他信息載體中,查找存在于項目集合或對象集合之間的頻繁模式、關聯、相關性或因果結構。或者說,關聯分析是發現交易數據庫中不同商品(項)之間的聯系。它是一種簡單、實用的分析技術,發現存在于大量數據集中的關聯性或相關性,從而描述了一個事物中某些屬性同時出現的規律和模式。
3.5數據模型設計
維度建模是專門用于分析型數據庫、數據倉庫、數據集市建模的方法,維度建模以分析決策的需求出發構建模型,構建的數據模型為分析需求服務,因此它重點解決用戶如何更快速完成分析需求,同時還有較好的大規模復雜查詢的響應性能。
3.6數據展現技術
通過可視化技術、畫像技術、智能算法及維度模型,進行個性化動態數據查詢與展示、多元化的報表自定義展示、商圈分析、用戶畫像等研究,滿足企業所有人員的查詢與共享需求。
第一,可視化:可視化(Visualization)是利用計算機圖形學和圖像處理技術,將數據轉換成圖形或圖像在屏幕上顯示出來,并進行交互處理的理論、方法和技術。
第二,用戶畫像:又稱用戶角色,作為一種勾畫目標用戶、聯系用戶訴求與設計方向的有效工具,用戶畫像在各領域得到了廣泛的應用。用戶畫像最初是在電商領域得到應用的,在大數據時代背景下,用戶信息充斥在網絡中,將用戶的每個具體信息抽象成標簽,利用這些標簽將用戶形象具體化,從而為用戶提供有針對性的服務。用戶畫像所形成的用戶角色并不是脫離產品和市場之外所構建出來的,形成的用戶角色需要有代表性,能代表產品的主要受眾和目標群體。
4從頂層到底層,思考構建地市級煙草商業企業數據敏捷應用體系
4.1規劃地市級煙草商業企業數據敏捷應用體系建設方法
規范數據抽取、清洗、儲存、建模、應用等標準。從業務架構設計到模型設計,從數據分析到數據服務,匯集業務系統相關數據,進行各種關聯分析和對比碰撞,規劃具備前瞻性、可持續性、可擴展性,能夠為企業經營決策提供柔性技術支撐平臺,為企業高質量發展提供決策依據,推動業務及管理決策向數據化和智能化發展。
4.2搭建數據管理需求場景,挖掘數據應用服務的價值
(1)通過對卷煙營銷關鍵指標、市場調研數據、客戶經理拜訪數據進行抽取滾動清洗、整理、分析,自定義展示,形成一套科學合理的市場狀態與貨源投放分析研判標準,逐步建立“系統大數據+市場活情況”綜合分析機制。幫助營銷人員及時獲取市場狀態的變化信息,提升貨源分配與客戶銷售能力匹配度,打破業務人員基于傳統的統計思維,根據工作積累的經驗和直覺對數據進行判斷的工作方式。
(2)對終端卷煙零售數據進行深入分析應用,提升消費者感知能力,為科學經營決策提供數據支撐。通過對卷煙零售客戶歷史銷量數據、各類零售終端進銷存數據、貨源數據以及消費者會員信息數據、消費數據等滾動清洗、整理,建立若干分析模型,包括數據監測分析預警模型、品牌推薦模型、品牌畫像模型、終端畫像模型等,以提升貨源分配與客戶銷售能力匹配度,并經過長期良性循環,為一定程度抑制部分區域真煙非法流動提供決策輔助;通過商品消費畫像鎖定商圈,通過終端與消費者畫像鎖定品牌培育對象等,逐步探索一套完整的零售終端數據分析和應用模式。
(3)研究基于數據挖掘的品牌精準選點培育,借助數據驅動,通過數據標簽以及終端畫像選點投放,實現目標客戶精準鎖定、投放節奏張弛有度、區域市場錯位發展、市場需求即時響應,提高品牌培育的精準度,為優化提升市場狀態奠定提供支持。
(4)探索開展品牌“精準推薦”,通過模型構建、數據展現、逆向評價,將卷煙精準推薦給適銷客戶,幫助客戶高效尋找暢銷卷煙。整個過程以經營數據驅動,實現卷煙零售客戶品牌精準推薦信息服務,為經營指導賦能,充分發揮數據在營銷決策中的重要作用,以批零網上配貨匹配度優化提升為突破口,實現卷煙零售客戶品牌精準推薦信息服務。
(5)嘗試引入社會第三方資源數據(如非煙數據、區域人口流動數據等),利用數據挖掘、可視化技術、畫像技術、智能算法、用戶維度模型,初步形成社會數據與零售終端及消費者數據的關聯分析模型,為優化提升市場狀態和貨源投放策略提供支持。
(6)探索物流類關鍵指標數據的綜合分析研判展示。主要包括對物流業務運行、設備管理、安防監控、對標指標等數據的抽取、分類、分析和展現,構建物流基礎數據模型。
(7)探索業務間關聯性的數據分析研判場景。如卷煙銷售數據與專賣涉煙違法案件概率、客戶訂單數據與物流分揀數據關聯分析等。
4.3形成全面、多樣化、可視化的信息匯總展示功能
實現個性化的動態數據查詢與展示、多元化的報表自定義展示等,為大數據分析提供多樣化數據形態基礎,提升匯總數據的直觀性,讓業務人員與數據直接對話。
5結論
文章主要思考了地市級煙草商業企業數據敏捷應用體系建設方法,從規范數據抽取、清洗、儲存、建模、應用等標準出發,解決企業數據應用服務的個性化靈活需求場景。通過向下抽取底層原始數據,做數據處理、數據拉通和數據服務,向上支撐各個業務數據的運營。以數據為驅動,貫通地市級煙草商業企業營銷、專賣、物流、綜合管理數據體系,推進數據資源整合和開放共享,保障數據安全,推動業務數據化向數據業務化發展,致力發揮數據的基礎資源作用和創新引擎作用,推動數據智能化在煙草企業的廣泛應用。
參考文獻:
[1]金向陽,葉周良,葉群峰.大數據服務模式在煙草應用中的探索[J].中國有線電視,2019(6):649.652.
[2]王昌玲.大數據和數據挖掘技術在煙草行業的應用分析[J].科技風,2019(3):78.
[3]姜未冬.煙草商業企業“互聯網+”經營策略研究[J].現代商業,2016(11):132.134.
[4]王保智.煙草商業企業引入“互聯網+”路徑淺析[J].全國商情,2016(7):4.5.
[5]張國寶,卞藝杰.一種面向閉環的數據治理平臺與方法設計[J/OL].計算機技術與發展,2019(8):1.6.[2019.08.01].http://kns.cnki.net/kcms/detail/61.1450.TP.20190327.1624.040.html.
[6]林海.數據治理在合肥市政府大數據平臺中的應用和實踐[J].電腦知識與技術,2019,15(10):281.283.
[7]趙恩來.打造企業中臺推動管理協同[N].國家電網報,2019.07.16(008).
[作者簡介]通訊作者:劉佳(1989—),女,碩士研究生,現就職于陜西省煙草公司西安市公司信息中心,科員,研究方向:通信與信息系統、計算機信息技術等。