999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

以提升企業(yè)核心競爭力為導向的數據集市構建技術研究

2024-01-23 08:07:14尹曉明徐紹倫王智泉
中國科技縱橫 2023年22期
關鍵詞:煙草

尹曉明 徐紹倫 王智泉

(山東威海煙草有限公司,山東威海 264200)

0 引言

近年來,各級煙草公司都遇到了不同程度的發(fā)展瓶頸,面臨諸多與生存和發(fā)展相關的痛點和難點問題。例如,在卷煙營銷活動中,常常要面對原有卷煙品牌的維護、新品牌的投放、滯銷品牌的退市等問題。以往,都是憑借員工的工作經驗、專業(yè)知識,收集一定量的市場數據,進行分析、判斷,在此基礎上策劃卷煙品牌的投放策略。但由于市場數據的抽樣樣本不足、人為因素的介入、營商環(huán)境的干擾,往往不能科學規(guī)劃卷煙品牌布局,不能科學設計品牌投放策略,不能及時啟動某些滯銷品牌的退市機制,使卷煙營銷工作一直很被動。與此同時,國際四大煙草公司包括菲莫國際公司、英美煙草公司、日本煙草公司、帝國煙草公司,在卷煙品牌培育、品牌衍生、品牌溢價等方面進行了大量探索和實踐,在國際煙草市場的份額合計約占50%,呈現壟斷格局。同時,這些國際煙草巨頭也相繼發(fā)力中國市場,外資煙草品牌在國內市場逐步擴張,市場占有份額逐步擴大。2019 年全國煙草工作會議上,國家煙草專賣局提出了“136/345”發(fā)展目標;國家煙草專賣局還提出了建設大品牌、大企業(yè)、大市場的行業(yè)戰(zhàn)略目標,以及品牌要做大、規(guī)格要做精的具體要求;我國“十四五”規(guī)劃和2035 年遠景目標綱要都將“加快推動數字產業(yè)化,推進產業(yè)數字化轉型”明確規(guī)定為打造數字經濟新優(yōu)勢的重要內容。

因此,煙草行業(yè)要引入先進的互聯(lián)網技術、數據挖掘技術、人工智能技術,實現煙草行業(yè)數字化轉型,解決煙草企業(yè)發(fā)展的痛點和難點問題,是新時代下復雜的國際國內競爭形勢給煙草行業(yè)帶來的重大挑戰(zhàn)和機遇,也是提高煙草企業(yè)核心競爭力,促進煙草經濟快速發(fā)展,提升我國煙草行業(yè)國際競爭力的必然要求。

為推動煙草行業(yè)數字化,提高煙草企業(yè)的核心競爭力,研究面向煙草企業(yè)的數據集市構建技術,并提出以提高企業(yè)核心競爭力為導向的數據集市構建框架圖,該框架主要包含數據收集、數據集市構建、數據管理與分析和數據應用等核心模塊。通過數據集市的構建與應用,為煙草產業(yè)深度賦能,推動產業(yè)變革、產業(yè)技術升級和產業(yè)經濟發(fā)展,促進煙草行業(yè)數字化轉型,化解煙草企業(yè)發(fā)展過程中的問題,確保煙草公司的核心競爭力,從而從容應對經濟新常態(tài)的挑戰(zhàn)。同時,可以加速構建卷煙“強國”,使我國煙草企業(yè)真正參與國際化競爭,減少國際煙草企業(yè)對我國煙草市場的沖擊。此外,可以優(yōu)化資源配置、促進生產要素合理流動,確保煙草行業(yè)的高質量發(fā)展。

1 研究背景

目前,中國煙草行業(yè)的數字化轉型得到了快速發(fā)展,不斷涌現出重要的研究文獻和研究成果。有研究者從市場狀態(tài)、終端需求強度、品牌貢獻度3 個維度設計卷煙品牌競爭力評價指標體系,構建基于熵權法的品牌競爭力模型,基于品牌競爭力評價結果、品牌生態(tài)調優(yōu)模型結果,合理推薦卷煙品牌的發(fā)展建議[1]。有研究者認為,依托線上線下融合的體驗營銷對于卷煙品牌培育有至關重要的作用,應用增強現實技術(Augmented Reality,AR)等新型技術,創(chuàng)新體驗營銷場景與體驗策略,提升卷煙消費者的產品感知度、體驗度和友好度,有效增強其對卷煙品牌的認同度[2]。也有研究者對卷煙目標消費者的特征及購買行為進行了深入分析,針對卷煙品牌培育存在的問題,明確卷煙目標消費者理論對改善現狀的積極作用,并提出基于目標消費者的卷煙品牌培育策略。以推動卷煙企業(yè)順應市場化改革,為實現大品牌、大企業(yè)、大市場的行業(yè)戰(zhàn)略目標,增強中式卷煙品牌的競爭力提供參考[3]。

此外,近年來知識圖譜相關技術在各行各業(yè)也得到了快速發(fā)展與應用。知識圖譜是一種語義網絡,通過三元組形式對客觀世界進行統(tǒng)一描述,其結點代表實體(Entity)或者概念(Concept),邊代表實體/概念之間的各種語義關系。實體是知識圖譜中最基本的元素,屬性是指一個實體指向它包含的屬性值,用實體、屬性、屬性值三元組刻畫實體的內在特性,關系是指兩個實體之間的某種關聯(lián),用實體、關系、實體刻畫實體之間的相互關聯(lián)。知識圖譜有自頂向下和自底向上兩種構建方式,針對自底向上的圖譜構建技術,主要包含數據清洗、信息抽取、知識融合、知識加工等幾個階段。

知識圖譜具有廣泛的應用場景。在人工智能領域,有研究者提出利用知識圖譜挖掘標簽之間的語義關系,提升視頻和圖片分類任務的準確性。在煙草領域,為解決煙草行業(yè)各系統(tǒng)中的多源、異構科研數據有效管理與利用問題,有研究者設計了煙草科研知識實體及關系的數據模型,研發(fā)了煙草科研知識圖譜服務平臺[4]。此外,隨著卷煙企業(yè)的不斷發(fā)展,在日常的生產工作中產生了大量寶貴的經驗和極具研究價值的知識,為預防卷煙企業(yè)知識和經驗的流失,有研究者提出將知識庫系統(tǒng)應用到卷煙企業(yè)[5]。同時,有研究者利用標簽體系對零售客戶精準畫像進行分類,深入挖掘煙草企業(yè)內部和企業(yè)外部數據,設計了一套全域標簽體系,極大助力了卷煙市場大戶管理、貨源精準投放等工作[6]。

2 以提升企業(yè)核心競爭力為導向的數據集市構建方案

為推動煙草行業(yè)數字化,提高煙草企業(yè)的核心競爭力,解決煙草企業(yè)發(fā)展過程中遇到的諸多問題,提出了數據集市構建與應用框架圖,如圖1 所示。該框架圖主要包含數據收集、數據集市構建、數據管理與分析和數據應用等幾個核心模塊。

圖1 數據集市構建框架圖

2.1 數據收集

為高效構建實用性強的數據集市,在數據收集階段需充分調研與煙草行業(yè)相關的各類數據,確定合理有效的數據源。

主要包含兩大類數據來源,即企業(yè)數據和社會數據。企業(yè)數據包含主數據、生產數據、業(yè)務數據和財務數據;社會數據包含社會經濟、政府管理和其他合作企業(yè)等數據,例如普查數據、年鑒等。主數據包含煙草局主數據和煙廠主數據,是核心基礎數據,例如煙草行業(yè)卷煙生產決策管理系統(tǒng)、省局營銷平臺、市場信息采集系統(tǒng)、現代終端信息管理系統(tǒng)含有的數據;生產數據主要包含工廠生產過程中需要采集的數據,例如材料采購、加工生產、卷煙存儲、能源供給、備品備件等數據;業(yè)務數據包含運輸配送、客戶銷售數據、客戶庫存數據、全方位用戶行為數據等與業(yè)務相關的多種數據;消費者數據包含消費者性別、年齡、地址、消費結構等;財務數據包含預算數據、成本數據、績效薪酬等多種數據。

總體而言,本文需采集的數據具有來源范圍廣、數據類型多、數據體量大等特點,同時涉及政府和企業(yè)內部的核心關鍵數據,故制定了符合法律法規(guī)要求的分布式數據采集和存儲機制。針對不同數據源的異構數據,解耦設計了多種符合需求的數據采集算法,并將算法分別部署在不同終端機器上,也將收集到的數據分別存儲于不同的終端機器。這種分布式數據采集和存儲機制可以按需分配計算和存儲資源,提高機器管理效率、數據共享效率和資源使用效率,在性能、可擴展性和可靠性方面具有較大優(yōu)勢。比如,單機數據存儲可能會由于機器故障導致關鍵數據丟失,而分布式數據采集和存儲,則可以有效應對單機故障或者計算機網絡故障等突發(fā)問題。

2.2 數據集市構建

知識圖譜是一種由三元組構成的語義網絡,其結點代表實體或者概念,邊代表實體/概念之間的各種語義關系。知識圖譜有自頂向下和自底向上兩種構建方式,為高效構建大規(guī)模實用數據集市,本文采用自頂向下的構建方式,主要涉及Schema 模型定義、數據獲取與清洗、數據集市構建與演化更新、人機協(xié)同等多個核心步驟。

首先,根據數據集市的構建需要滿足實際應用需求,構建數據集市的初始Schema 模型,這是高效構建高質量數據集市的核心和基礎。Schema 模型規(guī)范化了數據集市中的數據表達,即數據集市中應該包含哪些節(jié)點、節(jié)點之間有哪些連邊關系,以及節(jié)點和邊的屬性、數據類型的相關信息。一條數據只有滿足了Schema 模型的要求,才被允許更新到數據集市中。因此,初步抽象出數據集市應該包含的多種不同類型實體和各類型實體間多種關系,以及相關的屬性等信息。例如,與卷煙銷售相關的實體可以包含香煙種類、香煙等級、香煙品牌、香煙名稱、生產公司、銷售區(qū)域、銷售周期、上市時間、銷量、利潤、用戶性別、用戶年齡、用戶教育背景、用戶籍貫、用戶收入、用戶工作等。

其次,收集的大量相關數據主要分為三類,一類是相關數據庫中的結構化數據,一類是文本、圖片、視頻等非結構化數據,一類是網頁、百科等半結構化數據。這些多源異構數據難免存在數據重復、數據錯誤、數據之間存在沖突等多種問題。因此,需要通過數據挖掘、統(tǒng)計分析、預設規(guī)則等方法對數據進行清洗和整理,保證數據的一致性,以形成規(guī)范化數據,方便構建數據集市。

在數據清洗和整理過程中主要考慮以下幾個因素。一是處理數據中的無效值和缺失值,可以通過估算、變量刪除和成對刪除等方式完成,例如,通過平均值、最大值、最小值或概率估計等方式估算缺失值。二是檢查和刪除錯誤數據,例如,通過偏差分析發(fā)現可能的錯誤或異常數據,或者制定符合煙草行業(yè)數據特點的簡單規(guī)則進行錯誤數據識別。三是刪除重復數據。四是檢查數據的一致性,包括數據的取值范圍是否合理、數據語義是否存在沖突等。

數據集市的構建和演化更新主要包含信息抽取、知識融合、知識加工等幾個關鍵階段。信息抽取是通過實體識別、關系抽取和屬性抽取等技術從多源數據中提取出符合數據集市Schema 模型要求的相關實體、屬性以及實體間的關聯(lián)關系。實體識別使利用基于規(guī)則的識別方法以及基于機器學習的識別方法。關系抽取是指識別圖譜中實體間關系,是構建知識圖譜的重要環(huán)節(jié)。為高效抽取關系,聯(lián)合使用基于規(guī)則的關系抽取方法和聯(lián)合關系抽取方法。對于前者,本文設計了基于觸發(fā)詞模式的關系抽取模型。通過咨詢煙草行業(yè)的專業(yè)學者,依據煙草數據特點,本文構建了相關觸發(fā)詞庫,用于抽取實體間關系。對于后者,通過模型直接完成三元組抽取,并非將任務拆分為實體識別和關系分類兩個子任務。例如,利用Transformer 等預訓練大模型完成實體識別和關系抽取,具體包含特征抽取模塊、實體抽取模塊、關系分類模塊,關系分類模型可以利用BERT[7]預測實體間關系。

知識融合是指,由于通過不同數據源獲取的實體和關系存在重復、沖突、缺失等問題,因此需要通過實體鏈接、實體對齊、實體消歧等技術整合提取的知識,以消除矛盾和歧義,獲得統(tǒng)一的數據集市。知識加工主要是利用知識推理技術推理實體對之間可能存在的關系,用于知識圖譜的自動化補全。同時,根據新的需求和原始數據的更新,可以利用相關技術對圖譜進行演化更新。其中,知識圖譜推理是構建高質量數據集市以及數據集市得以演化更新的重要途徑。

知識圖譜推理是根據圖譜中已有的事實和關系推斷出未知的事實和關系,其在數據集市構建的各個階段都能發(fā)揮重要作用。例如,在知識融合過程中的實體對齊、在知識補全過程中的鏈接預測、在處理圖譜沖突信息時的實體消歧等都涉及知識圖譜推理技術。為充分發(fā)揮知識圖譜推理的作用,采用基于歸納的知識圖譜推理技術,其核心思想是通過分析和挖掘知識圖譜已有信息進行分析推理,主要包含基于圖結構的推理、基于規(guī)則學習的推理、基于表示學習的推理等方法,包含路徑排序算法(Path Ranking Algorithm,PRA)[8]、基于不完備知識庫的關聯(lián)規(guī)則挖掘算法(Association Rule Mining under Incomplete Evidence)[9]、Trans 系列算法(例如TransE[10])等算法。

因為數據規(guī)模大、數據集市體量大,完全依靠規(guī)則和算法構建的數據集市難免存在低質量信息或者錯誤信息,所以通過人機協(xié)同方式提升數據集市的質量。具體通過主動學習技術對自動抽取的知識進行篩選,將算法不確定或可能預測錯誤的結果進行標記,并輸入智標注平臺進行核對。本文提出了基于信息最大化的主動采樣框架,由于沒有歷史標注信息,通過最大化Fisher 信息實現。首先對標注過程進行建模,得到所有標注結果的對數似然函數l(x),可據此計算得到如下Fisher 信息量:

該信息量通常與樣本標注結果無關,僅取決于標注樣本本身,因此對標注噪聲魯棒。每次主動采樣時,需選擇使得Fisher 信息量最大的樣本進行標注。在該信息最大化問題中,本文以譜圖論為基礎,將其轉化為非歸一化的圖拉普拉斯算子(unnormalized graph Laplacian)的相關問題進行求解。

本文最終采用Neo4j 圖數據庫作為數據集市的存儲方式。

2.3 數據管理與分析

數據管理主要利用數據集成管理工具從數據標準管理、數據質量管理、數據安全管理、主數據管理等多個角度進行高效安全的數據管理。并通過數據分析建模工具從關聯(lián)、因果等多個角度深層挖掘數據價值,從企業(yè)經營、生產運行、工藝質量、財務等多個層面對業(yè)務經營活動進行賦值。

2.4 數據應用

數據應用主要包含智能生產、智能物流、智能財務、智能營銷、供應鏈、智能質量、智能管理、戰(zhàn)略決策等全方位立體化的應用服務。例如,智能財務可以實現自動化生成證財表、智能計算賦稅;智能營銷可以實現主動配貨,對客戶多維度分類,幫助零售戶提升、優(yōu)化卷煙營銷管理能力;智能物流可以實現物流線路的優(yōu)化、智能化工商網配管理等;智能生產可以指導原輔料進料、制絲生產、卷包生產、能源供給、備品備件物資供給直至卷煙成品打碼入庫的全生產過程。

3 結語

本文提出了以提升企業(yè)核心競爭力為導向的數據集市構建方案,旨在充分利用煙草行業(yè)相關的企業(yè)數據和社會數據,構建數據集市,充分分析和挖掘數據潛力,使其在煙草企業(yè)的發(fā)展和運營過程中充分發(fā)揮作用,為煙草企業(yè)充分賦能,促進煙草行業(yè)的數字化轉型,提高煙草公司的核心競爭力。

猜你喜歡
煙草
煙草具有輻射性?
CORESTA 2019年SSPT聯(lián)席會議關注新煙草、吸煙行為研究和雪茄煙
煙草控制評估方法概述
煙草依賴的診斷標準
我國煙草品牌微博營銷的反思
新聞傳播(2016年3期)2016-07-12 12:55:34
煙草中茄酮的富集和應用
SIMOTION運動控制系統(tǒng)在煙草切絲機中的應用
自動化博覽(2014年6期)2014-02-28 22:32:15
煙草鏡頭與歷史真實
聲屏世界(2014年6期)2014-02-28 15:18:09
百年煙草傳奇的云南敘事
西南學林(2013年2期)2013-11-12 12:58:54
煙草品種的SCAR標記鑒別
主站蜘蛛池模板: 国产精品99一区不卡| 国产精彩视频在线观看| 亚洲国产综合精品中文第一| 欧美成人a∨视频免费观看| 永久免费无码日韩视频| 免费国产在线精品一区| 情侣午夜国产在线一区无码| 久久国产精品麻豆系列| 欧美精品成人| 天天综合天天综合| 色婷婷久久| 日韩不卡高清视频| 综合亚洲色图| 在线视频亚洲欧美| 91视频日本| 亚洲成人动漫在线| 污网站在线观看视频| 精品国产福利在线| 久久国产成人精品国产成人亚洲| yjizz国产在线视频网| 国产美女叼嘿视频免费看| 色老头综合网| 国产免费黄| 国产成人综合日韩精品无码不卡| 国产高清在线精品一区二区三区| 国产精品美乳| 国产精品青青| 视频一区视频二区日韩专区| 无码网站免费观看| 人妻中文久热无码丝袜| 亚洲色无码专线精品观看| 九九香蕉视频| 欧美日韩午夜| 91精品啪在线观看国产| 国产精品刺激对白在线| 99久久人妻精品免费二区| 国产免费网址| 一级毛片免费高清视频| 国产成人精品视频一区视频二区| 在线看国产精品| 青青操国产视频| 波多野结衣一区二区三区四区| 国产一级无码不卡视频| 四虎影视国产精品| 最新国产麻豆aⅴ精品无| 波多野结衣第一页| 亚洲欧美不卡中文字幕| 亚洲国产理论片在线播放| 亚洲美女一区二区三区| 一级毛片免费观看久| 亚洲一级无毛片无码在线免费视频| 国产精品久久久久久久伊一| 色综合成人| 国产真实乱人视频| 久久黄色影院| 国产AV无码专区亚洲A∨毛片| 91在线播放免费不卡无毒| 国产剧情一区二区| 尤物国产在线| 中文字幕在线日本| 亚洲国产欧美目韩成人综合| 欧美久久网| 国产精品亚洲片在线va| 亚洲乱码精品久久久久..| 国产青榴视频在线观看网站| 毛片免费观看视频| 在线另类稀缺国产呦| 天天摸天天操免费播放小视频| 亚洲视频色图| 欧美www在线观看| 久久综合亚洲鲁鲁九月天| 精品国产成人a在线观看| 亚洲AV无码久久精品色欲 | 亚洲欧美日韩中文字幕在线| аv天堂最新中文在线| 三上悠亚精品二区在线观看| 日韩国产黄色网站| 99re视频在线| 影音先锋丝袜制服| 99成人在线观看| 欧美精品一区二区三区中文字幕| 久久99热这里只有精品免费看|