999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

分層理論在車聯網數據倉庫的應用

2023-08-27 23:37:00唐文笙張亮韋通明廖甜匯溫麗梅
汽車電器 2023年8期
關鍵詞:大數據

唐文笙 張亮 韋通明 廖甜匯 溫麗梅

【摘? 要】隨著智能網聯汽車的快速發展,各大汽車企業積累了龐大的業務數據,如何有效組織并使用這些數據,成為了各個企業所必須面對的問題。本文基于維度建模分層理論,結合實際車輛網聯數據,設計了車聯網數據倉庫,為各大汽車企業管理者提供一個組織并使用數據的解決方案,也為汽車數據行業工作者提供一些簡單的參考。

【關鍵詞】大數據;汽車行業;數據倉庫

中圖分類號:U463.6? ? 文獻標志碼:A? ? 文章編號:1003-8639( 2023 )08-0056-03

Application of Hierarchical Theory in Internet of Vehicles Data Warehouse

TANG Wen-sheng,ZHANG Liang,WEI Tong-ming,LIAO Tian-hui,WEN Li-mei

(SAIC GM Wuling Automobile Co.,Ltd.,Guangxi Laboratory of New Energy Automobile,

Guangxi Key Laboratory of Automobile Four New Features,Liuzhou 545007,China)

【Abstract】With the rapid development of intelligent connected vehicles,the major automobile enterprises have accumulated huge business data. How to effectively organize and use these data has become a problem that all enterprises must face.Based on the theory of dimension modeling and layering,combined with the actual vehicle network data,this paper designs the vehicle network data warehouse,which provides a solution for the managers of major automobile enterprises to organize and use the data,and also provides some simple references for the workers in the automobile data industry.

【Key words】big data;automobile industry;data warehouse

1? 引言

近年來,隨著汽車行業各種業務系統的不斷發展,產生了越來越多的歷史數據,這是汽車行業非常重要的戰略資源。將這些重要業務數據存儲在數據倉庫中進行統一管理、數據分析和挖掘潛在的重要業務信息,可以很好地幫助汽車企業領導層的管理和決策,最大限度地提高汽車企業的經濟效益,使汽車企業更好更快地發展。在大數據時代,基于數據倉庫的數據挖掘已經成為汽車企業競爭的重要工具。

2? 數據倉庫介紹

數據倉庫創始人W.H.Inmon定義了數據倉庫,“數據倉庫是面向主題的、集成的、不可更新的,并隨時間不斷變化的數據集合,用以支持管理部門的決策分析過程”。其中定義了數據倉庫的幾個特點:面向主題的、集成的、不可更新的。如圖1所示。

1)面向主題的:數據倉庫中的數據是面向主題的,對應于傳統數據庫面向應用的數據組織特點。主題是一個抽象的概念,也可以說主題是業務相關的數據的類別,每個主題對應一個宏觀的分析領域。

2)集成的:集成的概念與面向主題的概念密切相關。一個公司有多條產品線與產品渠道,每個產品線都有自己獨立的數據庫。此時需要從公司層面整體分析所有數據,就必須要集成每個產品線的數據,將多個分散的數據源統一成一致的、無歧義的數據格式,再放置到數據倉庫中進行分析,這就是所說的集成的概念。

3)不可更新的:數據倉庫中的數據主要用于企業決策分析。涉及的數據操作主要是數據查詢,一般不進行修改[1]。數據倉庫數據反映了很長一段時間內歷史數據的內容,是不同時間點數據庫快照的集合,并基于這些快照對導出數據進行統計、合成和重組,而不是對數據進行在線處理[2]。

3? 分層理論介紹

數據倉庫從數據源到采集與多層清洗加工,形成以數據資產為核心的數據倉庫,在這一過程中,形成了一套規范的數據邏輯分層。數據邏輯分層包括ods層、dwd層、dws層、dim層以及app層[3]。數據分層及其對應描述見表1,分層理論數據流向示意如圖2所示。

4? 分層理論在車聯網數據倉庫的應用

伴隨著智能網聯汽車的發展,車聯網數據日益龐大,傳統數據庫已經不再使用對海量車聯網數據的存儲、搜索和分析,效率低、業務需求實現周期長。此時采用數據倉庫對原始車聯網數據進行重構便可以很好地解決傳統數據庫所面臨的問題,將分層理論應用至車聯網數據倉庫,各個層級對應操作如下。

一是車聯網ods層,建立統一數據表,接入多個軟件的數據源,具體數據表見表2。

二是車聯網dwd層,在實際車聯網數據中,受到各種實際工況的影響,車聯網數據字段值會存在空值、異常值等錯亂數據的現象,在dwd層可對每個字段的錯亂數據進行清洗,字符串類型的空值數據清洗為unknown,數值類型的空值數據清洗為0,時間類型的空值數據清洗為‘2001-01-01 00:00:00,日期類型的空值數據清洗為‘2001-01-01。另外,針對于業務需求,對埋點名稱中的錯亂數據也定義了清洗規則,將埋點名稱中的前后空格均去除,例如:埋點名稱=‘ b_m_01 清洗為埋點名稱=‘b_m_01。經過上述清洗過程,可以有一個系統的、完整的、干凈的、具有一致性的dwd層數據。表2經過清洗后得到表3。

三是車聯網dws層,在本層對dwd層的數據進行輕度匯總加工,將發生時間拆分成發生日期、發生小時,同時保留其他全部的數據字段,增加計算指標:使用次數,用于統計某臺車在某個日期、某個小時、某個地點的某個功能的使用次數。表3經過匯總加工后得到表4。

四是車聯網dim層,dim層匯總一些常用維度,例如日期維度、地區維度、車型維度。其中,日期維度表包含了2001~2030年每個日期對應的年份、季度、月份、季節、每周幾等信息,地區維度表包含了中國境內各省市區縣對應的中文全稱、中文拼音、所屬大區、省份簡稱等信息,車型維度表則包含了車輛的車輛識別碼、生產日期、銷售日期、車輛型號、車輛配置等信息。另外還有一個埋點維度表,埋點維度表針對dwd中的每個埋點名稱進行標簽分類,包含了埋點名稱的1級、2級、3級、4級標簽以及相關的觸發方式。

五是車聯網app層,app層結合應用場景梳理了4個顆粒度的數據應用表,分別為小時、天、周、月。下面一一介紹各個顆粒度數據表內容。

1)小時顆粒度:按小時統計各個車型1級、2級、3級、4級標簽的使用次數。

2)天顆粒度:按天統計各個車型1級、2級、3級、4級標簽的使用次數。

3)周顆粒度:結合dim層中日期維度表,按周統計各個車型1級、2級、3級、4級標簽的使用次數。

4)月顆粒度:結合dim層中日期維度表,按月統計各個車型1級、2級、3級、4級標簽的使用次數。

表4針對應用場景可匯總形成表5。

可以看到,ods數據經過數據倉庫各個層級的處理之后,可以得到一個標簽化的統計指標,數據更加規整,提高了數據的可用性。

5? 總結

數據倉庫內部分層并非為了分層而分層,分層是為了解決ETL任務以及工作流的組織、數據的流向、讀寫權限的控制、不同需求的滿足等各類問題。一個良好的分層應當有清晰的數據結構體系,可以做到精準血緣追蹤,同時減少重復開發以及資源浪費。

本文基于維度建模分層理論實現了車聯網數據倉庫,可以很好地整合處理車聯網數據,并針對不同應用場景定制化數據服務。此數據倉庫層次清晰,各層的作用域明確,實現復雜度不高,可為多種車輛數據的收集、統計和分析提供參考。不足之處是對數據的分析和處理過于單一,在以后的工作中,可以嘗試使用一些人工智能的方法對數據進行處理和分析,挖掘出更多的數據價值。

參考文獻:

[1] 孟祥怡,梁士福,張天強,等. 新能源汽車充電用戶行為大數據分析及應用[J]. 汽車文摘,2021(3):34-39.

[2] 周飛,劉夢娜,張暉,等. 商業銀行數據倉庫系統中ETL的設計與實現[J]. 軟件工程,2018,21(11):42-45.

[3] 王雪檸,翟媛,陳顥. “十四五”時期我國汽車產業發展趨勢簡析[J]. 汽車工業研究,2021(4):2-7.

[4] 葛鵬,劉森. 大數據時代對汽車行業的影響分析[J]. 產業與科技論壇,2013,12(24):23-24.

[5] 奉國和,利偉業. 數據倉庫在航空客戶關系管理中的應用設計[J]. 情報雜志,2006(7):32-35.

(編輯? 凌? 波)

作者簡介

唐文笙(1997—),男,助理工程師,研究方向為數據倉庫建設。

猜你喜歡
大數據
基于在線教育的大數據研究
中國市場(2016年36期)2016-10-19 04:41:16
“互聯網+”農產品物流業的大數據策略研究
中國市場(2016年36期)2016-10-19 03:31:48
基于大數據的小微電商授信評估研究
中國市場(2016年35期)2016-10-19 01:30:59
大數據時代新聞的新變化探究
商(2016年27期)2016-10-17 06:26:00
淺談大數據在出版業的應用
今傳媒(2016年9期)2016-10-15 23:35:12
“互聯網+”對傳統圖書出版的影響和推動作用
今傳媒(2016年9期)2016-10-15 22:09:11
大數據環境下基于移動客戶端的傳統媒體轉型思路
新聞世界(2016年10期)2016-10-11 20:13:53
基于大數據背景下的智慧城市建設研究
科技視界(2016年20期)2016-09-29 10:53:22
數據+輿情:南方報業創新轉型提高服務能力的探索
中國記者(2016年6期)2016-08-26 12:36:20
主站蜘蛛池模板: 亚洲制服中文字幕一区二区| 男人天堂伊人网| 狠狠五月天中文字幕| 亚洲一区二区在线无码 | 亚洲午夜福利在线| 欧美乱妇高清无乱码免费| 日韩美一区二区| 欧美a在线| 免费一级大毛片a一观看不卡| 久久香蕉国产线看精品| 亚洲成人www| 国产爽歪歪免费视频在线观看| 亚洲Aⅴ无码专区在线观看q| 尤物成AV人片在线观看| 亚洲成av人无码综合在线观看| 996免费视频国产在线播放| 蜜臀av性久久久久蜜臀aⅴ麻豆 | 动漫精品啪啪一区二区三区| 亚洲国产成熟视频在线多多| 伊人无码视屏| 中文字幕在线日本| 亚洲 成人国产| 91精品国产自产在线老师啪l| 最近最新中文字幕在线第一页| 国产一在线| 19国产精品麻豆免费观看| 国产成人一级| 91福利片| 极品私人尤物在线精品首页 | 99精品视频在线观看免费播放| 婷婷六月综合网| 亚洲欧美h| 国产精品漂亮美女在线观看| 午夜电影在线观看国产1区| 538国产视频| 成人看片欧美一区二区| 亚洲最大情网站在线观看| 她的性爱视频| 久精品色妇丰满人妻| 久久福利片| 亚洲第一黄色网址| 日韩精品高清自在线| 狠狠亚洲婷婷综合色香| 精品国产一区二区三区在线观看| 日本成人精品视频| 真实国产精品vr专区| 高潮毛片免费观看| 国产无码精品在线播放| 欧美国产视频| 亚洲国产成人超福利久久精品| 国产95在线 | 日本在线视频免费| 在线中文字幕网| 国产中文一区二区苍井空| 免费不卡视频| 亚洲成人在线免费| 色综合中文综合网| 国产小视频在线高清播放| 激情综合图区| 亚洲 欧美 中文 AⅤ在线视频| 夜精品a一区二区三区| 久久精品这里只有国产中文精品| 日韩欧美国产区| 精品国产Ⅴ无码大片在线观看81| 看av免费毛片手机播放| 欧美在线天堂| 亚洲综合第一页| 亚洲天堂.com| 亚洲男人天堂2020| 91日本在线观看亚洲精品| 无码国内精品人妻少妇蜜桃视频| 日本精品中文字幕在线不卡| 日韩资源站| 国产亚洲欧美日韩在线观看一区二区| 喷潮白浆直流在线播放| 国产呦视频免费视频在线观看| 波多野结衣一二三| 午夜精品国产自在| 露脸真实国语乱在线观看| 亚洲欧美日韩精品专区| 色婷婷视频在线| 日韩黄色大片免费看|