通信行業是典型的數據密集型行業,相比其他行業來說,擁有更多的用戶的數據。隨著通信行業體制的改革,行業的競爭也愈加激烈,正確、迅速的處理數據并得到更多的有效的信息,就能夠更好為用戶服務,這成了在競爭中制勝的關鍵點。數據倉庫技術應運而生,通過將海量的數據變為有效的信息來為企業決策提供依據。
1數據倉庫技術
(一)基本概念
數據倉庫的概念是:面向主題、集成的、穩定的、隨時間變化的數據集合,是用來支持慣例決策的過程。一般來說,數據倉庫是一種多個異種數據源在單個站點以統一的模式組織的存儲過程。數據倉庫針對數據的處理包括了數據的選擇、分析、轉換與加載。對于數據來說,數據在數據倉庫中是有各自的生命周期的,當數據沒有價值之后,將會被從倉庫中清除。
(二)數據轉換
高效率、高質量的數據轉換是決策成功的重要基礎。但是在實際的操作中,數據的收集和維護并不是那么容易完成,主要的困難有三個:過程因素、人為因素和技術問題。為了使ROI達到最高且保證每個數據都正確,需要花費大量的人力和財力。因此,所有的數據在進入數據倉庫時,都需要經過選擇、轉換以及加載3個步驟,以保障數據的質量,數據轉換流程圖如圖1所示。
(一)數據處理
在通信領域里,數據倉庫技術的應用是對經營分析管理的又一次提升,數據倉庫技術經常用于數據處理,但是數據繁多,因此要謹慎選擇處理數據的方案。目前,主流數據倉庫的數據處理專業工具有:CA,NCR,IBM,Informix(IBM),Oracle和SAS。其中SAS的效率相對較高,因此在國際學術界里有一個約定俗成的規則:只要是SAS統計分析的結果,不要求說明詳細的算法。所以在這里以SAS的應用來舉例分析。在實際的數據處理中,SAS8.0有很有好的人機對話界面,不僅可以通過編程的方式進行數據處理,還可以通過在對話框中選擇相應的命令來間接的得到數據處理的代碼,進行數據處理。但是SAS也有它的劣勢,那就是SAS的數據倉庫是相對落后的數據集模式。盡管如此,依舊可以這么說,SAS瑕不掩瑜。所以由于SAS數據處理的功能以及對數據的針對性要比其他的專業工具都占優勢,所以在實際操作中還是選擇SAS作為數據處理工具的居多。于此同時,為了彌補SAS的數據庫在技術上的不足,數據倉庫的存儲就采用了時下最流行的Oracle數據庫。
(二)數據分析
對于通信行業來說,一個經營分析系統必不可少。其不僅要具有旋轉、切片、鉆取等PLAP功能外,更重要的是要有功能強大并且完整的Web端。在數據倉庫技術的應用中,數據分析是很重要的一塊,主要的分析工具有:Cognos,Business Objects,Brio。其中Brio更加適合通信企業經營分析系統的要求,比如Brio可以支持Web/Intranet環境,并且報表生成速度快,支持多種數據導出格式,如excel,pdf,txt,html,csv等。其離線分析方式也保證了經營分析系統的性能不會受到用戶的增加而減弱。
(三)在經營分析系統中數據處理的實現
從目前通信行業的市場來看,企業在構建自己的分析型系統之前,已經會存在一些業務系統。這些系統的存在代表了整個企業目前的業務情況,其中的數據一般是高粒度的,是企業數據倉庫的首要數據來源。在實際操作中,這些數據要進行選擇、轉換、加載等幾個步驟的處理之后才能進入數據倉庫。其中數據的轉換指的是從已存在的業務系統中抽取的源數據根據數據倉庫系統模型的要求,進行數據的轉換、清洗、合并、拆分、匯總等處理,并保證來自不同業務系統、格式有差別的數據的一致性和完整性。然后進行的加載就是把數據源系統中進行轉換后的數據加載到數據倉庫中,其具體的流程如圖2所示。
綜上所述,通信行業日益增多信息數據是一個巨大的機遇,也是一個難度不小的挑戰。發展數據倉庫技術,通過對數據的不斷分析和研究,積極挖掘出更深層次的規律,將會有巨大的發展前景。當然,數據倉庫的建設是一個十分漫長的過程,步驟繁多,要遵循分階段、循序漸進的原則。除此之外,作為通信行業最關心的主題,實用性也是要遵守的。要盡可能使用簡單、統一的方式來實現數據的處理。最重要的是在設計以及開發的過程中,要有相關專家培訓和指導,以確保技術應用的合理性和系統的質量。