摘要:介紹了數據倉庫、OLAP和數據挖掘技術,闡述了傳統決策支持系統與數據倉庫、OLAP和數據挖掘技術相結合的新型智能決策支持系統的體系框架。
關鍵詞:數據倉庫;OLAP;數據挖掘;智能決策支持系統
1、引言
決策支持系統是從管理信息系統演變而來,把信息的內在規律挖掘出來為決策服務。眾所周知,決策支持系統從傳統的“三庫”(數據庫、模型庫、知識庫)結構、“四庫”(數據庫、模型庫、方法庫、知識庫)結構、發展到“五庫”(文本庫、數據庫、模型庫、方法庫、知識庫)結構,直到現在,人們把數據倉庫、OLAP技術引進到決策支持系統中,可以說,決策支持系統正一步步走向完善。而OLAP和數據挖掘是密不可分的,我們把數據倉庫、OLAP和數據挖掘與傳統的模型庫、知識庫、方法庫結合起來形成綜合的智能決策支持系統。
2、數據倉庫
數據倉庫是在管理人員決策中的面向主題的、集成的、非易失的并且隨時間變化而變化的數據集合。傳統的數據庫包含的數據信息一般都是事務型數據,支持操作;而數據倉庫的數據屬于分析型數據,主要支持決策分析。數據倉庫中的數據有的是來源于組織中的操作數據,也有一些可能是來源于組織外部。
3、OLAP技術
OLAP(聯機分析處理)是針對特定問題的聯機數據訪問和分析。通過對信息(維數據)的多種可能的觀察形式進行快速、穩定一致和交互性的存取,允許管理決策人員對數據進行深入觀察。OLAP的多維數據分析方法主要有slice(切片)、dice(切塊)、turning/pivot(旋轉/轉軸、drill(鉆?。?/p>
4、數據挖掘
數據挖掘的任務是從大量數據中發現有用的數據,提取隱含在其中的、人們事先不知道的但又可能有用的信息和知識。挖掘的結果需要進行評價才能最終成為有用的信息,按照評價結果的不同,數據可能需要反饋到不同的階段,重新進行分析計算。數據挖掘的基本算法包括分類規則挖掘、預測分析與趨勢分析規則、關聯算法、聚類算法、統計分析算法、品種優化算法、進化算法等。
5、OLAP與數據挖掘的關系
數據挖掘與0LAP不同的是,數據挖掘不是用于驗證某個假定的模式(模型)的正確性,而是在數據庫中自己尋找模型,沒有目標性。這兩種技術可以在一定程度上融合,更好地為決策分析服務。
6、基于數據倉庫、OLAP和數據挖掘的決策支持系統
數據倉庫和OLAP技術的發展為決策支持系統注入了新的活力,而OLAP-q數據挖掘的有機融合更是決策支持系統的一個很好的方法。如圖1所示,該結構是傳統的DSS結構與數據倉庫、OLAP和數據挖掘有機的結合起來,尤其是OLAP與數據挖掘相輔相成,形成新的決策支持技術,此結構將會更好地為DSS服務,輔助決策人員作出決策判斷。
6.1 人機交互接口
該部分提供了一個用戶與機器交互的一個平臺。首先,該部分可以方便用戶輸入信息,該信息可以是自然語言;其次,系統返回的結果通過該部分清晰地呈現給用戶,可以以多種用戶理解的形式顯示,例如,圖表、圖片,報表等形式;最后,該部分提供用戶中途退出該系統的功能,并能夠對問題進行添加、刪除、修改等操作。
6.2 問題處理系統
該部分主要是理解用戶的自然語言,并將自然語言或其他語言轉化為計算機識別的序列,并按照一定的推理策略處理問題。
6.3 數據倉庫管理子系統
數據倉庫源數據來源于數據庫,這些數據并不是最新的,專有的,而是面向主題的、集成的、不同時間的數據集合。OLAP技術主要基于數據倉庫執行。
數據倉庫管理系統主要負責對數據倉庫的更新、添加、刪除的相關的操作。
6.4 方法庫管理子系統
方法庫包括各種數值方法和非數值方法,比如預測方法(時序分析法、結構性分析法、回歸預測法等)、統計分析法(回歸分析、主成本分析法等)、優化方法(線性規劃法、非線性規劃法、動態規劃法、網絡計劃法等)及數學方法等。
方法庫管理系統負責對方法進行刪除、添加等操作,也可以根據數據挖掘的結果自動生成新方法。
6.5 模型庫管理子系統
模型庫是提供模型存儲和表示模式的計算機系統。模型庫是DSS的共享資源,它有一些具有支持不同層次的決策活動的基本模型,其中有一些為支持頻繁操作的單一模型,還有一些用于生成新模型的基本模塊和基本元素。包括預制的標準模型和為解決某種問題特制的模型,還有在進行數據挖掘過程中自動生成的模型。
模型庫管理系統主要負責對模型庫中的模型進行添加、刪除、修改等操作。
6.6 知識庫管理子系統
知識庫中包含專家長期積累起來的經驗性知識和數據挖掘過程中得到的知識,并結合一些事實規則及運用人工智能等有關原理,通過建立推理機制來實現知識的表達與運用。
知識庫管理系統負責對知識添加、刪除、修改等操作。
6.7 OLAP、數據挖掘模塊
在進行決策的過程當中,運用OLAP技術進行在線分析,通過建立多維數據庫,采用多維分析的方法對特定問題數據進行分析,將結果返回給用戶,供決策者分析;而數據挖掘技術可以在OLAP分析的基礎上繼續進行數據挖掘,利用各種專門的算法,如關聯規則、決策樹、遺傳算法等建立模型,發現知識。OLAP為數據挖掘提供預期的挖掘對象和目標,數據倉庫為數據挖掘提供數據,模型庫為數據挖掘提供模型,知識庫為數據挖掘提供知識,方法庫為數據挖掘提供方法,然后生成新的模型,新的知識。如此循環,不斷完善,以更好地為決策者服務。
7、結束語
本文提出的結構采用模塊式,比較直觀。本文只是作者提出的一種結構,某些技術尚未解決,具體實現還有待于進一步研究。