[摘 要] 將人工智能理論引入決策支持系統(tǒng),構成智能決策支持系統(tǒng)。數(shù)據庫是智能決策支持系統(tǒng)的重要組成部分,本文介紹了元數(shù)據的基本概念,將基于元數(shù)據的數(shù)據倉庫技術運用到智能決策支持系統(tǒng)中,提出一個新的智能決策支持系統(tǒng)框架。
[關鍵詞] 元數(shù)據;Agent;數(shù)據倉庫;決策支持系統(tǒng)
doi : 10 . 3969 / j . issn . 1673 - 0194 . 2010 . 11 . 027
[中圖分類號]F270.7;C931.9 [文獻標識碼]A [文章編號]1673 - 0194(2010)11- 0071 - 02
決策支持系統(tǒng)(Decision Support System, DSS)是綜合利用大量數(shù)據,有機結合眾多模型,通過人機交互,輔助各級決策者實現(xiàn)科學決策的系統(tǒng)。隨著人工智能技術的發(fā)展,將知識處理方法和知識庫系統(tǒng)引入DSS形成了智能決策支持系統(tǒng)(Intelligent Decision Support System, IDSS)。數(shù)據庫是IDSS中的一個重要組成部分,面對數(shù)據庫中的大量數(shù)據,如何從這些數(shù)據中挖掘出有用的信息進行預測分析已越來越成為技術人員和決策者關心的問題。數(shù)據倉庫是支持管理決策過程的、面向主體的、集成的、不可更新的且隨時間不斷變化的數(shù)據集合。利用數(shù)據倉庫,對源數(shù)據進行提取、轉換、加載形成統(tǒng)一的數(shù)據格式,再利用數(shù)據挖掘和OLAP分析工具為決策者提供所需的信息。作為數(shù)據倉庫重要組成部分的元數(shù)據,可以幫助數(shù)據倉庫項目小組明確而全面的理解潛在數(shù)據源的物理布局以及所有數(shù)據源的業(yè)務定義,幫助決策者有效的使用倉庫中的信息。
文章簡要介紹了一下元數(shù)據的概念和它在數(shù)據倉庫中的應用,提出了一個新的基于元數(shù)據的數(shù)據倉庫的組織形式,并結合Agent技術將這種數(shù)據倉庫應用于智能決策支持系統(tǒng)中,使之更有效的進行決策。
1元數(shù)據概述
元數(shù)據最本質、最抽象的定義為:data about data (關于數(shù)據的數(shù)據)。元數(shù)據是可以用來定義存儲在數(shù)據庫中的數(shù)據形式的數(shù)據。換句話說,元數(shù)據包括了對系統(tǒng)自身有用的各種對象的細節(jié)信息。它是一種廣泛存在的現(xiàn)象,在許多領域中有其具體的定義和應用。
在數(shù)據倉庫領域中,元數(shù)據被定義為:描述數(shù)據及其環(huán)境的數(shù)據。一般來說,它有兩方面的用途。首先,元數(shù)據能提供基于用戶的信息,如記錄數(shù)據項的業(yè)務描述信息的元數(shù)據能幫助用戶使用數(shù)據。其次,元數(shù)據能支持系統(tǒng)對數(shù)據的管理和維護,如關于數(shù)據項存儲方法的元數(shù)據能支持系統(tǒng)以最有效的方式訪問數(shù)據。從數(shù)據倉庫管理人員來看,元數(shù)據是在數(shù)據倉庫中所有內容和所有處理過程的一個全面的倉庫和文件;從最終用戶的觀點來看,元數(shù)據是數(shù)據倉庫中所有信息的路標。只要是支持和管理數(shù)據倉庫操作的任何所需的信息,元數(shù)據都將包括。具體來說,在數(shù)據倉庫系統(tǒng)中,元數(shù)據機制主要包含以下內容: ① 描述哪些數(shù)據在數(shù)據倉庫中; ② 定義要進入數(shù)據倉庫中的數(shù)據和從數(shù)據倉庫中產生的數(shù)據;③ 記錄根據業(yè)務事件發(fā)生而隨之進行的數(shù)據抽取工作時間安排; ④ 記錄并檢測系統(tǒng)數(shù)據一致性的要求和執(zhí)行情況; ⑤ 衡量數(shù)據質量。
元數(shù)據是抽象的數(shù)據,但元數(shù)據的重要性也正體現(xiàn)在其所包含的信息中。例如,元數(shù)據用作目錄,可以幫助DSS分析者對數(shù)據倉庫的內容定位;當數(shù)據由操作環(huán)境到數(shù)據倉庫環(huán)境映射時,作為數(shù)據映射指南;對于用在當前細節(jié)數(shù)據與低度綜合的數(shù)據之間及低度綜合的數(shù)據和高度綜合的數(shù)據之間的匯總算法。如果沒有元數(shù)據,數(shù)據倉庫中的數(shù)據是完全孤立著的,元數(shù)據正如一座橋梁將他們聯(lián)系起來。
2基于元數(shù)據的數(shù)據倉庫模型
本模型在將元數(shù)據應用于數(shù)據倉庫的同時,設計了5種功能Agent對數(shù)據進行查找和獲取,使之更有效的將元數(shù)據與數(shù)據倉庫中的數(shù)據進行匹配。
2.1 基于元數(shù)據的數(shù)據信息查找與獲取
為了更有效地管理數(shù)據倉庫中大量的數(shù)據,作者設計了一種基于元數(shù)據的數(shù)據倉庫模型,在這個模型中,設計了5種功能Agent來完成對數(shù)據的查找獲取任務:數(shù)據讀取Agent,數(shù)據讀取控制Agent,數(shù)據映射Agent,位置查找Agent,位置查找控制Agent。
位置查找Agent和數(shù)據讀取Agent接收數(shù)據查詢請求,將他解釋成一個計算機可識別、可比較的數(shù)據請求任務,前者將該任務傳遞給位置查找控制Agent,而后者則將該任務傳給數(shù)據讀取控制Agent。
位置查找控制Agent得到數(shù)據請求任務后,根據元數(shù)據信息,連接到元數(shù)據庫,在元數(shù)據庫中查找匹配目標數(shù)據的組成及其位置信息,并將獲得的目標數(shù)據的組成和位置信息交給數(shù)據讀取控制Agent。
數(shù)據讀取控制Agent得到目標信息的組成及其位置信息后,再將所得結果交給數(shù)據映射Agent。數(shù)據映射Agent根據數(shù)據的位置信息及相關要求,與數(shù)據倉庫進行交互,得到目標數(shù)據并返回給數(shù)據讀取控制Agent。由于目標數(shù)據可能分布在不同的數(shù)據倉庫中,數(shù)據讀取控制Agent可以按照位置信息將數(shù)據按照所屬的數(shù)據倉庫進行歸類,并據此將數(shù)據讀取任務進行劃分,將這些數(shù)據讀取子任務交給不同的數(shù)據映射Agent分別訪問不同的數(shù)據倉庫以獲得目標數(shù)據。這些數(shù)據映射Agent可以并行地執(zhí)行,從而提高了數(shù)據讀取的效率。
2.2 元數(shù)據管理的實現(xiàn)
在數(shù)據倉庫中元數(shù)據不是一成不變的,元數(shù)據管理器執(zhí)行對元數(shù)據的管理和維護。元數(shù)據管理的主要任務是負責存儲和維護元數(shù)據庫中的元數(shù)據,一般來說除了數(shù)據源監(jiān)視器產生的元數(shù)據外,其他模塊或工具產生的元數(shù)據都是通過元數(shù)據管理器存入元數(shù)據庫的。
2.2.1數(shù)據源及數(shù)據源監(jiān)視器
數(shù)據倉庫的數(shù)據來自于多個異構的的數(shù)據源,他們可以使各種類型的數(shù)據庫、文本文件、甚至是Web數(shù)據。因此對各個數(shù)據源的描述是最基本的元數(shù)據,主要是在數(shù)據倉庫建模工具中定義。在數(shù)據倉庫的運行過程中,數(shù)據源中的數(shù)據可能會發(fā)生變化,這就會使得數(shù)據倉庫中的數(shù)據過期,因此必須要進行定期或不定期的更新。
2.2.2數(shù)據倉庫建模工具
建模工具幫助用戶通過需求分析創(chuàng)建數(shù)據倉庫的數(shù)據模式,同時還要定義模式中各個表的數(shù)據來源、數(shù)據轉換規(guī)則、有關的聚集操作等信息,與元數(shù)據管理的關系較密切。數(shù)據轉換的基本規(guī)則有:一對一抽取;多對一抽取;混合抽取。
2.2.3元數(shù)據瀏覽器
元數(shù)據管理的目的就是為了給數(shù)據倉庫的各有關模塊或人員元數(shù)據服務。元數(shù)據瀏覽器可以分門別類地組織和顯示各種元數(shù)據,供數(shù)據倉庫管理員或最終用戶根據需要瀏覽或查看他所關心的元數(shù)據。當然,并不是每個用戶都能瀏覽所有的元數(shù)據,通過用戶授權規(guī)定每個用戶的級別,借此控制每個用戶所能看到的元數(shù)據。
3基于數(shù)據倉庫的智能決策支持系統(tǒng)
基于數(shù)據倉庫的智能決策支持系統(tǒng)是將數(shù)據倉庫技術和人工智能技術應用于決策支持系統(tǒng)中,以更加有效地進行決策。以往建立的決策支持系統(tǒng),大多數(shù)都是以關系數(shù)據庫為基礎的,使得數(shù)據缺乏組織性,分析效率低下并無法支持靈活多變的分析需求。數(shù)據倉庫作為一種管理技術,旨在通過通暢、合理、全面的信息管理達到有效的決策支持。
接口Agent與用戶進行交互,接受用戶決策任務,并將任務交給問題求解Agent;最后再與用戶進行交互,對問題的中間結果或最終解決方案予以選擇或確認。
信息管理與協(xié)作Agent負責協(xié)調與控制Agent之間的交互與通訊。
問題求解Agent根據用戶決策任務,對任務進行分解,組織各種其它Agent完成各子任務,并對各個Agent的完成結果進行綜合,最終形成問題的解決方案。
模型庫管理Agent根據具體的決策子任務,從決策模型庫中選擇一個適當?shù)哪P瓦M行解釋執(zhí)行。模型的完整執(zhí)行可能需要其它Agent進行協(xié)作。
知識庫管理Agent根據決策任務或模型執(zhí)行的需要,利用知識或規(guī)則進行推理,以獲得完成決策任務所需的目標知識或應采取的動作。在此過程中,也需要與其它Agent協(xié)作。
數(shù)據庫管理Agent獲取模型執(zhí)行或推理過程中所需的數(shù)據以及元數(shù)據。
從上述體系結構可以看出,使用Agent技術,DSS的功能還是一樣的,但是在系統(tǒng)的結構、工作方式以及實現(xiàn)的方法等方面,更加簡單、清晰,各Agent之間相對獨立性比較高,相互之間的關系可以在運行階段進行設定,而不是在系統(tǒng)設計時預先確定。
4總結
數(shù)據倉庫系統(tǒng)可將來自各個數(shù)據庫的信息進行集成,從事物的歷史和發(fā)展的角度來組織和存儲數(shù)據,供用戶進行數(shù)據分析,并輔助決策支持,為決策者提供有用的決策支持信息與知識。因此基于這一技術的決策支持系統(tǒng)為決策支持系統(tǒng)提供了可取的數(shù)據組織方式、為決策人員提供了強有力的支持工具,能有力地推動決策的現(xiàn)代化進程。文章初步提出了一個基于元數(shù)據的數(shù)據倉庫在IDSS中的應用模型,由于系統(tǒng)設計和實現(xiàn)技術的局限性,此模型還需要進一步的完善。
主要參考文獻
[1] Anne J Gilliland-Swetland. Setting the Stage[M] // Murtha Baca(Eds). Introduction to Metadate:Pathways to Digital Information. Las Angels, CA: Getty Publications,2000.
[2] Jill Dyche. Data Warehouse, Metadata and Middleware[J]. EAI Journal, 2000(9):71-76.
[3] 徐立臻,劉安,等. 數(shù)據倉庫系統(tǒng)中的元數(shù)據管理[J]. 計算機工程與應用, 2002,38(24):193-196.
[4] 史忠植. 智能主體及其應用[M]. 北京:科學出版社, 2000.
[5] 廖璘,王立剛,等. 構造數(shù)據倉庫系統(tǒng)的元數(shù)據[J].計算機工程與應用,2001,37(16):94-96.