摘要 DSS的應用可分為二類:例行分析處理和啟發式分析處理。前者是指那些重復進行的分析處理,它通常是屬于部門級的應用,如部門統計分析,報表分析等等。后者指在個人級的分析應用中由于隨機性很大,決策者受到某種信息啟發而進行的一些興席的分析處理。
關鍵詞 SAS系統 應用管理 基本組成 功能
中圖分類號:G642 文獻標識碼:A
管理數據倉庫的日常活動。數據倉庫的開發是逐步完善的開發方法,它要求能盡快地讓系統運行起來,盡早產生收益;要在系統運行或使用中,不斷地理解需求,調整和完善系統。管理數據倉庫的工作主要是管理日常數據裝入的工作,包括刷新數據倉庫的當前詳細數據、將過時的數據轉化成歷史數據、清除不再使用的數據、調整粒度級別,管理元數據等;另外還有,如何利用接口定期從操作型環境向數據倉庫追加數據,確定數據倉庫的數據刷新頻率等。
一、SAS數據倉庫
早期的計算機主要是用來進行數據處理或稱數據計算的,隨著計算機技術及其外圍設備和通信能力的提高,計算機更多地用于大量繁雜事務的在線處理、千百萬設備的實時控制等。在此過程中,計算機系統積累了越來越多的數據,數據處理的任務更加繁重。在當今,企業面對堆積如山的數據應如何正確處理以支持經營者做出正確的決策,是關系到企業成敗的大事。美國SAS軟件從20世紀60年代在北卡州立大學就致力于計算機數據處理的研究,幾十年來,無數的成功事例使人們推崇SAS為國際上標準的數據統計軟件。SAS具有豐富的數據采集、數據管理、數據分析和信息展現等功能,使之成為決策支持系統的最好工具,下文簡單介紹SAS軟件的基本組成和功能。
二、SAS系統的基本組成
SAS系統是一個組合軟件系統,它由多個功能模塊組合而成,其基本部分是BASE SAS模塊。BASE SAS模塊是SAS系統的核心,承擔著主要的數據管理任務,并管理用戶使用環境,進行用戶語言的處理,調用其他SAS模塊和產品。也就是說,SAS系統的運行,首先必須啟動BASE SAS模塊,它除了本身所具有數據管理、程序設計及描述統計計算功能以外,還是SAS系統的中央調度室。它除可單獨存在外,也可與其他產品或模塊共同構成一個完整的系統。各模塊的安裝及更新都可通過其安裝程序非常方便地進行。SAS系統具有靈活的功能擴展接口和強大的功能模塊,在BASE SAS的基礎上,還可以增加如下不同的模塊而增加不同的功能:SAS/STAT(統計分析模塊)、SAS/GRAPH(繪圖模塊)、SAS/QC(質量控制模塊)、SAS/ETS(經濟計量學和時間序列分析模塊)、SAS/OR(運籌學模塊)、SAS/IML(交互式矩陣程序設計語言模塊)、SAS/FSP(快速數據處理的交互式菜單系統模塊)、SAS/AF(交互式全屏幕軟件應用系統模塊)、SAS/ACCESS(數據抽取)、SAS/WA(數據倉庫管理)、SAS/EIS(菜單驅動的行政信息系統開發工具)、SAS/INSIGHT(交互式數據探索與可視化工具)、SAS/Enterprise Miner(數據挖掘產品)等。SAS有一個智能型繪圖系統,不僅能繪各種統計圖,還能繪出地圖。SAS提供多個統計過程,每個過程均含有極豐富的任選項。用戶還可以通過對數據集的一連串加工,實現更為復雜的統計分析。此外,SAS還提供了各類概率分析函數、分位數函數、樣本統計函數和隨機數生成函數,使用戶能方便地實現特殊統計要求。
三、SAS數據倉庫的功能
數據倉庫是適應決策支持系統的需要而產生的,所以人們希望所采用的軟件產品能支持決策過程的全部工作內容,SAS的數據倉庫技術就可以支持決策全過程。下面以SAS數據倉庫為例說明數據倉庫的功能。
(一)SAS系統的數據存取功能力。
SAS有一個SAS/ACCESS(數據抽取)產品,利用它對眾多不同格式的數據進行查詢、訪問和分析。SAS/ACCESS提供了與目前許多流行數據庫軟件和老的數據文件的接口,用SASS/ACCESS可建立對應外部異構數據的一個統一的共用數據界面。所提供的與外部數據的接口是透明和動態的。用戶有時不必將數據真的讀到SAS系統中來,而只需在SAS系統中建立對外部數據的描述(也即所謂VIEW),便可把這些外部數據當做真正存儲在SAS系統中的數據集一樣使用。這時,用戶即可使用這些數據進行所謂ROLAP式的數據分析和決策工作。對一些經常使用的外部數據,也可利用SAS/ACCESS將其真正提取放入SAS系統中,并進一步經過整理放進數據庫。SAS/ACCESS提供的接口是雙向的,既可將數據讀入SAS系統,也可在SAS系統中更新外部數據,或將數據加載到外部數據載體中去,這使數據倉庫系統和原有的運行數據體系更加溝通。
(二)數據的清理和整合。
在SAS的數據倉庫中有專門的機制進行引入數據的檢查、核對和將不同來源數據進行整合的技術環節。在一個企業或其他大型的組織中,各種數據可能有不同的類型,格式可能也不盡統一。
從業務操作系統中引入的數據必須進行其完整性的檢查。在一條記錄中,各個數據項之間應有一定的存在關系。若有缺陷,且又沒有檢查,必然會給將來的統計、決策造成偏差。
數據的有效性也是必須進行校對的,以防止將數據源中的錯誤帶入決策過程中,這些必要的清理工作保障了決策所使用數據的質量。此外,還可以加入用戶自己認為需要加強環節,系統允許在數據整理的各個層次加上用戶強化環節。
(三)數據倉庫的加載和更新。
從數據源抽取數據不僅有質量問題,還有計劃地按一定時間節奏從數據源取出和裝入、更新數據倉庫的問題。因為SAS系統不主動去取外部數據的能力,所以按時間節奏從數據源取出數據的操作在和其他系統管理人員協調好的基礎上,就可完全在SAS系統內制定從各系統取用數據的計劃。在此基礎上,數據倉庫按照數據和信息使用的時間要求,準時加載、更新就完全有保障了。
從數據源到數據倉庫一氣呵成的集成式的操作,這是SAS數據倉庫技術的重要特點。
(四)按決策需要重組數據和信息。
清理好的數據還要重組。按照決策的需要組織成不同主題的數據倉庫表,這是十分關鍵性的操作。在任何一個企業或組織中,總是有許多業務和技術環節的,一般來說,數據庫的設計也總是針對這些業務和技術環節設置“實體”,即數據庫的表,這樣的設計使OLTP系統發揮了最大的工作效率。但在開發決策支持的OLAP時,這種結構的數據,特別是對于全企業范圍的數據進行操作時,其效率極低,這是因為可能要從許多表中取出所需數據,而且可能還要進行數據的篩選、擬合,這是極費時間和資源的。企業范圍的決策是對各個環節的業務種類重組,這就需要有相應數據結構的重組,即按決策的需要組織成不同主題的數據倉庫表以及相應的數據視圖、匯總表等,SAS為此設置了交互式操作的界面。
(五)豐富的決策數據處理能力。
SAS在這方面具有世界領先的豐富的決策數據處理軟件。SAS/STAT覆蓋了所有的實用數理統計分析方法,是國際統計分析領域的標準軟件,它提供了十多個程序,可進行各種不同模型或不同特點的回歸分析;為多種試驗設計模型提供了方差分析工具;在多變量統計分析方面,為主成份分析、相關分析、判別分析和因子分析提供了許多專用程序;還包括多種聚類準則的聚類分析方法等。
SAS/ETS提供了豐富的計量經濟學和時序列分析方法,是研究復雜系統和進行預測的有力工具。SAS/OR提供了全面的運籌學方法。SAS/IML提供了功能強大的面向矩陣運算的編程語言,幫助研究新算法,或解決SAS系統中沒有現成算法的專門問題。SAS/INSIGHT是一個可視化的數據探索工具,它將統計方法與交互式圖形顯示融合在一起,為你展現了一種全新的使用統計分析方法的環境。還有SAS的人工神經元網絡和SAS/ASSIST等許多適合各個層次、各種類型人員使用的工具。
(六)靈活多樣的結果展現方式。
分析結果的展現方式對決策時人的判斷有重要的影響,SAS也有眾多的方式、方法供你選擇:
1、 Base SAS中就有從簡單列表到比較復雜的統計報表和用戶自定義的式樣所產生的復雜的報表能力。
2、SAS/ER(Enterprise Report)為企業級的決策過程提供了報告的制作能力。
3、SAS/GRAPH是一個強有力的圖形軟件包,可將數據及其包含的深層信息以多種圖形生動地呈現出來。
從種數據源主動地取出數據,經過清理、整合,再按決策的需要分別主題重組數據,按照時序節奏不斷地自動裝載、更新數據倉庫,用世界權威的、豐富的數據處理工具進行決策分析,最后以多種形式將決策的意見呈現給用戶,這就是完整的決策支持數據倉庫解決方案。
通過SAS對異構數據庫的支持和優秀的跨平臺處理能力,可對現有的數據庫進行數據提取和整合,并按照主題存儲在數據倉庫中。在數據倉庫的基礎之上,可利用SAS的分析功能和強大的結果展現工具,進行分析、預警,及進行預測,從而很好的滿足用戶的需求。但由于SAS系統是從大型機上的系統發展而來,其操作至今仍以編程為主,人機對話界面不太友好,并且在編程操作時需要用戶最好對所使用的統計方法有較清楚的了解,非統計專業人員掌握起來較困難。□
(作者單位:海軍裝備研究院)
參考文獻:
[1]徐夕水;劉麗均,統計分析系統SAS軟件的應用,中國飼料,1998/09,8/550
[2]王澤軍;韓在峰,基于整合模式的EMS/SAS監控系統研究與設計,電子技術應用,2010/09,/25
[3]吳本中,統計分析系統SAS介紹,計算機應用與軟件,1987/04,3/60