999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于數(shù)據(jù)倉庫的社保行業(yè)決策分析研究

2009-04-29 00:00:00柴巧葉
軟件工程 2009年11期

摘要:利用數(shù)據(jù)倉庫技術(shù)可以對分布在社保部門之間的業(yè)務數(shù)據(jù)進行采集、加工、整合,從而建立數(shù)據(jù)倉庫。我們可以根據(jù)不同的業(yè)務主題建立不同的數(shù)據(jù)倉庫,為社保行業(yè)的管理及決策提供分析信息和決策依據(jù)。本文介紹了數(shù)據(jù)倉庫及相關(guān)技術(shù)、社保行業(yè)中數(shù)據(jù)倉庫的分析與設計、社保行業(yè)中數(shù)據(jù)倉庫的實現(xiàn)等。

關(guān)鍵詞:數(shù)據(jù)倉庫;社會保險;OLAP;DTS

1 引言

隨著信息化技術(shù)的迅速發(fā)展,社保行業(yè)的信息化建設已初具規(guī)模。建立在各種中、大型數(shù)據(jù)庫之上的基于聯(lián)機事務處理(OLTP)的MIS系統(tǒng)已經(jīng)日趨完善,但同時新的問題應運而生。一方面,歷史性數(shù)據(jù)開始出現(xiàn),對大量歷史數(shù)據(jù)的管理已迫在眉睫;另一方面,用戶已不僅僅停留在單純的業(yè)務流程自動化上,更希望能更好地匯總、分析企業(yè)多年來積累的龐大的業(yè)務數(shù)據(jù)、財務數(shù)據(jù)等數(shù)據(jù)資源,并從中挖掘出業(yè)務的內(nèi)在規(guī)律,以便更好地支持決策過程,在競爭中取得優(yōu)勢。

本文研究基于社保行業(yè)的迫切需求,建立數(shù)據(jù)倉庫,并在此基礎上進行數(shù)據(jù)查詢、多維分析(OLAP)和數(shù)據(jù)挖掘等工作,從而使社保行業(yè)更好地利用這些幾十年積累的各種數(shù)據(jù),從中發(fā)現(xiàn)內(nèi)在的、有價值的信息。

2 社保行業(yè)數(shù)據(jù)倉庫的設計

2.1 需求分析

社保行業(yè)迫切需要從當前海量數(shù)據(jù)中尋找潛在的規(guī)律及隱藏的知識,發(fā)現(xiàn)那些在經(jīng)驗之外的規(guī)律和推測之外的模式。本文針對某市社會保險部門構(gòu)建決策支持系統(tǒng)DSS,即數(shù)據(jù)倉庫系統(tǒng),通過與社保部門有關(guān)領(lǐng)導進行充分的交流和溝通,了解到其需求狀況,并獲得以下信息:決策的類型、決策者感興趣的問題等。

2.2 數(shù)據(jù)倉庫體系結(jié)構(gòu)的設計

(1) 數(shù)據(jù)源的確定。本系統(tǒng)的數(shù)據(jù)源是某省勞動廳近年來積累的事務數(shù)據(jù),數(shù)據(jù)基于關(guān)系數(shù)據(jù)庫,以光盤形式存儲。由于多年的數(shù)據(jù)積累,數(shù)據(jù)源中存在“多數(shù)據(jù)源”“數(shù)據(jù)不完整(有些感興趣的屬性缺少屬性值,或僅包含聚集數(shù)據(jù))”“含噪聲的(包含錯誤或存在偏離期望的孤立點值)”“不一致的(例如,同一字段的表達方式不同)”等質(zhì)量問題。另外,這些數(shù)據(jù)源是異構(gòu)的,即使是正確的數(shù)據(jù),也可能存在著不一致性、沖突等問題。因此需要對數(shù)據(jù)源進行清洗后再提供給數(shù)據(jù)倉庫所用。

(2) 數(shù)據(jù)倉庫層的設計。本系統(tǒng)使用SQL Server 2000作為數(shù)據(jù)倉庫服務器,在SQL Server 2000的“企業(yè)管理器”中新建一個關(guān)系數(shù)據(jù)庫,在該數(shù)據(jù)庫中建立表和關(guān)系圖,表的建立依據(jù)物理模型設計,關(guān)系圖的建立依據(jù)邏輯模型設計。此關(guān)系數(shù)據(jù)庫中的數(shù)據(jù)是使用SQL語句和DTS工具對源數(shù)據(jù)進行合并、清理、轉(zhuǎn)換和加載后得到的,新建的關(guān)系數(shù)據(jù)庫就是數(shù)據(jù)倉庫,即數(shù)據(jù)存儲中心,它將是OLAP服務器的數(shù)據(jù)來源。

(3) OLAP服務器層的設計。本系統(tǒng)使用SQL Server 2000的Analysis Services作為OLAP服務器,在Analysis Manager中建立分析數(shù)據(jù)庫,在分析數(shù)據(jù)庫下設定數(shù)據(jù)源,并按照星型模型建立多維數(shù)據(jù)集,為下一步進行多維分析奠定基礎。本數(shù)據(jù)倉庫中的多維數(shù)據(jù)是用ROLAP以關(guān)系型結(jié)構(gòu)進行表示和存儲的。

(4) 數(shù)據(jù)分析/應用層的選擇。本系統(tǒng)在數(shù)據(jù)透視表服務組件的支持下,應用EXCEL前端工具對數(shù)據(jù)倉庫進行多維分析和查詢。這種操作不需要學習其他語言來編寫客房端應用程序,使用所附帶的連接數(shù)據(jù)庫的功能操作即可。而且,它可以連接到分析服務器,將服務器端的多維數(shù)據(jù)集放到客戶端成為一個本地文件,以后在無網(wǎng)絡連接的情況下可以用來分析。使用Microsoft Visual Basic 開發(fā)客戶端人機交互界面,其中用ADO MD和DSO對象實現(xiàn)對多維數(shù)據(jù)集的訪問,從而實現(xiàn)多維數(shù)據(jù)集瀏覽工具的開發(fā)。

2.3 分析主題的確定

通過與社保有關(guān)人員交流,了解到他們在業(yè)務中最關(guān)心的是基金的管理,即基金的收繳與撥付。確立本數(shù)據(jù)倉庫的分析主題為“在職人員養(yǎng)老保險基金收繳”和“離退休人員養(yǎng)老金撥付”,度量值分別是“基金收繳金額”和“養(yǎng)老金撥付金額”。分析主題根據(jù)分析要求將數(shù)據(jù)組成了一個完備的分析領(lǐng)域,即主題域,且滿足主題域的獨立性和完備性的特征。

2.4 社保行業(yè)數(shù)據(jù)倉庫的邏輯數(shù)據(jù)模型設計

由于數(shù)據(jù)倉庫的主要操作對象是多維數(shù)據(jù),因此在數(shù)據(jù)倉庫設計中,應采用多維數(shù)據(jù)建模技術(shù),以使用戶能更好地理解企業(yè)的數(shù)據(jù)信息。多維數(shù)據(jù)建模符合人們的思維方式,易于用戶的理解和使用,能支持用戶從多個角度對數(shù)據(jù)進行分析。現(xiàn)在大部分企業(yè)使用的是關(guān)系數(shù)據(jù)庫,在建設企業(yè)的數(shù)據(jù)倉庫時,一般采用基于關(guān)系數(shù)據(jù)庫的建模方法。在基于關(guān)系數(shù)據(jù)庫的多維數(shù)據(jù)建模中最常見的是星形模型。本系統(tǒng)采用星形模型進行設計。

本系統(tǒng)的數(shù)據(jù)源是由某社部門提供的事務數(shù)據(jù)。通過分析設計了兩個事實表:zz_fact(在職人員養(yǎng)老保險基金收繳事實表)及l(fā)tx_fact(離退休人員養(yǎng)老金撥付事實表),這兩個事實表的主碼是由相應維表的主碼構(gòu)成的組合碼,事實表通過外碼與維表建立聯(lián)系,便于以后查詢。設計了四個維表,分別是time_by_day,Unit_Table,geo_table,sj_Private_table,它們的主碼分別是time_id,DWNM,geo_ID,sj_ID,它們通過主碼與事實表建立聯(lián)系。

2.5 社保行業(yè)數(shù)據(jù)倉庫的物理存儲模型設計

數(shù)據(jù)倉庫是數(shù)據(jù)庫技術(shù)一種新的應用。至今,數(shù)據(jù)倉庫一般仍是應用數(shù)據(jù)庫管理系統(tǒng)來管理其中的數(shù)據(jù)。數(shù)據(jù)倉庫的邏輯數(shù)據(jù)模型最終將轉(zhuǎn)為數(shù)據(jù)庫的物理模型。

建立數(shù)據(jù)倉庫物理模型所依據(jù)的邏輯模型是多維數(shù)據(jù)模型,而不是實體-關(guān)系模型,并且要盡可能地與多維數(shù)據(jù)模型保持一致。由于實際應用環(huán)境的限制,數(shù)據(jù)倉庫的物理模型同邏輯模型存在差異是不可避免的。

3 社保行業(yè)數(shù)據(jù)倉庫的實現(xiàn)

3.1 技術(shù)環(huán)境和實現(xiàn)工具的選擇

本系統(tǒng)使用Microsoft SQL Server2000作為數(shù)據(jù)倉庫服務器開發(fā)平臺,使用Analysis Services作為OLAP服務器開發(fā)平臺,使用DTS(Data Transformation Services)作為數(shù)據(jù)轉(zhuǎn)換工具。

3.2 數(shù)據(jù)倉庫的建立

本系統(tǒng)使用的數(shù)據(jù),是某市社保局所提供的已有的參保人員的信息資料,已轉(zhuǎn)換成SQL Server數(shù)據(jù)庫“sbdata”源數(shù)據(jù)。在這些源數(shù)據(jù)中有數(shù)據(jù)的重復、丟失、改變等臟數(shù)據(jù)。首先使用SQL語句將多個表的數(shù)據(jù)組合在一起,并進行字段的刪除、屬性修改等操作,最后通過DTS傳輸至 “sb”數(shù)據(jù)庫相應的表中。數(shù)據(jù)導入時先導入維表,然后再導入事實表;數(shù)據(jù)刪除要先刪除事實表,然后再刪除維表。本DTS包創(chuàng)建工作流的優(yōu)先級如下:(1)執(zhí)行SQL任務,刪除現(xiàn)有的SB數(shù)據(jù);(2)將數(shù)據(jù)匯集到維表中;(3)將數(shù)據(jù)匯集到事實表中。

完成SB的DTS包設置后,通過執(zhí)行包將源數(shù)據(jù)庫sbdata中的數(shù)據(jù)加入到SB數(shù)據(jù)倉庫中,并把SB作為分析服務器的數(shù)據(jù)源,在分析服務器下建立多維數(shù)據(jù)集。最后保存DTS包。

3.3 社保行業(yè)數(shù)據(jù)倉庫中數(shù)據(jù)分析的實現(xiàn)

在本系統(tǒng)中,采用SQL SERVER 2000的Analysis services OLAP分析工具。

在分析服務器端使用Analysis services的分析管理器(Analysis Manager)創(chuàng)建分析數(shù)據(jù)庫,在分析數(shù)據(jù)庫中建立多維數(shù)據(jù)集,并對多維數(shù)據(jù)集進行處理和分析。

(1) 分析數(shù)據(jù)庫的建立。OLAP分析數(shù)據(jù)庫是相關(guān)多維數(shù)據(jù)集及其所共享的對象的容器。對象包括數(shù)據(jù)源、共享維度和數(shù)據(jù)庫角色。如果有多個多維數(shù)據(jù)集要共享這些對象,則這些對象和多維數(shù)據(jù)集必須在同一個OLAP分析數(shù)據(jù)庫中。

在對象層次結(jié)構(gòu)中,OLAP分析數(shù)據(jù)庫從屬于分析服務器。因此,在安裝分析服務器后,首先在Analysis Manager中新建一個OLAP分析數(shù)據(jù)庫“社保養(yǎng)老保險決策”,即數(shù)據(jù)倉庫,將作為社保決策分析中數(shù)據(jù)源、多維數(shù)據(jù)集、共享維度、挖掘模型、數(shù)據(jù)庫角色的容器。

(2) 數(shù)據(jù)源的設置。數(shù)據(jù)源是OLAP將要分析的數(shù)據(jù)來源。創(chuàng)建分析數(shù)據(jù)庫后,應該指定數(shù)據(jù)源。Analysis Manager為指定數(shù)據(jù)源提供了可以使用的OLE DB Provider清單,在此清單中選擇數(shù)據(jù)源類型(Microsoft OLE DB Provider for ODBC Driver/Microsoft OLE DB Provider for SQL Server是兩種應用廣泛的數(shù)據(jù)源)。在此選擇Microsoft OLE DB Provider for SQL Server數(shù)據(jù)源類型。

此時,我們已設定了數(shù)據(jù)源-SQL數(shù)據(jù)庫文件“sb”,建立了分析數(shù)據(jù)庫-“社會保險決策”。在此,“sb”和“社會保險決策”均屬數(shù)據(jù)倉庫的數(shù)據(jù)庫。“sb”是數(shù)據(jù)倉庫的數(shù)據(jù)庫,是實際存在的數(shù)據(jù)庫,由Microsoft SQL Server 2000系統(tǒng)支持,主要管理工具是“企業(yè)管理器”,而“社會保險決策”是數(shù)據(jù)倉庫的分析數(shù)據(jù)庫,是虛擬的、用來存放OLAP服務結(jié)構(gòu)的對象,由Microsoft SQL Server 2000 Analysis Services系統(tǒng)支持,主要管理工具是“Analysis manager”。

3.4 社保行業(yè)數(shù)據(jù)倉庫中多維數(shù)據(jù)的查詢

Microsoft 提供了服務器端的組件——分析服務器,可以用來創(chuàng)建多維數(shù)據(jù)集,提供客戶端的組件——數(shù)據(jù)透視表服務(Pivot Table Services),讓用戶可以通過它來獲取多維數(shù)據(jù)。

(1) 用EXCEL實現(xiàn)對多維數(shù)據(jù)的查詢。用EXCEL2000作為分析服務器前端工具,可以連接后臺大型關(guān)系數(shù)據(jù)庫,將數(shù)據(jù)下載到前端做二維的數(shù)據(jù)透視表分析,從而使客戶端用戶能方便的查看分析服務器或多維數(shù)據(jù)集的數(shù)據(jù)。EXCEL2000也可以連接到分析服務器,將服務器端的多維數(shù)據(jù)集放到客戶端成為一個本地文件,即使在沒有網(wǎng)絡連接的情況下也可以用來分析,也可隨時連接服務器來更新文件,盡可能達到數(shù)據(jù)同步的效果,快速得到所需要的信息。

用EXCEL對社保基金收繳多維數(shù)據(jù)集進行查詢、分析,可以選擇不同的維來分析數(shù)據(jù),了解社保基金收繳情況。可以在“數(shù)據(jù)透視表”工具條上使用圖表向?qū)Вx擇三維柱形圖表,產(chǎn)生圖表。更直觀的了解細節(jié)性數(shù)據(jù)。

(2) 用VB實現(xiàn)對多維數(shù)據(jù)的查詢。本系統(tǒng)采用VB開發(fā)客戶端應用程序,實現(xiàn)對多維數(shù)據(jù)集的訪問、查詢、透視表展示和圖形展示。

以下介紹客戶端應用程序的功能和操作方法:

A.主窗口。客戶端程序的主窗口包括:標題欄、工具欄及顯示界面。

工具欄有“樹形瀏覽”“圖表顯示”“切片選擇”“高級查詢”和“退出系統(tǒng)”四個圖標。系統(tǒng)默認在樹形瀏覽界面以樹形視圖的方式顯示當前運行服務器的數(shù)據(jù)庫體系結(jié)構(gòu)。系統(tǒng)默認在圖形顯示界面以圖表的形式顯示查詢結(jié)果,單擊“切片查詢”可以通過選擇切片進行查詢。單擊“高級查詢”可以使用MDX(Multi-Dimensional Expressions,多維表達式)語句來查詢。

B.查詢多維數(shù)據(jù)庫。用戶可以通過查詢多維數(shù)據(jù)庫,顯示自己定制的查詢結(jié)果。系統(tǒng)提供了兩種方式來查詢多維數(shù)據(jù)庫,即切片查詢與高級查詢。

通過MDX的各種函數(shù)可以查詢用戶需要的任何信息。比如,需要了解社保行業(yè)“養(yǎng)老保險金撥付和收繳的差額(補貼)大于零的企事業(yè)單位(即需要補貼的企事業(yè)單位),并要求按照補貼數(shù)額從大到小進行排列。

代碼如下:

WITH

member [measures].[補貼] as '[Measures].[養(yǎng)老金撥付金額]-[Measures].[社會保險收繳金額]'

SELECT

{[Measures].[社會保險收繳金額],[Measures].[養(yǎng)老金撥付金額],[measures].[補貼]}on columns,

order(

filter(

{ {[單位].[所有 單位].[企業(yè)],[單位].[所有 單位].[事業(yè)]}*{[時間].[所有 時間].children}},

([measures].[補貼])>0),([measures].[補貼]),desc)on rows

FROM

[收繳撥付立方]

WHERE

([地理].[所有 地理].[太原])

通過查詢結(jié)果得知,近年來養(yǎng)老保險資金缺口較大,且有上升的趨勢,這是養(yǎng)老保險暴露出來的問題,也是全國養(yǎng)老保險普遍存在的問題,本人認為主要有以下原因:①人口老齡化程度逐漸加深;②基金收繳率低,拖欠現(xiàn)象比較嚴重;③基金管理不夠完善。

通過本系統(tǒng),決策者可從不同角度,采用不同方式,對不同主題進行查詢、分析、研究,從而更好的了解本地的養(yǎng)老保險金收繳和撥付情況,為最終的決策和管理提供依據(jù)。最終完成以下功能:①更科學的測算、確定社會保險基金在年度財政預算中的比例,保證中央及地方財政預算安排的社會保障資金要及時足額撥付到位;②預測可能出現(xiàn)的資金風險,科學地確定基金積累水平預警線。為建立有效的基金支付風險預警制度,保證社會保險基金長期安全運行提供科學依據(jù);③對現(xiàn)行政策執(zhí)行情況進行監(jiān)測和評價,對未來政策決策提供依據(jù)和支持;④進一步完善政府對社會保險的管理。

4 結(jié)束語

本文在研究數(shù)據(jù)倉庫技術(shù)的理論基礎上,提出了基于某省社保行業(yè)數(shù)據(jù)倉庫的設計與實現(xiàn)過程。本文是應用比較成熟的數(shù)據(jù)倉庫技術(shù)完成的。在整個研究過程中,本人通過與社保行業(yè)有關(guān)領(lǐng)導及管理人員多次溝通,進行需求分析,根據(jù)社保行業(yè)的需求狀況,設計并實現(xiàn)了社保行業(yè)的數(shù)據(jù)倉庫系統(tǒng),基本滿足了用戶的需求。

社保行業(yè)數(shù)據(jù)倉庫的建立,可以使社保行業(yè)更好地了解自己的運營狀況,更全面、深入地分析業(yè)務數(shù)據(jù),從而為業(yè)務的發(fā)展提供良好的決策基礎。

參考文獻

[1]曹曉靜.決策支持系統(tǒng)的發(fā)展及其關(guān)鍵技術(shù)分析[J].計算機技術(shù)與發(fā)展,2006(11):94.

[2]蘇新寧,楊建林,江念南,栗湘.數(shù)據(jù)倉庫和數(shù)據(jù)挖掘[M].北京:清華大學出版社,2006.

[3]龔小勇.關(guān)系數(shù)據(jù)庫與SQL Server2000.[M]北京:機械工業(yè)出版社,2006.

主站蜘蛛池模板: av大片在线无码免费| 99热国产这里只有精品无卡顿"| 国产aⅴ无码专区亚洲av综合网| 激情无码视频在线看| 国产理论精品| 午夜日韩久久影院| 在线观看精品自拍视频| 国产毛片片精品天天看视频| 亚洲性影院| 性做久久久久久久免费看| 国产成年无码AⅤ片在线| 国产主播在线一区| 亚洲性视频网站| 午夜欧美在线| 在线毛片免费| 精品福利视频网| 国产av剧情无码精品色午夜| 视频一区视频二区日韩专区| 国内熟女少妇一线天| 91丝袜乱伦| 亚洲另类国产欧美一区二区| 91探花国产综合在线精品| 制服丝袜一区| 国产成人AV男人的天堂| 一区二区三区成人| 奇米影视狠狠精品7777| 特级aaaaaaaaa毛片免费视频| 亚洲男人天堂网址| 999国产精品| 欧洲高清无码在线| 国产高清自拍视频| 日韩av电影一区二区三区四区| 国产91九色在线播放| 久久精品女人天堂aaa| 国产福利一区二区在线观看| 国产精鲁鲁网在线视频| 国产99视频免费精品是看6| 青青青草国产| 啪啪啪亚洲无码| 国产导航在线| 无码内射中文字幕岛国片| 亚洲天堂区| 无码日韩人妻精品久久蜜桃| 亚洲天堂日韩在线| 最新国产精品鲁鲁免费视频| 九九九精品成人免费视频7| av无码久久精品| 成人伊人色一区二区三区| 久久综合干| 噜噜噜久久| AV熟女乱| 中文字幕永久视频| 91精品伊人久久大香线蕉| 国产激情影院| 国产精品深爱在线| 狠狠躁天天躁夜夜躁婷婷| 免费看美女毛片| 丁香六月激情婷婷| 精品视频第一页| 青青青国产视频| 亚洲丝袜中文字幕| 毛片手机在线看| 第一区免费在线观看| 免费看a级毛片| 久久特级毛片| 亚洲精选高清无码| 国产主播在线一区| 亚洲三级电影在线播放| 欧美亚洲日韩不卡在线在线观看| 99久久精品国产综合婷婷| 国产视频一二三区| 免费av一区二区三区在线| 国内精品视频| 亚洲精品欧美日本中文字幕| 精品乱码久久久久久久| h网址在线观看| 亚洲精品视频网| 国产精品v欧美| 无码福利日韩神码福利片| 色亚洲激情综合精品无码视频 | 欧美午夜在线视频| 精品国产成人高清在线|