999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

城鎮低保基礎信息數據集市的數據模型設計

2008-12-31 00:00:00雷啟明周利平
計算機應用研究 2008年10期

 收稿日期:2008-04-15;

修回日期:2008-07-15

作者簡介:

雷啟明(1949-),男,四川樂山人,副教授,主要研究方向為數據庫(teacher_lei@263.net);

周利平(1976-),女,講師,博士研究生,主要研究方向為計算機網絡.

(1.樂山師范學院 計算機科學與信息工程系 四川 樂山 614002; 2.四川大學 計算機科學學院 成都 610065)

摘要:

為了加強城市居民最低生活保障(以下簡稱低保)問題的基礎信息的科學管理,為政府部門提供對低保問題的決策支持,將數據集市理論運用于低保基礎信息的決策管理。提出了低保基礎信息數據集市的數據模型——雪花模型,并對數據模型中的事實表、維度表、大維度、粒度、聚集事實表等相關的技術問題進行了細致的探討,對研究并建立低保基礎信息數據集市具有參考價值和實際意義。

關鍵詞:數據倉庫; 數據集市; 雪花模型; 基礎事實表; 維表; 聚集事實表

中圖分類號:TP392

文獻標志碼:A

文章編號:1001-3695(2008)10-3171-03

Data model design of town subsistence allowances basic information data market

LEI Qi-ming ZHOU Li-ping2

(1.Dept.of Computer Science Information Project Leshan Teachers College Leshan Sichuan 614002 China;

2.School of Computer Sichuan University Chengdu 610065 China)

Abstract:

In order to strengthen the scientific management of basic information of the subsistence allowances for urban residents and provide government departments with decision-making support of subsistence allowances applied data market theory into the decision-making management based on information of subsistence allowances. Presented the data model of information data market of subsistence allowances: snowflakes model and made a detailed study of many related technical issues in the data model such as the facts table the dimension table giant dimension granularity gathering facts table etc. So it is of a reference value and practical significance to researching and establishing information data market of subsistence-allo-wances.

Key words:data warehouse; data market; snowflakes model; basic fact tables; dimension tables; gathered fact tables

低保問題是近幾年我國比較突出的社會問題。作為民生話題不可忽視的一個方面,正越來越受到政府部門的關注。現階段我國低保問題主要由民政部門負責,采用的方法還停留在人工管理階段,或者利用操作型數據庫進行數據管理。各部門所掌握的信息多為文本信息或操作型數據,很難在信息的海洋中獲取支持決策的數據,有礙于城市信息化的進一步發展。研究對我國低保問題的科學管理是城市信息化建設的組成部分,是人口基礎數據庫信息的科學利用,是為政府部門提供有效解決民生問題的決策支持。

1數據倉庫和數據集市

數據倉庫技術是當前用于企業決策支持的、先進的有效方法。1993年,W.H.Inmon[1]在其所著的《Building the data warehouse》中對數據倉庫進行了完整的界定。他將數據倉庫定義為:一個面向主題的、集成的、隨時間變化的、非易失性的數據集合,用于支持管理層的決策。這一界定被學術界廣泛認同。W.H.Inmon關于數據倉庫的定義,可以從幾方面來理解:

a)數據倉庫是一種數據資源集成與整合的具體方法。數據倉庫不同于一般的數據庫,它是按照一定的要求、圍繞明確的主題,對原有分散的、相互獨立、異構的操作型數據進行有效集成。

b)數據倉庫存儲的數據具有相對的穩定性。

c)數據倉庫的數據主要用于對管理決策過程的支持。

數據倉庫的鮮明特點使數據倉庫技術具有廣泛的應用前景。目前,已有不少行業把數據倉庫技術用于數據管理和決策支持,取得了經驗、產生了效益。

數據集市是數據倉庫的一個子集,它面向部門級業務,面向某個特定的主題,是一種簡化的小型數據倉庫。實際上,多個相互聯系的、圍繞一個宏觀大主題的多個數據集市的集成就構成了數據倉庫。數據集市和數據倉庫在其實現過程和數據模式方面沒有根本的差異,而數據集市比數據倉庫更為簡潔、方便,易于快速實施并應用。因此,在建立企業級的數據倉庫前,可規劃建立多個部門級的數據集市,并在此基礎上集成實現企業級的數據倉庫。

2數據倉庫的星型模型

星型模型是數據倉庫廣泛采用的數據模型,它能準確、簡潔地描述出實體之間的邏輯關系。數據倉庫的其他數據模型一般是在星型模型的基礎上的變形與擴充。一個典型的星型模式包括一個大型的事實表和一組邏輯上圍繞這個事實表的維度表,如圖1所示。

事實表是星型模型的核心,用于存放大量的具有業務性質的事實數據。事實表由主鍵和事實的度量數據兩部分組成。事實表通過主鍵將各維度表鏈接在一起,形成一個相互關聯的整體共同描述主題。事實表中存放的大量數據是同主題密切相關的、用戶最關心的對象的度量數據。

維度是觀察事實、分析主題的角度。維度表的集合是數據倉庫數據模式的關鍵,它通過主關鍵字與事實表相連。用戶依賴于維度表中的維度屬性對事實表中的事實數據進行查詢、分析,從而得到支持決策的數據。因此,對事實表和維表的分析設計是數據倉庫數據模型設計的關鍵。

3低保信息數據集市的數據模型

數據模型是建立數據倉庫的基礎,業務需求是進行數據倉庫數據模型設計的驅動力。低保基礎信息是人口基礎信息的一個子集。適宜選用以星型模型為基礎,建立能滿足需求的低保,基礎信息數據集市的數據模型。

3.1事實表的設計

如前所述,事實表由主鍵和度量數據兩部分組成,星型模型中各維度表主鍵的組合構成事實表的主鍵。針對低保問題,最需要關注的數據是居民的收入問題。因此在事實表中,需要存放居民個人收入、個人月收入、家庭月收入、家庭人均收入等度量數據。

事實表中數據的細節程度或綜合程度的級別,稱為數據粒度。粒度是數據倉庫事實表的重要特征,其級別依賴于維表的屬性。不同的需求,對數據倉庫的粒度要求不同。

低保基礎信息數據集市需要保留最低層次的細節數據,以滿足數據集市的信息查詢要求。很多數據挖掘的應用程序也需要最低層次的數據顆粒;再者,低粒度的事實表便于從操作型系統中抽取源數據;此外,最低層次的細節數據是聚集事實表的基礎。另一方面,為提供決策支持,需要多方面的高粒度的匯總數據。因此,低保人口基礎信息數據集市的數據模型設計能方便獲取從最低層次的細節數據到高度概括的匯總數據,這不僅需要設計好事實表,同時依賴于維度表屬性的設計。

3.2維度表的設計

維度表的集合是建立數據倉庫數據模式的關鍵。建立低保基礎信息數據集市的目的是要通過低保群體的人員結構分析、基本生活現狀分析,在解決民生問題和對低保人群的政策扶持問題等方面提供決策支持。

針對低保問題需要掌握的基礎信息和決策的需求,在低保數據集市中,設計了以下維度及其主要屬性:

a)居民維,這是最重要的一個維度,因為居民維是對低保對象的描述。在居民維中建立了居民的固有屬性、社會屬性、健康屬性等,以便獲得低保居民的個人細節數據。從數據粒度的需要,居民維還建立了居民的歸屬屬性,如所屬家庭、與戶主關系、屬地等。為建立聚集事實表做好準備。

b)時間維,在數據倉庫的多維數據結構中,時間維往往是不可少的一個維度,因為很多事實都是在一定的時間或者時間段內發生。在低保數據集市中,時間段是評價居民收入水平的一個指標;時間也能說明低保人群收入和生活條件變化情況。時間維采用日、月、年三個屬性。

c)低保對象維,主要用于描述居民享受低保的原因,以便針對不同情況采取積極的幫扶措施。針對低保人群的可能情況,設計了病殘、無生活來源、孤寡、失業、退休、低收入、無業等維度屬性。

d)收入類維,用于描述居民的收入來源,是同事實表中的度量數據聯系最密切的一個維度表。因為居民的收入情況是實施低保政策的主要依據,為了準確把握低保家庭的收入情況,設計了社會救助、在職工資、下崗補貼、退休費、自謀職業收入、其他收入等維度屬性。

e)地區維。由于各地劃分的居民低保最低控制線不同,同時為掌握低保人群所在地分布情況,地區維設計了地區名、低保控制線等維度屬性。

此外,根據數據挖掘和決策分析的需要,還可建立性別維和年齡維等維度。

3.3處理好大維度問題

在上列各個維度中,居民維是典型的大維度。這是因為:居民維很深,一個地區的低保人數可能數以萬計;居民維很寬,根據需要,居民維可以有幾十個以上的維度屬性。

數據倉庫的大維度會給數據倉庫的操作應用帶來一些問題:大維度中的長文本字段不僅占用存儲空間,而且維度數據不易更新和維護;向大維度表填充數據難度增大;對事實表的查詢涉及大維度表時,會影響效率。解決數據倉庫大維度問題較好的辦法是采用雪花模型。

雪花模型是在星型模型的基礎上拓展而來的。將星型模型中的大維度表進行分解,通過增加詳細類別表形成一些局部的層次區域,就演變成為雪花模型。本文對低保數據集市中的大維度表——居民維進行了“雪花化”。在居民維中提取出家庭類別表,既解決了大維度表帶來的問題,也為建立聚集事實表做好了準備。基于上述分析,設計出低保基礎信息數據集市的雪花模型構架,如圖2所示。

4低保信息數據集市聚集模型設計

聚集是從最低粒度的事實表中衍生出來的預先計算的匯總數據,這些匯總數據形成了一組獨立的聚集事實表。實際應用中,可以根據需要將跨越任何維度的特定匯總數據構建為一個聚集事實表。

4.1建立數據集市聚集事實表的必要性

建立低保基礎信息數據集市的主要目的是要為管理者提供具有決策價值的匯總數據。因此,把使用頻率高的匯總數據存放在聚集事實表中,對提高數據集市的使用性能、為管理者提供決策支持,使用戶獲得更好、更快的查詢結果,是非常必要的。數據集市聚集模型的好壞將在很大程度上影響到數據集市的使用效果。

4.2怎樣建立聚集事實表

在數據集市中建立聚集事實表,要注意以下原則:

a)每一個不同的聚集必須使用單獨的事實表存儲聚集數據,成為相對獨立的聚集事實表。

b)聚集事實表中的維表必須是基本事實表中的維表壓縮。

c)基本事實表中的度量數據加載后,才能作聚集處理。

4.3低保基礎信息數據集市常用的聚集事實表

每一個數據倉庫(數據集市)都可能有多個維度表,因此,一個數據倉庫(數據集市)會有很多個聚集事實表。究竟需要哪些聚集,要針對用戶需求和決策需要。例如,在低保基礎信息數據集市中可建立下列常用聚集事實表:

a)單路聚集。在有多個維度的數據模型中,如果只有一個維度升高的維度層次,其他維度保持最低層次,所生成的事實表為單路聚集事實表。在低保數據集市中,把居民同維的屬性層次升高到家庭,其他維度層次保持不變,生成一個單路時間聚集事實表,如圖3所示。

b)二路聚集。在有多個維度的數據模型中,如果有兩個維度升高的維度層次,其他維度保持最低層次,所生成的事實

表為二路聚集事實表。在低保政策中,一般是依據一個家庭一年的收入水平核發低保。因此,可以生成時間維屬性為年、居民維屬性為家庭、其他維保持不變的二路聚集事實表,如圖4所示。

利用本文提出的低保基礎信息數據集市的數據模型,可以根據需要靈活方便地生成多個聚集事實表。

5結束語

能否滿足需求是衡量一個應用軟件質量的重要依據。利用本文提出的低保信息數據集市的數據模型架構,能夠從多方面獲取低保方面的重要信息,為政府行政機構解決低保問題提供決策支持。通過進一步的多方面探索,為開發、應用人口基礎信息數據倉庫打下基礎。

參考文獻:

[1]INMON W H.數據倉庫[M].王志海,等譯.北京:機械工業出版社,2003.

[2]邵紅全,趙茜.運用多維數據模型實現數據集市[J].河北省科學院學報,2003(2):99-102.

[3]PONNIAH P.數據倉庫基礎[M].段云峰,等譯.北京:電子工業出版社,2004.

[4]李姍姍,寧洪,陳波,等.通用數據倉庫元數據模型的研究[J].計算機工程與應用,2004,40(5):52-55.

[5]劉中蔚,陳紅.用基于元數據庫的工作流調度數據倉庫的更新[J].計算機應用研究,2006,23(3):178-180.

[6]HAN Jia-wei KAMBER M.數據挖掘概念與技術[M].范明,等譯.北京:機械工業出版社,2004.

[7]平靜,林平瑞.元數據管理及其在數據倉庫中的應用[J].平原大學學報,2006(8):130-132.

[8]彭曉東.基于數據倉庫的綜合決策支持系統的設計研究[J].電腦開發與應用,2003(6):11-20.

主站蜘蛛池模板: 伊人AV天堂| 色综合天天综合| a欧美在线| 91视频日本| www.亚洲色图.com| 国产午夜精品一区二区三区软件| 久久久久青草大香线综合精品| 午夜激情婷婷| 男人天堂亚洲天堂| 成人一级黄色毛片| 国产午夜无码片在线观看网站 | 中文字幕在线视频免费| 久久香蕉国产线看观看精品蕉| 国产午夜一级毛片| 国产性生大片免费观看性欧美| 国内精品视频| 国产精品hd在线播放| 露脸真实国语乱在线观看| 玖玖精品在线| 久久久久国产精品熟女影院| 色天堂无毒不卡| 999精品视频在线| 日本欧美精品| 国产精品香蕉在线| 四虎国产永久在线观看| 日本久久免费| www.精品国产| 免费在线a视频| 国产又粗又爽视频| 日本欧美成人免费| 波多野结衣二区| 久青草网站| 中文无码毛片又爽又刺激| 成人免费网站久久久| 99re热精品视频中文字幕不卡| 国产成人亚洲精品无码电影| 国产18在线播放| 色爽网免费视频| 午夜精品一区二区蜜桃| 国产精品冒白浆免费视频| 欧美一级大片在线观看| 狠狠色婷婷丁香综合久久韩国| 伊人色天堂| aaa国产一级毛片| 99热这里只有精品久久免费| 国产Av无码精品色午夜| 丁香婷婷久久| 国产香蕉国产精品偷在线观看| 最新无码专区超级碰碰碰| 欧美高清日韩| 色135综合网| 欧美亚洲一区二区三区导航| 久久精品国产亚洲麻豆| 国产精品99在线观看| 91视频首页| 在线精品自拍| 婷婷久久综合九色综合88| 毛片网站在线播放| 日韩精品成人在线| 成人av手机在线观看| 午夜影院a级片| 国产欧美专区在线观看| 国产波多野结衣中文在线播放 | 国产在线观看一区精品| а∨天堂一区中文字幕| 亚洲AV无码乱码在线观看裸奔 | 青草视频久久| 亚洲无线国产观看| 国产黄色免费看| 97在线公开视频| 99九九成人免费视频精品| 18禁不卡免费网站| 婷婷色一区二区三区| 亚洲中文字幕日产无码2021| 国产va在线| 91日本在线观看亚洲精品| 国产成人高清精品免费5388| 亚洲天堂精品在线| 日韩精品免费一线在线观看| 黄色污网站在线观看| 在线色国产| 激情亚洲天堂|