梁展澎+宋文婧
摘要:新形勢下高校財務管理追求更有效、快捷的數據化決策支持,數據倉庫及OLAP技術作為大數據時代下重要的數據挖掘工具,可以為高校建立各種財務主題的數據立方體來提供決策數據支持,并結合熱點通過績效工資數據立方體的創建過程舉例說明數據倉庫及OLAP技術是如何應用到具體的高校財務管理業務中。
關鍵詞:數據倉庫 OLAP;財務決策;績效工資
高校早在90年代已經推行會計電算化,但一直依賴傳統的財務指標、財務報表作為分析方法。二十幾年來,數據庫累積了大量的財務數據,正所謂“數據海量,信息缺乏”。伴隨信息技術的飛速發展,數據庫技術日新月異,大數據時代的來臨,為高校財務管理大數據分析提供了技術基礎。為了能夠快速在現有海量數據中提取其中隱含的信息及規律,并立體、生動的展示給用戶,數據挖掘技術應運而生,其中數據倉庫(Data Warehouse)及聯機分析處理(Online Analysis Processing,縮寫OLAP)技術應用尤其廣泛。
一、數據倉庫與聯機分析處理(OLAP)
高校財務系統經歷了不同的歷史時期,數據庫更新換代,再且可用于財務分析的相關數據分布在不同的部門,數據來源不同,數據庫結構必然存在差異,必須先要解決異構數據庫如何融合的問題才能便于查詢分析。更新驅動方法應運而生,這種方法預先對異構數據庫中的數據進行清洗、抽取、轉換、加載到新的數據庫中形成數據倉庫,從而提高了數據查詢的處理效率。數據倉庫是基于更新驅動方法延伸的一種新的數據庫技術。數據倉庫創始人W.H.Inmon對數據倉庫作了如下的定義:“數據倉庫是面向主題的、集成的、時變的、非易失的數據集合,用以支持經營管理中的決策制定過程”[1]。從定義可見數據倉庫與傳統面向應用(增、刪、改、查)的數據庫不一樣,數據倉庫是面向主題的,將操作性數據庫、文本、EXCEL等不同來源的數據進行綜合、匯總、分析與利用。因為數據倉庫的主要目的是支持高層決策分析,對于數據質量要求很高,必須經過ETL(Extraction、Transformation、Load)即抽取、轉換、加載過程才能獲得準確、完整、可信的數據,這是數據倉庫創建過程中必不可少的步驟,這樣才能使OLAP分析或數據挖掘得到的結果具有較高的準確度和可信度。
OLAP指聯機分析處理,包括一系列考察多維數組數據的技術,可以從多個維度、粒度進行分類、匯總,實現對數據的多維分析[2]。OLAP以多維數據集的形式組織數據,組成數據立方體(Cube)。OLAP技術通過對數據立方體進行切片、切塊、鉆取、旋轉、轉軸等各種分析動作,使用戶從多個角度、多層次地觀察數據,從而深入理解包含在數據中的信息。OLAP可為具有明確分析范圍和分析要求的用戶提供高性能的決策支持。
以教學、行政、科研、財務等部門的數據庫為基礎,將數據進行清洗、抽取、轉換、加載到數據倉庫,并通過OLAP技術對數據進行查詢、分析、挖掘,為高校財務管理提供決策分析的數據支持。例如對高校一卡通消費數據進行挖掘,分析學生的消費狀況和消費特點,對貧困生的選擇與生活補貼的發放時間提供依據;對高校教師工資進行挖掘,分析各層級工資結構,為工資調整提供依據。可見,數據挖掘技術能夠為高校財務管理提供更快捷、更強大的數據分析渠道。
高校財務數據涉及教學、行政、科研等部門,涉及面廣,數據量大。在實際應用中,數據倉庫根據需求設定主題,從不同的數據庫中提取需要的數據字段,形成特定主題的數據立方體。為了更好理解OLAP技術如何幫助高校財務管理與決策,結合最近普遍關注的行政事業單位人事改革、養老金改革等熱點話題,選取績效工資主題作為重點介紹的對象。
二、績效工資數據立方體的構建
我國高校薪酬制度存在激勵機制缺乏、薪酬成本支出過大、績效考核體系不完善等問題[3],這將影響我國高校師資隊伍建設、人才引進等重大人才培養項目的推進。因此各大高校在了解自身薪酬結構、總量、等級水平等工資要素的基礎上來建設薪酬制度及制定激勵措施、推行績效工資改革是非常重要的。
(一)模型選擇
在創建數據倉庫前需要定義兩種表:事實表與維度表,事實表主要存儲用戶感興趣的明細與匯總數據,還有維度表的主鍵值;維度表主要存儲變量的屬性,一個維度至少需要一個維表,事實表通過外鍵與維度表的主鍵聯系在一起構成不同的多維數據模型[4]。當前數據倉庫的數據模型主要包括星型模型、雪花模型、事實模型。星型模型是最常見的模型,只有一個數據龐大的事實表與一組關聯的維表,雪花模型是星型模型的變種,在原有維表的基礎上分化出一個更細的維表,事實模型也稱星系模型,可以看成多個雪花模型的匯總,一般應用在數據復雜的主題倉庫。要研究的績效工資數據立方體含有人員信息表及工資明細表兩個事實表,因此選用的數據模型是事實模型。
(二)事實表與維度表
事實表一般含有大量的數據,有若干與主題關系密切的度量值及一系列與維表相關聯的關鍵字。本主題的兩張表,一是人員信息表,主要包含工號關鍵字、姓名、部門、職務、職稱、學歷、學位,二是工資明細表,主要度量字段包含崗位工資額、職務崗位津貼、校內崗位績效、附加崗位績效、年終一次性獎金、校內勞務酬金等字段,包含的關鍵字是工號關鍵字、日期關鍵字、工資模板關鍵字。維度表包括職務維度、職稱系列維度及其附屬維度、部門維度、時間維度等表。
(三)績效工資數據立方體模型
事實表與維度表關聯既可以查詢單一維度下的數據信息也可以聯合幾個維度查詢分析,如時間維度與職務或者職稱維度聯合可以查詢最近幾年各個職務或職稱工資增長幅度,還可以繪制折線圖便于用戶瀏覽;部門維度與職務或職稱維度聯合可以查詢分析各部門下的職務或職稱人數分布情況并繪制餅圖;部門維度也可以匯總為行政、科研、教學、后勤四大部門,用于分析每個大部門的工資分布情況。績效工資數據立方體存儲了大量的數據,可以根據用戶需求從各個維度進行切片、切塊,便于多角度分析學校績效工資的變化及分布情況。
(四)績效工資數據立方體的實現
績效工資數據立方體需要的數據包括人事處數據庫獲取人員信息及財務處數據庫獲取的工資信息,通過SQL Server 2008 R2中的整合服務(SQL Server Integration Services,SSIS)來實現跨數據庫的數據抽取、轉換與裝載,以績效工資為主題的數據倉庫構建完成后,采用R2的分析服務(Microsoft SQL Server Analysis Service,SSAS)實現OLAP多維數據集,最后采用R2的報表服務((Microsoft SQL Server Reporting Service,SSRS)以簡單易懂的多維圖表方式展示給用戶。
三、結束語
在經濟新常態下,對高校財務管理所提供的決策數據的要求越來越高,精細化管理將是必然的趨勢。同時數據倉庫及OLAP技術是對大數據進行多維分析的有力工具。本文提出把數據倉庫及OLAP聯機分析處理技術運用到高校財務管理的具體業務中,根據學校需求構建主題數據集,并結合社會熱點,重點介紹績效工資數據立方體的創建過程及其使用價值。
參考文獻:
[1] Inmon W.H..數據倉庫[M].王志海,譯.北京:機械工業出版社,2006.
[2]廖華江,黃寧.高校一卡通消費數據OLAP多維分析系統與應用[J].贛南師范學院學報,2015(3):11-14.
[3]鄔琛瑜.高校薪酬管理存在問題及對策探討[J].浙江海洋學院學報(人文科學版),2015,32(6):89-92.
[4]張治坤,吳小鵬,邢承杰等.基于事實星座形模型的財務數據倉庫[J].武漢大學學報(理學版),2012,58(S1):251-256.
(作者單位:廣東外語外貿大學財務處)