[摘 要]本文以統計臺賬為線索,深入剖析了電子臺賬在企業未來統計工作申的作用,棵討了運用數據倉庫技術規劃企業統計數據資源的方法,通過SEB的規劃,提高了企業信息化程度和企業統計信息資源利用率,提升了統計源頭數據規范化,有效性和可用性的程度,是統計工作的重大突破。
[關鍵詞]數據倉庫 電子臺賬 數據挖掘統計分析
進入21世紀,信息技術飛速發展,但統計數據失真卻愈演愈烈。究其原因,主要是統計信息化程度不高所致。筆者認為,堵住統計弄虛作假的關健是把握源頭數據的準確,重要的手段就是加快企業信息化步伐, 利用INTERNET技術和現代管理技術整合企業統計數據資源。用現代科技手段控制統計上弄虛作假的意念,本文針對上述問題提出用電子臺帳(statisticalElectronlc BookSEB)方法整合企業統計數據資源的設想,意在探索一條適合中國統計發展的“數據鏈”模式。
1、企業統計數據資源狀況分析
過去企業為了管理自身的生產、銷售、財務和統計工作按照上級要求建立了手工統計臺帳。統計臺帳是根據統計核算和編制統計報表工作的需要。將原始資料經過初步整理加工,按照規定順序登記的一種帳冊。統計臺帳有利于積累歷史統計基本資料;可以比較全面、系統地為本單位領導及時提供基本資料;便于編制統計報表,是保證統計工作順利開展的前提。傳統統計臺帳存在的問題如下:
1.1 落后形勢。現在已步人信息社會,信息社會的主要特征是大量的數據隨時隨地需要加工和發布。由于當今統計報表種類和數量不斷增多,完全靠手工過錄,速度慢、效率低,無法適應各種報表管理工作的需要,特別是傳統統計臺帳的重要功能是面向歷史,與統計報表、企業決策缺乏必要的聯系,無法面對社會、企業需求的多樣性和變化。由于沒有充分利用網絡等現代化手段管理企業統計數據,使企業統計數據管理出現真空。
1.2 工作次序倒置,許多企業統計臺帳形同虛設,傳統統計臺帳往往記錄于報表發布之后,其數據來源于報表,僅把它作為是歷史的記載?;驊豆ぷ鳈z查,無形中置臺帳于次要地位。它的后果是,臺帳的基礎工作作用沒有得到有效強化,使臺帳成為無源之水。
1.3 數據過錄誤差率高。登記臺帳據耍抄錄大量的數據,抄錄過程中難免出現差錯,在缺乏有效的校對環節情況下,臺帳數據與其它統計記錄數據不一致,是經常出現的。由于臺帳記錄的數據質量受到影響。統計數據的權威性和歷史性和公信力將會受到質疑。
1.4 不便查詢和使用。統計臺帳應該成為全方位服務黨政領導和社會各界的基礎統計資料,查詢工作是經常需要的。伹傳統臺帳查詢起來無疑相當費功夫,查詢速度極慢,缺乏聯想和引用能力。
1.5 數據記錄范圍有限。手工臺帳記錄的數據單位和數據指標個數有限,數據記錄面小。主要原因是紙介質和人工使用局限所致。
2 SEB規劃方法
用數據倉庫觀點整合企業數據資源并為決策服務。數據倉庫是一個面向主題的、集成的、相對穩定的、反映歷史變化的數據集合,用于支持管理決策。SEB分進度SEB和歷史SEB兩大類,如果將進度SEB理解為當前工作系統,并按進度SEB的規范加以描述,則進度SEB通過一定的運作方式可以產生需要的上報報表,并按特定的要求轉換成歷史SEB,按照這種模式在網上層層轉換,就形成了一條有效的數據鏈。供各級統計管理部門查詢使用。
2.1 數據流規劃
SEB的數據流規劃應從三方面考慮:第一統計指標的選取要與企業經營決策和統計管理實際相結合,綜合指標可以選一些如國內生產總值(GDP)、工業總產值、總收入、工業企業銷售收入、工業增加值、中間投入、全員勞動生產率、新增固定資產投資、基本建設投資、工業企業從業人員、財政收入、出口創匯額、凈利潤、稅收等,同時還要兼顧各專業的特殊指標。第二,原始輸入流按進度SEB要求采取集群指標批量采集方式。進度SEB輸人流存在于SEB進度指際類中,按數據集市來規劃。分類上按時點指標分月度、季度、年初、年末指標,時期指標按指標性質和單位原始記錄擁有悄況分別設計。歷史SEB輸T流按歷史指標與進度指標的關系,采取集群指標批量采集方式與導人相結合的方式。歷史SEB輸人流主要存在于SEB歷史指標類中,對歷史SEB輸入流一旦入庫只提供指標過失標記,填列注銷時間,并在備注中注明注銷原因,不提供更新和刪除辦法。數據的有效性檢查在集群指標批量采集方式中完成。原則上數據上報后進度SEB數據就蓋棺定論了,這時系統封鎖修改功能,并導人歷史SEB中。如果數據箱要調整,可以在下個時點進行,并要覆蓋同期歷史SEB數據。第三,輸出數據流設計要體現多樣、靈活性。能通過定義指標子集和數據切片、數據切塊、挖掘等方式提供分析和向上級統計部門報送統計報表能力,避免重復抄錄工作。特別導出統計報表上是保證SEB數據一致性的重要措施。
2.2 系統功能建模
星型模型是一種使用關系數據庫實現多維分析空間的模式。它由事實表(大表)以及多個維表(小表)所組成。SEB的星型模型將各種統計指標按統計報告期(月度、季度、年度)形成多個維表,為企業決策提供了強大的數據檢索能力。在事實表中包含了企業各報告期全部經營活動數據。而維表可以看成一種窗口,透過它用戶可以分析企業數據,維表中包含有支持商業運作的相關項的文字說明。維的設計提供了維的屬性的定義,這些屑性狠豐富。
數據挖掘是SEB的重要功能,比如我們通過指定品和年度生成包含銷售量和利潤增長指標的三維表,還可以通過向下鉆取功能獲得產品及圍繞其產品的其他附件產品的銷售;再向下鉆取,獲得企業其他產業活動單位的銷售情況等。
SEB建??梢苑秩竭M行。第一步,定義SEB子系統。SEB子系統的定義是指用一段準確的文字,清楚說明子系統目標、功能和有關信息服務機制等。第二步,定義SEB功能模塊。對每一子系統的功能模塊識別、定義,是系統功能建模的重點部分,更應力求完整和準確。統計分析包括圖形分析、對比分析、歷史分析。 數據挖掘及數據集合操作如子集抽取能力。第三步,定義程序模塊。
結束語
采用數據倉庫技術規劃SEB一方面使企業統計數據得到有效整合,另一方面也使企業正常的業務活動與企業統計工作有機結合起來,形成統一的整體。通過SEB的規劃,提高了企業信息化程度和企業統計信息資源利用率,提升了統計源頭數據規范化、有效性和可用性的程度,是統計工作的重大突破。