[摘 要] 簡要介紹了元數據的定義,提出財會信息領域的元數據系統的結構,以及財會信息資源元數據標準化的研究內容,指出需要解決的關鍵技術,并對今后的研究方向進行展望。
[關鍵詞] 財會信息;元數據;標準
隨著信息時代的到來,人們的時間觀念、空間觀念、思維模式、工作方式和生活方式都在發生變化。會計作為經濟生活中不可缺少的一部分,必將更多地運用信息技術。但就目前而言,會計電算化、審計信息化和政務信息化等系統,采用了不同的數據庫平臺和數據結構,國內眾多的財務軟件也自成體系。會計信息系統是管理信息系統的重要子系統,同時會計信息系統本身也是多層次的軟件系統,且不同層次的系統之間存在著數據依賴關系:高層次的會計管理信息系統、會計決策支持系統和會計檢查系統的數據主要來源于會計核算系統。而目前國內商品化的會計軟件由于在數據庫、數據結構、開發工具以及數據存儲格式方面不盡相同,在數據交換的接口方面不公開、不統一,嚴重阻礙了高層次的會計信息系統的開發和應用。這對不同財務軟件之間以及財務軟件與業務系統軟件之間的數據交換形成了障礙,同時也不利于政府監管部門和社會財務信息使用者獲取企事業單位真實的財務數據和信息。
要解決上述問題,就需要有一個統一的、公認的技術標準——財會信息資源的元數據標準。
元數據最本質,最抽象的定義為:關于數據的數據(data about data)。它是一種廣泛存在的現象,在許多領域都有其具體的定義和應用。
在數據倉庫領域中,元數據被定義為:描述數據及其環境的數據。一般來說,它有兩方面的用途:首先,元數據能提供基于用戶的信息,如記錄數據項的業務描述信息的元數據能幫助用戶使用數據;其次,元數據能支持系統對數據的管理和維護,如關于數據項存儲方法的元數據能支持系統以最有效的方式訪問數據。具體來說,在數據倉庫系統中,元數據機制主要支持以下5類系統管理功能:①描述哪些數據在數據倉庫中;②定義要進入數據倉庫中的數據和從數據倉庫中產生的數據;③記錄根據業務事件發生而隨之進行的數據抽取工作時間安排;④記錄并檢測系統數據一致性的要求和執行情況;⑤衡量數據質量。
在軟件構造領域,元數據被定義為:在程序中不是被加工的對象,而是通過其值的改變來改變程序的行為的數據。它在運行過程中起著以解釋方式控制程序行為的作用。在程序的不同位置配置不同值的元數據,就可以得到與原來等價的程序行為。
在圖書館與信息界,元數據被定義為:提供關于信息資源或數據的一種結構化的數據,是對信息資源的結構化的描述。其作用為:描述信息資源或數據本身的特征和屬性,規定數字化信息的組織,具有定位、發現、證明、評估,選擇等功能。
此外,元數據在地理、生命科學等領域也有其相應的定義和應用。而當今世界流行的元數據標準就有7種之多:CDWA 、DC 、EAD 、FGDC 、GILS 、TEI 和VRA。它們在不同領域的信息資源組成傳遞中起著十分重要的作用。
元數據的基本意義就是“關于數據的數據”。元數據為各種形態的數字化信息單元和資源集合提供規范、普遍的描述方法和檢索工具;元數據為分布的、由多種數字化資源有機構成的信息體系提供整合的工具與紐帶。下面我們就來設想一下財會信息領域的元數據。
1 系統組成
元數據體系的外部系統是財會信息資源外部的元數據環境,即各種獨立于具體系統的,被廣泛承認的,通用的元數據標準的總和。
元數據體系的內部系統主要是財會信息資源系統本身的元數據處理方法和體系結構,即元數據管理系統。它是整個財會信息資源系統的重要組成部分,其基本功能是為財會信息資源系統的運行建立基礎。
為了實現財會信息資源和外界信息環境的溝通,元數據內部系統和外部系統必須是同構的。這種同構關系實際是將外部元數據系統映射到財會信息資源的內部體系中的方法。為了建立同構關系,元數據管理系統的結構應包括6個組成部分:
(1)基準元數據系統。是指某個財會信息資源標準的元數據系統。它的作用是:作為基準元數據,組織標識財會信息資源中的數字化信息資源;以標準形式描述用戶的查詢提問;為各種網絡信息發掘工具提供數字化信息。
(2)元數據字典。是一種用于各種元數據體系與系統基準元數據系統相互轉換的對照表,它描述了各種元數據的基本特征,構建了各種元數據與基準元數據系統的對應關系。其基本作用是為系統的轉換模塊提供轉換依據。
(3)數據屬性集。是指財會信息資源存儲數據的屬性總和。元數據管理系統可通過數據屬性集將財會信息資源的數據結構和基準元數據相對照,保障它們之間的可互換性。
(4)數字化信息資源集。它描述的對象是信息源。財會信息資源系統可以通過信息源特征集來確定各個信息源所采用的元數據體系,將用基準元數據表達的查詢式轉換成各個信息源所采用的元數據表達式,從而決定各個信息源的檢索方法并解釋檢索結構。
(5)轉換模塊。提供了實現各種元數據之間相互轉換、翻譯的方法。
(6)維護模塊。可以對各種對照表進行添加、刪除、修改等動態管理,保證元數據管理系統的可擴展性和可維護性。
由于元數據體系的基本作用是控制財會信息資源系統和外界進行數據交換。因此,標準性、完備性和可擴展性應該成為所有設計原則中最重要的內容。元數據體系研究設計的核心是基準元數據系統的確定。
在選擇基準元數據系統時,應該選擇由權威機構或組織制訂的,被廣泛認可和使用的元數據方案。此外,元數據體系應該能夠解釋和兼容大多數財會信息資源所涉及主題領域中,獲得公認的元數據方案,并且要求具有擴展的可能性。
2 研究內容
通過對國際財會信息資源元數據標準化發展狀況與趨勢的分析和研究,結合我國財務管理與會計服務發展狀況及對標準化的需求,研制基于XML的、符合我國國情、適用于企業管理與政府服務的技術標準規范——財會信息資源元數據,開發與之配套的、具有自主知識產權的關鍵技術,將是我們現在應立即著手進行研究的。
主要研究內容有3個方面:研究支持中國特色的財會信息資源元數據標準規范的標準框架;研究中國特色的財會信息資源元數據的標準規范的相關關鍵標準;研究中國特色的財會信息資源元數據的標準規范的支撐建模語言、建模方法。
財會信息資源元數據標準框架及關鍵標準的研究主要包括以下7個部分:
(1)財會信息資源元數據技術體系結構。主要規定財會信息資源元數據的總體架構。
(2)財會信息資源元數據消息服務規范。主要規定描述消息交換的格式,并給出保證消息的可靠安全傳輸的具體實現方法。
(3)財會信息資源元數據注冊規范。財會信息資源元數據注冊庫是財會信息資源元數據的核心,該規范主要規定財會信息資源元數據注冊機制接口和注冊服務。
(4)財會信息資源元數據公共元素字典。主要規定構成文檔的基本元素、元素的設計方法等。這些元素一般應在不同的文檔中重復出現。
(5)財會信息資源元數據文檔規范。主要規定從會計處理過程中抽取出來的相關文檔。
(6)財會信息資源元數據過程規范。主要為會計處理過程定義語義規范,使得企業可以采用統一的規范定義會計處理過程。
(7)財會信息資源元數據集成描述規范。主要規定用于描述會計處理過程所必須提供的信息。
開發一套支撐財會信息資源元數據標準規范研制和應用的核心工具——建模語言和方法。
(1)財會信息資源元數據應用建模語言FA-XAML。FA-XAML是一種支持財會信息資源元數據應用、面向對象和可視化的建模語言,它以統一建模語言UML為基礎,是UML在財會信息資源元數據應用方面的擴展。
(2)財會信息資源元數據應用建模方法FA-XAMM。 FA-XAMM是一種基于FA-XAML、用例(Use Case)驅動、以系統架構為中心的建模方法,它主要定義會計處理流程及其應用建模過程中的角色、工作流程、活動和工件,支持符合中國企事業單位特點的會計處理流程及其應用建模。
3 需要解決的關鍵技術
(1)財會信息資源元數據體系結構設計。體系結構是標準的總框架,在設計財會信息資源元數據體系結構時,將國外成熟的標準與中國企業的實際相結合。
(2)我國企業會計處理流程和財務管理模式的抽取。必須對企事業單位的會計處理流程和企事業單位財務管理模式進行大量調查、進行正確的分析和抽取。
(3)處理好標準的通用性與專用性的矛盾。財會信息資源元數據是一個通用的標準,但又要適用于特定的行業,在體系結構設計中還要使標準不過于龐大、煩瑣。我們的設計思想是在底層采用通用結構,在高層加入專用子集,使其具有很好的可擴展性。
(4)接口的定義與實現。各個模塊之間都必須通過接口訪問。因此開發工具的關鍵是接口的定義與實現。
(5)財會信息資源元數據數據庫的設計。注冊庫以
XML格式存儲數據,這是一種新型的數據庫,其數據格式和存取方式都與現有的關系數據庫不同,需要研究新的方法。
(6)財會信息資源元數據應用建模語言(FA-XAML)元模型的建立。建立完備的FA-XAML元模型是FA-XAML建模語言設計成功的關鍵。如何利用UML擴展機制,結合財會信息資源元數據及其應用建立FA-XAML元模型是一個技術難點。
4 研究方向展望
目前,我們可以在以下5個方面開展財會信息資源元數據的研究:
(1)重視財會信息資源建設。把網上信息資源的組織與整理放到重要的議事日程上。加強對網上信息資源描述和管理的研究,在數字資源的研究與開發上要充分體現以人為本的原則。同時,要加強財會信息界同行之間、財會信息資源項目之間的溝通、交流與合作,通過對元數據的理論研究與應用開發,提高財會信息資源建設的整體水平。
(2)開展專題性調查研究。組織有關元數據應用的地區性或全國性調查,全面了解元數據普及與應用的程度,廣泛征求研究人員和用戶對DC及其他元數據的意見,并公開調查結論,以促進國際元數據應用的交流和發展。
(3)加快元數據標準化研究進程。要學習與研究國際上先進、通用的元數據標準或應用方案,在充分考慮財會信息資源應用特點的前提下,對目前流行且具有國際化前景的各類元數據方案進行比較研究,在保持與國際標準接軌和兼容的基礎上,制定符合財會信息資源應用需求的擴展與應用規范。
(4)促進財會信息資源元數據應用的技術推廣。鼓勵開展一些標準化程度高、技術含量高、應用效果好的合作項目,推動對現代信息技術環境下財會信息資源元數據的編碼、著錄規范及相關技術的研究與實踐。吸收和參考各種成熟、規范的編碼體系,形成適應具體應用需求與財會信息資源特點的應用規范,提高互操作性。同時應努力探討與實施財會信息資源元數據注冊管理機制,推動標準化、模塊化的財會信息資源元數據應用方案的交流與推廣。
(5)加強各類元數據間的轉換。各種數字化項目,最終都要成為互聯網上閱讀瀏覽的網絡數據庫,各種格式的元數據在網絡數據庫間的導入和導出已成為元數據工作者研究的熱點,不同格式的元數據之間的精確互換是亟待解決的問題。在推廣元數據應用時,應進一步了解和重視各類元數據間的發展趨勢。針對各種元數據的不同特點,取長補短,發揮各自特長,對各種信息資源形態與特點的資源進行有效的內容組織與信息挖掘。加強各種元數據格式之間的融合,提高財會信息資源元數據應用的互操作性。
目前,越來越多的財會資源以數字形態產生,并通過計算機系統和網絡加以應用。這些資源可以根據不同需要,以不同層次和角度以及多種技術方法來相互連接和重組。其中,財會資源元數據標準是有效描述財會信息資源,實現資源發現和交流的基礎,它涉及操作者相關、內容相關、數據與元數據、管理系統與應用軟件等各個方面。如何結合本地需求更好地應用相關元數據標準,是各國財會科研機構共同關注的問題。目前,各國的元數據標準本土化制定工作均已取得了相當的成果。因而制定符合本國需求的財會信息資源元數據技術規范勢在必行。
由于財會信息資源建設具有地域廣泛性、技術復雜性和文化多樣性等特點,使得大量的財會信息資源難以共享,不同的財會系統也難以互相溝通。解決這個問題的關鍵在于財會信息標準化。對財會信息資源元數據標準的成功研制將充分展示我國財會科研工作者的綜合實力,完善會計信息系統的功能,實現更好地與國際發展形勢接軌。