摘要:金融元數(shù)據(jù)模型(MMF)是為了滿足金融行業(yè)元數(shù)據(jù)共享而建立的模型,通過(guò)對(duì)金融行業(yè)各個(gè)部門(mén)的信息流的分析與歸納,根據(jù)數(shù)據(jù)倉(cāng)庫(kù)理論和根據(jù)Dublin Core體系的要求,提出了MMF的設(shè)計(jì)方案,并通過(guò)對(duì)這一自主設(shè)計(jì)的模型的實(shí)際使用進(jìn)行了舉例說(shuō)明。
關(guān)鍵詞:元數(shù)據(jù);數(shù)據(jù)倉(cāng)庫(kù);數(shù)據(jù)共享
中圖分類(lèi)號(hào):TP
文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1672-3198(2010)13-0189-02
1 引言
隨著我國(guó)金融市場(chǎng)的快速發(fā)展,不同金融部門(mén)之間數(shù)據(jù)共享的問(wèn)題越來(lái)越嚴(yán)重,無(wú)論是經(jīng)濟(jì)主體在經(jīng)濟(jì)業(yè)務(wù)方面,還是金融政策的決策與金融監(jiān)管的進(jìn)行,都需要大量與準(zhǔn)確的金融數(shù)據(jù)。于是金融數(shù)據(jù)的共享問(wèn)題成為了當(dāng)前的焦點(diǎn)。而數(shù)據(jù)倉(cāng)庫(kù)作為數(shù)據(jù)共享的最佳方案成為了需要發(fā)展的技術(shù),而數(shù)據(jù)倉(cāng)庫(kù)的前提,元數(shù)據(jù)模型的研究也日漸深入。
元數(shù)據(jù)被定義為data about data。它被應(yīng)用在各個(gè)不同的領(lǐng)域。而在數(shù)據(jù)倉(cāng)庫(kù)領(lǐng)域元數(shù)據(jù)則用來(lái)描述數(shù)據(jù)以及數(shù)據(jù)環(huán)境。元數(shù)據(jù)及其管理是數(shù)據(jù)倉(cāng)庫(kù)領(lǐng)域中非常重要的一個(gè)方面,它貫穿于數(shù)據(jù)倉(cāng)庫(kù)的設(shè)計(jì)、開(kāi)發(fā)、運(yùn)行和維護(hù)的全過(guò)程,對(duì)元數(shù)據(jù)組成結(jié)構(gòu)的研究以及統(tǒng)一管理已經(jīng)成為一種迫切的需要。在數(shù)據(jù)倉(cāng)庫(kù)領(lǐng)域,元數(shù)據(jù)記錄著源數(shù)據(jù)庫(kù)與目標(biāo)數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)模型、物理數(shù)據(jù)結(jié)構(gòu)及其相關(guān)匹配模式等重要信息。
通過(guò)針對(duì)金融市場(chǎng)中存在的信息流的分析與歸納,通過(guò)使用自主設(shè)計(jì)的金融元數(shù)據(jù)模型MMF(Metadata Model of Finance),來(lái)將不同類(lèi)型的數(shù)據(jù)轉(zhuǎn)化為元數(shù)據(jù)形式,并通過(guò)XML格式從而方便數(shù)據(jù)倉(cāng)庫(kù)的建立以及數(shù)據(jù)共享的進(jìn)行。
2 信息流分析以及信息歸納模式分析
在建立元數(shù)據(jù)模型前,必須先對(duì)該行業(yè)有足夠的了解,清楚其業(yè)務(wù)流程以及涉及到的信息流,再對(duì)涉及到的元數(shù)據(jù)進(jìn)行歸納總結(jié)。才能夠?qū)崿F(xiàn)數(shù)據(jù)倉(cāng)庫(kù)對(duì)決策的支持。并根據(jù)此來(lái)建立起正確的元數(shù)據(jù)模型。因此我們先對(duì)金融市場(chǎng)中存在的經(jīng)濟(jì)主體以及涉及到的經(jīng)濟(jì)主體的信息流進(jìn)行總結(jié)分析。
2.1 信息流分析
參與金融活動(dòng)的經(jīng)濟(jì)主體,按照其所屬行業(yè)的不同,主要分為中央銀行,商業(yè)銀行,證劵公司,投資基金,信托投資,金融租賃公司,非金融類(lèi)企業(yè)。他們都參與六種金融市場(chǎng)業(yè)務(wù)。六種金融市場(chǎng)業(yè)務(wù)分別是貨幣市場(chǎng)業(yè)務(wù),外匯市場(chǎng)業(yè)務(wù),商業(yè)市場(chǎng)業(yè)務(wù),證劵市場(chǎng)業(yè)務(wù),信托租賃業(yè)務(wù),保險(xiǎn)市場(chǎng)業(yè)務(wù)。
在分析了所有金融行業(yè)的信息流之后,我們將每一種不同行業(yè)的信息流分為6個(gè)部分的信息。而所有行業(yè)的信息流的這6個(gè)部分的信息一起將完整的描述所有金融行業(yè)在參與金融業(yè)務(wù)時(shí)候的所有信息內(nèi)容。這六種信息分別是政策信息、交易信息、結(jié)算信息、財(cái)務(wù)信息、賬戶信息、資金信息。而這些信息具體所包含的內(nèi)容在接下來(lái)數(shù)據(jù)類(lèi)型的詳細(xì)構(gòu)造中將進(jìn)行敘述。而這六個(gè)部分與金融主體信息流之間的關(guān)系見(jiàn)圖1
通過(guò)圖1可以看出,不同的經(jīng)濟(jì)主體所包含不同種類(lèi)的信息,通過(guò)這些信息,可以清楚的描述每種信息流的內(nèi)容。2.2 信息歸納模式分析
在MMF中,將金融數(shù)據(jù)的歸納分析按照其信息的來(lái)源,分析手段的不同分為初級(jí)、中級(jí)、高級(jí)三種級(jí)別。初級(jí),來(lái)自某個(gè)數(shù)據(jù)集合的單一類(lèi)別,分類(lèi)統(tǒng)計(jì)OLAP等。高級(jí),來(lái)自某個(gè)數(shù)據(jù)集合的多個(gè)類(lèi)別,OLAP 關(guān)聯(lián)分析。綜合級(jí),來(lái)自多個(gè)數(shù)據(jù)集合的多個(gè)類(lèi)別以及低級(jí)分析結(jié)果,各種數(shù)據(jù)挖掘分析手段。
3 MMF的構(gòu)成概況
在經(jīng)過(guò)了對(duì)金融數(shù)據(jù)流的分析以及歸納之后,MMF模型的設(shè)計(jì)就應(yīng)運(yùn)而生了,參照Dublin Core的要求,該模型要實(shí)現(xiàn)金融元數(shù)據(jù)的語(yǔ)義和語(yǔ)法方面的要求,體現(xiàn)各個(gè)元數(shù)據(jù)之間的內(nèi)在邏輯關(guān)系。
3.1 MMF的目標(biāo)以及特征
設(shè)計(jì)MMF的目的就是建立一個(gè)統(tǒng)一的元素?fù)?jù)模型,供各個(gè)不同的金融行業(yè)進(jìn)行使用建立起自己獨(dú)特的元數(shù)據(jù)體系,并且在統(tǒng)一的語(yǔ)法條件下建立數(shù)據(jù)倉(cāng)庫(kù)以進(jìn)行金融數(shù)據(jù)的共享與數(shù)據(jù)分析。而作為一個(gè)元數(shù)據(jù)模型,具體應(yīng)該涉及的是統(tǒng)一的元數(shù)據(jù)模型以及如何轉(zhuǎn)化為滿足自己行業(yè)要求的元數(shù)據(jù)模型。因此MMF要滿足以下的特征。
(1)多樣性。MMF 中語(yǔ)意模型與編碼方法相分離,未對(duì)編碼的實(shí)現(xiàn)做出限制, 保證了MMF 實(shí)現(xiàn)的多樣性, 語(yǔ)意模型可對(duì)應(yīng)多種編碼綁定方法, 如XML 編碼綁定。
(2)完整性。MMF 的內(nèi)容, 應(yīng)當(dāng)是行業(yè)內(nèi)部所以的數(shù)據(jù)流和處理算法的全集, 在映射到具體行業(yè)時(shí), MMF 或其子集可直接作為該行業(yè)的元數(shù)據(jù)模型加以修改, 以提高實(shí)現(xiàn)的效率和質(zhì)量。
(3)高通用性。MMF的內(nèi)容, 層次清晰、通用性強(qiáng), 可以保證元數(shù)據(jù)的不同編碼方式都具有較好的語(yǔ)意互操作性, 也保證了不同編碼間轉(zhuǎn)換方法的便捷性。
(4)高穩(wěn)定性。作為金融行業(yè)通用元數(shù)據(jù)模型, MMF中包含的元數(shù)據(jù)應(yīng)以合理的方式進(jìn)行管理與配置, 以保證模型自身的穩(wěn)定。
(5)可擴(kuò)展性。MMF 能夠隨著該行業(yè)業(yè)務(wù)內(nèi)容的增加、業(yè)務(wù)邏輯的調(diào)整, 各種新的數(shù)據(jù)類(lèi)型與分析模式的出現(xiàn), 方便地實(shí)現(xiàn)對(duì)模型自身內(nèi)容的擴(kuò)展、更新, 以保證模型的有效性。
3.2 MMF的總體結(jié)構(gòu)
在MMF中,所有的信息根據(jù)其描述內(nèi)容的不同分為6個(gè)部分,即模型信息類(lèi)別、數(shù)據(jù)信息類(lèi)別、變量標(biāo)準(zhǔn)類(lèi)別、處理過(guò)程類(lèi)別、角色權(quán)限類(lèi)別、數(shù)據(jù)組織類(lèi)別。各個(gè)信息之間相互獨(dú)立。MMF的模型MMF的構(gòu)造方法是自上而下, 逐步細(xì)化的。在進(jìn)行分析時(shí), 可以歸納為:MMF 基本構(gòu)成單元為數(shù)據(jù)元素, 數(shù)據(jù)元素根據(jù)相互間語(yǔ)義的關(guān)聯(lián), 構(gòu)造出類(lèi)別表、定義表和詞匯表等中間部件, 逐級(jí)綜合, 最終構(gòu)成MMF 的整體。MMF對(duì)所有的中間部件都給出了引用名稱、定義等方面的規(guī)范, 而在于數(shù)據(jù)元素部分, 又給出了數(shù)據(jù)類(lèi)型和取值范圍的說(shuō)明。MMF的總體結(jié)構(gòu)可以用表格的形式描述,而采用樹(shù)狀圖的方法, 則能更加直觀地體現(xiàn)出其結(jié)構(gòu)的層次性。
4 部分元數(shù)據(jù)類(lèi)別的詳細(xì)構(gòu)造
在這里我們針對(duì)變量標(biāo)準(zhǔn)和處理過(guò)程兩個(gè)類(lèi)別進(jìn)行具體實(shí)例的研究,對(duì)元數(shù)據(jù)的具體語(yǔ)義特征進(jìn)行更加細(xì)化的劃分,以實(shí)現(xiàn)對(duì)其功能的具體描述。
4.1 變量標(biāo)準(zhǔn)類(lèi)別的構(gòu)造
在MMF中,根據(jù)收集到的信息來(lái)源不同,將所有的信息分為6個(gè)類(lèi)別,作為變量類(lèi)別的子類(lèi)別。見(jiàn)表1所示。
4.2 MMF與Dublin Core的映射關(guān)系
Dublin Core 到MMF的映射。Dublin Core是較早的元數(shù)據(jù)規(guī)范, 最初用于對(duì)與網(wǎng)絡(luò)文本資源有關(guān)的元數(shù)據(jù)進(jìn)行描述, 其中的數(shù)據(jù)元素包括標(biāo)識(shí)符( Identifier) 、標(biāo)題(Title) 、語(yǔ)種(Language) 、描述(Description) 、主題及關(guān)鍵字( Subject and Keyword) 等15 類(lèi), 每個(gè)元素都有一個(gè)描述性的名稱, 用于對(duì)該元素的通用語(yǔ)義理解進(jìn)行表述。為了提高互操作性, 許多數(shù)據(jù)元素都有相關(guān)的詞匯表。近年來(lái), Dublin Core 得到了不斷擴(kuò)充, 應(yīng)用范圍也日益擴(kuò)大。作為金融行業(yè)的元數(shù)據(jù)模型, MMF是依照Dublin Core 規(guī)范的構(gòu)造方法和對(duì)元數(shù)據(jù)的分析而建立的, MMF中所包含的數(shù)據(jù)元素雖然與Dublin Core 規(guī)范中的數(shù)據(jù)元素在語(yǔ)義、結(jié)構(gòu)等方面存在著不同, 但仍可建立一定的映射關(guān)系。這種映射關(guān)系的存在, 對(duì)于用戶正確理解MMF的結(jié)構(gòu), 建立自己的元數(shù)據(jù)模型, 具有較大的幫助。
5 發(fā)展趨勢(shì)
MMF 是根據(jù)數(shù)據(jù)倉(cāng)庫(kù)理論和Dublin Core 規(guī)范的要求, 在對(duì)金融業(yè)務(wù)知識(shí)進(jìn)行了分析與總結(jié)的基礎(chǔ)之上, 提出的適合金融行業(yè)通用的元數(shù)據(jù)模型。利用該模型, 可以為不同金融行業(yè)數(shù)據(jù)倉(cāng)庫(kù)項(xiàng)目的建設(shè)提供指導(dǎo), 從而提高工作效率。由于MMF 所包含的元數(shù)據(jù)來(lái)源較廣, 性質(zhì)多樣,如何利用這些數(shù)據(jù)分析出有效的結(jié)果,特別是在進(jìn)行非結(jié)構(gòu)化信息(如政策信息)的元數(shù)據(jù)的歸納時(shí), 如何確保其內(nèi)容的準(zhǔn)確、合理、快速的被分析和理解,并得到有效的結(jié)論,將是今后研究的重點(diǎn)。
參考文獻(xiàn)
[1]Dublin Core Metadata Element Set ,Version 1. 0 :Reference De2、scription (EBPOL). http :PPwww. dublincore. org PdocumentsP,2004-05-24.
[2]盛昌銀. 都柏林核心元數(shù)據(jù)——網(wǎng)絡(luò)信息資源組織的新標(biāo)準(zhǔn)[J ].現(xiàn)代圖書(shū)情報(bào)技術(shù),2003,(1):44–47.
[3]David Marco(美).元數(shù)據(jù)倉(cāng)儲(chǔ)的構(gòu)建與管理[M].張銘,李欽等譯.北京:機(jī)械工業(yè)出版社,2004.
[4]彭蓉,劉進(jìn)等譯.John Poole,Dan Chang等著.公共倉(cāng)庫(kù)元模型開(kāi)發(fā)指南[M].北京:機(jī)械工業(yè)出版社,2004.
[5]David Marco(美).張銘,李欽等譯.元數(shù)據(jù)倉(cāng)儲(chǔ)的構(gòu)建與管理[M].北京:機(jī)械工業(yè)出版社,2004.
[6]Extensible Markup Language (XML) 1. 0 (Second Edition) . W3C ,2000.
[7]Alexander R. Dunegan. A Metadata Approach to Managing XML in Relational Databases. MS Thesis ,Emory University ,August ,2003.
[8]江念南.證券行業(yè)通用元數(shù)據(jù)模型的研究[J].情報(bào)科學(xué),2006,24(1).
[9]Adam Mathes Cooperative Classification and Communication Through Shared Metadata Computer Mediated Communication-LIS590CMC Graduate School of Library and Information Science University of Illinois Urbana-Champaign December,2004.