



摘要:在我國金融統計標準化建設進程中,如何建立一個大數據模型來促進元數據和統計數據之間進行批量信息轉換和處理,是金融統計標準化工作落地的一大難題。西班牙、法國等歐洲主要國家中央銀行通過運用數據點模型(DPM)搭建元數據和統計數據之間的數據關系,進而推動標準化數據的批量信息采集、轉換和處理,其建模理念、建模框架對于推進我國金融統計標準化建設提供了啟示借鑒。
關鍵詞:金融統計;數據點;標準化;大數據模型
一、基本框架
西班牙、法國等歐洲國家中央銀行根據貨幣統計或其他監管統計要求,通過建立工具分類標準收集受監管機構或信貸機構的公共財務數據、利率統計數據和非金融公司的資產負債數據,并以XBRL(即可擴展商業報告語言,是一種可擴展、標準化的語法格式)分類標準表單作為中央數據倉庫,形成能夠直接在網頁上就實現輸入和輸出數據的XML(是一種自我描述的、可擴展的、標準化的交換數據方法)標記語言。而在數據倉庫中通過運用數據點模型(DPM)來搭建元數據和統計數據之間的數據關系,適時推動標準化統計數據的批量采集、轉換、處理和生成,實現元數據輸入端到統計數據輸出端的直接轉換和處理,推動金融統計工作標準化的落地工作。當前,運用數據點模型(DPM)創建XBRL分類標準已逐漸被歐洲各國中央銀行和統計部門所使用。其中,西班牙銀行最早于2010年6月就開始使用DPM模型構建XBRL分類標準;歐洲銀行業監管局(EBA)于2013年12月發布了根據DPM構建的最新XBRL分類標準,推動金融統計工作標準化。
二、數據點模型建設經驗
歐洲國家中央銀行和銀行業監管部門運用數據點模型,推進金融統計工作標準化的建設經驗主要包含以下幾方面內容。
(一)引進多維度、多層次定性信息對元數據進行描述
數據模型主要是金融機構元數據向監管部門統計數據之間轉變的“橋梁”。傳統的數據模型主要有表單中心方法和數據中心方法(見表1)。表單中心方法僅能通過表單中的橫坐標和列坐標等二維信息對數據進行描述,無法了解諸如年份、幣種、國別等多維度信息內容;而數據中心模型盡管增加了元數據的定性信息,但對于定性信息中指標的分層次信息(例如國別區域項下的州級區域)則無法體現。因此,數據點模型通過引進多維度、多層次的定性信息共同對元數據進行描述,將數據主要信息存放至度量元素中,其他定性信息則以維度或參考信息等形式存在,克服了傳統數據模型維度小、層次低及交叉數據難統計的模式。
(二)創建標準、開放、可拓的數據點模型結構
數據點模型的基礎是數據點,核心是通過對數據點定性和定量信息進行確定并形成一個完整的數據點結構,以數據點結構的形式將元數據存儲至中央數據倉庫,并結合統計需求生成所需的統計數據。一般而言,一個數據點就代表著一個統計數據需求,數據點結構涵括度量、維度特征和其他參考信息等三大類信息(見圖2),數據點結構主要具有標準性和開放、可拓性特征。一是監管部門基于統計需要,可以自行設定數據點結構搭建數據模型,同時還可結合指標進一步充實維度和層次等定性信息,滿足數據模型的開放、可拓性特征;二是由于所有的定性和定量指標都參照國際通用金融工具分類標準,因此整個數據點結構均具有標準化特征。
(三)減少數據冗余定義,降低數據信息重復統計
一是增強元數據的統一性。由于引入了多維度、多層次定性信息,使得數據能夠在更廣泛的中央數據倉庫中儲存、轉換和處理,確保了元數據到統計數據的標準化統一。二是降低了數據信息的重復統計。在數據點建模過程中,每一個數據點都只會被定義一次,并且通過對域(例如交易對手國)、域成員(例如交易對手國域下的美國、中國、歐洲等)和分層關系(例如“父子”關系、“總分”關系、域成員關系)明確細分,確保數據點模型擁有明確的數據點結構,避免了傳統的表單匯總方式下數據的冗余定義,降低了數據信息重復統計。
(四)推動統計數據的自動批量信息采集、轉換和處理
運用數據點模型構建的數據結構框架,可以有效推動金融機構從元數據到監管部門統計數據之間的標準化批量數據采集、轉換和處理(見圖3),即通過數據點模型格式實現元數據到金融數據的采集、轉換和處理。一是金融機構通過將數據點結構運用至其會計、信貸或其他金融統計系統,實現金融機構的各項業務屬性均以數據點的形式逐筆統計并存儲。二是監管部門通過在中央數據倉庫中運用同樣的數據點結構,實現對金融部門的批量標準化數據點進行批量接收、存儲;再根據統計數據需求設定其維度、區域、幣種等條件限制,在中央數據倉庫中對符合所有條件限制的數據點進行自動歸集、匯總、處理,最終生成所需的統計數據。
(五)設置科學、嚴謹的數據建模步驟
數據點模型建模步驟主要有5個:
1、定義字典元素。根據統計要求,明確所需統計數據的度量、維度、域及域成員,構成了模型字典元素。字典元素主要區分為定量和定性進行區分,定量方面主要是由元數據來解釋數據的相關信息,而定性方面則涵括主維度元素類別、域的創建、維度定義和每一個域成員的默認值。
2、確定分層關系。將一組成員的層次結構進行規范并定義計算規則和概念。首先是對域成員分層進行定義,定義關系一般有三種,分別是以表象方式為目的的父子關系、以匯總方式為目的的總分關系和以解釋域成員之間語義的域成員關系。
3、定義數據點。數據點的定義方式是通過在一個度量元素和其相關維度元素之間建立關系。例如一個數據其主維度元素是基于金額類型,那么其相關維度元素可能涵括風險類別、市場國家、工具持倉、資產組合等維度內容。
4、定義標準化表單和確保數據點模型質量。該步驟需要專業的分類標準制造商(例如IT專家)來完成,其目的是從不同的模塊中生成規范化的表單,并在表單內顯示所有相關的維度元素。一旦創建完表單之后,需要由監管部門專家或標準制造商進行檢查其質量,如果發現表單邏輯不一致等相關錯誤,那么需要對表單中所使用的域或域成員之間的差異進行溝通交流。
5、數據點模型發布。當分類標準表單創建完成,數據點模型將會被提交至相關部門來創建XBRL分類標準,以此收集和存儲相關數據。在XBRL的創建過程中將進行最后的質量檢查,如果質量檢查失敗,那么數據點模型將會返回修正進行重新分類。
三、啟示借鑒
歐洲主要國家中央銀行數據點模型為我國金融統計系統搭建大數據模型,推進金融統計工作標準化提供了啟示借鑒。
(一)以數據點模型為基礎,搭建標準化數據信息處理平臺。當前國內金融統計方法主要采取表單式統計,無法對單點數據的所有相關維度進行描述。因此,建議我國推進金融統計標準化過程中,在現行的工具分類標準和元數據標準下,以數據點模型為基礎,搭建中央數據倉庫,實現金融機構與中央銀行的數據對接,實現元數據到統計數據的標準化、自動化采集、轉換和處理,切實推動金融統計標準化落地工作。
(二)搭建標準化、開放性的數據點結構。從數據點結構可以看到,監管部門可以適時根據金融創新情況對金融工具進行標準化定義并對數據點結構的指標等維度內容進行擴充,而當前我國存貸款標準化綜合抽樣試點工作中則將存貸款余額和發生額指標的所有維度內容進行了確定,并以表單或統計系統形式采集其相關數據。因此,隨著互聯網等金融創新不斷推進,建議盡快建立以數據點結構為基礎的數據模型,并適時開放部分指標端口,提供開放性的數據點結構,擴充最新金融工具分類。
(三)建議研究制定金融業數據點模型的構建工作,推動金融業綜合統計工作。歐洲國家中央銀行、管理機構已經逐步開始運用數據點模型推動數據統計標準化工作,并相繼發布了貨幣金融統計、利率統計和保險業統計分類標準表單。因此,建議研究構建我國金融業數據點模型,按照數據點模型的建模步驟,結合我國金融業綜合統計目標和要求,制定并發布金融業數據點模型下的分類標準表單,并引導金融機構按照金融業數據點模型的分類標準表單構建其統計系統,用于逐筆統計金融工具標準下的每一個單點數據,實現金融業綜合統計標準化目標。
參考文獻:
[1] Collins,J.(2013),Comparison of Relational and Multi-Dimensional Database Structures,http://www.alphadevx.com/a/36-Comparison-of-Relational-and-Multi-Dimensional-Database-Structures,retrieval,28.02.2013.
[2] Weber,A.(2013) Data Point Methodology - Guidance for the preparation of data point models based on European supervisory reporting frameworks,Bachelor thesis of the BW Cooperative State University.May,2013.
[3] Deutsche Bundesbank(2013),Improving transparency in financial and business reporting Harmonisation topics — Part 2:Guidelines for data point modelling,11.2013.
[4] Banco de Espa a (2012),DPM Architect for XBRL,Update Demo,www.eurofiling.info/201212/presentations/DPM_Morilla_20121213.ppsx,retrieval,10.04.2013.