周強
(中國人民銀行 上海總部 外匯管理部, 上海 200120)
PDCA循環理論在外匯數據質量管理上的應用研究與實踐
周強
(中國人民銀行 上海總部 外匯管理部, 上海 200120)
針對外匯數據質量影響因素多、數據質量管理難、部分業務數據質量水平低等問題,提出了一種基于PDCA循環思想的數據質量管理辦法。在計劃階段定義數據質量管理需求,設計數據質量管理業務規則和量化指標,制定了評估規則和指標,在實施階段確定數據質量水平并進行數據質量監測,在檢查階段實施登記評估,系統流程控制和層級反饋,在行動階段解決數據質量問題,通報考評并且總結修正。通過4個階段和12個過程,形成了數據質量管理的閉環和循環改進機制,通過在對外金融資產負債及交易統計數據上一年的實踐,數據質量得到顯著提升,影響數據質量的內在和外在因素得到了有效抑制。
PDCA; 數據質量; 外匯管理
當前,我國政府職能正在加速轉變,習近平總書記和李克強總理多次強調要以“壯士斷腕”的決心,全力推進行政改革和簡政放權。2009年以來,外匯局堅持以外匯管理“五個轉變”為方向,狠抓改革攻堅,大力簡政放權,有序推進資本項目可兌換,完善監測預警與事中事后管理,切實防范跨境資本流動沖擊,外匯管理服務經濟結構調整與轉型升級的能力不斷提升。
切實履行好外匯管理職責,做到“說得清、管得住、放得下”,離不開高質量的外匯數據,一是為推進簡政放權,加快貿易投資便利化提供有力支撐;二是為宏觀決策提供可靠的數據基礎。然而,從外匯管理內外部環境看,仍然存在較多制約因素,影響外匯數據質量水平。一方面,銀行是外匯管理數據的主要來源,其自身業務管控能力和技術水平直接影響到外匯數據質量高低,如其對政策的理解、自身信息化程度、業務操作流程、內控與人員培訓都將影響到外匯管理數據質量。另一方面,外匯局在數據質量管理方面進行諸多嘗試,積累了一定的經驗,但尚未建立一套可操作性強的數據質量管理體系,數據管理水平有待進一步提升。
外匯管理數據有其自身特點,比如自身并不生產數據,而是來源于銀行的交易數據和申報數據,外匯數據的產生、采集、傳輸及應用有一套復雜的機制,數據質量與內外部環境及生命周期各環節均有關。因此,數據質量管理是管理與技術相結合的一項系統工程,通過借鑒國內外質量管理做法和經驗,本文提出了基于PDCA循環的數據質量管理辦法,并在“對外金融資產負債及交易統計數據”上進行了實踐,取得了良好的效果。
1.1 數據質量評估標準
在不同時期,不同的應用場景下數據質量有不同的概念和標準。如文獻[1]定義數據質量的4個指標為一致性、正確性、完整性和最小性,這主要是從技術角度對數據質量進行衡量,然而隨著質量含義的不斷延伸,對數據質量概念的認識也從狹義向廣義轉變,準確性不再是衡量數據質量的唯一標準。從用戶使用的角度來看,即使準確性相當高的數據,如果時效性差,仍達不到質量的標準。文獻[2]指出數據對用戶必須是可信和可用的,基本評估指標包括精確性、完整性、一致性、有效性、唯一性、時間性和穩定性。文獻[3]定義的數據質量特性有可達性、正確性、完整性、一致性、時效性和相互關系。總的來看,數據質量概念主要包括以下幾個方面:一是注重從用戶角度來衡量數據質量,強調用戶對數據的滿意程度;二是數據質量是一個綜合性概念,應從多角度來評價數據的好壞;三是不同的數據其質量要素側重有所不同,如對于外匯管理數據來說,準確性、完整性和及時性是數據質量的最基本要素,而可達性、唯一性等基本不存在問題。
1.2 數據質量管理
數據質量管理源于質量管理。上世紀60年代A.V.Feigenbaun和J.M.Juran率先提出全面質量管理概念[4]。全面質量管理特點體現在“全”字上,是以質量為中心,全面的、全員參與的質量管理,是綜合運用多種科學技術手段與技術體系的,多方法的質量管理,使產品質量在整個形成過程中得到控制,實現客戶滿意度最大化。其核心是全過程的質量管理。2000年由國際標準化組織頒布的第三版IS09000族系列標準吸收了全面質量管理的精華思想,形成了8項質量管理原則:以顧客為關注焦點、領導作用、全員參與、過程方法、管理的系統方法、持續改進、基于事實的決策方法和互利的供方關系。ISO9000:2000版標準鼓勵在設計、實施和改進質量管理體系時采用過程方法,其基礎是PDCA循環,即“戴明環”,設計并實施“計劃-實施-檢查—行動”不斷周而復始的質量管理體系。PDCA循環最早由休哈特于1930年構想,后來被美國質量管理專家戴明博士在1950年再度挖掘出來,并加以廣泛宣傳和運用于持續改善產品質量的過程。PDCA循環包括Plan(計劃)、Do(實施)、Check(檢查)和Adjust(行動),PDCA循環就是按照既定的順序進行質量管理,并且循環不止地進行下去的科學程序。
Richard Y. Wang,Veda C. Storey,Christopher P. Firth等利用信息系統環境和制造環境的相似性,建立起數據產品與物質產品的聯系。顧客對應用戶,原始數據對應原材料,數據加工對應材料加工,數據產品對應物質產品。這樣,全面質量管理的原則、方法、指南和技術就可以用于數據質量管理。數據質量管理指借助質量管理方法,對各類數據質量問題,進行識別、度量、監控、預警等一系列管理活動,改善和提高組織的管理水平,使得數據質量獲得進一步提高[5]。
文獻[6]介紹了全面數據質量管理在美國國防部的有效應用。文獻[7]介紹了pdca方法在歐洲道路數據管理上的成功應用。
在數據質量管理過程中,核心環節是對數據質量的測量、評估以及清洗,這是目前研究較多的領域之一,然而影響數據質量的因素有很多,包括組織、外部環境等,單從技術層面解決數據質量的效果有限,在實際應用中,只有將管理與技術相結合才能有效實施數據質量管理。因此,利用全面數據質量管理PDCA循環理念是改進外匯數據質量的理想選擇。
通過借鑒相關研究,我們認為,以PDCA循環理論為指導,從外匯管理數據實際情況出發,結合不同業務數據的特點,有針對性的突出數據質量管理各環節中的重點,建立一套涵蓋評估、監控、報告及反饋等全流程的數據質量管理操作流程,明確外匯局各部門、金融機構等所有參與主體職責分工,定義明確的業務需求與數據管理規則,探索數據質量管理規范化、制度化建設,可以有效提高外匯數據質量水平。
按照PDCA循環理論,參考文獻[5]中的相關數據質量管理過程,結合外匯管理數據質量現狀,我們選擇的數據質量管理流程,如圖1所示。

圖1 數據質量管理PDCA流程圖
2.1 計劃階段
在計劃階段,一是選擇數據質量維度,定義數據質量要求。二是制定數據質量管理業務規則。三是設計數據質量管理監測指標。四是評估業務規則與指標。
2.1.1 定義數據質量管理需求
數據質量需要滿足外匯管理政策的要求,實現特定的業務應用。定義數據質量管理需求首先是基于業務與政策評審,識別與業務政策相關的關鍵數據,其次選擇一組數據質量維度對數據錯誤及原因進行歸類。根據數據質量評估標準的相關研究,我們認為,適合外匯管理的主要質量維度應包括:
(1) 準確性:指數據準確反映其所建模實體的程度。如應如實申報數據的主要要素信息。
(2) 完整性:指數據集全部記錄都如實存在。
(3) 一致性:指相關聯的數據之間不能有沖突。
(4) 合理性:指數據能夠準確反映業務發展水平,若數據出現異常波動,應主動調查是否數據采集出現了問題。
(5) 及時性:指對數據達到可用性標準的時間預期,如在規定時間內申報數據。
(6) 有效性:指數據值符合數據元素屬性的定義,如值域范圍要求等。
2.1.2 設計數據質量業務規則
數據質量業務規則主要有兩個來源,一是源于外匯管理政策與業務操作標準流程。外匯管理政策是交易行為的規范要求,數據是交易行為的抽象表現,應當在政策規定的框架內報送交易數據,如對外金融資產負債及交易統計數據申報規范詳細定義了每一類交易編碼的含義與使用場景,數據申報必須嚴格遵守申報要求,體現對外資金交易實質。二是通過接口規范進行定義,如組織機構代碼字段長度為9位;外匯賬戶類型取值應在事先確定的數據字典范圍內;數據表主鍵唯一等。
業務規則應由業務部門共同參與制定,強化業務部門與技術部門的溝通,一方面確保業務規則符合特定的業務需求,潛在的業務用戶能夠正確理解與運用規則開展后續數據質量監測,另一方面為業務規則向監測指標準確轉化奠定基礎,減少因規則不清晰造成指標體系不穩定。
2.1.3 設計數據質量監測指標
數據質量監測指標主要由業務規則衍生而來,具有以下特性:一是業務相關性,即每一個指標都應能夠準確說明數據質量是否符合業務預期;二是可接受程度,高質量的數質量不等于零錯報率,特別是對大數據數據質量監測,需要對指標設定可接受閾值,在閾值之內則表示符合業務預期;三是可控性,監測指標應當能夠說明數據質量問題產生的原因。
2.1.4 評估業務規則與監測指標
評估業務規則與監測指標是完善計劃階段成果的必要環節。制定業務規則是從管理制度中選擇關鍵風險點,主要由業務部門負責;設計監測指標是將業務規則轉化為數據之間、字段之間勾稽關系,運用計算機語言實現自動化、批量化操作,由技術部門負責。為保證業務規則與監測指標實現高度吻合,需要對這兩個環節進行評估。評估的主要方法,一是書面評審,由技術人員與業務人員進行面對面溝通,就業務流程與數據的依賴關系,業務流程如何使用數據,哪些數據元素對于業務應用至關重要等方面達成共識;二是指標試運行測試,分析測試結果,是否能夠發現預期的數據質量問題,是否有潛在的數據質量問題無法通過現有的指標監測。
2.2 實施階段
在實施階段,按照既定的業務規則與監測指標,確定數據質量水平基準,并將指標投入運行,觀察監測情況與預期質量水平的差距,查找出現數據質量問題的原因。
2.2.5 確定數據質量水平
運用數據質量監測指標來測量數據項與業務規則的吻合度,隔離錯誤數據,分析數據質量問題的根源,評估數據質量水平。可建立數據質量評估模板,模板主要項目包括:所關注的業務項目、關鍵數據與維度、主要業務規則、與業務規則相關聯的監測分析指標、主要監測指標的可接受閾值、數據質量問題反饋機制與處理方案等。
2.2.6 開展數據質量監測
通過自動化處理或人工操作,對全部數據進行掃描或開展抽樣檢測,測量數據對規則的符合度。監測方法主要包括:在采集環節,利用接口規范對通過接口文件形式批量采集的基礎數據進行校驗,接口規范中詳細指出不同業務類別應當包含的信息內容及內容的規范性,對于不符合規范,校驗不通過的文件將不予接收,同時金融機構端接口程序能夠接收并準確解析返回的錯誤信息;在監測環節,主要運用合規性監測指標進行監控,具有較強的剛性,往往能夠直接確認數據質量問題;在分析環節,主要運用合理性監測指標,主要包括波動檢查,計算指標的同比或環比波動率,然后與經驗值或預先確定的閾值進行比較;關聯性檢查,對兩個存在關聯關系的指標,如同增、同減等正關聯關系,以其中一方為參照物,分析另一方所處水平或變化情況。
2.3 檢查階段
在檢查階段,一是對數據質量開展持續監測,建立常態化的數據質量問題登記評估制度;二是實施流程化控制,對數據質量管理問題登記、跟蹤、處理建立控制措施;三是通過適當的形式對內、對外進行反饋,按照數據質量問題的性質、覆蓋面等,建立層次性的反饋機制。
2.3.1 登記評估
登記評估是將數據質量問題管理工作標準化。一方面需要將數據質量問題進行標準化分類。不同業務條線產生的數據問題表現千差萬別,需要透過現象看本質,把問題的性質通過標準化的概念進行表述,這有利于后續的統計分析與總結報告。另一方面將記錄事項標準化。持續性監測需要設定一段較長時間周期,在此期間內對若干機構,或業務類別進行有針對性監測,記錄數據質量問題類別、性質、數量、發生的頻率,主要涉及金融機構類別、地區或網點分布、初步原因分析,可以采取的處理措施等。
2.3.2 實施流程控制
梳理數據質量管理工作流程,實施流程化控制。一是詳細問題記錄,記錄事項必須準確,無歧義;二是分配人員,根據對問題的診斷以及既定的職責分工,確定負責跟蹤處理的人員以及監督人員;三是逐級上報,基于數據質量問題的影響,持續時間,問題的緊迫性等建立清晰的上報體系,通過系統實現并加以控制;四是監控數據質量問題處理進展情況,對逾期未完成的事項進行提示。
2.3.3 建立層級性反饋機制
反饋機制包括對內與對外兩個層面。對內,建立不同層級外匯局間、技術部門與業務部門、不同業務部門間的數據質量問題提示與反饋操作程序,對于重大數據質量問題應通過全局性平臺進行部門會商。對外,區分不同程度數據質量問題采取不同的反饋措施,對一般性質量問題,可通過接口反饋,郵件告知等方式進行提示;對重大質量問題或頻繁發生的數據質量問題,需通過約談高管、發送風險提示函等給予警示。
2.4 行動階段
在行動階段,一是要求金融機構及時處理外匯局發現的數據質量問題;二是實施通報考評,對金融機構數據報送質量水平定期進行考評;三是按照實踐情況,對業務規則與監測指標的改進。
2.4.1 解決數據質量問題
金融機構應當及時修正數據,并從源頭上查找數據質量問題的原因,糾正錯誤的數據報送流程,同時舉一反三,杜絕相同類型事件的發生。對于數據質量問題嚴重的金融機構,必要時對其內控、人員、信息系統等進行全面的考核與檢查。
2.4.2 實施通報考評
建立通報考評制度,獎懲結合,有效引導金融機構切實抓好數據質量管理工作。對數據質量狀況良好的金融機構,適當降低非現場監測頻率,減少現場核查的次數,將全面監測轉變為抽樣監測;對數據質量較差的金融機構,實施嚴格的數據質量監控,必要時可要求金融機構提供額外足以證明其數據質量符合要求的信息,或要求金融機構報送的數據顆粒度更小,細化程度更高。
2.4.3 總結與改進
通過實踐總結,對制定的業務規則與監測指標進行再評估,修正原有的數據質量管理計劃與規則,并進入新的循環。
我們將基于PDCA循環的外匯數據質量管理模型在對外金融資產負債及交易統計數據(簡稱FAL,下同)上進行為期一年的實踐,取得了良好效果。
3.1 計劃階段
對外金融資產負債及交易統計數據是由境內金融機構、境外金融機構境內主報告行及其他指定機構申報的涵蓋對外金融資產負債存量及流量的數據,包含直接投資、證券投資、存貸款等十一類數據,其數據為報表形式,共采集34張報表,根據相關政策規定,申報主體應及時、準確、完整地報送數據,同時考慮其報表統計類數據的特點,將其質量需求定義為準確性、及時性、完整性、有效性、一致性和合理性。相應的業務規則和監測指標(部分),如表1所示。

表1 FAL業務規則和質量監測指標表
3.2 實施階段
外匯局對FAL數據差錯要求“零容忍”,一經發現申報數據中存在未報、漏報送、錯報等問題時,均要求銀行立即申報、修改。
在采集環節,對于能在接口端校驗的規則(主要是有效性規則)通過接口規范對接口文件批量采集的數據進行有效性校驗,對于不符合規范的文件將拒收,將錯誤信息反饋金融機構,同時在外匯局端記錄錯誤情況,統計錯誤率,監測金融機構是否及時修正錯誤,同類錯誤是否連續出現等情況。
在監測環節,對于已入庫數據按照準確性、一致性、完整性等規則進行檢測,準確性和一致性規則具有較明確的業務邏輯和易實現性,因此可通過計算機程序進行自動校驗,發現可疑錯誤數據,經外匯局確認后通過系統分發至金融機構端,金融機構可對錯誤進行修正和反饋,系統監測錯誤狀態并實時統計規則錯誤數和錯誤率,以便后續階段評估和跟蹤處理。對于完整性規則,通過與國際收支申報系統、人民銀行報表等其他外部數據進行橫向比對,確定業務規模偏差程度,對比兩者差異,查找差異原因。
在分析環節,主要依靠人工通過環比指標和大額指標結合經驗判斷數據合理性,并將異常數據發與金融機構確認,核實錯誤情況。如C01表金融衍生品C0109結算的原始幣種選擇“黃金”,其計價單位為盎司,而C0110、C0111、C0112等數值字段金額特別巨大時其金額可能錯填成美元數量。
3.3 檢查階段
登記方面一是通過采集與管控平臺的接口校驗情況和核查結果自動記錄錯誤歷史信息,主要針對一致性、有效性、準確性等規則,對錯誤數據進行統計,如某表某規則的錯誤數、錯誤比例以及錯誤的改正情況,對問題進行初步確認,通過系統的交互功能對錯誤糾正狀態進行監測;二是人工對所有錯誤項目進行登記分類,記錄問題類型、描述、原因、處理建議、錯誤數等要素,從而為問題統計和分類評估提供依據。
在流程控制方面一是分配專人負責相應問題的跟蹤處理;二是通過采集與管控平臺確保問題的有效交互,通過系統自動化流程和人工確認相結合,使問題得到有效分發;三是監測問題處理進展,對逾期未完成的事項進行提示,核實問題處理效果,確保問題的及時有效解決;四是針對金融機構的反饋對規則進行維護,及時調整、完善核查規則,為下一輪循環奠定基礎。
在層級反饋上根據數據質量程度采取不同級別的反饋措施,一是通過接口和管控平臺的系統自動化反饋機制,使金融機構可及時看到錯誤反饋,修正后系統將更新錯誤狀態,從而使外匯局能夠跟蹤問題處理進展;二是對于管控平臺未處理錯誤采用郵件、電話等反饋形式,主要用于提示、問題交互及確認,例如對于及時性的提醒、對完整性和合理性的確認等,是目前最常要的一種反饋機制;三是對于出現嚴重質量問題或頻繁出現問題且改正不積極的啟動高管約談機制或發出風險提示函。
3.4 行動階段
金融機構是數據產生的源頭,對于外匯局而言解決數據質量問題就是加強對金融機構的監督和指導,通過對接口程序和核查結果的監測,要求金融機構查找原因,改進接口程序、加強內控管理,跟蹤問題處理進展,確保問題得到及時有效改正,同時將數據質量較好的金融機構的做法和管理經驗進行宣傳,促使金融機構更有效的提高數據質量,將數據質量問題盡量解決在金融機構內部。
為約束金融機構做好數據質量,調動其工作積極性,建立評分和通報考核制度,根據數據質量情況和考核評分標準對金融機構進行打分排名,并將考評情況向金融機構通報,引起金融機構重視。
總結與修正是對pdca循環所有步驟的利弊進行評估,是下一輪循環的依據。通過總結,一是將有效的規則、指標和管理方法、機制進行固化;二是發現不足和漏洞,對存疑規則進行修正;三是完善核查方法、提升管理效率,根據pdca循環過程中發現的問題設計新規則、新方法。總結和修正為下一輪循環奠定了基礎,使數據質量不斷提升。
通過pdca不斷循環,對外金融資產負債及交易統計數據質量得到顯著提升,通過數據質量管理,外匯局和金融機構達到了雙贏的結果。對于外匯局而言,數據質量管理流程和機制逐步規范化和標準化,人員職責清晰,核查效率提升,業務規則和監測指標不斷豐富和完善,形成了良性循環。對銀行而言,錯誤率不斷下降并逐步維持在較低水平,一年來總體錯誤率從最初的30%下降到5%左右。主要是通過數據質量管理工作使影響質量的信息、技術、流程和管理四要素得到了很大改善。例如信息因素方面,通過代碼表的及時更新使幣種代碼在金融機構和外匯局端保持一致,解決了有效性問題;技術因素方面,Z銀行由于接口程序升級不當導致6月份接口錯誤激增,很快被數據采集與管控平臺監測到,從而幫助銀行找到原因并及時修復;流程因素方面,J銀行發現主要問題是在接口人工復核環節未作修正而直接上報導致,因此加強了復核環節的核對和補錄,降低了出錯率;管理因素方面,金融機構管理水平得到顯著提升,人員培訓得到加強,從而解決了報送范圍不明確、數據質量處理不積極等問題。
本文研究了PDCA循環理論在外匯數據質量管理上的應用,定義了PDCA 4個環節的具體活動,通過用于對外金融資產負債及交易統計數據的實踐,解決了很多實際問題,不僅數據質量得到提高,數據管理的機制體制也得到進一步加強。同時我們也看到數據質量管理的精度有待提高,很多細節需要進一步研究,如完整性、合理性的核查需要更智能化的方法。下一步我們將繼續立足外匯管理實際,加強數據質量管理研究,在提升數據質量管理的同時提升數據質量管理工作效率。
[1] 郭志懋, 周傲英. 數據質量和數據清洗研究綜述 [J].軟件學報,2002,13(11):2076-2077.
[2] 楊青云,趙培英,楊冬青,等.數據質量評估方法研究[J].計算機工程與應用,2004,40(9):3-4.
[3] 丁海龍,徐宏炳.數據質量分析及應用[J].計算機技術與發展,2007,17(3):236-237.
[4] 張根保. 現代質量工程[M].北京:機械工業出版社,2000: 8-25.
[5] DAMA International.DAMA數據管理知識體系指南[M].馬歡,劉晨等,譯.北京:清華大學出版社,2012:213-230.
[6] 商廣娟.有效的數據質量管理體系—21世紀管理的基石[J].航空標準化與質量, 2005(2):18-22.
[7] T Wiltschko,T Kaufmann.Quality Assured Road Information for ITS-Applications-the Quality Concept of EuroRoadS[C]// World Congress on Intelligent Transport Systems,San Francisco,2005,12:2491-2502.
A PDCA Based Model on the Application and Practice of Foreign Exchange Data Quality Management
Zhou Qiang
(Shanghai Headoffice Foreign Exchange Administration,the People’s Bank of China,Shanghai 200120,China)
There are many factors affect the data quality of foreign exchange, so data quality management is difficult in this area, quality of part business data is at the low level. To solve the problem, a new data quality management approach based on PDCA cycle is presented. In the planning phase,we define quality management needs,design business rules and quantitative indicators of data quality,and evaluate these rules and metrics.In the implementation phase,we determine the level of data quality and imprement to monitor data quality. In the checking phase, we do registration and evaluation of data quality, adopt system flow control and level feedback. In the action phase, we resolve data quality issues, circulate information and take assessment. Finally we summarize and correct all the phases.These four phases and 12 sub-processes form a closed loop and circulation mechanism for improving data quality. Through a year of practice in foreign financial assets, liabilities and transactions statistical data, data quality has been significantly improved, the internal and external factors of data quality have been effectively restrained.
PDCA; Data quality; Foreign exchange administration
周 強(1984-),男,工程師,研究方向:數據挖掘、信息安全,上海 201203
1007-757X(2017)01-0062-05
TP311
A
2016.05.16)