999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

模型驅動方法論在業務中臺中的實踐研究(三)

2020-05-18 13:23:31李忠民高曉欣
現代信息科技 2020年20期

李忠民 高曉欣

摘? 要:數據詞典是確保數據一致性的主要措施,通過編制數據詞典確保數據一致性,避免重復甚至沖突的定義,是系統建設中重要的基礎性工作,但是對于大型系統來說涉及的詞匯量巨大,數據詞典的編制面臨著管理上、業務上等諸多困難,確保數據詞典本身的質量是一個重要問題。文章在某大型央企的業務中臺的建設過程中,對編制方法進行了研究,在該方法的指導下完成了詞匯梳理工作,從中提煉編制了數據詞典,并結合MDA方法論在業務中臺項目實現落地。

關鍵詞:模型驅動架構;數據詞典;數據元

中圖分類號:TP393.09? ? ? 文獻標識碼:A 文章編號:2096-4706(2020)20-0107-05

Research on the Practice of Model Driven Architecture in the Middle Office (3)

——Establishment and Implementation of Data Dictionary

LI Zhongmin,GAO Xiaoxin

(Beijing China-Power Information Technology Co.,Ltd.,Beijing? 102208,China)

Abstract:Data dictionary is the main measure to ensure data consistency. It is an important basic work in system construction to compile data dictionary to ensure data consistency and avoid duplicate or even conflict definitions. However,for large-scale systems,the vocabulary involved is huge,and the compilation of data dictionary faces many difficulties in management and business. To ensure the quality of the data dictionary itself is an important issue. In the construction process of the financial center of a large-scale central enterprise,researched the compilation method,under the guidance of this method,we have completed the word sorting work,extracted and compiled the data dictionary,and combined with the MDA method to achieve the implementation of the financial middle office project.

Keywords:model driven architecture;data dictionary;data element

0? 引? 言

對大多數企業來說數據不一致是一個突出的數據質量問題,已經嚴重制約企業信息化應用水平的提高。從企業的角度,不同時期、不同業務條線重復建設,系統林立,系統之間相互割裂,呈煙囪式架構,造成數據無法共享,業務無法銜接。從單一系統來看,一是由于不規范的設計,存在同一個語義的數據項多次定義,且每次定義的類型、長度、精度都存在不一致的情況;二是隨著系統的優化升級,不斷地貼補丁,引入重復定義和不一致的定義,進一步加劇了數據不一致性。獲得企業范圍的數據一致性,是企業信息化建設中孜孜以求的目標,從企業視角看,解決這個問題的關鍵是制定數據的企業標準,從單個系統的層次看,就是根據數據標準編制數據詞典。

作為業務中臺的承建單位,我們展開了數據詞典編制方法論研究,提出了經實踐證明可行的業務中臺數據詞典編制方法。同時模型驅動架構方法論(MDA)是一種系統分析和設計的方法論,它把系統分析和設計過程抽象為一系列前后依賴的模型的建模過程,實現了業務需求的結構化描述,該方法論在業務中臺中得到應用。實踐中我們有機結合二者,不但應用于數據詞典的編制,而且做到切實貫徹落實到系統分析設計過程中去,取得了不錯的效果。本文總結業務中臺數據詞典編制和實施實踐經驗,提出一個可行的數據詞典的編制方法,并結合MDA方法論,探討了在系統分析設計過程中貫徹落實數據詞典的路徑。

1? 數據詞典制定過程中的幾個關鍵概念

1.1? 數據元

一種元數據,在本文中特指模型中的數據項及其抽象父類,如邏輯模型中的屬性、物理模型中的字段等。每個數據元都由定義域、值域來描述,定義域即數據元的語義,值域即Domain,包括數據元的取值范圍、編碼規則、格式等約束,如圖1所示。

1.2? 語義

數據元的定義域,不同的數據元語義不同,某些數據元之間在語義上存在泛化關系,存在泛化關系的數據元雖然語義不同,不過子類是父類語義的細化和補充明確。

1.3? Domain

數據元的值域,每個數據元都由語義和Domain二者來定義。Domain包括:數據類型、取值范圍(對于枚舉)、編碼規則、格式、最大值/最小值等約束,詳見圖1。Domain的概念是數據詞典制定過程中的關鍵概念,是保持數據的一致性的重要措施。

1.4? 抽象數據類型

數據元的最高層抽象,規定了能夠加之于其上的操作集合,如數值型可以進行加減乘除等操作,在數據標準這個領域,抽象數據類型分為數值型、字符型、日期型等,全部抽象數據類型的集合是數據類型詞典。

1.5? 抽象數據元

一種元數據,數據模型中數據項的抽象父類,如“身份證號”是“投標人身份證號”“企業法人代表身份證號”等數據項的抽象數據元。抽象數據元的集合構成數據元詞典。

1.6? 標準數據元

一種元數據,為某個抽象數據元的具體化,是領域模型中的屬性,邏輯模型中的屬性,物理模型中的字段的標準定義,每個標準數據元都是某個抽象數據元的子類,繼承于同一抽象數據元的多個標準數據元,其值域保持一致。如“投標人身份證號”“企業法人代表身份證號”是標準數據元,其繼承于“身份證號”這一抽象數據元,其數據類型、長度、編碼規則都與“身份證號”保持一致。標準數據元的集合構成數據詞典。

1.7? 普通數據元

一種元數據,各類模型中描述數據的原子單位,如領域模型中的屬性,邏輯模型中的屬性,物理模型中的字段。普通數據元與標準數據元是遵從關系,每個普通數據元必須且只能遵從于一個標準數據元,其語義和值域與該標準數據元嚴格一致。例如數據模型的合同、合同履約信息等多個實體中都存在“投標人身份證號”,這些數據項都對應著數據詞典中的“投標人身份證號”這個標準數據元,且語義、值域與其保持嚴格一致,這種關系可以確保在整個模型中所有“投標人身份證號”的長度、編碼規則等特征完全一致。

1.8? 數據詞典

數據類型詞典、抽象數據元詞典和標準數據元詞典共同構成數據詞典,定義了企業范圍內所有數據元的權威的語義和值域。

2? 元數據之間的關系

元數據之間存在三種關系:組合關系、泛化關系、遵從關系,如圖2所示。

在數據詞典制定時存在一個重要的基礎性原則:即存在泛化關系或遵從關系的數據元其值域(Domain)嚴格一致,該規則是制定數據詞典和在模型中貫徹數據詞典的重要依據。

2.1? 組合關系

如圖2所示,從左向右,元數據存在組合關系。數據詞典由數據類型詞典、抽象數據元詞典和標準數據元詞典構成;數據類型詞典規定了元數據體系的最高抽象層次中的元素,即企業的數據的抽象數據類型,抽象數據類型數目是有限的、可枚舉的,一般有三種:字符型、數值型、日期型。抽象數據元詞典由抽象數據元構成,其中的每個抽象數據元語義互相獨立,不存在相同的兩個抽象數據元;標準數據元詞典由標準數據元構成,每個標準數據元都是某個抽象數據元的子類,其Domain與其父類嚴格一致,不存在相同的兩個標準數據元;數據模型由普通數據元構成,一個模型中可以存在多個相同的普通數據元,普通數據元其語義和值域都嚴格遵從標準數據元。企業級的數據詞典實現對企業范圍的所有數據概念的全覆蓋、無遺漏、不重復的定義,且給出公司級的、權威的語義和值域定義。

2.2? 元數據的泛化關系

從上向下在元數據的各個概念中存在三個層次的抽象,即抽象數據類型、抽象數據元、標準數據元,具體含義為:

(1)抽象數據類型:最高層的抽象是抽象數據類型,抽象數據類型規定了數據的可能取值的范圍和可以作用其上的操作,作為最高的抽象形式,只有種類有限的數據類型,如字符型、數值型、日期型等。

(2)抽象數據元:第二層抽象是抽象數據元,其規定了數據元的抽象語義和Doma,抽象數據元繼承了抽象數據類型的所有特征,在此基礎上,又增加了語義和Domain等信息,即數據類型、編碼規則、取值范圍、格式、最大值/最小值等信息,抽象數據元的數據類型一定是抽象數據類型的某個枚舉值,抽象數據元的構成元素詳見圖1。

(3)標準數據元:第三層抽象是標準數據元,標準數據元是數據的模板,對應著模型中的“屬性”“字段”等元素。標準數據元的構成元素與抽象數據元相同,但標準數據元必須是某個抽象數據元的子類,其語義繼承父類的語義并進行細化,而其Domain與其父類保持完全一致,一個父類可以有多個子類,通過這種值域上的絕對一致性,使得同一父類的數據能夠保持全域一致性,簡化了數據交換的困難,促進了數據共享。如“投標人身份證號”“企業法人身份證號”這兩個標準數據元存在共同父類“身份證號”,因此二者的Domain都與父類“身份證號”完全一致,從而二者的Domain也完全一致(意味著二者數據類型、長度、精度、編碼規則等信息完全相同),推而廣之,整個模型中所有“xxx身份證號”的數據元,其Domain也完全一致,從而得到數據的全域一致性。

2.3? 元數據的遵從關系

從上向下,元數據之間存在遵從關系,在系統分析設計過程中建立的各類模型中的數據項(如屬性、字段)等元數據與標準數據元之間存在遵從關系,在建模時定義屬性、字段等元素時,不是像往常一樣直接給出名稱、數據類型等要素,而是要引用標準數據元詞典中的某個數據元,即模型中的數據項要遵從標準數據元詞典中的某個標準數據元,在語義和值域上保持完全一致,這種遵從關系,使得數據詞典能夠貫徹到模型中去,從而確保在系統實現中得到數據的全域一致性,如圖2所示。

3? 數據詞典的一種編制方法

制定數據詞典有技術上、業務上、管理上的一系列困難,基于筆者在業務中臺項目中的實踐經驗,介紹一下對于技術困難的解決方案。制定數據詞典要經過原始數據元歸集、抽象數據元詞典構造、標準數據元詞典構造三個階段。

3.1? 原始數據元歸集

原始數據元詞典是客觀世界中存在的、未經標準化的業務概念的集合,其中存在大量的重復、不規范甚至沖突的定義,是數據詞典化的工作對象。在業務中臺項目中,原始數據元詞典的來源是統一數據模型的數據元、ERP的數據元和已建系統的物理模型字段。

3.2? 抽象元詞典的構造

抽象數據元詞典的構造過程分為構造抽象數據元、定義抽象數據元兩個階段,在構造抽象數據元階段,我們對原始數據詞典中的單詞進行語義分析,識別其間存在的泛化關系,構造語義關系樹,把全部單詞處理完后會識別出一座森林,這片森林的根構成一個集合,這個集合即抽象數據元詞典。在業務中臺項目中由于原始數據詞典中單詞數量達到70萬余條(由于是多個來源的簡單集合,分析后的結果表明大部分單詞是重復的),巨大的詞匯量是完成這項工作的障礙,實踐中我們的做法為:

第一步計算機輔助切詞處理:對原始數據詞典中的所有單詞進行切詞處理,通過比較分詞的重復比率,識別出潛在的同義詞和近義詞,形成一個個的近義詞集合。

第二步同義詞人工過濾:首先把分詞后形成的近義詞集合分工給多個團隊,經過分詞處理后每個集合的詞匯量還是相當巨大的,各團隊首先對集合中的單詞按照后綴分類排序(一般相同后綴的詞語義重復或者相近的概率比較大),先進行一輪人工排重,經驗表明經過這樣排重后詞匯量降到原來的二十分之一左右(3萬左右),平均每個團隊5 000條左右。

第三步泛化關系的整理過程:首先從集合中隨機取一個小集合(如100條),人工對其中的單詞進行分析:

(1)刪除不規范的單詞;

(2)拆分復合單詞;

(3)定義模糊的明確語義,如對于“審核人”,要確定是審核人名稱還是審核人員工編碼;

(4)合并同義詞;

(5)對每個詞識別其抽象語義,如果已經存在則與該父類建立泛化關系,否則新建抽象父類;

(6)再取下一個100條,重復上述工作。

經過多次迭代,每個單詞都與某個抽象數據元建立了泛化關系,整個詞典形成了一座語義森林。

第四步合并各團隊工作成果:選取上述森林的根形成的抽象數據元集合,對該集合再次重復第三步的工作,最終形成抽象數據元詞典,實踐中最終得到數千條抽象數據元構成的數據元詞典。

第五步抽象數據元定義:定義數抽象據元的Domain,即數據類型、長度、精度、取值范圍、編碼格規則缺省值等約束。定義依據是各項已存在的標準或者事實標準,原則為:優先遵從企標、然后依次是行業標準、國家標準、國際標準、事實標準。

3.3? 標準數據元詞典的構造方法

標準數據元詞典是與抽象數據元詞典同時構造的,在抽象數據元詞典構造過程中,最終形成一座語義森林,森林的根構成了抽象數據元詞典,所有節點(包括根、中間節點和葉子節點)構成了標準數據元詞典。

標準數據元詞典中的單詞在語義上與抽象數據元詞典中的某個抽象數據元有繼承關系,在Domain上,與該數據元保持完全一致。

4? 數據詞典在系統建模過程中的貫徹落實

在業務中臺工作中的經歷中,筆者提出了一個MDA落地的可行的模型序列:業務過程模型、用例模型、業務對象模型、領域模型、概念模型、邏輯模型、物理模型和組件模型。該模型序列覆蓋了系統分析設計開發實現全生命周期,通過對模型序列的模型逐一建模,引導從業務空間逐步逼近以至最終達到系統實現。在這一系列模型的建模過程中,都面臨對數據元的定義和引用,這些數據元都是普通數據元,其語義和取值都要嚴格遵從標準數據元給出的語義和值域,故通過各模型的建模過程中對數據詞典的嚴格遵從,使得數據詞典得以切實貫徹落實:首先,從系統建設的角度,數據詞典得以在分析設計開發全生命周期中貫徹落實;其次,從數據運用的角度,數據詞典得以從輸入、系統處理到輸出全程貫徹落實;再次,從數據分布的角度,數據詞典得以從展示層、業務邏輯層、數據訪問層以至于數據庫,都得以貫徹實現;最后從數據傳輸的角度,數據詞典從數據存儲到交換都得以貫徹。同時,使得不同系統間間和不同模型間同一語義的普通數據元也得以嚴格一致,從而實現全域的數據一致性,為數據共享、業務銜接鋪平道路。下文就具體實踐中數據詞典的落地實施做法進行論述。

4.1? 在建模工具中建立數據標準模型

抽象數據類型、抽象數據元和標準數據元都是以對象的方式存儲在數據標準模型中,示例如圖3所示。

圖3中顯示了數據標準模型的一個例子,其包含數據類型詞典、抽象數據元詞典和標準數據元詞典三大部分,作為示例,數據類型詞典中有三種抽象數據類型:字符型、數值型、日期型;抽象數據元詞典中有四個抽象數據元:日期、金額、身份證號、id,實際上每個都規定了語義和Domain,由于工具所限圖中沒有顯示出來;數據詞典有七個標準數據元,分別繼承于抽象數據元詞典中的某個抽象數據元。

4.2? 在業務過程模型貫徹數據詞典

業務過程模型包括業務流程模型和用例模型,這兩個模型都從交互場景分析入手,描述交互中的輸入輸出和相應的系統處理過程,這些輸入輸出業務信息由數據項組成,這些數據項就是普通數據元,要在業務過程建模中貫徹數據詞典,就要確保這些數據元遵從標準數據元詞典中的標準數據元定義,具體實現過程為:在傳統的業務流程模型或者用例模型中,這些數據項是輸入輸出業務信息的一個屬性,其數據類型可以取int、char等標準類型,但是在模型驅動的方法論中,數據類型可以取某一個已經存在的類,比如標準數據元詞典模型中的某個標準數據元,我們利用這一特征,利用普通數元的數據類型來表達該屬性和標準數據元之間的血緣關系,即設置該普通數據元的數據類型為標準數據元詞典模型中其引用的標準數據元,示例如圖4所示。

圖中有兩個模型:a.數標準典模型,包含抽象數據元詞典和標準數據元詞典;b.業務流程模型。作為示例標準數據元詞典展示出了“合同簽訂日期”“訂單提交日期”“合同額”“招標人身份證號”“企業法人代表身份證號”“合同編號”“訂單編號”等七個標準數據元。我們要為業務流程模型中的“合同編號”屬性和標準數據元詞典中的“合同編號”標準數據元之間建立遵從關系。步驟為:

(1)選中“業務流程模型-合同詳情數據對象”的“合同編號”普通數據元;

(2)點擊右下角type標簽中的“搜索”圖標,打開“Select Type”搜索框;

(3)在彈出框中,選擇“數據標準模型-標準數據元詞典”并展開;

(4)在列表中選中“合同編號”標準數據元;

(5)點擊“OK”,完成設置,此時即設置業務流程模型中的“合同編號”屬性的數據類型為數據標準模型-標準數據元詞典中的“合同編號”標準數據元,在二者之間通過前者的數據類型建立了遵從關系,使得前者的取值、編碼、長度、精度等值域信息遵從于后者的定義。

4.3? 業務對象模型中貫徹數據詞典

業務對象由屬性構成,這些屬性也是普通數據元,與業務過程模型相同,其語義和值域都要遵從相應的標準數據元,其遵從關系也是通過將該普通數據元的數據類型設置為其遵從的標準數據元實體表達的,即業務對象的屬性的數據類型取其遵從的標準數據元。

4.4? 在領域模型和數據模型中貫徹數據詞典

領域模型由領域對象等元素組成,數據模型包含概念模型、邏輯模型、物理模型,其實體都是由普通數據元構成,與業務過程模型的處理方式相同,不再重復論述。

5? 結? 論

編制數據詞典是確保數據全域一致性,實現數據共享、業務協同的重要基礎性工作,是企業實現數字化轉型的重要前提,MDA方法論實現了業務需求的結構化描述,數據詞典的制定是模型驅動架構設計方法的重要補充,二者結合能夠確保數據詞典在信息化過程中切實落實到系統實現中去,而不是停留在桌面上、條文中。本文提出了一種制定數據詞典的方法并且提出在模型驅動架構方法論下數據詞典的貫徹落實策略,該方法能夠做到確保數據詞典在分析、設計、實現過程中全面得到貫徹,確保數據詞典在代碼、數據中全面得到貫徹,確保數據詞典在對業務全覆蓋、無遺漏、不重復、無沖突,是一種可行的、有實踐價值的數據詞典構建方法。

參考文獻:

[1] 張鵬,李忠民.企業級數據模型全域一致性的一種解決方案 [J].智庫時代,2018(35):135-136+139.

[2] 弗蘭克爾.應用MDA [M].鮑志云,譯.北京:人民郵電出版社,2003.

[3] KLEPPE A,WARMER J,BAST W.解析MDA [M].鮑志云,譯.北京:人民郵電出版社,2004.

[4] 郭棟,王偉,曾國蓀.一種基于微服務架構的新型云件PaaS平臺 [J].信息網絡安全,2015(11):15-20.

[5] 李蘇璇.基于微服務架構的SaaS應用構建方法研究 [D].廣州:華南理工大學,2016.

[6] 張天,張巖,于笑豐,等.基于MDA的設計模式建模與模型轉換 [J].軟件學報,2008(9):2203-2217.

作者簡介:李忠民(1967—),男,漢族,山東聊城人,技術專家,中級職稱,本科,研究方向:銀行應用系統設計開發、大型互聯網平臺架構設計、大數據應用系統設計;高曉欣(1982—),女,漢族,河北保定人,中級職稱,碩士研究生,研究方向:項目過程管控、大型互聯網平臺架構設計。

主站蜘蛛池模板: 亚洲人人视频| 欧美国产菊爆免费观看| 色悠久久久久久久综合网伊人| 无码乱人伦一区二区亚洲一| 精品久久综合1区2区3区激情| 人妻无码一区二区视频| 四虎在线观看视频高清无码| 东京热高清无码精品| 亚洲无码免费黄色网址| 国产精品无码翘臀在线看纯欲| 国产精品一区在线观看你懂的| 99视频精品在线观看| 波多野结衣亚洲一区| 无码中文字幕乱码免费2| 亚洲人成网站观看在线观看| 六月婷婷激情综合| 欧美一级一级做性视频| 国产在线精品99一区不卡| 欧美激情第一区| 久久香蕉国产线| 免费看a级毛片| 欧美日韩国产一级| 国产成人永久免费视频| 热久久综合这里只有精品电影| 国产亚洲精久久久久久无码AV| 尤物视频一区| 99久久国产自偷自偷免费一区| 久久精品国产电影| 朝桐光一区二区| 国内精自视频品线一二区| 国产第一页免费浮力影院| 美女潮喷出白浆在线观看视频| 亚洲无码视频图片| 四虎影视8848永久精品| 国产欧美中文字幕| 亚洲乱码视频| 国产福利微拍精品一区二区| 免费人成视频在线观看网站| 成人国产一区二区三区| 72种姿势欧美久久久大黄蕉| 原味小视频在线www国产| 日日拍夜夜操| 亚洲欧美人成电影在线观看| 久久精品aⅴ无码中文字幕 | 伊人久久大香线蕉aⅴ色| 天天综合网在线| 新SSS无码手机在线观看| 99热最新网址| 亚洲中文字幕无码爆乳| 四虎永久在线精品影院| 国产欧美精品午夜在线播放| 男人天堂伊人网| 亚洲国产一成久久精品国产成人综合| 国产91无码福利在线| 久久精品人人做人人| 国产激情无码一区二区APP| 丝袜无码一区二区三区| 精品国产免费第一区二区三区日韩| 丝袜无码一区二区三区| 国产日韩精品欧美一区喷| 国产欧美日韩另类精彩视频| 亚洲an第二区国产精品| 性喷潮久久久久久久久| 亚洲欧美激情小说另类| 中文字幕亚洲专区第19页| 精品午夜国产福利观看| 亚洲无码91视频| 欧美一道本| 特级毛片免费视频| 成人综合在线观看| 免费国产无遮挡又黄又爽| 日韩性网站| 97视频免费看| 91小视频版在线观看www| 日韩a在线观看免费观看| 亚洲无码高清免费视频亚洲| 中文字幕免费视频| 久久综合干| 中国一级特黄视频| 午夜丁香婷婷| 亚洲美女高潮久久久久久久| 国产69精品久久久久孕妇大杂乱 |