張明磊 彭鵬 劉碩豐 龍陳鋒
摘要:該文設計了一種適合長沙黃花綜合保稅區的數據中臺,首次基于以共享為基礎、以需求為導向的原則,通過構建數據共享交換、數據管控和數據服務模型,提出了一種數據分級治理模型,形成了數據資源池,建立了統一的保稅區數據治理體系,構建了數據中臺功能架構模型,實現了保稅區數據業務系統的分級共享治理,推動了保稅區業務數據共享開放。
關鍵詞:數據中臺;綜合保稅區;數據;模型
中圖分類號:TP302.1;TP311.52??? 文獻標識碼:A
文章編號:1009-3044(2021)29-0001-03
A Data Middle Platform of the Changsha Huanghua Comprehensive Free Trade Zone
ZHANG Ming-lei2,PENG Peng1, LIU Shuo-feng1, LONG Chen-feng3*
(1. Changsha Comprehensive Insurance Investment Co. LTD, Changsha 410137, China;2. Department of Science and Technology, Changsha Customs District P.R China, Changsha 410000, China;3.School of Information Science & Technology, Hunan Agricultural University, Changsha 410128, China)
Abstract: A data Middle platform of the Changsha Huanghua comprehensive free trade zone is designed, which based on sharing, the principle of demand oriented, by building the data exchange, data control and data sharing service model, this paper proposes a data classification governance model, formed the data resources pool, the establishment of a unified data management system, the bonded area to build the function of data China architecture model, realize the free trade zone data service system of hierarchical Shared governance, Promoting the free trade area business data sharing and opening.
Key words: data middle platform; comprehensive free trade zone; data; model
1引言
長沙黃花綜合保稅區以產業為基礎,以航空為依托,與黃花機場、長沙海關實現聯動和無縫對接,實現保稅區內的倉儲、物流、商貿等以及配套的商務辦公、會展、綜合服務等功能。區內包括進口生鮮保稅倉、保稅研發港、高端裝備加工區、醫療設備分撥中心、保稅奢侈品店、基建設備展交中心、文化貿易保稅園、智能裝備產業園、電商總部基地、海關機場口岸等各種功能單位或機構。保稅區內的單位、公司或機構涉及海量的各種異構數據,為保稅區數據管理、分析和治理帶來了極大挑戰。
目前國內保稅區都實現了信息化管理,推動了保稅區的快速發展[1-3],但是數據維護工作量相當大,并且維護分散在區內管理部門、公司、海關等單位[4-7]。隨著業務不斷變化和創新,各單位都針對自己的業務在不同時間、不同階段和不同需求等提出了新的要求,但是區內外各種數據尚未實現整體管理和治理,數據孤島現象嚴重,各部門對數據嚴防死守,數據管理、分析和治理的響應力、效率、匯聚力等方面嚴重跟不上這些需求。為此,本文以保稅區內的多源異構業務系統為數據源,基于數據分級治理體系,設計了一種適合長沙黃花保稅區的數據中臺。
2數據中臺設計原理
2.1總體功能架構
通過對長沙黃花綜合保稅區內各部門、企業、海關等單位的各種異構業務系統的數據業務流程實地調查研究,結合保稅區3D可視化運維管理數據實效性和特殊性,數據中臺總體設計以共享為基礎、以需求為導向的原則,將多源異構業務系統的數據進行匯聚和標準化處理,通過數據接入、數據處理、數據共享交換系統,加強數據管控和數據服務,形成統一的數據資源池,建立統一的保稅區數據治理模型,對區內外提供統一的數據需求功能,豐富保稅區主題庫和專題庫數據資源,提升保稅區數據資產價值,打造保稅區數據開放服務,總體架構如圖1 所示。這種總體架構模式容易劃分保稅區內外各業務部門的大數據智能分析服務邏輯功能以及中臺業務子功能模塊。
2.2 數據分級治理模型
保稅區的數據治理以數據應用為導向,貫穿于數據生命周期,通過數據元和業務邏輯規則的標準化管理,不斷加強區內元數據、數據模型、主數據和數據安全等管理,從而持續提升和優化數據質量,為數據服務提供支撐。數據治理主要采用一級治理和二級治理聯動的分級治理模式,包括技術治理與環境治理,具體數據治理模型如圖2所示。
(1)數據接入。提供統一的數據匯聚業務功能,將保稅區繁雜、各式多樣的外部關聯部門業務系統、內部業務系統等相關數據接入到數據治理模型,以便與其他系統進行數據交換,為上層大數據應用支撐平臺的業務分析工作提供數據源。從保稅區的數據來源分布來看,接入數據包括外部關聯數據、感知數據和其它數據等,針對不同來源數據采用不同的數據接入方式,主要分為外部關聯數據接入、感知數據接入和其他數據接入等方式。數據接入功能包括數據接入子系統提供數據探查、數據讀取、數據對賬、斷點續傳、任務管理和數據分發等。
(2)數據處理。針對已匯聚的結構化數據記錄、半結構化文本等具體數據內容建立標準化的數據處理模式,并將處理后的數據存儲在系統數據資源池中,實現了數據抽取、清洗、轉換、去重、補全、關聯、融合、比對、數標識等功能。處理方式分為從前置庫到原始庫、從原始庫到資源庫、從資源庫到主題庫、從主題庫到專題庫等4種。
2.3 數據共享交換模型
保稅區內外需通過共享交換子模型完成與橫向各硬件系統進行數據共享交換。數據共享交換模型由交換管理模塊、接入管理模塊、交換前置模塊、交換傳輸模塊、交換橋接模塊、運行監控模塊等部分組成,工作原理是通過交換橋接子系統將各轉隸單位和綜合保稅區3D可視化運維管理平臺相關數據部門需要交換的信息交換到前置交換信息庫,并在交換管理子系統的流程控制下,通過交換橋接子系統和交換前置子系統把需要交換的信息定向傳輸到接收轉隸單位和相關部門,從而把共享信息實時交換到共享交換庫,如圖3所示。
交換管理子系統支持對整個信息共享交換子系統的綜合管理監控,包括交換標準定義、交換流程的定義、交換流程的執行等。交換前置子系統支持不同的前置交換庫之間的雙向信息交換,是前置交換庫和交換傳輸子系統之間的橋梁,需支持多個交換服務的并發運行。接入管理子系統實現對接入點的接入管理與控制,包括接入點注冊、配置、維護等功能。交換傳輸子系統是交換前置子系統之間的信息交換通道,實現交換信息的打包、轉換、傳遞、路由和解包等功能。交換橋接子系統用來實現各轉隸單位和該項目相關部門業務庫與前置交換庫的雙向信息同步,由各轉隸單位和該項目相關部門應用數據庫(或文件等數據)到前置交換庫(或文件等數據)之間的信息交換橋接接口,以完成兩個數據庫(或文件等數據)之間的在線實時交換的系統。運行監控子系統主要實現對信息共享交換子系統的傳輸、接入節點、數據庫運行狀態以及適配器等的監控。
2.4 數據管控模型
數據管控主要通過數據管理、資源目錄、數據鑒權、數據質量、數據運維、數據血緣和數據分級分類等功能模塊,實現對保稅區、海關、企業等單位數據的全生命周期管理,如圖4所示。
為了消除相同屬性信息因定義和描述不一致而導致信息理解和使用出現偏差,數據標準管理提供一整套標準的維護、查詢和落地功能以及以最小的勞動成本管理數據標準。元數據編目管理是對信息資源的規范化描述,是按照一定標準,從信息資源中抽取出相應的特征,組成的一個特征元素集合。資源目錄管理是按照統一的數據資源目錄標準規范,對數據資源進行統一管理,實現數據資源科學、有序、安全使用。數據標簽管理提供標簽需求分析、標簽專題數據預加工(歸集、清洗、標準化、整合)、標簽數據同步、標簽創建和標簽計算等功能。
數據質量保證是從數據質量組織機構、數據質量管理以及數據質量驗證機制三個方面提供相應的管理流程支持,建立完善的數據質量文檔體系,保證整個系統內的數據質量活動都要求有完善的紀錄,最終依次建立或完善質量考核體系,由數據處理過程監控、數據稽核、問題管理、日志管理、質量報告、質量問題處理等環節組成。
數據血緣管理是在數據產生、加工融合、流轉流通到最終消亡等過程中形成的繼承關系集合。通過對接入數據、原始庫、資源庫、主題庫、專題庫等各類數據資源間和數據項間的繼承關系進行描述和管理,反映數據資源在各個環節間的繼承關系。
2.5數據服務功能模塊
數據服務功能模塊提供面向上層業務應用和面向外部業務系統的服務,主要包括數據資源目錄、授權、索引、接口、標簽管理和可視化等服務功能。
數據資源目錄服務實現用戶按權限查看數據資源目錄,支持根據目錄相關屬性和數據項進行數據資源查詢。數據授權服務是通過動態授權、鑒權管理等為用戶分配各類系統功能權限和數據資源訪問權限。數據索引服務是通過統一的索引服務檢索接口提供數據資源的位置檢索服務,以便快速定位資源所在位置。數據查詢類服務是通過標準化的查詢功能配置和服務接口調用,以預設或自定義的數據項為單一查詢條件或組合查詢條件,實現按要素分類查詢或基于不確定關鍵字的一鍵式全網檢索。數據標簽服務是提高指標的規范性以及標簽管理的規范性,保障數據管理平臺用戶對標簽理解一致以及數據管理平臺與外部系統有效互動。數據可視化服務是對數據資產進行統一管控和可視化查看,并能夠通過大數據門戶建設實現資源資產的展示及統計(已接收數據情況、已共享數據情況)、資源綜合檢索定位、資源申請審核、調用、查詢、下載,資源訂閱、缺失資源申請。
2.6數據資源池
按保稅區數據使用等級類別要求,構建包含原始庫、資源庫、主題庫、專題庫等各類標準統一、組織與挖掘流程規范的系統管理數據資源池,以滿足保稅區管理內部各單位業務專題數據落地建庫需求,為綜合展示、數據服務、領導決策提供數據支持。
原始庫包含保稅區內所有單位內部、外部所有需要組織的數據,對于不同種類的數據,采取了不同的存儲機制進行存取。該庫保留完整的原始業務信息,解決數據標準化、時效性、一致性問題,不做復雜數據整合,不對外部應用提供查詢服務,主要滿足資源庫、主題庫快速批量獲取數據需求。
資源庫是對原始庫數據進行提煉加工后形成的公共數據集合,支撐其他各項業務需求。這些公共數據是經過數據處理系統的清洗、轉換、關聯、比對等操作后所形成的符合數據質量標準與規范的業務域標準數據。該庫由負責數據治理過程功能的治理區和提供外服訪問功能的使用區組成。
主題庫設計面向常態與非常態業務需求,通過將資源庫數據進行二次抽取裝載的方法重新組織數據,并按照不同領域專題應用的需求重新整合所形成。通過按照規范對數據進行加工、整理和入庫,并構建必要的數據應用的環境,提供統一的數據訪問服務,滿足應急管理在數據分析、計算與可視化的需求以及常態下監測預警等業務需求以及非常態下開展突發事件應急處置的數據應用需求,支撐系統管理業務應用。
專題庫是主題庫的數據按照專題應用的需要重新整合形成的數據庫。專題庫的建庫按照專題應用業務模型,通過二次抽取裝載的方法重新組織數據,構建滿足系統專題業務應用需要的數據庫。
3結論
(1)首次在綜合保稅區業務系統中采用了數據中臺實現了數據分析和治理。
(2)基于以共享為基礎、以需求為導向的原則,構建了數據中臺功能架構模型,實現了保稅區數據業務系統的共享治理,推動了保稅區業務數據共享開放。
(3)通過構建數據管控和數據服務模型,形成數據資源池,建立了統一的保稅區數據治理體系。
參考文獻:
[1]朱煒.信息系統在企業組織管理和風險控制中的應用——上海外高橋保稅區聯合發展有限公司的信息化實踐[J].上海企業,2016(6):65-68.
[2]華碩卿. 綜合保稅區智慧應用平臺的研究[D].長沙:湖南大學,2018.
[3]郭銀萍. 淺談綜合保稅區信息化系統的設計[J].智能建筑電氣技術,2020,14(6):110-114.
[4]王振宇,劉曉慶,許伯然. 海關支持綜合保稅區發展措施常見問題解答[J].中國海關,2020(8):42-43.
[5]劉曉慶,蔡嘉鋮.綜合保稅區業務常見問題解答[J].中國海關, 2020(5):50-51.
[6]苗建琳. 對我國綜合保稅區發展現狀、問題及對策的分析[J].經貿實踐,2017(6):129.
[7]張圓圓.鄭州新鄭綜合保稅區的發展現狀、問題及對策[J].科技經濟市場,2015(11):42-43.
【通聯編輯:代影】