999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

標識符在企業主數據結構化中的應用

2025-07-30 00:00:00鄧輝王毅張輝郎大宇
標準科學 2025年6期
關鍵詞:數據模型數據結構編碼

摘要:【目的】統一主數據結構是企業數字化建設的基礎和難點。【方法】研究了標識符在數據標識中的功能作用,分析了數據元、元數據、主數據與數據結構化的關系,提出給企業主數據構成的每個數據元賦予唯一的標識符,建立數據元字典,分類分級構建元數據集和結構化的主數據模型,并給每個主數據模型賦予唯一的標識符,以保證不同信息系統的數據結構一致。【結果】按數據元字典和主數據模型,開發主數據編碼系統,統一主數據編碼,使跨系統、跨業務、跨部門、跨網絡擁有單一的數據來源,實現企業主數據的無障礙協同共享。【結論】為企業主數據結構化和數據編碼建設提供了理論參考。

關鍵詞:標識符;主數據;數據元;元數據;數據模型;數據結構;編碼

DOI編碼:10.3969/j.issn.1674-5698.2025.06.010

0引言

在企業數字化轉型中,跨系統、跨網絡、跨業務、跨層級的數據協同是大勢所趨。但是企業信息系統及基礎數據庫建設的年代不同、開發單位不同、主管單位不同,不同系統、不同業務所執行的數據結構及標識規則各異,形成了一個個數據“孤島”。這導致同類數據不能自動查詢、采集、統計、分析和互操作,大大削弱了數據的價值,嚴重影響數字化轉型進程。本文嘗試用唯一標識符規范企業數據元及元數據和主數據,達到數據的定義統一、結構統一、格式統一、標識統一、標準統一、源頭統一,實現企業數據協同共享的目標。

1標識符在數據標識中的功能作用

1.1標識符的定義與功能作用

在信息系統建設中,面對龐雜的數據和數據關系,為保證源頭數據的唯一性、關聯性,提高數據的檢索、追溯和自動化處理效率,需要給重復使用的數據確定名稱或標識符以避免重復和混淆。在不同的領域,標識符的概念有所不同。在軟件編程中,標識符用于命名變量、函數、類、模塊或其他用戶自定義元素。由于早期編程語言的兼容性問題,長期以來標識符默認使用英文字符和數字。在電子數據交換中,標識符是用于標識或命名一個數據項并可能指出該數據項的確定性質的一個字符或一組字符[1]。在供應鏈物流領域,使用“應用標識符(AI)”來標識貿易項目、產品、資產、物流單元等數據含義與格式,AI由國際物品編碼協會(GS1)負責維護管理。在工業制造領域,使用“數據標識符(DI)”來標識制造過程相關的包裝、運輸、度量、位置等數據的含義與格式,DI由美國物料儲運學會(MHI)負責維護。GB/T38606—2020給出了數據標識符代碼表和部分應用標識符與數據標識符的映射關系表[2]。在信息與文獻領域,使用“數字對象唯一標識符(DOI)”來定位檢索學術資源,DOI注冊服務機構需經ISO26324批準。國際標準化組織(ISO)還建立了一種信息對象注冊的分層結構,由對象標識符(OID)唯一地標識信息對象,全球OID根注冊系統由法國電信公司維護,各國OID注冊中心按授權負責相關節點及其分支節點的注冊、管理和維護[3-4]。

我國已經廣泛應用了一些標識符,如居民身份證號碼、組織機構代碼、統一社會信用代碼、商品條碼、中國標準書號等,在社會、政治、經濟、生活中發揮著重要作用。

1.2不同領域的標識符標準與可替代性

由于標識符在大數據應用中的重要作用,我國加速與國際標識符標準的接軌,并研制了一些國內標識符標準,例如:流通領域的GB/T16986—2018《商品條碼應用標識符》、GB/T28532—2012《承運人標識符編碼規則》、GB/T26319—2010《國際貨運代理單證標識符編碼規則》、GB/T36596—2018《國際貿易商業發票標識符編制規則》等,文獻領域的GB/T12906—2008《中國標準書號條碼》、GB/T42713—2023《信息與文獻參與者名稱標識符》、GB/T36369—2018《信息與文獻數字對象唯一標識符系統》、GB/T41132—2021《科普信息資源唯一標識符》、GB/T40989—2021《新聞出版知識服務知識對象標識符(KOI)》、GB/T23730.1—2009《中國標準視聽作品號第1部分:視聽作品標識符》等,以及物聯網領域的對象標識符GB/T41810—2022《物聯網標識體系對象標識符編碼與存儲要求》、GB/T38606—2020《物聯網標識體系數據內容標識符》、GB/T42587—2023《信息技術自動識別與數據采集技術數據載體標識符》等。這些與標識符相關的標準為企業數據結構化、標準化提供了指引。

若國家、行業標準已經規定了數據元、元數據的標識符,企業直接采用更經濟,還能與外部采用相同標準的系統接口保持一致,方便信息協同共享。但是,不同部門、不同行業制定的數據元、元數據標準大多是從本行業管理習慣出發的,導致標識符的設置各具特色,不同標準之間的數據定義、結構、格式、標識符等數據屬性有差異。企業原封不動照搬不同行業的標識符,大概率不能實現數據交互,因為不同的標識方法在不同的標識系統中是不能相互替代的。例如:10.978.12345/99990是一個DOI名稱,978-12345-99990是一個中國標準書號(ISBN),這2個標識符標識了同一指示物;但是10.978.12345/99990不能用ISBN的銷售訂單系統進行驗證,也不能轉換為一個GS1條碼作為ISBN條碼使用,因為它不符合ISBN的語法規則;978-12345-99990同樣也不能交給DOI的解析系統進行驗證,因為它不符合DOI的語法規則[5]。

1.3企業內部標識符的功能作用

為確保標識符的科學性、準確性,以及在企業范圍內的唯一性,企業應結合自身業務、所處行業、與外部數據交互的需求,繼承已有的數據命名規則和標識符,制定企業內部標識符的編碼規則。企業內部標識符只限在企業范圍內使用,也就是在企業數據交互范圍內,每個標識符只表示一個特定含義,以避免標識符的重復和二義性。

軟件開發人員習慣用自然語言、縮寫詞自主命名和定義標識符,但由于自然語言和縮寫詞具有多義性,不同人的理解可能會有差異,如CAD在不同的語境中有計算機輔助設計、加拿大元、冠狀動脈疾病等完全不同的含義。另外,同一事物可用不同的詞語表達,如Manufacturer、Factory、OEM,以及漢語的生產廠、生產廠家、生產單位、制造單位、生產制造單位等詞匯實質上表達的是同一個事物。為避免人們對同一單詞或短語的不同理解,除了對概念進行定義之外,“數字”“數字+字符”作為標識符應用越來越廣泛。

2企業數據結構化與數據元、元數據、主數據的關聯關系

數據元、元數據、主數據是信息領域的專用術語,由英文翻譯而來。企業產生的大量結構化數據是靠主數據規范的。主數據是用元數據描述的,元數據是由數據元組成的。數據元、元數據、主數據對于數據結構化有不同的功能作用。

2.1數據元

數據元(DataElement)是用一組屬性描述定義、標識、表示和允許值的數據單元,在特定的語義環境中被認為是不可再分的最小數據單元,也有翻譯成“數據元素”的。數據元一般由對象類、特性和表示3部分組成。對象類是人們希望采集和存儲相關數據的事物,如人、汽車等。特性是用來區別和描述對象,是對象類的所有成員共有的特征,如性別、顏色等。表示是描述數據被表達的形式,由值域、數據類型、計量單位、表示類組成。值域是數據元允許值的集合[6]。以“姓名”為例,數據元的表示如圖1所示。

數據元一般包括“中文名稱”“標識符”“定義”“數據類型”“數據格式”“值域”“約束/條件”等。圖1還給出了姓名的“英文名稱”,便于中英文準確對照;用“注釋”規范了姓名的填寫要求。使用信息系統管理數據元的,還可包含數據生成、注冊、更改、時間等管理屬性,保持數據元狀態的可追溯性。企業統一數據元表示時,應設置相同的數據類型和格式,這樣才能實現信息系統集成和數據協同共享。

2.2元數據

元數據(Metadata)是定義和描述其他數據的數據,特別是描述基礎數據的結構和特性,提供數據準確性和一致性的要求。我國發布了一系列元數據標準,企業宜直接引用,也可制定企業元數據標準,統一主數據需要的各項數據元名稱、結構和格式。以照明產品為例,其元數據包括產品基礎信息、產品發布信息、產品價格信息、產品分類信息、產品生產信息、技術參考信息等。每一類信息相關的特性都很繁雜,一般選定并規范一些必要的、在較大范圍內共享的、變動頻率不高的特性作為該類信息的核心元數據集,以保證該類信息在一定范圍內擁有準確的、單一的理解。表1摘錄了幾項照明產品的基礎信息元數據[7]。

2.3主數據

主數據(MasterData)是企業需要跨系統、跨部門進行共享的核心業務實體數據[8]。主數據跨越企業各部門,存在于人、財、物、產、供、銷等多個應用系統中,具有共享性、唯一性、原始性、穩定性等基本特征,能夠被重復利用,需要各系統保持一致。不同領域的企業主數據范圍不盡相同,以大型生產制造企業為例,典型的主數據包括組織機構(客戶、供應商、部門)、人員、財務、質量、經營、物品、合同、設計、工藝、生產制造等方面的能被共享、重復利用的數據,如圖2所示。

企業主數據包羅萬象,依據數據范圍,對數據進行分類,制定每一類數據的結構化規則、編碼標準,再根據編碼標準構建數據模型,開發主數據平臺,借助主數據平臺形成標準化的、源頭的數據庫。各個信息系統使用這個源頭數據庫就能實現企業內部數據的協同共享。

3唯一標識符在企業主數據結構化中的應用

3.1統一企業數據元標識符

我國發布了一系列公共性公益性數據元、元數據和數據分類與代碼標準,如性別(GB/T2261.1)、民族(GB/T3304)、學歷(GB/T4658)、學位(GB/T6864)、專業技術職務(GB/T8561)、貨幣(GB/T12406)、計量單位(GB/T17295)、國家和地區(GB/T2659.1)、行政區劃(GB/T2260)等。這些標準規定了一些重要術語、概念的名稱、含義、數據類型、數據長度、值域等特性,企業應直接引用,減少理解差異,提高數據的規范性和權威性。

企業根據本單位數據管理的范圍,引用或結合相關標準,梳理出所需的數據元,規范每個數據元的名稱、定義、數據類型、數據格式或字節長度、值域等特性,結合主數據分類,為每個數據元賦予一個唯一的標識符,建立企業數據元字典,保證企業信息系統的數據元的源頭準確、唯一,實現企業范圍內同一數據元的無障礙交互。

不同企業對數據顆粒度的要求不盡相同,必要時應對數據的內涵及外延進行解釋,還可根據需要細分數據元,如“面積”使用“頃”“畝”“平尺”“平方千米”“平方米”“平方英寸”“平方英尺”“平方碼”等不同的計量單位會產生不同的數值。例如GB/T16986詳細定義了國際通用的物流計量單位的應用標識符,其中“面積”的應用標識符見表2。

3.2企業核心元數據建設

把某類主數據必需的、企業重點關注的、在企業內部能夠實現統一的數據元作為該類主數據的核心元數據。采用統一建模語言(UML)描述數據實體與數據元的關系,規范數據結構,分類分級構建數據模型,對主數據構成元素的名稱、數據類型、數據長度、值域、權限,以及編碼規則、校驗規則、編碼狀態等特性進行定義和約束。核心元數據的數據元,應從企業數據元字典中選用,并保證數據元標識符的一致性。為便于管理,企業可對每一個數據模型進行編號,也就是建立數據模型的標識符。

3.3主數據標識碼

主數據是由元數據、數據元集合組成的,如圖2虛線部分的供方主數據記錄由標識碼、供方名稱、地址、負責人、產品類別、質量認證、開戶行名稱、賬戶號碼、辦公電話等數據元集合構成。這些數據元能夠滿足企業不同數據庫要求。統一規范的主數據結構是企業數據交換和資源共享的重要前提,統一主數據標識是減少數據二義性的有效方法。主數據標識是通過編碼系統(或平臺)實現的,編碼是給事物或概念賦予代碼的過程。編碼的結果是代碼,代碼是一種標識碼。近幾年“編碼”一詞使用頻率越來越高,人們經常有意無意地把“編碼”當作名詞使用,表示給事務賦予的“代碼”本身[9]。由此看出編碼、代碼與標識符何其相似,編碼、代碼也是一種標識符。

依據數據模型,建立統一的主數據編碼系統,對機構、人員、物品、供方、質量、合同等主數據實體編制具有唯一性的主數據標識碼,堅持一數一源,實現一次錄入全域共享,避免由于信息描述不一致而引起一碼多物、一物多碼及數據質量問題,使跨系統、跨部門擁有統一的數據結構、格式和標識符,優化企業數據的流通與共享機制,推動數據管理和應用水平的提升,實現數據資源的最大化利用,進而提升工作效率和用戶滿意度[10]。

4結語

通過梳理企業對數據資源需求,進行數據結構化分析,匯總提煉必要的數據元,結合國家、行業標準規范每個數據元的名稱、定義、數據類型、數據格式或長度、值域等特性,結合主數據分類,給每個數據元賦予唯一的標識符,建立企業數據元字典;把企業主數據必需的、重點關注的、在企業內部需要統一的數據元作為核心元數據,規范主數據結構和編碼規則,制定企業主數據標識標準;分類分級構建主數據模型,開發主數據編碼系統,統一主數據編碼,使企業跨系統、跨業務、跨部門、跨網絡擁有統一的、準確的、權威的數據來源,實現數據的無障礙協同共享。

參考文獻

行政、商業和運輸業電子數據交換(EDIFACT)應用級語法規則第1部分:公用的語法規則:GB/T14805.1—2007/ISO9735-1:2002[S].

物聯網標識體系數據內容標識符:GB/T38606—2020[S].

信息技術開放系統互連對象標識符(OID)的國家編號體系和操作規程:GB/T26231—2017[S].

韓雪,周鋼,馬文靜,等.OID標識與統一社會信用代碼數據關聯技術分析與研究[J].標準科學,2016(10):116-120.

信息技術元數據注冊系統(MDR)第1部分:框架:GB/T18391.1—2009/ISO/IEC11179-1:2004[S].

信息與文獻數字對象唯一標識符系統:GB/T36369—2018/ISO26324:2012[S].

鄧輝,王毅,張輝.企業物品編碼元數據標準化研究[J].中國標準化,2025(3):30-34.

數據管理能力成熟度評估模型:GB/T36073—2018[S].

張輝,王毅,鄧輝.物品編碼與編目術語的辨析[J].中國標準化,2025(3):21-25.

陳堅.基于主數據管理標準化的政府數據治理研究[J].標準科學,2024(9):35-40.

猜你喜歡
數據模型數據結構編碼
基于任務群的小學信息科技跨學科主題學習新樣態
“一心引領·四維融合”數據結構課程的OBE教學實踐探索
社交電商用戶消費助農影響因素探究
村委主任(2025年10期)2025-08-03 00:00:00
基于預測劃分卷積神經網絡的全景視頻快速編碼算法
張寧:那些人做不了的事,交給 AI
中國商人(2025年12期)2025-08-01 00:00:00
基于遺傳模擬退火的編碼流量分配方法
主站蜘蛛池模板: 日韩在线网址| 国产精鲁鲁网在线视频| 日本亚洲成高清一区二区三区| 91香蕉视频下载网站| 日本国产一区在线观看| 午夜啪啪网| 国产91导航| 国模极品一区二区三区| 国产精品一区二区在线播放| 99这里只有精品免费视频| 日本道综合一本久久久88| 国产成人区在线观看视频| 亚洲精品麻豆| 91无码视频在线观看| 在线日韩一区二区| 99久久精品国产自免费| 亚洲国产中文欧美在线人成大黄瓜 | 国产成人乱无码视频| 久久久国产精品无码专区| 久久久久88色偷偷| 毛片久久久| 99热国产这里只有精品无卡顿"| 好久久免费视频高清| 亚洲精品国产首次亮相| 亚洲第一国产综合| 日韩大片免费观看视频播放| 欧美高清视频一区二区三区| 香蕉99国内自产自拍视频| 亚洲人成网站18禁动漫无码| 色偷偷综合网| 一级毛片a女人刺激视频免费| 亚洲精品无码在线播放网站| 91精品专区国产盗摄| 999在线免费视频| 国产成在线观看免费视频| 亚洲国产欧美国产综合久久 | 999精品视频在线| 伊人久久综在合线亚洲91| 无码AV动漫| 久久精品欧美一区二区| 亚洲av中文无码乱人伦在线r| 激情综合婷婷丁香五月尤物| 中文字幕va| 欧美日韩va| 在线精品自拍| 99热国产这里只有精品无卡顿"| 最新亚洲人成无码网站欣赏网 | 欧美亚洲一二三区| 美女国产在线| 国产成人精品在线1区| 久久男人资源站| 夜夜拍夜夜爽| 亚洲美女一级毛片| 国产精品自在线天天看片| 婷婷伊人五月| 国产在线无码av完整版在线观看| 欧美日韩综合网| 青草视频免费在线观看| 天堂网国产| 国产精品成人啪精品视频| 99久久国产自偷自偷免费一区| 国产一区二区三区在线观看视频| 欧美成人免费午夜全| 毛片免费网址| 久久国产拍爱| 国产成人区在线观看视频| 久久综合九色综合97网| 99re在线免费视频| P尤物久久99国产综合精品| 特级欧美视频aaaaaa| 久久人人爽人人爽人人片aV东京热| 乱人伦视频中文字幕在线| 广东一级毛片| 伊人久综合| 国产乱肥老妇精品视频| 99久久免费精品特色大片| 亚洲国产精品人久久电影| 日本在线欧美在线| 91精选国产大片| 亚洲手机在线| 高清无码一本到东京热| 欧美成人手机在线观看网址|