


摘要:科學數據安全既是科學數據管理理論發展的內在需求,也是科學數據發展的現實需要。在計量領域,隨著計量數字化轉型發展,計量科學數據安全在數據安全普遍意義的基礎上提出了可信的要求。國際計量局(BIPM)制定的發展戰略CIPM2030+中提出計量數字化轉型要實現“遠程+X”,其提供的服務仍然是計量科學數據。因此在“遠程+X”計量中,實體世界中計量的權威性轉化為數字世界中計量科學數據的可信度。本文提出了從三個途徑建立計量科學數據可信度的方法,即分別從數據產生主體的防抵賴和身份可信、數據傳輸過程的防篡改和可追溯,同時給出相應的實現技術建議,并具體介紹了中國計量科學研究院在實現計量科學數據可信方面的數據安全體系設計。通過這些研究有助于建立計量科學數據的可信體系,為計量科學數據的安全應用和計量數字化轉型構建可信基礎。
關鍵詞:數據安全;數據可信;計量數字化轉型;數據可追溯
1 "引言
科學數據是數字時代的新生產要素,中共中央、國務院《關于構建數據基礎制度更好發揮數據要素作用的意見》[1](數據二十條)、國家數據局等17部門《“數據要素×”三年行動計劃》[2]均指出數據要素應在各領域流通共享。數據安全是高質量共享的基礎。尤其對于科學數據,采用數據安全構建高質量共享作為科學研究的新范式。計量作為構建國家一體化戰略體系和能力的重要支撐,計量領域的科學數據發揮著數據基礎標準的作用,其安全性主要體現在數據的可信。可信的計量科學數據,才能構建標準參考數據,在數據共享中成為國家計量標準。
另一方面,國際計量界正在大力開展計量數字化轉型。國際計量局(BIPM)與國際科學理事會數據委員會(CODATA)、國際標準化組織(ISO)等10個國際組織共同簽署了關于計量數字化協議[3],科學數據是其中的重要內容,指出科學數據在高質量共享中應遵循FAIR+T化原則。同時國際計量局(BIPM)制定了應對全球數字化變革的計量戰略CIPM2030+[4],指出數字時代計量的重要模式是“遠程+X”,即遠程校準、遠程檢定和遠程測試。“遠程+X”是以數字技術方式提供計量科學數據服務,例如以遠程檢測代替原有的現場檢測,實現一種計量數字化轉型。對數字化校準對象來說,遠程檢測更準確、更直接、更高效。遠程檢測相較于原有現場校準方式,要解決的核心問題是數據的可信。因此在“遠程+X”計量中,實體世界中計量的權威性轉化為數字世界中計量科學數據的可信度是建立計量科學數據可信體系的重要基礎。
2 "計量科學數據可信度
計量數字化轉型工作在國內外尚為起步階段,目前對于計量科學數據的可信度還沒有明確定義。“計量與數字化”屬于交叉科學,對于計量科學數據可信度的研究,需結合計量學、信息技術、數據科學等學科的相關內容開展研究。根據計量數字化轉型的基本目的,計量科學數據是為計量數字化轉型后的計量活動服務的,其中一種重要模式即為“遠程+X”計量。因此,計量科學數據的可信度可以根據“遠程+X”的計量基本模式,從數據的全流程安全角度進行定義。
從數據的全流程安全分析,參照國際計量界的通用方法[5],計量科學數據的安全可分為產生和傳輸兩個階段。在數據產生階段,安全問題重點是數據產生主體。數據產生主體可能產生的數據安全問題主要有對于數據歸屬的抵賴,以及主體身份的可信。在數據傳輸階段,安全問題重點是傳輸過程。傳輸過程可能產生的數據安全問題主要有數據在傳輸過程中是否被篡改,以及數據經過傳輸之后是否還可以被追溯。尤其是在可追溯方面,應該重點關注的計量科學數據特色安全問題。計量的基本特征之一是溯源性。溯源性在計量領域是指“通過文件規定的不間斷的校準鏈,測量結果與參照對象聯系起來的特性,校準鏈中的每項校準均會引入測量不確定度”[6] 。其中“參照對象可以是實際實現的測量單位的定義,或包括無序量測量單位的測量程序,或測量標準”。因此當計量數字化轉型時,由“測量程序”體現的計量溯源性更為明顯。尤其是溯源性有時是指量值溯源性,有時也用于非量值概念,即指某項目的歷程(“軌跡”)。諸如樣品可追溯性,文件可追溯性,儀器可追溯性。因此在計量科學數據的安全性方面,計量溯源性可明確為數據自身的可追溯性。
綜上,從計量科學數據的安全性方面分析,計量科學數據可信度的內涵包含了數據產生主體的防抵賴和身份可信、數據傳輸過程的防篡改和可追溯,即數據可信度是指數據是否在防抵賴(含身份可信),被篡改、可追溯三個方面實現了安全。因此,數據安全意義上的計量科學數據的可信數據結構由最小字段、計量特性字段、安全(可信)字段共同構成,如圖1所示。
3 "計量科學數據可信度的建立方法
按照計量科學數據可信度的內涵, 計量科學數據可信度的建立也需依賴三方面的技術,即數據防抵賴(含身份可信),被篡改、可追溯技術,且需結合計量特色,即溯源性。
數據防抵賴(含身份可信)方面,主要可以采用基于CA證書[7]的數字簽名[8]技術。CA數字證書提供數據產生主體的身份可信。數字簽名附加在數據單元,或對數據單元做密碼變換,這種附加數據或密碼變換被數據單元的接收者用以確認數據單元的來源和完整性,可以防止數據產生主體對數據產生行為的抵賴。基于CA數字證書的數字簽名技術,結合了兩種技術的優點,可以在數據防抵賴(含身份可信)方面有效地實現數據安全意義上的計量科學數據可信。
數據防篡改方面,主要可以采用面向計量數據字段的國密算法SM3技術。使用國密算法SM3[9],即雜湊算法,可以作用于計量科學數據,產生輸出時的消息摘要(比特串)。該消息摘要對于傳輸的數據具有唯一特性,尤其是當被傳輸的數據具有更多的計量屬性字段,例如測量數據的主體信息、數據的測量條件、數據測量依據的基標準、數據測量的不確定度等,使得該消息摘要更具有加密性。因此面向計量數據字段的國密算法SM3技術,可以在數據被篡改方面有效地實現數據安全意義上的計量科學數據可信。
數據可追溯方面,主要可以采用時間同步技術和可信時間戳技術。時間同步是指每一個計量科學數據結構,都包含一個時間字段(如圖1中所示)。該時間字段的含義是數據產生的時間,即產生數據的計量測試活動時間。由于所有的計量測試活動都具有該屬性,而且該屬性可以通過完善的不間斷時間溯源鏈建立可信度,因此該字段既是計量科學數據的元數據,同時也是可以提供數據追溯的可信字段。我國以時間頻率基準直接復現秒定義(目前國際單位制中時間的基本單位)[10],為國家最高的時間標準。該基準通過獨立測量和計算得到實際復現值及其不確定度,此不確定度稱為基準的準確度,用相對值表示。目前只有少數幾個國家研制出了時頻基準,準確度達到了10-15量級。目前我國的時間頻率基準裝置是銫原子噴泉時頻基準,一種新型的時間頻率基準裝置,由于銫原子運動速度很低,也大大減小與速度有關的一些因素在復現時引入的偏差,故可得到很高的準確度。所有的終端計量活動的時間屬性都可以溯源至此國家基準,在保證時間的準確性的同時自然建立了時間的可信(如圖3中的基準時間同步所示)。時間戳[11]則是使用數字簽名技術,對被簽名的數據對象進行運算產生的數據。簽名的對象包括原始文件信息、簽名參數、簽名時間等信息。時間戳可以證明原始文件在簽名時間之前已經存在。可信時間是經計量溯源具有一定不確定度水平的時間。以溯源至此基準的時間以及其他內容作為簽名對象,產生可信時間戳,作為計量科學數據的追溯關鍵字段,可以使時間戳具有了不間斷的高精度溯源鏈,保證了計量科學數據可追溯的質量。因此可信時間戳技術,可以在數據可追溯方面有效地實現數據安全意義上的計量科學數據可信。
以上三方面的技術并不是獨立使用,在實現數據可追溯方面的可信時間戳技術就使用了數據防抵賴(含身份可信)方面的數字簽名技術。同時,所有技術都結合了計量科學數據的溯源性特性,是面向計量科學數據溯源性字段進行加密,因此三方面的技術應綜合運用,可以有效地實現計量科學數據的可信,達到數據產生和傳輸過程高度透明、數字可驗證、易辨
真偽、計量可追溯的目的。
4 "實現計量科學數據可信的安全體系設計
計量科學數據可信度的實現技術需要綜合使用,才能發揮保障計量科學數據安全的作用。因此,需要設計一種計量科學數據可信的安全體系實現計量科學數據的可信。該體系需包括計量科學數據及其可信度的實現技術兩部分,其中計量科學數據可信度的實現技術包含了三個方面即數據防抵賴(含身份可信),被篡改、可追溯,同時又是綜合應用,沒有明確的界限,包括但不限于CA證書、數字簽名、數據加解密、時間同步技術和可信時間戳等技術。
中國計量科學研究院(下稱中國計量院)已經進行了多年的計量數字化轉型研究,其中包括了計量科學數據安全體系研究,目前形成了綜合應用計量科學數據可信度實現技術進行計量科學數據安全運行的體系。該體系按照計量科學數據可信度的內涵和建立方法建設,其原理圖如圖2所示。
該體系主要功能分為兩部分,分別為可信計量科學數據的生成和經傳輸后計量科學數據的可信使用。
可信計量科學數據的生成部分,綜合采用CA證書、數字簽名、數據加解密、可信時間戳等可信技術,生成疊加明文、暗文、明文二維碼的可信計量科學數據。對于計量活動,表現形式為一份可信計量證書。具體過程為,首先獲取證書系統和證書服務器,證書系統中包含用于非對稱加密的公鑰和私鑰,證書服務器則用于保存時空證書;其次對于每個計量活動產生的原始計量數據,生成一個哈希值,再使用私鑰,通過SM2算法對哈希值進行加密得到簽名暗文,同時獲取到操作系統時空信息形成時間空間明文,通過時間空間明文和證書系統生成明文二維碼,將時間空間明文和明文二維碼疊加到初始計量數據上生成疊加明文、二維碼的可信計量數據。在計量數據的本體層面,將之前生成的暗文寫入,最后生成疊加明文、暗文、二維碼的可信計量數據本體文件,即數字校準證書(DCC)[12],也可同時生成可視化的計量證書。
經傳輸后計量科學數據的可信使用,則是通過證書檢驗、暗文檢驗、明文檢驗經傳輸得到的計量科學數據(計量證書),以判斷該數據(證書)是否可信。首先掃描明文二維碼查詢證書服務器上的時空證書信息,對時空證書信息進行證書檢驗,得到證書檢驗結果,若匹配則證書檢驗結果為真,若不匹配則為假。然后對于明文使用方式,則可以查看數據證書的時間空間明文與傳輸前的明文是否一致,得到明文檢驗結果,若一致,則明文檢驗結果為真,反之則為假;對于加密文件(暗文)使用方式,先獲取證書系統中的公鑰,再獲取疊加明文、暗文、二維碼的簽名文件。通過公鑰和簽名驗證系統對暗文進行檢驗,使用公鑰對得到的簽名文件進行解密,得到暗文檢驗結果,若匹配則證書檢驗結果為真,若不匹配則為假。綜合證書檢驗結果和暗文檢驗結果得到計量數據證書檢驗結果,當證書檢驗結果、暗文檢驗結果、明文檢驗結果都為真時,計量數據證書檢驗結果為真,即該計量數據證書可信,其余情況檢驗結果皆為假,即該計量數據證書不可信。
該計量科學數據安全體系已經形成了CA數字簽名、基準時間同步、可信時間戳、可信視頻綜合應用四個方面的特色系統,實現時間可信、身份可信、內容可信、視頻可信。中國計量院的可信計量科學數據安全體系構筑了國家質量基礎設施NQI數字化安全基礎。如圖3所示。
5 "總結
本文提出的方法是對計量科學數據可信的階段性研究成果,依據該研究成果構建的計量科學數據安全體系經過了實踐的檢驗。目前,計量數字化轉型工作還處于起步階段,因此計量科學數據本身將有更多的研究結果和規范,面向計量科學數據的可信技術也會不斷進步。隨著研究的深入和國內外技術的發展,包括可信在內的計量科學數據的安全將會有更豐富的內容。
參考文獻
[1] 中共中央、國務院,《關于構建數據基礎制度更好發揮數據要素作用的意見》[G],[2022-12-02].
[2] 國家數據局、中央網信辦、科技部、工業和信息化部、交通運輸部、農業農村部、商務部、文化和旅游部、國家衛生健康委、應急管理部、中國人民銀行、金融監管總局、國家醫保局、中國科學院、中國氣象局、國家文物局、國家中醫藥局,《“數據要素×”三年行動計劃(2024—2026年)》[G],[2023-12-31].
[3] signatories of the Joint Statement of Intent (JSI) , Joint Statement of Intent on the digital transformation in the international scientific " and quality infrastructure[G]. https://www.bipm.org/en/liaison/digital- transformation.
[4] BIPM,CIPM2030+[G]. https://www.bipm.org/en/search.
[5] EURAMET, Document specifying rules for the secure use of DCC covering legal aspects of metrology. https://doi.org/10.5281/zenodo. 3664211, 2020.10.26.
[6] 國家計量技術規范[S],JJF1001-2011,通用計量術語及定義.
[7] 國家標準,GB/T 25056,信息安全技術 證書認證系統密碼及其相關安全技術規范[S].
[8] 國家標準,GB/T 25069,信息安全技術 術語[S].
[9] 國家標準,GB/T 32905,信息安全技術SM3密碼雜湊算法[S].
[10] 國家計量技術規范,JJF1180-2007時間頻率計量名詞術語及定義[S].
[11] 國家標準,GB/T 20520,信息安全技術 公鑰基礎設施 時間戳規范[S].
[12] 數字校準證書(DCC)[DB],https://www.nim.ac.cn/dcc/#/homepage/ contentdetail?id=fe9049b1-7455-4ee8-be17-defb3e4ee252amp;routeId=1amp;ver=fe9049b1-7455-4ee8-be17-defb3e4ee252.
引用格式:劉子龍,龔浩,王娟,熊行創.計量科學數據可信度研究[J].農業大數據學報,2024,6(2):253-258.DOI:10.19788/j.issn.2096-6369.000034.
CITATION: LIU ZiLong, GONG Hao, WANG Juan, XIONG XingChuang. Research on the Trusted Level of Metrology Scientific Data[J]. Journal of Agricultural Big Data:2024,6(2):253-258. DOI:10.19788/j.issn.2096-6369.000034.
Research on the Trusted Level of Metrology Scientific Data
LIU ZiLong1,2, GONG Hao1,2, WANG Juan1,3, XIONG XingChuang1,2,*
1.Center for Metrology Scientific Data, National Institute of Metrology, Beijing 100029; 2.Key Laboratory of Metrology Digitalization and Digital Metrology for State Market Regulation, Beijing 100029; 3. China Jiliang University, Hangzhou 310018
Abstract: Scientific data security is not only an inherent requirement for the development of scientific data management theory, but also a practical need for the development of scientific data. In the field of metrology, with the development of metrology digital transformation, reliable requirements have been put forward for data security in metrology science based on the universal significance of data security. The development strategy CIPM2030+formulated by the International Bureau of Weights and Measures (BIPM) proposes to achieve \"remote+X\" in the digital transformation of metrology, and its services still focus on metrology scientific data. Therefore, in \"remote+X\" measurement, the authority of measurement in the physical world is transformed into the credibility of scientific measurement data in the digital world. This article proposes three methods to establish the credibility of metrological data, namely, the anti-repudiation and identity trustworthiness of the data generation subject, the anti-tampering and traceability of the data transmission process, and provides corresponding implementation technical suggestions. It also specifically introduces the data security system design of the National Institute of Metrology in achieving the credibility of metrological data. Through these studies, we will gradually establish a trustworthy system for metrological scientific data, and build a trustworthy foundation for the secure application of metrological scientific data and the digital transformation of metrology.
Keywords: data security; trusted data; metrology digital transformation; data traceability