郭宏杰 楊 輝 魏 連 譚子兮 嚴 碩 曹 揚 灑科進
1(國家信息中心 北京 100045)
2(中電科大數(shù)據(jù)研究院有限公司 貴陽 550022)
3(提升政府治理能力大數(shù)據(jù)應(yīng)用技術(shù)國家工程實驗室 貴陽 550022)(3632212@qq.com)
根據(jù)國家“十四五”發(fā)展規(guī)劃目標綱要,打造數(shù)字經(jīng)濟新優(yōu)勢已成為未來工作的方向和重點,習近平總書記屢次在關(guān)鍵講話中對我國大數(shù)據(jù)戰(zhàn)略的實施提出多方面要求.探索解決數(shù)據(jù)相關(guān)主體的供需及權(quán)責關(guān)系,強化數(shù)據(jù)開放共享中的安全保障,建立數(shù)據(jù)資源高效合規(guī)流通的營運機制,從而推動數(shù)據(jù)的有序流通,發(fā)揮數(shù)據(jù)作為“基礎(chǔ)性戰(zhàn)略資源”和“生產(chǎn)要素”的重大作用,是推進數(shù)字經(jīng)濟社會發(fā)展的重要手段.
數(shù)據(jù)流通的主要環(huán)節(jié)包括數(shù)據(jù)需求的確認、數(shù)字資源的接入、數(shù)據(jù)的傳輸和使用等,涉及數(shù)據(jù)產(chǎn)生者、數(shù)據(jù)提供者、數(shù)據(jù)使用者及數(shù)據(jù)流通服務(wù)者等相關(guān)方.數(shù)據(jù)產(chǎn)生者是指通過自身屬性及行為形成相應(yīng)數(shù)據(jù)的主體,如一般互聯(lián)網(wǎng)用戶.數(shù)據(jù)提供者也可稱為數(shù)據(jù)收集者,是指通過各種方式完成數(shù)據(jù)采集與存儲,并按約定條件提供數(shù)據(jù)的主體,如政府公共服務(wù)部門及電商平臺.數(shù)據(jù)使用者也可稱為數(shù)據(jù)需求者,即按照相關(guān)約定條件,通過使用數(shù)據(jù)以滿足自身業(yè)務(wù)需求的主體,如公共服務(wù)機構(gòu)或商業(yè)機構(gòu).數(shù)據(jù)流通服務(wù)者是指基于密碼技術(shù),在數(shù)據(jù)流通過程中為相關(guān)各方提供包括但不限于身份認證、授權(quán)管理、責任認定、隱私保護等網(wǎng)絡(luò)信任服務(wù)的主體,如數(shù)據(jù)交易所等.在數(shù)據(jù)要素的流通中,各方面臨著不同的問題和需求.
另外,數(shù)據(jù)在流通過程中存在數(shù)權(quán)爭議、隱私保護及責任追溯等問題,為促進數(shù)據(jù)合規(guī)流通,國家正在加快數(shù)據(jù)領(lǐng)域的立法進程.《中華人民共和國網(wǎng)絡(luò)安全法》[1]、《中華人民共和國民法典》[2]、《中華人民共和國數(shù)據(jù)安全法》(以下簡稱《數(shù)據(jù)安全法》)[3]、《中華人民共和國個人信息保護法》(以下簡稱《個人信息保護法》)[4]等相繼出臺,明確提出“信息須經(jīng)被收集者同意方能提供給他人”;其中《個人信息保護法》明確提出了處理個人數(shù)據(jù)的基本原則,即合法正當、最小必要、公開透明、準確完整和確保安全.《深圳經(jīng)濟特區(qū)數(shù)據(jù)條例》[5]則進一步構(gòu)建了以“告知—同意”為核心的個人數(shù)據(jù)處理規(guī)則,并對上述原則進行了細化.
1) 數(shù)據(jù)產(chǎn)生者使用數(shù)據(jù)難.數(shù)據(jù)產(chǎn)生者作為數(shù)據(jù)的生產(chǎn)主體,本應(yīng)享有數(shù)據(jù)的使用權(quán)和知情權(quán),但由于數(shù)據(jù)提供者和數(shù)據(jù)使用者的信息化系統(tǒng)暫未有效實現(xiàn)互聯(lián)互通,尤其在政務(wù)辦事中,往往需要數(shù)據(jù)產(chǎn)生者線下開相應(yīng)證明文件,給用戶在數(shù)據(jù)使用上帶來“不便”.
同時,由于當前服務(wù)機構(gòu)法律意識不健全,在未取得數(shù)據(jù)產(chǎn)生者授權(quán)的情況下導致數(shù)據(jù)濫用的情況頻頻發(fā)生,即便部分服務(wù)機構(gòu)在用戶協(xié)議中給出數(shù)據(jù)使用的相關(guān)提示并取得用戶授權(quán),用戶也難以知曉授權(quán)后的數(shù)據(jù)使用詳情,造成數(shù)據(jù)產(chǎn)生者“不知”自身數(shù)據(jù)是否被非法亂用以及對數(shù)據(jù)使用詳情無法覺察(“不察”)的情況.
2) 數(shù)據(jù)提供者管理數(shù)據(jù)難.目前,數(shù)據(jù)提供者掌握著巨大的數(shù)據(jù)資源,但由于責權(quán)、邊界不清等問題,“不愿”“不敢”開放共享數(shù)據(jù);同時由于打破信息孤島的技術(shù)難度大,數(shù)據(jù)提供者沒有完善的技術(shù)手段,導致其在開放數(shù)據(jù)共享時存在“不會”的難題.
3) 數(shù)據(jù)使用者獲取數(shù)據(jù)難.數(shù)據(jù)使用者作為數(shù)據(jù)的需求單位,往往不知道(“不明”)應(yīng)該去哪里獲取所需要的數(shù)據(jù).有時即使找到了數(shù)據(jù)提供者,但由于溝通推進過程慢,導致數(shù)據(jù)獲取“不快”的問題.隨著《數(shù)據(jù)安全法》《個人信息保護法》的相繼出臺,數(shù)據(jù)使用者在拿到數(shù)據(jù)后也困惑于數(shù)據(jù)合規(guī)應(yīng)用問題,造成使用上的“不安”.
4) 數(shù)據(jù)流通服務(wù)者運營數(shù)據(jù)難.數(shù)據(jù)流通服務(wù)者作為上述各方的“連接者”和“服務(wù)者”,需要對數(shù)據(jù)資源流通使用時法律法規(guī)、標準規(guī)范的符合性、應(yīng)用場景的風險評估、規(guī)則模型的適配性、服務(wù)接入的流程化、系統(tǒng)高效運行的連續(xù)性、全業(yè)務(wù)生命周期的可追溯性等內(nèi)容進行全面、深入把控,并形成健全、有效的機制,這樣才能引導數(shù)據(jù)流通產(chǎn)業(yè)安全、合規(guī)、高效的發(fā)展,但在數(shù)字經(jīng)濟的發(fā)展初期,還需要業(yè)務(wù)主管部門在政策上給予支持,在資源投入上給予扶持.
2021年3·15晚會,央視曝光了多個招聘平臺信息嚴重泄露事件,表明個人信息安全存在嚴重隱患.如何在利用大數(shù)據(jù)開展就業(yè)與人才服務(wù)的同時,嚴格遵守國家相關(guān)法律法規(guī)要求,保護個人隱私信息不受侵害,是目前亟需解決的難題與痛點.
1.2.1 對于C端求職者
求職者作為簡歷數(shù)據(jù)的產(chǎn)生者,其需求包括:
1) 了解最新的區(qū)域就業(yè)市場的需求.求職準備過程中,宏觀就業(yè)形勢能直觀地讓求職者看到自己在市場中的定位,為其擇業(yè)提供參考與指導.
2) 基于自身意愿精準、快速投遞簡歷的需求.在海量的招聘信息中,需要快速找到精準匹配自身意愿的招聘信息,完成有針對性的簡歷投遞.
3) 基于自身意愿證明其真實工作經(jīng)歷的需求.求職者在求職過程中,需要提高簡歷的可信度,打消用人單位對其工作經(jīng)歷、學歷等信息的疑慮,從而盡快獲得面試機會.
1.2.2 對于B端招聘企業(yè)
招聘企業(yè)作為簡歷數(shù)據(jù)的使用者,其需求包括:
1) 了解最新的區(qū)域人員從業(yè)經(jīng)歷的需求.用人單位需要從宏觀角度了解區(qū)域人力資源狀況,從而指導招聘與薪酬策略.
2) 獲得與崗位匹配之求職簡歷的需求.企業(yè)需要在眾多求職者簡歷中迅速篩選出符合要求的候選人.
3) 對潛在雇員背景調(diào)查的需求.企業(yè)需要通過背景調(diào)查去更加清楚地了解候選人的過往經(jīng)歷,降低招聘風險,提高用工效率.
1.2.3 對于G端政府部門
政府部門作為數(shù)據(jù)的提供者,其需求包括:
1) 掌握最新的區(qū)域就業(yè)市場供需情況的需求.就業(yè)形勢與人才供求關(guān)系直接反映了本地的經(jīng)濟發(fā)展狀況,政府只有了解本地最新的人才供需情況,才能“對癥下藥”地制定相應(yīng)政策和措施,保障企業(yè)用工、居民安居樂業(yè).
2) 規(guī)范人才招聘市場,保護公民隱私的管理需求.政府需要發(fā)揮其管理職能,在安全、合規(guī)、保護公民隱私的前提下,促進人力資源的合理流動和優(yōu)化配置,實現(xiàn)招聘服務(wù)業(yè)態(tài)的健康有序發(fā)展.
3) 基于個人授權(quán)的數(shù)據(jù)便民服務(wù)需求.充分開發(fā)利用數(shù)據(jù)資源,促進民生就業(yè),實現(xiàn)基于個人授權(quán)的數(shù)據(jù)便民服務(wù),這是政府機構(gòu)職責所在.
我國相關(guān)法律法規(guī)明確要求個人信息應(yīng)當取得個人同意后方能提供給他人,目前業(yè)內(nèi)普遍采取的用戶簡單點擊“同意”的做法無法保證用戶對數(shù)據(jù)授權(quán)范圍的充分知悉和“明示同意”.
本文采用區(qū)塊鏈保全存證、智能合約和星際文件系統(tǒng),為參與數(shù)據(jù)流通的多方搭建了可信數(shù)據(jù)流通環(huán)境.基于區(qū)塊鏈的不可篡改特性,數(shù)據(jù)授權(quán)流通平臺搭建了區(qū)塊鏈保全存證系統(tǒng),將每一次用戶授權(quán)和數(shù)據(jù)流通過程上傳到區(qū)塊鏈網(wǎng)絡(luò),確保數(shù)據(jù)流通過程的可追溯性,解決了數(shù)據(jù)流通事后難以追溯的問題.智能合約的運用為“授權(quán)書”的驗證和執(zhí)行提供了技術(shù)保障,讓流通過程更加可信、智能,解決了數(shù)據(jù)流通中參與多方的信任問題.星際文件系統(tǒng)與區(qū)塊鏈的結(jié)合實現(xiàn)了去中心化保存和文件共享,保障數(shù)據(jù)傳輸過程不經(jīng)由中央平臺,解決了數(shù)據(jù)提供者擔心數(shù)據(jù)的傳輸經(jīng)由第三方平臺而造成的信息泄露問題.
本文通過建設(shè)基于區(qū)塊鏈技術(shù)的分布式政務(wù)數(shù)據(jù)授權(quán)流通平臺,形成 “身份可信、簽名可靠、流程可溯、隱私可控”的數(shù)據(jù)授權(quán)流通模式,滿足數(shù)據(jù)流通中的“參與主體明確、應(yīng)用場景明確、數(shù)據(jù)內(nèi)容明確、生命周期明確”的需求.使得數(shù)據(jù)產(chǎn)生者在充分了解數(shù)據(jù)授權(quán)范圍、使用場景等關(guān)鍵信息后,再完成授權(quán)書的在線簽署、業(yè)務(wù)全過程用戶深度參與,輔以權(quán)威的司法存證和區(qū)塊鏈存證,保證了線上授權(quán)的法律效力,厘清了各方責任,整體上實現(xiàn)對數(shù)據(jù)授權(quán)業(yè)務(wù)方式的創(chuàng)新.
2.2.1 系統(tǒng)架構(gòu)
數(shù)據(jù)授權(quán)流通平臺采用層次架構(gòu)組織系統(tǒng),整體架構(gòu)分成5個層次,如圖1所示,從下至上分別是基礎(chǔ)層、平臺層、后端服務(wù)層、應(yīng)用層、用戶層,每一層都為上一層提供服務(wù),使用下層服務(wù),每一層只與相連層次交互,簡化系統(tǒng)交互.

圖1 系統(tǒng)架構(gòu)
1) 基礎(chǔ)層(IaaS):支撐應(yīng)用系統(tǒng)運行的硬件設(shè)施,包括計算資源、存儲資源、網(wǎng)絡(luò)資源、安全資源、邊緣節(jié)點等.
2) 平臺層(PaaS):提供應(yīng)用運行與管理的平臺服務(wù)能力,包括容器運行環(huán)境、容器編排、邊緣計算容器、DevOps等組件工具,為云原生提供服務(wù)化、韌性、可觀測、自動化能力.
3) 后端服務(wù)層(BaaS):包括區(qū)塊鏈后端服務(wù)和應(yīng)用共享能力平臺.區(qū)塊鏈后端服務(wù)由智能合約、保全存證、算法機制、驗證機制等功能集成,支撐數(shù)據(jù)授權(quán)流通平臺的穩(wěn)定安全運行.應(yīng)用共享能力平臺,提供基于微服務(wù)架構(gòu)的開發(fā)框架、微服務(wù)治理組件以及統(tǒng)一認證、統(tǒng)一授權(quán)、統(tǒng)一消息、統(tǒng)一日志等公共能力服務(wù).
4) 應(yīng)用層(SaaS):建設(shè)應(yīng)用功能模塊,構(gòu)成完整的應(yīng)用平臺.其中數(shù)據(jù)授權(quán)流通平臺包括數(shù)據(jù)流通門戶管理、機構(gòu)管理、API服務(wù)管理、場景管理、授權(quán)簽名、應(yīng)用管理、審計管理等;運營中心包括用戶分析、畫像分析、客服中心、行為分析、服務(wù)分析等.
5) 用戶層(US):使用數(shù)據(jù)授權(quán)流通平臺的用戶主要有3類主體,分別是數(shù)據(jù)產(chǎn)生者、數(shù)據(jù)使用者、數(shù)據(jù)提供者.
2.2.2 業(yè)務(wù)流程
如圖2所示,數(shù)據(jù)使用者調(diào)用數(shù)據(jù)時,通過數(shù)據(jù)授權(quán)流通平臺將授權(quán)請求推送至數(shù)據(jù)產(chǎn)生者,數(shù)據(jù)產(chǎn)生者閱讀授權(quán)內(nèi)容及應(yīng)用范圍,完成授權(quán).

圖2 數(shù)據(jù)授權(quán)流通平臺業(yè)務(wù)流程圖
數(shù)據(jù)提供者基于數(shù)據(jù)產(chǎn)生者的授權(quán)范圍,通過加密技術(shù)將數(shù)據(jù)發(fā)送給數(shù)據(jù)使用者,完成數(shù)據(jù)流轉(zhuǎn).
數(shù)據(jù)授權(quán)流通平臺將流通全環(huán)節(jié)生成存證摘要文件,上傳到權(quán)威存證機構(gòu)和區(qū)塊鏈中.
2.3.1 星際文件
為了避免在區(qū)塊鏈中存儲非必要的信息[6],引入了IPFS.IPFS[7]星際文件系統(tǒng),采用分布式數(shù)據(jù)分發(fā)的形式,實現(xiàn)在邊緣節(jié)點中存入的數(shù)據(jù)可便捷地被他方獲取,提高了數(shù)據(jù)傳遞效率,保證數(shù)據(jù)傳輸?shù)膶崟r性.
本文將星際文件系統(tǒng)與區(qū)塊鏈相結(jié)合,搭建基于星際文件系統(tǒng)與區(qū)塊鏈的文件存儲和內(nèi)容分發(fā)網(wǎng)絡(luò)協(xié)議,在數(shù)據(jù)授權(quán)流通服務(wù)中實現(xiàn)數(shù)據(jù)提供者和數(shù)據(jù)使用者之間的數(shù)據(jù)文件直接傳輸,保障數(shù)據(jù)傳輸過程不經(jīng)由中央平臺,保護數(shù)據(jù)隱私,避免數(shù)據(jù)泄露.
2.3.2 智能合約
數(shù)據(jù)使用者向區(qū)塊鏈網(wǎng)絡(luò)提交授權(quán)請求,該授權(quán)請求包含目標數(shù)據(jù)的信息,使得數(shù)據(jù)產(chǎn)生者獲知數(shù)據(jù)使用者所希望請求的授權(quán)范圍、授權(quán)時長、應(yīng)用場景和使用主體.該授權(quán)請求自動調(diào)用數(shù)據(jù)授權(quán)智能合約中定義的請求接口.
數(shù)據(jù)產(chǎn)生者通過事件監(jiān)聽回調(diào)機制,在監(jiān)聽到日志中寫入上述授權(quán)請求事件時作出響應(yīng).數(shù)據(jù)產(chǎn)生者向區(qū)塊鏈網(wǎng)絡(luò)提交授權(quán)確認,簽訂電子授權(quán)書,該授權(quán)確認調(diào)用數(shù)據(jù)授權(quán)智能合約中定義的授權(quán)接口,使數(shù)據(jù)授權(quán)智能合約將數(shù)據(jù)使用者標記為已獲得授權(quán).
系統(tǒng)自動判斷數(shù)據(jù)產(chǎn)生者所簽訂授權(quán)書中的內(nèi)容,請求數(shù)據(jù)提供者將目標數(shù)據(jù)直接提供至數(shù)據(jù)使用者,并基于授權(quán)書中的內(nèi)容,限定授權(quán)范圍、授權(quán)時長,在實現(xiàn)智能化處理的同時,保障數(shù)據(jù)產(chǎn)生者的合法權(quán)益.
2.3.3 保全存證
數(shù)據(jù)授權(quán)流通平臺搭建了一套符合國家《電子數(shù)據(jù)存證技術(shù)規(guī)范》的電子證據(jù)保全系統(tǒng),平臺上每一次用戶授權(quán)和數(shù)據(jù)流通過程都會被完整記錄,生成唯一的保全文件,并被上傳至權(quán)威存證機構(gòu)和區(qū)塊鏈網(wǎng)絡(luò)中.權(quán)威存證機構(gòu)可出具法院認可的權(quán)威證明文件,區(qū)塊鏈技術(shù)確保了流通信息公開、透明、不可篡改,還可以充分還原數(shù)據(jù)流通中的全過程.
基于區(qū)塊鏈技術(shù)的去中心化、不可篡改等特性,結(jié)合權(quán)威存證機構(gòu)的權(quán)威性,在數(shù)據(jù)流通過程中如遇糾紛,平臺可快速出具權(quán)威保全證明文件,保障平臺用戶的合法權(quán)益.
2.3.4 邊緣節(jié)點
如圖3所示,ESB組件、IPFS星際文件節(jié)點、區(qū)塊鏈超級賬本背書節(jié)點、加密算法模塊這4個組件都運行在KubeEdge邊緣容器計算服務(wù)上.ESB負責數(shù)據(jù)協(xié)議轉(zhuǎn)換、數(shù)據(jù)動態(tài)封裝,此外ESB上不同的Flow通道,其線程互相隔離,彼此互不干擾.

圖3 邊緣計算節(jié)點
2.3.5 API動態(tài)封裝
數(shù)據(jù)提供者無須對已有系統(tǒng)架構(gòu)或數(shù)據(jù)接口進行修改,平臺可靈活實現(xiàn)對數(shù)據(jù)接口的整合.通過動態(tài)封裝技術(shù),生成不同場景下的定制訪問接口,使其成為統(tǒng)一、個性化的數(shù)據(jù)服務(wù).同時動態(tài)封裝還可通過配置訪問接口的傳出參數(shù),實現(xiàn)對數(shù)據(jù)請求最小顆粒化的控制.
基于區(qū)塊鏈的政務(wù)數(shù)據(jù)授權(quán)流通平臺已在就業(yè)與人才領(lǐng)域成功落地,如圖4所示.用戶在網(wǎng)絡(luò)招聘平臺查看工作崗位機會時,可通過主動授權(quán)方式,允許招聘平臺獲取自身社保數(shù)據(jù),核驗其既往工作經(jīng)歷,提高簡歷的可信度;同時平臺可根據(jù)核驗過的真實工作履歷為用戶提供精準匹配的崗位機會,實現(xiàn)人才與企業(yè)之間的快速、精準撮合,降低各方時間和溝通成本.

圖4 產(chǎn)品原型
本文方案將基于區(qū)塊鏈的星際文件、智能合約、司法保全存證等多項技術(shù)融合到數(shù)據(jù)流通中,通過多方授權(quán)的機制,實現(xiàn)了身份可信、簽名可靠、流程可溯、隱私可控,滿足了法律對數(shù)據(jù)處理的“四明確”要求(明確業(yè)務(wù)參與主體、明確數(shù)據(jù)應(yīng)用場景、明確使用數(shù)據(jù)內(nèi)容、明確數(shù)據(jù)有效期限).本文方案有別于傳統(tǒng)的只在數(shù)據(jù)提供者與數(shù)據(jù)使用者之間搭建傳輸通路的方案,通過建立完整的數(shù)據(jù)授權(quán)流通機制,確保業(yè)務(wù)全流程實現(xiàn)數(shù)據(jù)產(chǎn)生者(用戶)的深度參與,在充分了解數(shù)據(jù)授權(quán)范圍、使用場景等關(guān)鍵信息后,再完成授權(quán)書的在線簽署,過程中輔以權(quán)威的司法存證,既保證了線上授權(quán)的法律效力,又厘清了各方責任,從數(shù)權(quán)的角度保護了各方主體的合理權(quán)益主張.
從實際應(yīng)用的角度,在實際就業(yè)與人才服務(wù)場景中,基于用戶授權(quán)填寫、核驗的“誠信簡歷”,人才服務(wù)機構(gòu)可向招聘企業(yè)提供更加簡單、有效、合規(guī)的背景調(diào)查與人崗精準匹配推薦服務(wù);企業(yè)降低了招聘中的人力、物力和時間成本,招聘企業(yè)實現(xiàn)了“降本增效”,人才服務(wù)機構(gòu)實現(xiàn)了“增值創(chuàng)收”.
綜上所述,基于區(qū)塊鏈技術(shù)的數(shù)據(jù)授權(quán)流通機制不僅在理論上安全可信,其對業(yè)務(wù)合規(guī)要求的高滿足度與應(yīng)用可行性也在實際場景中得到驗證,為公共數(shù)據(jù)資源的安全、合規(guī)應(yīng)用提供了技術(shù)路徑與實踐辦法,對構(gòu)建數(shù)字經(jīng)濟大生態(tài)起到了至關(guān)重要的作用.