王智慧,周旭晨,朱云
1. 復(fù)旦大學(xué)計(jì)算機(jī)科學(xué)技術(shù)學(xué)院,上?!?01203;2. 上海市數(shù)據(jù)科學(xué)重點(diǎn)實(shí)驗(yàn)室,上?!?01203
隨著大數(shù)據(jù)時(shí)代的來(lái)臨,數(shù)據(jù)資源的戰(zhàn)略性和商業(yè)價(jià)值越來(lái)越被人們認(rèn)同和重視,數(shù)據(jù)資源的開(kāi)放共享需求也日益緊迫。然而在現(xiàn)實(shí)中,數(shù)據(jù)資源的開(kāi)放共享卻變得越來(lái)越困難。造成這種狀況的主要原因之一是數(shù)據(jù)開(kāi)放共享時(shí)的隱私保護(hù)問(wèn)題[1]。
以醫(yī)療數(shù)據(jù)開(kāi)放為例,醫(yī)療數(shù)據(jù)開(kāi)放顯然能夠?yàn)獒t(yī)療數(shù)據(jù)開(kāi)發(fā)利用提供便利,為臨床診斷、藥物研發(fā)等提供數(shù)據(jù)支持,推動(dòng)醫(yī)療數(shù)據(jù)價(jià)值的實(shí)現(xiàn)。但是,醫(yī)療數(shù)據(jù)常包含較多的隱私信息,例如,患者個(gè)人信息、既往病史、就診記錄等。因此,出于對(duì)患者的隱私保護(hù)的考慮,醫(yī)療數(shù)據(jù)的開(kāi)放將不可避免地受到制約。
從數(shù)據(jù)開(kāi)放模式下的隱私保護(hù)需求考慮,一方面要求實(shí)現(xiàn)對(duì)個(gè)體隱私的保護(hù),即保護(hù)數(shù)據(jù)所描述的個(gè)體對(duì)象的隱私;另一方面也要求對(duì)數(shù)據(jù)自身的稀缺性加以保護(hù),即保護(hù)數(shù)據(jù)開(kāi)放者提供的原始數(shù)據(jù)的整體隱私不被非法攫取。因此,從隱私保護(hù)的角度來(lái)說(shuō),數(shù)據(jù)開(kāi)放要求必然是有監(jiān)管的開(kāi)放,即數(shù)據(jù)自治開(kāi)放。
本文考慮在數(shù)據(jù)自治開(kāi)放模式下,以數(shù)據(jù)盒為基本數(shù)據(jù)單元向數(shù)據(jù)使用者開(kāi)放。數(shù)據(jù)盒是數(shù)據(jù)自治開(kāi)放的載體,它封裝了被開(kāi)放的數(shù)據(jù)以及相應(yīng)的數(shù)據(jù)管理系統(tǒng)。數(shù)據(jù)使用者先向數(shù)據(jù)開(kāi)放者申請(qǐng)使用數(shù)據(jù)盒,在獲得數(shù)據(jù)開(kāi)放者的授權(quán)之后,再通過(guò)數(shù)據(jù)盒提供的數(shù)據(jù)訪問(wèn)接口使用數(shù)據(jù),以此實(shí)現(xiàn)數(shù)據(jù)的開(kāi)放?!?br>