陳德華,潘喬,王梅,樂嘉錦
東華大學計算機科學與技術學院,上海 201620
隨著信息技術的飛速發展,全球數據資源正以前所未有的速度不斷增長和積累,大數據以其具有的巨大潛在價值成為政府、學術界和企業界共同關注的焦點。數據資源的價值具有隱藏性,研究人員需進行深度分析和挖掘,方能發現其潛在的價值。然而目前這一過程受到數據的完整性以及數據的訪問權限等條件的制約,使得數據的應用價值受到極大限制。很明顯,只有開放的數據資源,才能釋放數據的價值。數據開放是大數據發揮其作用的基礎。
數據資源的戰略性和商業價值正在日益顯現,據麥肯錫公司預測,醫療數據的有效利用每年可為美國醫療健康體系帶來3000多億美元的潛在價值,并貢獻0.7%的年度生產力增長,可為加拿大醫療健康體系節省100億美元的衛生費用[1]。因此,目前全球各國都將數據開放提升到國家戰略層面。截至2014年4月,已經有63個國家制定了政府數據的開放計劃,如美、英、法等8國簽署的《開放數據憲章》①。國務院2015年印發《促進大數據發展行動綱要》,明確將政府數據的開放排在首位。然而數據開放帶來的數據安全和隱私泄露的風險[2-4]使得數據資源的開放變得越來越困難。數據自治開放為數據開放提供了新思路和新的解決辦法。數據管理方式的變化將帶來數據應用技術的巨大變革。長久以來,針對面向聯機事務處理(online transaction processing,OLTP)的關系數據庫以及面向聯機分析處理(online analytical processing,OLAP)的多維數據模型[5]產生了大量的研究成果,已建立成熟完備的應用解決方案。……