牟明福,蘇正泉
(1.中共貴州省委黨校,貴州 貴陽 550028;2.國家行政學院,北京 100089)
大數據是基于云計算、物聯網等為基礎構建的新型信息技術系統和架構,相對于傳統信息化系統,其網絡邊界更寬、信息生態系統覆蓋面更廣、數據集中度更高,面臨的安全風險也隨之加劇。大數據安全是一場必要的斗爭[1];大數據的發展,帶來一系列新的挑戰,直接影響和關涉國家安全、個人隱私[2]。隨著大數據技術不斷發展,世界各國政府把信息網絡安全戰略逐漸從互聯網信息安全擴展到大數據信息安全領域[3]。
目前,國內外學者對信息安全風險評估的方法、模型、影響因素均有專門研究[4-8]。陳火全[9]提出大數據背景下建立基于信譽機制的P2P網絡安全治理策略;陳建昌[10]對大數據環境下的網絡安全,從物理安全、信息傳播安全、管理安全3個方面進行了分析,并提出加強技術防范和提高安全防范意識的網絡安全防護措施;陳明奇等[1]研究指出,美國實際上已經確立了基于大數據的信息網絡安全戰略;張玉蘭[11]等提出,不是所有安全事件都能完全預防,高效的事件響應能力可降低信息安全事件損失和破壞。綜合以上研究成果可知,現階段缺乏對大數據發展中信息安全風險的系統辨識,且對信息安全風險全過程治理的研究尚有不足。
信息安全是國家安全的重要組成之一,既影響國家安全又聯系國民安全。圍繞數據采集、數據傳輸、數據存儲、數據分析4個大數據核心環節,進行系統的信息安全風險辨識,引入公共安全管理、風險治理理論,探索構建信息安全防御策略,對強化大數據發展中的信息安全管理、推動信息安全戰略落地,是非常必要且具有積極借鑒意義的。
安全在各個領域都普遍存在,它有2層含義,一是指安全的狀態,即沒有危險,沒有恐懼;二是指對安全的維護,指安全措施和安全機構。信息安全,是在信息作為與物質、能源一起構成社會發展基本要素后,其重要性日漸凸顯并為保護其價值而逐步發展的概念,它的含義在“安全的狀態”和“安全的維護”這2個方面都各有所指,且其重點目標、概念、范圍也在信息化發展中不斷演化:從最初的強調“通信保密”到“信息安全”、“計算機安全和信息安全”以及總體性的“信息安全”;范圍領域則從最早主要涉及軍事領域,擴展到信息化社會的各個方面;目標從最早的“對作戰信息的保密”發展到“信息在各環節的完整性、可用性、可控制性和不可否認性”;對應地,其理論和實用技術關注的重點也由最初的“防止泄密”,發展成為“防范、監測、管理、評估、控制、攻擊”等多方面的基礎理論和實用技術,并正在向“鑒別、授權、訪問控制、抗否認性以及個人隱私、知識產權的保護”等方向不斷擴展。
“信息安全”對應英文Information Security或Cyber Security 2種表述。中國使用信息安全更具普遍性,既指網絡安全,又指內容安全;空間安全側重強調網絡空間的基礎設施安全,更為關注從宏觀視野上對信息安全進行考察。
信息與其他資源一樣具有生命周期,從信息的產生到最終被使用并發揮作用,可將信息的生命周期分為需求、收集、傳輸、處理、存儲、維護、使用和退出等過程,綜合起來看,廣義上的信息安全指信息收集、處理、存儲、傳輸和使用等信息生命周期上各個環節的安全,每一個環節上都有數據的流動和痕跡,因此信息安全從本質上來說是信息資源(數據)的安全。數據安全是網絡空間安全核心內容[12]。信息安全核心任務就是綜合運用技術與管理等各種手段,讓信息資源(數據資產)免受威脅,或者將威脅所帶來的后果降到最低程度,以維護系統或組織的正常運轉。
隨著大數據應用范圍和領域的擴大,信息安全的需求也越來越迫切,并在數據(信息)流動的各個環節都有風險和挑戰呈現出來。“棱鏡門”事件從某種程度上折射出我國網絡信息安全的脆弱,巨大的風險迫切地要求我國重新思索網絡信息安全戰略,在充分利用新技術以提升經濟效率的同時,確保網絡信息安全、公民權利以及國家安全[13]。
大數據環境下的數據采集,既有基于物聯網和各類傳感器的采集,也有基于網絡信息的數據采集,這就決定了大數據采集來源非常廣泛。連接在物聯網上的各種感知與終端設備(傳感器、智能家電、嵌入式系統等感知端)都是由諸如現場總線、無線局域網、樓域網、園區網等多樣化的自組織網絡構成,從積極的意義上講,這些網絡實時產生和貢獻大量數據。從安全風險上看,一方面,由于感知終端處于公開、暴露、移動、野外等復雜環境中,感知設備安全防護能力脆弱,且當前的認證、加密、防控、鑒別、審計等技術并不成熟或應用不夠充分,“數據采集”中更容易出現安全問題;另一方面,“采集端所有權”廣泛分布的屬性,也導致基于這種復雜環境下采集數據所對應的信息安全需求比傳統局域網、廣泛連接的互聯網更高,對隱私權的保護問題也更為突出[14-15]。
基于大數據環境下的網絡,既將感知數據向系統傳輸,又承擔對數據進行加工后產出的“智慧服務”響應向用戶進行傳輸的任務。傳統的數據傳輸安全一般依靠基于密鑰的加密技術、建立可信平臺、建立專用隧道等方式進行保障,但大數據環境下的數據采集端和服務響應端,無論是載體形式、還是所支持的數據種類都非常多樣,針對不同的終端和多樣的數據很難構建統一的加密機制。沒有統一的加密防御或放棄“加密”防御,數據可能會“裸身傳遞”,再加上探測、監聽、數據截獲等各種網絡安全侵犯能力的更新,大數據在網絡中傳輸的風險問題自然更為突出。
首先,“云中數據”可能遭受“內外攻擊”。大數據的“高價值屬性”決定了各類海量數據可能隱含巨大政治、軍事、經濟、文化科研價值,這些海量數據集中存儲在云計算系統(數據中心),自然就易于成為首選的攻擊目標。在傳統網絡環境中,為了防御來自外部的攻擊,可以在內、外部網絡間采用安全網關進行防御,從而保護內部網絡免受外部非法用戶的侵入。但在云計算技術服務方式下,公有云是為多租戶服務的,大量不同用戶的應用都運行在同一云計算系統(數據中心)內部,更多的安全攻擊可能來自云計算系統內部。因此,在云計算技術條件下,大數據集中系統不僅要防御外部對整個云計算系統(數據中心)實施網絡入侵和攻擊,而且要高度關注云內部“壞分子”(微軟首席安全官—查理曾提出過“查理理論”:不論人口多少,壞分子總占有一定比例)對各類數據實施“前側后”(FSB)3種方式的攻擊。相應地,又為基于云計算的大數據存儲帶來了更為復雜的安全風險[16]。
其次,用戶因數據托管而面臨新風險,如圖1所示。大數據技術背景下的數據集中,一般采用將用戶數據交云計算服務商(數據中心)托管實現數據集中存儲,它所面臨的新風險包括:優先訪問權風險,用戶把數據交給云計算服務商后,具有數據優先訪問權的并不是用戶自身而是云計算服務商;數據處所風險,客戶使用云計算服務時,并不知道自己數據存放在哪臺服務器上,甚至根本不了解這臺服務器被放置在哪個國家;數據隔離風險,大量用戶數據在云計算服務平臺中幾近處于共享環境中而很難隔離;數據恢復風險,用戶數據能否恢復、多久能得到恢復,取決于云計算服務商對數據的備份和恢復能力,而不是用戶自身;長期發展風險,如果用戶選擇了某家云計算服務商,就會一直期望這家服務商能平穩發展,持續提供相應服務,云計算服務商如果消失,可能會為用戶帶來“災難性”的數據損失。

圖1 數據集中“托管”(存儲)面臨新風險Fig.1 Data centralization "managed" (storage) face new risks
大量結構化和非結構化數據采集、匯聚起來,通過數據挖掘、分析,大數據中蘊含的價值能夠如“能源”或“鉆石”般被開采出來。但開采者(數據挖掘分析人員)并非都是數據及數據價值權益的擁有者,且用戶與開采者間因大數據、云計算技術水平的差異,存在嚴重的信息不對稱,大數據價值也只有通過系列的關聯分析、深度挖掘后才能顯現出其相應價值,因而用戶向開采者事先無法準確地依據數據價值進行授權或契約。通過對數據進行挖掘和開采后,開采者既可以在看到結果后全方位透視用戶的隱私和權益,又可以將開采結果部分或全部截獲,然后將經截獲處理后的結果進行掩飾或包裝,最后將包裝后的結果交付用戶。數據處理者有可能通過掌握的信息軌跡,預測數據權人的行為走向,進而調整商業活動模式[17];在大數據發展的初期,沒有或難以構建對數據挖掘的安全防御和監控體系,整個數據挖掘過程猶如進入“無人之境”。自然地,用戶的隱私和數據收益權益受到損失,風險演變成了危機[18]。
全球數據空間沒有國界邊疆,大數據成為大國之間博弈和較量的利器[19]。強化大數據發展中的信息安全,就是要在對信息安全風險開展辨識的基礎上,綜合施策,預防和化解大數據發展中的信息安全風險,防止信息安全事件發生、降低信息安全事件損失。由信息安全戰略及大數據風險辯識、預防、化解、總結環節構成的信息安全治理閉環如圖2所示。

圖2 信息安全治理閉環Fig.2 Information security management closed loop
知名IT評論人謝文強調:沒有市場經濟制度和法治體系作為基礎支撐,大數據很可能成為發達國家在下一輪全球化競爭中的利器,而發展中國家依然處于被動依附狀態;舍恩伯格在其所著的《大數據時代-生活、工作與思維的大變革》中,是用“無處不在的‘第三只眼’”、“我們的隱私被第二次利用了”,要“掙脫大數據的困境”對大數據發展中的信息安全進行強調[20]。我國約有一半的人口已經是互聯網網民,即使是非網民,也因為生活在大數據時代,而無法與數據的產生、匯聚與使用“絕緣”,大數據發展既事關國家安全又直接聯系和影響人民群眾安全。圍繞大數據發展,推進創新性的戰略計劃,在致力于提升綜合競爭實力的同時,要將重點鎖定在不斷滿足公眾日益增長的物質、文化生活需求,并使其權益得到充分的保護。如果因為大數據發展中信息安全問題頻發,產生一些“數據利益權貴”、“數據挖掘投機分子”等而致公眾的隱私與數據權益受損,這樣的大數據發展戰略是得不償失和不可持續的。因此,需要將安全融入大數據發展戰略與規劃,大數據在引入安全問題的同時,也是解決信息安全問題的有效手段[21]。一方面,要審慎地推進大數據發展,避免將各種安全風險放大;另一方面,高度重視大數據發展中的信息安全,自覺從發展屬性的角度考慮和重視安全,將其滲透到大數據發展戰略的每一方面[22-23]。
需要著眼于大數據的全生命周期,基于大數據復雜性的基本特征及其量化指標,研究大數據環境下以數據為中心的計算模式,突破傳統的數據圍繞機器式計算,構建以數據為中心的推送式計算模式[24]。無論大數據技術如何發展,數據仍然是信息安全的“核心目標”,它的安全風險涉及數據采集、數據傳輸、數據存儲、數據挖掘與應用這個生命周期的各個環節。傳統信息安全具有“保密性、真實性、完整性、可用性、可控性”5方面防御目標,大數據信息安全需要在此基礎上,關注系統可控性和問題可查性。
系統可控性是基于云計算技術的數據集中、數據挖掘與分析中的安全保護等需求而產生的,它要求對授權操作或使用數據的人或實體加以控制。大量數據聚集于一起的“資產”屬性尤為突出,在交付數據存儲過程中,用戶就非常有必要采用選擇本地、本區域數據中心存儲或強化數據備份的機制,做到將數據資產控制在自己可觸及范圍內;問題可查性則要求在出現對數據的非法使用或破壞等信息安全問題時,能提供可追蹤調查的依據和手段。
據此構建以數據為核心的信息安全防御管理體系,如圖3所示。

圖3 以數據為核心的信息安全防御管理體系Fig.3 Information security management system framework based on data
風險溝通是在不同利益相關者之間(如科技專家與普通大眾之間、政府官員與社區或社會團體之間)針對有關風險因素進行溝通的過程。由于風險具有主觀性,不同利益主體對風險的感知是不同的,任何一方的行動都會對風險選擇和處置結果產生影響,因此,不同利益主體之間相互進行信息溝通至關重要[25]。對大數據,尤其是大數據信息安全這一新興發展領域,廣大社會公眾普遍對其知之甚少,易于出現要么將安全問題“束之高閣”,要么“談信息安全色變”的傾向,既不利于對大數據發展的推動,又無法科學保護大數據安全。圍繞大數據安全開展風險溝通,一是采取教育培訓手段,拓展大數據及安全領域專家與民眾間的溝通,讓民眾了解大數據技術原理、特征并對大數據發展的安全風險、尤其是大數據發展可能對自身權益和隱私帶來的風險有所了解;二是針對基于大數據技術的數據采集、存儲、加工等應用,積極開發和普及各種防御技術、產品和服務,建立為網絡用戶提供普遍性安全防御的機制,讓大數據安全嵌入政府公共服務;三是企業、公眾或其他社會組織在向受托方交付數據存儲或挖掘等任務時要充分溝通,明確雙方在風險防御中的法定職責、義務和恢復措施,共同控制風險;四是要引導媒體正確傳播大數據安全風險知識,尤其是要避免誤導式的風險溝通和知識傳播。
發展中的大數據信息安全在產生、發展和演化上存在多樣性,無論怎么努力,想要做到“百密而無一疏”,即保證百分之百的安全,這幾乎是不可能的。這就要求在大數據信息安全工作實踐中,一方面,要做好事前的預防和準備,包括前述的風險辨識與溝通、信息安全管理防御體系的構建等;另一方面,可以采用情景構建或事件推演的方式,在前期工作基礎上,篩選出現有防護手段無法防止的事件,并推演出事件發生后的情景及變化,有針對性地制定應急預案并作好數據多重備份等準備,做到一旦有信息安全事件發生,能夠快速響應和處置、控制事件的范圍,避免隱私侵犯的擴大并降低數據財產權益損失。同時,探索建立風險問責機制,探究風險演變成事件的原因,查找在安全制度建設、防御體系構建、安全策略等方面存在的缺失或漏洞并加以改進,既在整個安全工作中形成事前預防、事中處置到事后總結的閉環,又能通過檢驗、檢測推動安全防御體系水平的提高[26]。
1)我國目前還處在大數據發展起步階段,各種信息網絡安全問題日漸涌現和日趨復雜,主要在數據采集、數據傳輸、數據存儲和數據分析4個環節以不同風險形式呈現。
2)防范與化解大數據發展的信息安全系統性風險,需要將安全融入大數據發展戰略與規劃,加強大數據信息安全管理,進行大數據安全風險溝通,科學處置信息安全事件,及時恢復信息化系統并科學總結信息安全應對與處置,以構筑健壯的風險防御體系。
[1]陳明奇,姜禾,張娟,等.大數據時代的美國信息網絡安全新戰略分析[J].信息網絡安全,2012(8):32-35.
CHEN Mingqi,JIANG He,ZHANG Juan, et al.Analysis of the U.S. information network security strategy in the era of big data[J].Net Info Security ,2012(8):32-35.
[2]江常青.大數據對國家網絡安全的風險評估[J].中國信息安全,2015(5):53-54.
JIANG Changqing.Big data risk assessment of national network security[J].China Information Security,2015(5):53-54.
[3]蔡鈺.大數據時代信息網絡安全的戰略分析[J].陜西行政學院學報,2015(3):122-124.
CAI Yu.Strategic analysis of information network security in big data era[J].Journal of Shaanxi Academy of Governance,2015(3):122-124.
[4]張利, 彭建芬, 杜宇鴿,等. 信息安全風險評估的綜合評估方法綜述[J]. 清華大學學報(自然科學版), 2012(10):1364-1369.
ZHANG Li,PENG Jianfen,DU Yuge,et al.Information security risk assessment survey[J]. Tsinghua Univ(Sci & Tech),2012(10):1364-1369.
[5]劉佳,徐賜文.信息安全風險評估方法的比較分析[J].中央民族大學學報(自然科學版),2012,21(2):91-96.
LIU Jia,XU Ciwen.Comparative analysis of on the information security risking-assessment methods[J].Journal of MUC( Natural Sciences Edition),2012,21(2):91-96.
[6]吳德,劉三陽.信息安全風險評估模型SVRAMIS[J].西安電子科技大學學報(自然科學版),2013,40(1):44-47, 154.
WU De,LIU Sanyang.Risk assessment model of information security SVRAMIS[J].Journal of Xidian University(Natural Sciences Edition),2013,40(1):44-47,154.
[7]黃景文.信息安全風險因素分析的模糊群決策方法研究[J].山東大學學報(理學版),2012,47(11):45-49.
HUANG Jingwen.Fuzzy group decision making for information security risk factors analysis[J].Journal of Shandong University (Natural Science),2012,47(11):45-49.
[8]曾忠平.信息安全人因風險研究進展綜述[J].情報雜志,2014(4):6-11, 22.
ZENG Zhongping.A comprehensive review of the theories and practices of human factor risk analysis in information security management[J].Journal of Intelligence,2014(4):6-11,22.
[9]陳火全. 大數據背景下數據治理的網絡安全策略[J]. 宏觀經濟研究, 2015(8):76-84.
CHEN Huoquan.Network security policy of data governance in big data context[J].Macroeconomics,2015(8):76-84.
[10]陳建昌.大數據環境下的網絡安全分析[J].中國新通信,2013(17):13-16.
CHEN Jianchang.Analysis of network security in big date environment[J]. China New Telecommunications,2013(17):13-16.
[11]張玉蘭,陸松,邱嵐.基于信息安全事件的應急處理機制研究與實踐[J].信息安全與技術,2015,6(6):77-80.
ZHANG Yulan,LU Song,QIU Lan,et al.Research and practice of information security emergency handling mechanism based on event[J].Cyberspace Security,2015,6(6):77-80.
[12]惠志斌.新安全觀下中國網絡信息安全戰略的理論構建[J].國際觀察,2012(2):17-22.
HUI Zhibin. Theoretical construction of China's network information security strategy under the new security concept[J].International Review,2012(2):17-22.
[13]李晶. “棱鏡”折射下的網絡信息安全挑戰及其戰略思考[J]. 情報理論與實踐, 2014, 37(4):48-52.
LI Jing.The challenges and strategic thinking of the network information security reflected by the prism[J].Information Studies:Theory & Application,2014,37(4):48-52.
[14]李孟剛.國家信息安全問題研究[M] .北京:社會科學文獻出版社, 2012.
[15]賀洪明.基于個人信息利用的安全管理研究[J].中共貴州省委黨校學報,2015(3):88-91.
HE Hongming.Research on security management based on personal information[J] .Journal of Guizhou Provincial Party School of the CPC,2015(3):88-91.
[16]范淵.智慧城市與信息安全[M].北京:電子工業出版社,2014.
[17] 蔣潔. 大數據輪動的隱私風險與規制措施[J]. 情報科學, 2014(6):18-23.
JIANG Jie.Privacy risks of moved big data and related control measures[J].Information Science,2014(6):18-23.
[18]維克托·邁爾-舍恩伯格,肯尼思·庫克耶 著,盛楊燕,周濤 譯.大數據時代-生活工作與思維大變革[M] .杭州:浙江人民出版社,2013.
[19]馬建堂.切實把握大數據時代的新機遇、新變革[N].經濟日報,2016-01-11(14).
[20]劉德寰, 李雪蓮. 大數據的風險和現存問題[J]. 廣告大觀:理論版, 2013(3):67-73.
LIU Dehuan LI Xuelian.Risk and the existing problems of big data[J] .Outdoor Advertising(Theory Edition),2013(3):67-73.
[21]馮登國,張敏,李昊.大數據安全與隱私保護[J].計算機學報,2014,37(1):246-258.
FENG Dengguo,ZHANG Min,LI Hao.Big data security and privacy protection[J].Chinese Journal of Computer,2014,37(1):246-258.
[22]馬奔,毛慶鐸.大數據在應急管理中的應用[J].中國行政管理,2015(3):136-141, 151.
MA Ben,MAO Qingduo.The application of big data approach in emergency management[J].Chinese Public Administration ,2015(3):136-141,151.
[23]閃淳昌,薛瀾.應急管理概論-理論與實踐[M].北京:高等教育出版社,2012.
[24]程學旗,靳小龍,王元卓,等.大數據系統和分析技術綜述[J].軟件學報,2014,9(9):1889-1908.
CHENG Xueqi,JIN Xiaolong,WANG Yuanzhuo,et al. Survey on big data system and analytic technology[J]. Journal of Software, 2014,9(9):1889-1908.
[25]童星,張海波.中國應急管理理論、實踐、政策[M].北京:社會科學文獻出版社,2012.
[26]劉鐵民. 應急預案重大突發事件情景構建——基于“情景-任務-能力”應急預案編制技術研究之一[J]. 中國安全生產科學技術, 2012, 8(4):5-12.
LIU Tiemin.Studies on scenes'construction of emergency planning——partⅠof emergency planning technology based on "scene-task-ability" [J].Journal of Safety Science and Technology,2012,8(4):5-12.