吳文臣,郭偉偉
(1.廣州應用科技學院,廣東 廣州 510000;2.齊齊哈爾工程學院,黑龍江 齊齊哈爾 161000)
云計算和互聯網技術的飛速發展正在全面改變人們的生活和生產方式。最近幾年以來,由于各類社交媒體發展速度的逐漸加快,在不同領域產生了海量的數據信息,通過積極運用大數據技術可以為后期的經濟社會價值研究提供重要的理論支撐。同時,在大數據發展背景之下,大數據的收集和存儲,包括后續的共享與使用等過程均面臨較多的安全挑戰,一旦出現數據泄露現象,就會給各大企業的隱私信息帶來嚴重影響。為了規避此類問題的發生,本文主要探討基于全生命周期管理的大數據安全技術要點,核心內容如下。
隨著大數據時代的到來,社交網絡與健康醫療等行業迅猛發展,大數據所蘊含的社會價值已經獲得各大產業界與學術界的廣泛認同。但是,因為大數據安全問題的出現對現有的產業資源開放與共享帶來較大影響,所以導致部分大數據的重要價值無法得到充分挖掘,影響大數據資源的利用效果[1]。從科學角度來分析,在全生命周期管理層面,針對大數據的采集、儲存、傳輸、共享以及刪除等方面進行研究,可以幫助相關人員更好地了解此項技術未來的發展趨勢。未來,大數據安全技術將會面臨更多的挑戰,通過建立出更加完善的安全防護體系,能夠實現大數據的有效存儲與傳輸,真正達到數據資源的良好共享。
此外,通過對大數據安全技術實施全生命周期的管理能夠確保數據安全和共享更為均衡,在保證數據安全共享的同時更好地保障個人隱私,包括一些個人的隱私信息。與此同時,針對大數據信息安全標準體系進行有效的完善,能夠確保大數據安全保障工程順利實施[2]。
大數據信息的源頭比較多,數據具有多樣性特點,同時數據的增長速度非常快,所以大數據的有效采集需要引起相關人員的廣泛關注。結合當前時期大數據采集特點能夠得知,其所面對的安全威脅主要是數據被隨意的改造。例如,電商交易過程中經常會出現較多虛假的評論,在互聯網技術的支持下通過偽造一系列數據給用戶的數據分析帶來較大影響,也會影響廣大用戶的判斷力。針對已經采集的各項大數據信息進行準確評估,去除虛偽信息,保存真實信息,能夠確保各項數據來源更加安全可靠[3]。
通過加強對大數據信息進行真實性分析,并加強數據清理與預處理,能夠實現各項數據的有效融合。因為大數據具有海量特征,通過合理應用大數據分析技術,建立相應的數據分析模型,能夠幫助相關人員在短時間內獲取更加精確的數據信息。相關人員在具體工作中不僅要全面考慮到大數據來源是否真實,還要根據數據的具體傳播途徑,包括數據的實際處理情況,從多個角度來分析大數據安全問題,此問題也是未來研究的熱點話題。
目前,大數據通常以分布式存儲方式儲存在大數據平臺中,通過運用云存儲技術,采用多個副本和多個節點的存儲方式將各類數據進行有效存儲,可以實現數據的大量存儲,但是此種存儲方式也存在一定弊端,非法入侵與數據泄露風險明顯增加,故如何提升大數據存儲的安全性也需要引起相關人員的重視[4]。從全生命周期管理角度來分析,要想實現大數據的安全存儲目標,相關人員可從以下幾方面著手,具體見表1。

表1 大數據安全儲存的主要途徑
根據當前大數據分析和計算需求可以得知,在云計算平臺的大力支撐下,將大數據有效遷移至云環境中可以實現數據的快速存儲和分析,提高數據計算結果的準確性。但是在此環節大數據信息的安全控制效果比較差,使得數據安全邊界周圍的數據,缺乏良好的安全控制,如一些重要的信息安全性下降會增加數據安全的防護難度[5]。通過將不同信息系統內部的各類信息有效遷移至云平臺中,能夠保證大數據在傳輸期間更加完整。通常來講,大數據安全傳輸重點體現在以下兩個方面。
2.3.1 對數據進行加密處理
通過合理運用數據加密算法,可以保證大數據的安全性更高,但是若單純采用常規的數據加密算法,密鑰管理流程過于復雜化,計算開銷也比較大,存在諸多缺陷和不足,不能有效體現出數據的各項價值。而新型的加密機制在實際應用期間也面臨較多的安全問題,如何提升大數據的安全性仍需要相關人員進行深入研究與分析[6]。通過應用屬性加密機制,結合用戶的實際屬性及數據的真實數據,進行有效關聯,能夠幫助用戶在短時間內快速獲取相關數據,進而顯著提高各項數據的安全性與保密性。
2.3.2 保持大數據完整性
大量用戶通常采用云計算平臺,針對海量的數據信息實施綜合存儲與管理,但在此過程中用戶也會失去一定的控制權,不能夠保證云端數據更加完整。對于共享數據的完整性進行有效驗證,并及時更新原有的各項數據,可以顯著減少數據安全問題的發生。通過采取有效的管控方案,能夠確保大數據信息更加完整,大數據可以實現實時更新,具有動態管理特點。在云計算環境下,混合云融合技術的出現,將公有云與私有云的各項優勢有效結合,被廣泛運用。如何提升混合云當中大數據信息的機密性與完整性,需要引起相關人員的高度重視[7]。
2.4.1 安全訪問
安全訪問作為實現大數據安全共享的核心手段,通過應用大數據技術和大數據分析技術,并在數據訪問體系中加強授權管理力度,實現精細化控制目標,提高數據信息的隱私保護效果。以大數據技術作為重要支撐,加強安全訪問控制,能夠對各項數據進行多元化分析,確保最終的判斷結果更加合理[8]。
通過將大數據技術應用到安全訪問中,并構建更加完善的數據安全訪問控制體系,特別是在云計算環境下優化大數據管理體系,打造更加穩定的大數據存儲平臺,可以幫助管理人員在短時間內快速找到數據泄漏的具體原因,采取良好控制對策。例如,在大數據信息應用的過程中,相關人員通過加強安全訪問控制力度,數據信息的安全性得到顯著提升。科學運用安全訪問控制技術前數據安全性為84.36%,數據完整性為87.32%,運用之后的數據安全性提升到97.24%,數據完整性提升到98.14%。
2.4.2 安全共享
政府信息體系與公共數據互聯共享以及各大行業之間數據的共享與整合,已經成為大數據技術發展的核心趨勢,能夠為大數據的流動提供重要支撐,也是大數據產業鏈的有效體現。但在大數據共享背景下,因為資源需要跨部門、跨越管理領域,所以在此過程中特別容易出現數據存儲不當問題,引發數據泄露現象[9]。
對于大數據安全共享的問題,相關人員結合數據安全管控特點,采用云存儲文件對原有的數據體系結構進行優化,加強自我保護,確保各項數據實現高效存儲,進一步提升各類文檔的私密性與安全性。在信息流安全控制層面,通過采用分散信息控制技術,針對原有的控制程序進行優化,可以確保程序內部與外部環境間的數據穩定流動,此種技術的合理運用能夠減少信息的泄漏,確保各項數據信息更加安全可靠。例如,在某跨領域大數據分析環節,通過積極運用分散信息控制技術,大數據信息資源的利用效率得到顯著提高,具體見圖1。

圖1 大數據利用效率對比
另外,在大數據共享層面,對于不同區域的地理空間數據信息,采用數字水印技術能夠實現各項數據的安全共享。對于政府部門大數據信息安全存儲問題,相關人員需要適當加強數據加密控制力度,進而實現數據的安全共享,提高數據安全管理效果。
2.4.3 隱私保護
自大數據管理全生命周期層面來分析可知,通過建立穩定的大數據隱私保護機制,進一步明確大數據隱私保護內涵,不僅能夠提升各類數據信息的安全性與可靠性,而且可以實現數據的快速溯源與隱私保護間的平衡[10]。
用戶自身對Web服務的依賴性逐漸增強,若儲存在云端或者云平臺的各項數據沒有徹底刪除,那么將特別容易出現違規恢復現象,進而使得用戶數據或者隱私信息被泄漏。在云計算環境下,針對大數據的安全刪除問題,相關人員可以采用密碼技術,用戶規定過期后,各項敏感數據會快速被刪除。
大數據信息資源具備特別高的商業價值和社會價值,涉及的領域也比較多,故相關人員需要結合不同領域的特點,制定出更加完善的安全保證體系,在提升大數據信息準確性的同時,避免出現較多的錯誤信息。同時,在建立大數據安全保證體系的過程中,工作人員要特別注意以下兩個問題。一是結合大數據特點,加強分析力度,具體內容為結合大數據信息的具體來源,經過認真分析之后,對既有的數據資源安全保證體系進行大力完善。二是構建安全標準化體系,根據大數據安全規范相關需求,構建更加完善的安全標準化體系,促進大數據產業的健康發展。
本文主要對基于全生命周期管理角度的大數據安全技術要點進行分析,可以確保大數據安全技術得到良好的運用,明顯減少數據泄露和數據丟失等現象的發生。