黃世榮
摘要:隨著信息技術的廣泛使用,各行業在近幾年所積累的數據成倍增長,對數據的分析與使用已經成為了專門的學科領域。隨著大數據生成速度的不斷加快,數據量也不斷膨脹,給數據安全帶來更大風險。本文從大數據的定義出發,探討大數據應用的本質特征并對大數據的風險進行簡要的探究。
關鍵詞:大數據;應用模式;安全風險
中圖分類號: TP309 文獻標識碼:A 文章編號:1672-3791(2017)01(a)-0000-00
一、大數據的定義及應用特征
隨著數據數量的不斷增長,大數據的重要性日益得到了廣泛的認同。但是,目前對大數據的概念還有不同理解,人們似乎還認為大數據是個抽象的概念,從大數據的本質出發,更深刻的理解大數據在社會經濟等各方面的內涵,對于探討大數據的應用模式和安全風險控制具有重要意義。
1.大數據的基本定義
2011年,全球麥肯錫咨詢公司將大數據的根據形象的描述為下一個時代創新與生產力的最前沿。生動的指出了大數據是基于創新思想,超出了傳統數據庫范疇的,用來收集、存儲、管理和分析數據信息的方式。首先,大數據的數量是隨著時間的增長而不斷增長的。其次,不同層級的機構擁有和需要的數據集是不同的,當前通用的大數據計算單位是TB。第三,大數據從數量、速度和各類三個維度對大數據進行描述,從而也從這三個維度對大數據進行控制。因此,數據不斷龐大,擁有時效性和數據存在形式的多樣性,使大數據理論顛覆了傳統的數據庫理論,使信息技術站在了時代的最前沿。雖然學界對大數據的定義莫衷一是,數據的生成、采集、存儲、處理(分析)是大數據的基本要素。
2.大數據的主要應用特征
大數據的主要應用特征有以下幾方面:首先,大數據的數據量巨大,數據增長量通常以幾何級數的形式來進行計算。其次,數據類型繁多、原始類數據、多元型數據、函數數據等種類多樣。第三,數據處理速度不斷加快,隨著計算機技術的快速發展,數據運算和處理的能力越來越強,在數據分析中會為用戶提供大量有價值信息。通過對大數據的研究可以發現,大數據可以用來進行趨勢推測,可以對個體數據進行剔除,可以用來對社會現象進行預測,也可以用來進行個性化的預測。大數據的應用范圍廣泛,數據處理能力越來越強,可以更長的時間和更廣的范圍為用戶提供依據。通過對大數據的分析,還能對真相進行有效辨識。
二、大數據的應用模式
大數據的應用模式建立在大數據的分析方式基礎之上,布隆過濾器、散列法、索引等方法都可以根據數據的規模,對數據進行有效的分析,從而為應用提供良好的基礎。大數據的應用有自身從不成熟到成熟的演變過程,最后廣泛的應用于社會經濟的各個領域,從而為廣大用戶熟知和使用。
1.大數據的應用演化
大數據最初的應用是海量數據進行檢索的互聯網搜索平臺,在互聯網搜索平臺的助推下,大數據逐漸演出多種應用模式。首先,在商業系統,最初是將企業的數據收集存儲到關系型數據庫系統中,以便于查詢和聯機處理。隨著互聯網用戶的增多,點擊商業網站用戶的信息日益增加,數據日志、用戶行為可在網站上獲取,從而為企業分析用戶提供了基本數據。其次,互聯網最初只用來傳遞電子郵件,在線社交的頻繁,視頻、圖片、音頻等不同結構類型的數據增加,使非結構化數據技術不斷成熟。第三,科學研究領域為了收集大量數據,研究了數據分析、共享的平臺,使大數據廣泛應用成為可能。歷經上述演化過程,根據數據的產生方式和結構特點,大數據主要應用在結構化數據、文本、WEB、多媒體、移動數據這6個領域里,并形成了相應的數據應用模式
2.大數據的主要應用模式
在科學的數據分析的基礎之上,大數據的應用主要有以下幾種模式:首先,租售數據的模式。通過廣泛的收集數據,采用相關的數據分析技術,過濾到無關聯的數據,保留時效性較強的數據,定期為各行業提供數據服務的模式。有效而且龐大的數據庫是其它這種數據應用模式的基礎。其次,租售信息的模式。這種模式集中于某一行業或領域,廣泛收集行業有關數據,再龐大數據處理能力的支持下,對數據進行有效整合,從而采集到對行業發展有價值的信息,向行業內企業出售信息來獲取回報的應用模式。第三,數字媒體的模式,主要利用新型網絡媒體,充分發揮新媒體傳遞信息速度快,可以實時進行傳遞、可進行有效互動的優勢,對準特定的客戶群體,提供精準的快捷信息服務,同時能獲得有效的反饋信息。第四,空間運營模式。主要是為了搶占更多的數據資源,從而獲得數據資源的獨享性。第五,云計算服務。主要針對用戶的個性化需求,提供依托互聯網的動態虛擬化的信息資源,企業不再需要購買大量的設備設施,只需要向服務商交納相應用的使用費用即可。
三、大數據的安全風險控制
大數據的出現開戶了新的時代,使數據的價值變得日漸重要,也為數據的安全帶來的廣泛的擔憂。由于數據的規模更大、數據的各類更多,數據的結構也更加復雜,使維護數據安全的成本也隨之不斷提高,如何保證數據的安全轉移,如何控制數據不出現冗余的問題,都是數量安全需要研究的問題:
1.保持大數據的隱私
數據信息量的海量增加,數據處理的不斷開放,數據獲取渠道的增多,給數據隱私帶來了極大的挑戰,面對大數據時代的互聯網,數據隱私主要考慮兩方面的問題:首先,如何保護個人的隱私。數據信息采集技術越強,數據分析能力進步的越快,用戶就會在毫無察覺的情況下,將個人的興趣、愛好、特征等信息被潛在的獲取,用戶甚至對已經被大數據分析出來的信息毫無察覺。其次,大數據獲得的信息未經用戶的許可,就將信息隨意的傳輸和使用,在傳輸使用的過程中很可能存在著泄露的風險,如何保證大數據時代個人信息與隱私的安全,是大數據安全風險研究的首要命題。
2.保證大數據的質量
大數據的價值不僅源于龐大的數據量和快捷的速度,而且更來源于數據的質量。低質量的數據不僅浪費了互聯網資源,而且還無法被有效利用,甚至阻礙了大數據的發展。數據的質量與數據的生成、數據的采集、數據的傳統和存儲都有關系。數據的質量突出的表現為數據的精準性、完整性、冗余度和一致性,雖然學界致力于消除數據的冗余問題,加強數據的質量,還應當充分的考慮數據的自我修復和自我檢測的功能研發。
3.有效的安全機制
大數據種類的不斷豐富,給數據的安全帶來更大的風險,以往小規模加密的方法,不可能有效的在大數據時代應用。研究更高級別的密碼學方法,應當針對不同的數據結構和非結構數據,采用不同的數據加密方法,從而更好的促進數據安全。同時,在當前大數據使用越來越廣泛今天,需要加強研發對數據的隔離措施,要建立對數據的可追溯機制,要使數據的可用性、可控性和完整性在高效的前提下都得到較好的保持。
4.大數據在安全領域的應用
保證大數據的安全,是信息技術研究的課題。同樣大數據也改革了信息技術,從而為信息安全技術發展帶來了革命,使信息安全技術走向了新的舞臺。例如,通過對入侵日志的分析,就可以發現潛在的安全漏洞,從而可以應對更高級別的安全威脅。通過對計算機病毒和漏洞的分析,就可以掌握某類型病毒或漏洞的特征,從而對更有效的應對這類威脅采用更好的方法。
結語:對于大數據應用模式的研究,應當從社會發展的實際需要做起,要根據實際情況,有效的整合云計算為代表的數據處理技術和存儲技術的研究,開發出更先進的應用模式,使大數據的深化歷程加快發展。通過對大數據風險的控制,可以更好的促進數據廣泛的應用于社會經濟各個領域。
參考文獻:
[1]黃偉.基于SDS架構的多級DDoS防護機制[J].計算機工程與應用,2014,(05):26-27.
[2]馮永強,張良,馮怡,朱尚杰. 大數據應用的現狀與展望[J].信息化建設. 2015(12):118.