馮麗

摘要:大數據技術并不是指數據量很大,而是指數據源頭、數據格式和數據渠道的多樣性及相關匯總分析。簡稱為“三多一分析”。大數據分析和其他計算機分析技術的差別在于它所分析的不是單一源頭、單一渠道、單一格式數據,而是多樣性數據,大數據安全是傳統數據安全特性的和新安全特定的結合。針對新安全特性,采用發布干擾消息、風險預警和防范、大數據反分析等技術進行安全建設。
關鍵詞:大數據技術;數據源;數據格式;數據渠道;多樣化;數據分析;大數據安全
中圖分類號: TP399? ? ? ? 文獻標識碼:A
文章編號:1009-3044(2019)25-0013-02
1 大數據技術的特征
大數據技術是近些年來比較熱門的話題,很多機構和人員都在研究。但是,相當一部分人員對大數據技術的認識并不清晰。僅僅從字面將它理解為信息量很大的數據,這是典型的以偏概全。信息量很大的數據被稱為海量數據。海量數據與大數據技術并不是一回事,根據筆者的分析和認識,大數據技術有如下幾個顯著特點:
數據格式多樣:結構化數據、非結構化數據;文字、圖片、影像、聲音等等各種各樣格式的數據,均可以被統稱為大數據技術的數據格式。
數據來源多樣:電腦、手機、傳感器均可以作為大數據技術的數據源。
通信方式多樣:網站、郵件、手機短信、即時聊天工具、影音播放器都可以作為大數據技術的通信方式。
著重數據分析:通過多個源頭、多種渠道收集到的多種格式數據,要根據某一個計算模型,進行計算分析,并得到某一個有價值的結論。
用一句話概括:大數據技術就是“三多一分析”。
以一個真實案例來說明大數據的特性。根據釘釘軟件的考勤統計報告,某男性A近期出現很多缺勤記錄。通過手機監視程序發現,該A男性近期經常光臨淘寶、京東等電商平臺,查看嬰兒床、嬰兒紙尿褲等用品;同時,該男性所在城市的婦幼保健醫院攝像頭顯示,A男性有若干次出入醫院的記錄。由此我們可以分析出,A男性的老婆、姐妹或者其他女性親屬是孕婦,并且將要臨產。如果保險公司得到該結論,并獲得該男性聯系方式,可以向該男性推薦生育保險。當然,我們的分析是人工完成的,在真實的應用環境當中,數據分析主要通過程序或者人機結合的方式獲得,這就是大數據技術的典型應用。
根據這個案例,我們可以知道,大數據技術的涵蓋面非常廣,它可能是涵蓋面最廣的計算機技術,所有電子數據內容、數據源和通信方式,都是大數據技術的輸入。此外,大數據技術的彈性非常大,少到分析一個人的一條短信和一段視頻,多到分析一個國家全年的醫療影像和用藥記錄,雖說規模差別巨大,但都從屬于大數據技術。大數據技術這個名稱,本身沒有明確指出大數據技術的本質特點,所以才會被簡單理解為海量數據。
2 大數據分析技術與其他數據分析技術的區別
數據加分析,是很多計算機技術的特性,比如模式識別技術、自然語言處理技術、人工智能技術,那么大數據技術與這些技術的區別是什么?
大數據技術最突出的特征,是數據的源頭、格式和渠道的多樣性。大數據技術的數據分析與其他計算機技術的數據分析差別不大,甚至還要弱一些,即使數據分析有差別,也是因為原始數據的源頭、渠道和格式的多樣化造成的。
3 大數據典型應用
由于數據源頭、格式和渠道的多樣性,大數據涵蓋面廣。凡是涉及數據的地方,都能應用大數據技術。典型應用就是預測技術:用戶行為預測、市場物價預測、人體健康預測、疾病疫情預測、交通行為預測、災害災難預測。
4 大數據安全
大數據安全是個籠統的概念,可以有如下三種解釋:一、利用大數據技術保護傳統信息系統安全。二、如何保護大數據技術本身的安全。三、如何防止基于大數據技術的破壞活動。
第一個解釋,屬于大數據技術的一個應用,應用對象是傳統信息系統安全。從多個角度、多種技術收集數據,并針對安全問題進行分析,得到有價值的結論。問題的關鍵是數據源、數據渠道和分析模型,通過充足的數據源和數據渠道,迅速收集到有價值的數據,并根據模型分析出有效的安全結論。
第二解釋,屬于大數據技術自身的安全,針對的目標是大數據本身。問題的關鍵是大數據基礎設施如服務器、網絡設備、是否具備有效的安全防護措施,數據源、數據渠道是否被屏蔽、數據內容是否真實。分析模型是否有效。分析結論是否被竊取或者篡改。
第三種解釋,指如何防范基于大數據技術的入侵行為。針對目標是基于大數據技術的入侵行為。
三種解釋當中,第二、第三種會帶來安全問題,第二種屬于傳統安全問題,第三種屬于新安全問題。因為犯罪分子利用大數據技術這一新技術進行破壞,傳統的安全防護措施,不能有效抵擋這種新型進攻,要專門制定新的模型和安全措施。為了陳述方便,將第三種解釋重命名為基于大數據技術的入侵行為。
為了防范基于大數據技術的入侵行為。要根據大數據技術“三多一分析”的特點,制定防范措施。防護措施分為數據源防護、數據渠道防護、數據內容防護,數據分析阻斷四個角度。其中數據源防護、數據渠道防護、數據內容防護未脫離傳統信息安全領域,可以采用傳統的身份鑒別、訪問控制、安全審計、通信加密等技術。數據分析不在我方進行,而是在不法販子方進行,較難阻斷,我方可以采用發送干擾數據的方法,干擾不法分子的數據分析結論。
大數據技術本身可以作為防護手段,防范基于大數據技術的入侵行為。大數據技術的一個重要應用就是預測技術,我方采用大數據技術構造風險預警平臺,提前預知可能發生的基于大數據技術的入侵行為。
同時,可以對不法分子的攻擊行為大數據分析,即反向大數據分析。通過多源頭、多渠道采集不同格式的犯罪分子數據,并做關聯分析,為捕獲不法分子創造可能。
5 總結
科學技術是把雙刃劍,大數據技術也不例外,它既可以為我們創造價值,也可以被不法分子利用并進行破壞,我們要慎重合理對待大數據技術,不可以過于樂觀,也不可以盲目悲觀。要以平和端正的態度,從客觀事實出發,一分為二地看待問題,充分利用大數據技術的優勢,積極抵御大數據技術帶來的危害,為人類造福。
【通聯編輯:唐一東】