◆龔 皓 干 彬 凌 儉
(四川傳媒學院 四川 611745)
“大數據”時代背景下的計算機信息處理技術安全分析
◆龔 皓 干 彬 凌 儉
(四川傳媒學院 四川 611745)
現代社會的快速發展離不開計算機技術與信息技術,經過這么多年的發展,計算機信息技術已經成為社會發展的主要動力之一。同時,計算機信息技術也使得大數據時代的到來變得理所應當,因此在本文中,本文對大數據的概念以及其自身特點進行研究與分析,將如今大數據技術在應用過程中所面臨的挑戰與機遇進行介紹。除此之外,對大數據技術所應用的關鍵技術進行介紹,為計算機信息技術的不斷完善提供幫助。
大數據時代;計算機信息處理;應用技術
隨著計算機信息技術的不斷發展,在人們在日常生產與管理的過程中對數據和信息的生成和處理也越發重視。計算機信息技術與數據化的快速發展,使數據搜索存儲以及交換技術的發展走向了快速發展時期。隨之而來的就是大數據時代,大數據時代的來臨屬于計算機信息技術發展的必然結果,因為其能夠為社會群體的日常生活與生產,提供更加豐富的信息資源和信息處理技術,在如今信息化的社會中,其所發揮的作用無可替代。
現如今所說的大數據就是指擁有數量巨大特點的信息數據,因為這一類信息數據數量巨大,所以在對其進行處理時,如今的主流計算機軟件不能夠在一定時間內對這些信息進行獲取、處理、存儲以及傳輸和管理等操作。這不僅僅是因為其數據量巨大,而且這些數據種類繁多,對這些數據進行處理時,有時候還會出現數據處理重復的情況。大數據主要體現在大,對于這個大的定義,目前在行業內還沒有一個統一標準,最籠統的標準就是數據量處于10TB-1PB以上,在這個范圍內的數據都可以歸類為大數據。
大數據的特點有很多,主要可以歸類為數量大、種類多、速度快。
首先,數量大就是指進行信息處理的大量數據,這些數據在依靠計算機技術進行處理時數據量變得越來越大,已經從TB發展到PB這一層次。其次,種類多則是指隨著現代社會的不斷發展,信息技術應用越來越廣泛,所以在進行信息處理時其來源變得多種多樣,人們對信息的需求也更加多元化,原始的結構化以及半結構化數據也開始向著多樣化方向發展,這就是所謂的種類多。最后,是速度快。因為大數據的數據量巨大,所以在進行處理時就需要處理速度足夠快,這樣才能夠使信息的傳播與擴散不會阻滯,進而滿足社會群眾對信息數據的需求。以上就是大數據的特點,大數據中所應用的主要技術就是以大數據的特點為基礎來實施。
大數據背景下的計算機信息處理技術有很多,主要包括以下幾種:
(1)DEEP WEB數據感知與獲取技術
DEEP WEB數據感知與獲取技術,就是在網絡中通過利用深層空間技術,進行信息的抽取分析以及集成。在網絡中進行這些操作的基礎,就是依靠信息數據的動態變化、數據分布式處理與訪問以及信息的規模技術。通過這一系列的操作,對網絡上的大量數據進行分析以及處理,最終實現對具有高質量特點信息數據的集成、抽取以及整合。
(2)數據分析技術
大數據背景下計算機信息處理所應用的數據分析技術,就是指在進行數據處理時依靠情感分析、網絡分析、空間分析以及數據時域序列分析和數據回歸分析等技術進行數據分析,數據分析技術在大數據處理工作中占據重要地位。在數據分析技術中,空間分析技術是將地理數據編碼、幾何以及網絡拓補技術進行有機融合,進而實現對數據的綜合分析。網絡分析技術則是在進行數據分析時,依靠網絡特征為基礎來進行。情感分析技術,則是利用以自然語言為基礎的編碼技術來進行數據分析。
(3)可視化技術
可視化技術,我們可以從字面來進行理解,就是指在進行數據的分析以及處理時,能夠將分析與處理結果以圖片動畫和圖表等形式進行展示。這樣的表現形式能夠使人們對數據的理解更加直觀,便于人們進行溝通和交流。這項技術對于工作量巨大的數據分析與處理人員來說具有很大幫助。
(4)分布式處理技術
分布式數據處理就是數據的分布式存儲和處理,如今主要依靠谷歌公司的GFS技術實現。這項技術在進行應用時,是將數據進行以列為單位的劃分,這樣能夠使數據的壓縮程度加快,而且對數據的循環利用效率也會大大提高。而且在進行數據的存儲時,利用行列混合式存儲結構是最好的選擇,能夠使數據的壓縮以及查詢時間都大大減少,并且還能夠是使磁盤空間調到最科學合理的利用。
(5)數據挖掘技術
以內容信息為基礎的數據挖掘技術,就是指在進行信息檢索時以網絡搜索技術以及信息實體關聯技術為依靠來進行數據信息的分析以及挖掘。這項技術現實中的應用就是熱點信息搜索的排序學習算法,通過對網絡上信息數據的關注特點以及媒體的信息量等特點,來實現有效信息數據的搜索。如今,應用最廣泛的學習算法包括逐點,逐對及逐列等。
(6)高效索引技術
數據高效索引技術是由谷歌公司所提出,現如今這項技術應用在聚簇索引以及互補式聚簇索引技術技術的研究工作中。互補式聚簇索引技術,是依靠多副本索引技術建立相互補充的數據索引表,這樣就能夠實現數據查詢時的優化。
(7)聚類及分類分析技術
聚類分析技術是指在數據點沒有進行明確標明的情況下,將數據統一集合,然后分成多個對象組,通過對對象組內的數據進行分析,進而達到對數據進行綜合查詢的目的。分類分析技術則是通過對明確數據點進行歸類及分析,經過分析之后形成新的數據點,在此基礎上進行針對性的假設以及客觀結構預測,進而達到對之后信息發展的預估。
(8)關聯規則及機器學習技術
關聯規則學習技術就是利用對比以及排序等方法將龐大以及復雜的數據之間所存在的潛在關聯規則找出,然后對復雜龐大的數據進行分析處理。這項技術就是就是對數據間所存在的復雜關聯規則進行尋找,然后再對數據進行反復的篩選,進而實現對龐大數據的處理。機器學習技術則是利用計算機來進行擬人化的學習,在學習過程中通過對已經存在的信息知識體系進行重新組織,進而達到對數據的處理及分析。這項技術主要應用在人工智能領域,在數據處理工作中的應用則主要體現在數據挖掘技術中,是核心技術。
(9)神經網絡及遺傳算法技術
大數據處理中所應用的遺傳算法技術,是以現如今生物界所表現出的進化發展規律和具有數據演化隨機化特點的數據搜索辦法為基礎,進而對龐大的數據信息進行搜索。遺傳算法技術中的尋優方法是概率化,也就利用概率化方法達到對數據信息搜索方向自動調整的目的。現如今遺傳算法技術的應用比較廣泛,在物流地址選擇,機器學習以及信號處理等領域得到了大范圍應用,發揮出顯著效果。神經網絡技術則是對生物運動神經的網絡行為進行模擬,然后將所模擬到的神經網絡運行方式大數據處理分析的運行方式,應用神經網絡技術進行大數據處理分析,還需要與分布式處理算法進行結合,這樣才能發揮出更好的處理效果【6】。
在計算機系統數據庫中構筑防火墻可以對訪問的信息進行過濾。設置防火墻是現在普遍應用的一種數據庫安全防護措施。保證計算機網路的訪問命令都要嚴格的經過防火墻的過濾和分析,才能進入計算機的目標數據庫。防火墻是計算機應用系統中保護數據庫安全的一個重要技術。且防火墻有兩種類型,分別是硬件防火墻和軟件防火墻。兩種防火墻的數據庫保護形式雖然不同,但原理是一樣的,都是通過對外部信息進行審核來實現對內部網絡環境的保護。防火墻是計算機數據庫保護技術中一項重要的保護措施,其外部有信息的過濾功能有效保護數據庫的安全。
大數據時代下的計算機信息數據處理將會面臨更多的挑戰與機遇,挑戰則是指在發展過程中,需要不斷對數據處理技術進行更新以及完善,機遇則是指計算機信息處理技術以大數據為依托,在未來的應用將會越來越廣泛,成為推動社會進步的重要力量。因此,對于大數據背景下的計算機信息處理技術,要做好完善以及優化工作,使其能夠發揮出更加重要的作用。
[1] 李春輝.“大數據”背景下的計算機信息處理技術分析[J].電子技術與軟件工程,2014.
[2] 呂敬全.“大數據”時代背景下計算機信息處理技術分析[J].信息與電腦:理論版,2013.