袁春蕓
?
大數(shù)據(jù)時代的計算機信息處理技術分析
袁春蕓
中國聯(lián)合網(wǎng)絡通信有限公司唐山市分公司,河北 唐山 063000
隨著網(wǎng)絡的普及,計算機用戶的數(shù)量呈現(xiàn)出爆炸式的增長,每天因此而產生的數(shù)據(jù)總量,已達到了十分驚人的地步,然而新形勢下計算機的處理技術能力的要求也是在不斷變化發(fā)展著,計算機技術也在不斷跟進,兩者是相輔相成的?,F(xiàn)在,必須利用新的思路、新的技術來應對日益增長的數(shù)據(jù)處理要求。基于此,對大數(shù)據(jù)時代的計算機信息處理技術進進行了分析。
大數(shù)據(jù)時代;計算機;信息處理技術
在現(xiàn)代社會發(fā)展的過程中,各種數(shù)據(jù)不斷產生,數(shù)據(jù)的容量及本身的結構也發(fā)生了巨大的變化,然而這些數(shù)據(jù)對計算機信息處理技術提出了新的要求,這些要求的提出使現(xiàn)有的計算機信息處理技術面臨了巨大的挑戰(zhàn),同時也迎來了新的發(fā)展機遇,本文就將對大數(shù)據(jù)時代背景下的計算機信息處理技術進行簡單的闡述,供參考。
(1)大數(shù)據(jù)的概念。所謂的“大數(shù)據(jù)”,就是信息的數(shù)據(jù)量巨大,由于需要處理的數(shù)據(jù)十分龐大,目前的計算機主流軟件在短時間內無法實現(xiàn)對其進行獲取、處理、存儲、傳輸、管理等方面的功能,它不僅包括數(shù)據(jù)量大,同時還包括數(shù)據(jù)比較難以處理、復雜多樣,同時在處理的過程中,還會出現(xiàn)數(shù)據(jù)處理的重復性,對于大數(shù)據(jù)的數(shù)據(jù)量大到什么程度,目前還沒有一個統(tǒng)一的標準,一般認為數(shù)據(jù)量在10 TB~1 PB(1 TB=1024 GB,1 PB=1024 TB)以上的數(shù)據(jù)為大數(shù)據(jù)。
(2)大數(shù)據(jù)的特點。一是數(shù)量大。大數(shù)據(jù)的產生是基于大量數(shù)據(jù)信息處理而產生的,需要運用計算機技術處理數(shù)據(jù)的量越來越大,從TB及已經(jīng)發(fā)展到PB技術的數(shù)據(jù)處理;二是種類多。隨著信息技術在生活應用中普及,人們對信息的需求也越來越多樣化,信息數(shù)據(jù)的來源也變得多樣化,結構化和半結構化的原始數(shù)據(jù)也出現(xiàn)了多樣化,使得大數(shù)據(jù)呈現(xiàn)出多樣化的發(fā)展趨勢;三是速度快。海量的數(shù)據(jù),就需要高速度的對數(shù)據(jù)進行處理,這樣才能滿足使用者對信息數(shù)據(jù)的需求,如果大數(shù)據(jù)的處理出現(xiàn)滯后,將不利于信息的傳播與擴散。
(1)分布式存儲技術。分布式存儲技術是當前專門應對大數(shù)據(jù)存儲的問題而發(fā)展起來的,由于大數(shù)據(jù)的海量數(shù)據(jù)使得傳統(tǒng)模式的單個數(shù)據(jù)庫很難存儲,同時應對管理以及備份等工作,分布式存儲技術打破了傳統(tǒng)的思維,利用網(wǎng)絡專線或者高速網(wǎng)絡將多個數(shù)據(jù)庫存儲服務器搭建在一起,形成一個總分形式的分布式存儲系統(tǒng),而上層的總與下層的分的特殊結構之間則是通過數(shù)據(jù)之間的邏輯關系串聯(lián)起來,在結構上看,分布式系統(tǒng)中同一個數(shù)據(jù)鏈中大數(shù)據(jù)可能隨機分配到不同的數(shù)據(jù)庫服務器中進行存儲,而由于數(shù)據(jù)庫存儲服務器彼此之間特殊的數(shù)據(jù)邏輯關系,看似分離的數(shù)據(jù)卻又在邏輯上得到統(tǒng)一,分布式存儲技術,不僅解決了海量數(shù)據(jù)的存儲問題,而且多個服務器的共同服務還提升了大數(shù)據(jù)的高通并發(fā)性,解決了數(shù)據(jù)串行處理反應時間長的問題,大大提升數(shù)據(jù)處理性能,目前,分布式處理技術在百度、IBM得到了廣泛的應用。
(2)數(shù)據(jù)挖掘技術。數(shù)據(jù)挖掘技術是主要應對大數(shù)據(jù)數(shù)據(jù)處理的而興起的、體現(xiàn)人工智能處理的計算機處理技術。數(shù)據(jù)挖掘技術多采用仿生學的手段,按照人類思維的方式,將海量的大數(shù)據(jù)進行處理,最終從海量數(shù)據(jù)中過濾出對企業(yè)生產或決策有用的信息,進而指導人們的行為。數(shù)據(jù)挖掘的主要流程包括數(shù)據(jù)選取、數(shù)據(jù)預處理、數(shù)據(jù)挖掘、數(shù)據(jù)分析與評估。首先對大數(shù)據(jù)的有效部分進行選取,然后采用數(shù)據(jù)預處理的技術對數(shù)據(jù)中的無效數(shù)據(jù)、冗余數(shù)據(jù)、零數(shù)據(jù)等進行清洗和刪除,然后采用數(shù)據(jù)挖掘的技術方法對有效數(shù)據(jù)進行挖掘,最后將有用的數(shù)據(jù),通過專門的應用系統(tǒng)進行分析與展示。其中,數(shù)據(jù)挖掘技術是采用人工智能的思維方式而設計的數(shù)據(jù)處理技術,主要包括決策樹、聚類、神經(jīng)網(wǎng)絡等多種數(shù)據(jù)處理技術,通過數(shù)據(jù)挖掘的處理,最終對清洗后的數(shù)據(jù)進行有效地分類,最后通過專門的應用系統(tǒng)對分類的數(shù)據(jù)進行分析、處理、展示,從而使用形象直觀的方式展示有價值的數(shù)據(jù)信息。
(3)信息安全技術。在大數(shù)據(jù)背景下,各種數(shù)據(jù)信息已經(jīng)脫離了原來獨立的形式而形成了相互關聯(lián)的數(shù)據(jù)結構,但是受限于這種關聯(lián)結構,其中的某個數(shù)據(jù)出現(xiàn)問題時,其他數(shù)據(jù)也會隨之受到影響,對信息的安全管理也不在是建立在單個數(shù)據(jù)或者是單個數(shù)據(jù)的基礎之上,而是需要同時對整個信息系統(tǒng)進行管理,為了保證大數(shù)據(jù)信息的安全,就需要不斷發(fā)展信息安全技術。首先,需要加強當前信息安全體系的建設,在加強安全體系建設的同時,還需要對技術管理人員進行新技術的培訓,提高技術人員對新管理體系的適應能力和管理能力,確保新的安全體系的作用能夠充分發(fā)揮,為大數(shù)據(jù)信息的安全提供保障;其次,需要加快大數(shù)據(jù)安全相關的技術研究工作,隨著大數(shù)據(jù)時代數(shù)據(jù)結構及總體容量的變化,當前的信息安全技術難以對大數(shù)據(jù)進行全面的安全監(jiān)測,應該全面加強新的信息安全技術的開發(fā),通過技術的更新實現(xiàn)對大數(shù)據(jù)信息的全面監(jiān)測,全方位保障數(shù)據(jù)的安全;最后,在新的安全技術出現(xiàn)之前,大數(shù)據(jù)的存儲管理容易造成數(shù)據(jù)的泄露,同時,由于當前監(jiān)測方式無法對數(shù)據(jù)進行全面監(jiān)測,還容易導致數(shù)據(jù)存在一定的安全隱患,因此,在當前技術條件下,可以將重點數(shù)據(jù)信息作為監(jiān)測的首要對象,通過確保重要信息的安全來保障整體信息的安全性,在當前技術條件下,這是行之有效的辦法。
綜上所述,相信在不久的未來,計算機信息處理技術會發(fā)展會推動現(xiàn)代社會的不斷進步和發(fā)展。本文主要對大數(shù)據(jù)處理中運用的關鍵技術進行了分析,希望能夠為相關研究領域的人們提供參考。
[1]劉銀龍.“大數(shù)據(jù)”背景下的計算機信息處理技術分析[J].電子技術與軟件工程,2015(1):206.
[2]呂敬全.“大數(shù)據(jù)”時代背景下計算機信息處理技術分析[J].信息與電腦,2013(6):126-127.
The computer information processing technology of the era of large data analysis.
YuanChunyun
China United Network Communications Co.,Ltd.,Tangshan branch,Hebei Tangshan 063000
With the popularity of the network,the number of computer users showing explosive growth,the amount of data generated every day so,has reached alarming proportions,but the processing ability under the new situation of the computer is in constant change and development,computer technology is also constantly follow up,the two are complementary and now,we have to deal with the processing requirements of the growing use of new ideas,new technical data,the computer information processing technology in the era of big data is analyzed.
Big data era;The computer;Information processing technology
TP274
A
1009-6434(2016)11-0140-02