陸峰
(廣西瑞豪科技有限公司 廣西南寧 530022)
基于大數據時代下的計算機信息處理技術探析
陸峰
(廣西瑞豪科技有限公司 廣西南寧 530022)
在科學技術不斷進步的背景下,各種計算機的信處理技術不斷更新,并且互聯網技術也迅速發展,使得人類社會開始進入大數據的時代。在大數據時代下,計算機的信息數據處理技術逐漸受到重視。本文分析了大數據概念、特點與影響,并探討在大數據的時代下,計算機的信息數據處理技術,提出大數據下計算機的信息處理技術未來發展展望,以期為信息處理提供參考。
大數據時代;計算機;信息處理技術
隨著計算機的技術出現,使得傳統計算模式發生改變,給社會的科學技術發展與完善提供了一個新方向。近年來,計算機的技術逐漸廣泛應用在各行各業中,在人們的生活與工作中占據著重要位置。但是在發展過程中還面臨著諸多挑戰,大部分互聯網公司為獲得更多的盈利,對于計算機的數據存儲研究過于重視,而對大數據時代特點與發展趨勢沒有全面掌握,從而導致自身發展受到影響。因此,需要相關人員深入分析大數據時代背景下,可能存在的挑戰與機遇,從而針對自身情況研究計算機的信息處理技術,進而給互聯網用戶提供最優質服務。
1.1 大數據特點
大數據主要特點就是多樣化、數據量比較大、復查比較容易以及快速化等。其中,數據量比較大主要指大數據的時代計算機的信息數據處理量相對較大,并且呈現出與日俱增的情況,已經從原先TB的數量級轉變成ZB數量級,1ZB等于10242PB;快速化主要指新時代網絡的數據流中,大部分數據傳輸都比較高速與實時,在處理這類數據時需要持續、實時與快速,必要時還要對這類數據處理工具進行不斷更新;數據復查主要指計算機中海量數據信息的處理難度比較大,很多信息處理的技術還需要不斷完善;多樣化主要指在大數據的時代背景下,數據的類型非常復雜,通常包含圖片、文本、視頻以及音頻等,并且格式多種多樣,這就加大了計算機的信息處理難度[1]。
1.2 大數據時代對信息數據處理的影響
物聯網的技術與云計算的技術產生為大數據時代到來創造了必然條件,而大數據時代會對政府機關活動方式、計算機的用戶使用以及企事業單位的運營有著直接性影響。此外,在大數據的時代背景下,其核心與重要內容內容就是數據,并且在大數據的時代下,網民、企業與消費者間界限變得越發模糊,界限不夠明確,這在某種程度上嚴重影響了企業發展方向、運行、管理以及經營。
1.3 大數據下信息數據處理技術發展情況
大數據屬于計算機的技術發展的階段性產物,大數據時代則是IT行業第三次的技術性變革,在其開始誕生之時就對企業、國家管理以及人們日常生活、工作有著重要影響。近年來,隨著大數據的理念逐漸形成,網民與計算機的網絡消費界限越來越模糊,數據逐漸變成一種可以展現社會價值的重要資產,對于企業文化樹立、組織結構調整以及運營模式創新都有良好推動與導向的作用,這表明大數據的時代背景給人才培養、企業文化與組織建設提供了挑戰,同時也創造了機遇。當下大數據時代已經是時代發展典型的特征,其可以代表當今時代的信息技術發展態勢。而且在大數據時代背景下,可以看出現今是信息的大爆炸時代,同時也是競爭和機遇共存的時代[2]。
計算機的信息數據處理流程從圖1中可以看出,具體處理技術如下:
2.1 數據分析與可視化的技術
①數據分析的技術:數據的分析技術主要包含情感的分析、網絡的分析、空間的分析、各種時域序列的分析以及回歸分析等。網絡分析主要指在網絡的特征下所實施的分析技術之一;空間的分析主要是幾何統計的分析、集拓撲分析與地理編碼分析;而情感分析也就是自然語言的主觀分析。②可視化的技術。應用可視化的技術可以創建圖片、圖形以及圖表等,以便人們對數據結果進行正確分析與理解,同時應用可視化的技術可以幫助相關人員充分認識數據集。

圖1 計算機信息數據處理的流程圖
2.2 關聯規則的學習技術、分類與聚類分析的技術
分類的分析技術主要是在數據點歸納基礎上,給出新數據點,并在假設結構確定基礎上,合理預測客戶可能發生的行為;聚類的分析技術一般是在限制因素不明確情況下,將集合分成不同的對象組,然后對對象組進行分析與處理,這種技術分析比較詳細,因此在數據的挖掘方面應用比較廣泛。另外,在數據的挖掘中還會應用關聯規則的技術與機械學習的技術,其中,關聯規則的技術指在數據處理過程中,探索不同數據之間可能存在的關聯規則;機器的學習技術屬于人工智能中的關鍵性內容,主要目的就是對人們學習的行為進行模擬。近年來,計算機的網絡技術開始向著云計算的網絡方向進步與發展,換句話說,在今后計算機的信息處理不再只是依賴于計算機的硬件,其更重視網絡的連接,即在計算機的網絡技術基礎上,對信息的處理技術進行完善,從而提高大數據的處理效果。
2.3 網絡深層的空間技術與公布型的數據存儲技術
①分布型的數據存儲主要在可擴展分布式的文件系統技術(GFS)上所發展起來的新技術之一,這種技術在IBM與百度等公司都有著廣泛應用。通常情況下,分布型的存儲技術使用列存儲的概念,列存儲的概念則是把列當做基本的單位,從而對數據進行存儲,與行存儲比起來,列存儲的技術主要優勢是數據可以壓縮與循環速度比較快等。而較為常用的一種技術主要是行列的混合存儲,這種結構能夠快速加工與處理海量數據,充分應用磁盤的空間,縮短搜索的時間。②網絡深層的空間技術主要特點是信息的規模比較大、分布性比較特殊與訪問的途徑復雜等,這種技術可以集成處理海量數據,從而方便數據的整合。
2.4 遺傳算法和數據的高效索引
①遺傳的算法:這種計算方式是在生物書進化規律基礎上發展而來,屬于一種隨機的搜索方式,并且隨機該搜索方式可以自動調整搜索的方向,廣泛應用在信號處理、機器學習以及物流選址等方面。②數據高效的索引:目前關于數據高效的索引研究重點主要是聚簇索引與互補型的聚簇索引兩個部分,互補型的聚簇索引一般是將不同副本當做索引列,建立互補索引表;而聚簇索引則是與具體索引順序相結合,然后存儲數據。
2.5 在相關內容信息基礎上挖掘數據
在相關內容數據的基礎上挖掘數據的技術研究重點是:實體關聯的研究技術和網絡搜索技術。在網絡搜索技術研究中,排序學習的算法是最重要的部分,提出排序學習的算法是為了方便海量數據處理。究其原因,各種社會媒體中關鍵資料存在的形式都是短文本,這在某種程度上就推動了排序的學習算法產生,通過這種主逐對、逐列與逐點計算,可以提高社交媒體海量數據處理的效率。
計算機的互聯網主要是依托于相關計算機的硬件設施存在,在這某種程度上會造成計算機的信息數據處理技術發展存在一定局限性,致使計算機無法和計算機的應用軟件發展同步,進而與網絡發展需要不適應。因此,計算機的信息數據處理技術要想在今后獲得更好的發展,需要徹底擺脫計算機硬件設施的限制,漸漸與互聯網技術相接軌。①信息的處理技術漸漸朝著云計算的方向發展,因為云計算的技術屬于新興數據處理的技術,可以在處理數據時,徹底分離開存儲空間與硬件設施,也就是在不依賴計算機硬件設施基礎上,完整保留數據的信息。②計算機的信息數據處理技術傳輸方式需要轉變成開放式,建立開放式的傳輸通道,可以割開硬件設施和數據信息。③需要不斷完善與發展計算機的硬件技術,有機結合網絡與硬件設施,將計算機硬件設施限制性削弱,進而推動計算機的網絡技術發展與完善。
總而言之,在大數據時代背景下,雖然計算機信息數據處理技術獲得一定發展,但仍然存在很多缺陷與不足。因此,為了完善計算機信息數據處理技術,需要深入探索與研究各種先進信息數據處理的技術,確保計算機互聯網更好和為用戶服務,進而推動社會進步。
[1]黃俊俊.基于大數據背景下的計算機信息處理技術探析[J].大科技,2016,16(03):256.
[2]楊曜宇.計算機網絡技術在大數據時代的重要作用研究[J].中小企業管理與科技,2015,21(19):201.
TP274
A
1004-7344(2016)23-0256-02
2016-7-3
陸峰(1970-),男,漢族,廣西南寧人,助理工程師,本科,主要從事計算機信息系統集成、計算機網絡工程、機房工程、音視頻會議系統工程、小區及樓宇智能化工程的設計與建設工作。