◆龍娟
“大數(shù)據(jù)”下計(jì)算機(jī)信息處理技術(shù)探索
◆龍娟
(貴州交通職業(yè)技術(shù)學(xué)院 貴州 551400)
在社會經(jīng)濟(jì)發(fā)展的推動下,信息技術(shù)不斷優(yōu)化和更新,大數(shù)據(jù)時(shí)代已經(jīng)到來。互聯(lián)網(wǎng)的飛速發(fā)展加快了信息傳播的速度,信息的迅猛發(fā)展為計(jì)算機(jī)信息帶來了新的挑戰(zhàn)。通過在計(jì)算機(jī)信息特性的背景下相應(yīng)關(guān)鍵技術(shù)的研究,實(shí)現(xiàn)了大容量存儲和在各種平臺上高效交換各種類型數(shù)據(jù)信息,打破時(shí)間和空間限制,突破并完善應(yīng)用程序,使在中國主要產(chǎn)業(yè)的發(fā)展和競爭中的計(jì)算機(jī)信息處理技術(shù)持續(xù)發(fā)展。
大數(shù)據(jù);計(jì)算機(jī)信息;處理技術(shù)
隨著大數(shù)據(jù)的到來,計(jì)算機(jī)信息技術(shù)取得了突破性的創(chuàng)新,遍及各個(gè)領(lǐng)域,并為行業(yè)轉(zhuǎn)型和發(fā)展提供了技術(shù)支持。面對大量的數(shù)據(jù)和信息,除了提供更快的信息處理速度之外,還對信息本身的安全性和信息資源的使用提出了更高的要求。在大數(shù)據(jù)中探索計(jì)算機(jī)信息處理技術(shù)的應(yīng)用和創(chuàng)新已成為當(dāng)今研究的熱點(diǎn)。本文簡要說明計(jì)算機(jī)信息處理的過程,包括信息處理與加工,信息采集,信息存儲,信息數(shù)據(jù)安全技術(shù)等,并展望計(jì)算機(jī)信息處理技術(shù)的創(chuàng)新方向和發(fā)展前景。
大數(shù)據(jù)離我們并不遙遠(yuǎn),簡單來說,它實(shí)際上是數(shù)字存儲,是日常生活和社會發(fā)展中的各種內(nèi)容信息。大數(shù)據(jù)時(shí)代的主要特征是信息處理,并根據(jù)需要進(jìn)行和分析提取。與原有的信息處理模式比,大數(shù)據(jù)信息處理速度是快速而有效的。大數(shù)據(jù)的到來,極大地刺激了中國經(jīng)濟(jì)和社會以及計(jì)算機(jī)信息處理技術(shù)的發(fā)展方向,它改變著我們的生活和生產(chǎn),為我們帶來了更大的便捷。其特點(diǎn)表現(xiàn)在三個(gè)方面。第一,大數(shù)據(jù)覆蓋于人們?nèi)粘I畹姆椒矫婷妫粘I畹亩鄻有砸蟠髷?shù)據(jù)信息的復(fù)雜性,“雜”是大數(shù)據(jù)的特點(diǎn),要應(yīng)對一個(gè)全面的變革,掌握構(gòu)成生活各個(gè)方面的信息類型的復(fù)雜性,須要求提升數(shù)據(jù)信息采集技術(shù)水平。第二,大數(shù)據(jù)信息量來源廣,這勢必導(dǎo)致數(shù)據(jù)多信息量大,“大”是大數(shù)據(jù)的特點(diǎn),要確保大數(shù)據(jù)時(shí)代信息處理的順暢,須保證足夠的信息存儲容量;第三,便捷是我們對現(xiàn)今社會的追求與服務(wù)的目標(biāo),信息化數(shù)據(jù)的處理不僅僅限于數(shù)據(jù)收集、存儲,對其速度也提出了更高標(biāo)準(zhǔn)的要求,“快”也是大數(shù)據(jù)的特點(diǎn),信息處理是大數(shù)據(jù)的最高優(yōu)先級,存儲的量并不能為信息處理帶來幫助,運(yùn)行的便捷性才是尋找方便的操作方式。
當(dāng)前大數(shù)據(jù)時(shí)代下,對計(jì)算機(jī)信息處理技術(shù)要求更高。不斷提升信息處理技術(shù),才能應(yīng)對大規(guī)模的數(shù)據(jù)。但計(jì)算機(jī)信息處理技術(shù)的前進(jìn)并非在短時(shí)間內(nèi)就能得到提升,需要一定時(shí)日才能完成。在現(xiàn)階段,需要繼續(xù)探索和研究最終促進(jìn)計(jì)算機(jī)信息可持續(xù)發(fā)展的方法,大數(shù)據(jù)時(shí)代的計(jì)算機(jī)信息處理技術(shù)主要可以從以下幾個(gè)方面來理解。
大數(shù)據(jù)時(shí)代,從人們的生活需求到社會生產(chǎn),數(shù)據(jù)處理貫穿于各個(gè)領(lǐng)域,發(fā)揮著不可替代的作用。由于數(shù)據(jù)種類的復(fù)雜性,在對數(shù)據(jù)進(jìn)行管理的過程中,數(shù)據(jù)量呈現(xiàn)爆炸性增長,使數(shù)據(jù)處理變得越加困難,我們想要在計(jì)算機(jī)信息化中取得更大的發(fā)展,需要解決由此帶來的數(shù)據(jù)處理難題。維克托?邁爾?舍恩伯格教授在《大數(shù)據(jù)時(shí)代》中提出,我們處理數(shù)據(jù)的理念要完成三大轉(zhuǎn)變:要全體不要抽樣,要效率不要絕對精確,要相關(guān)不要因果。數(shù)據(jù)處理方法有很多,但總的處理流程可提煉為四步:采集,統(tǒng)計(jì)與分析,導(dǎo)入與預(yù)處理,數(shù)據(jù)挖掘,每一個(gè)步驟皆有其探索的空間。現(xiàn)在我們對于信息處理的要求不再滿足于對數(shù)據(jù)的存儲和檢索的需求,而是在于要更加準(zhǔn)確快速地處理信息。在信息處理中,獲取信息的途徑不是單一的,應(yīng)對多種多樣數(shù)據(jù)源,需要通過一定的技術(shù)手段,選擇適當(dāng)?shù)摹⒏咝У姆椒ǎ_保信息獲取的更快速、更精確,如此才能提高保留率,獲得更大的信息價(jià)值。
獲取信息是數(shù)據(jù)處理的基礎(chǔ)環(huán)節(jié),數(shù)據(jù)采集技術(shù)的質(zhì)量對數(shù)據(jù)信息的最終價(jià)值有著直接影響。信息采集是建構(gòu)在網(wǎng)絡(luò)信息挖掘的基礎(chǔ)之上的,在快速準(zhǔn)確地采集各種數(shù)據(jù)信息的同時(shí),必須對其進(jìn)行分類,處理和傳輸。對信息分類的不正確處理會大大降低資源的價(jià)值。數(shù)據(jù)處理中,根據(jù)處理業(yè)務(wù)的需要不同而有所區(qū)別,在對信息進(jìn)行分類和調(diào)節(jié)時(shí),需要進(jìn)行清晰的劃分,以使整個(gè)環(huán)節(jié)更加有條理和邏輯。并且應(yīng)對數(shù)據(jù)的收集、存儲、加工、分類、歸并等進(jìn)一步進(jìn)行統(tǒng)一格式化處理,為后期大數(shù)據(jù)信息的標(biāo)準(zhǔn)化和分析處理提供基本保證。在數(shù)據(jù)采集中,必須保證信息準(zhǔn)確、實(shí)時(shí)有效、來源可靠、成本較低、信息完整,因而需要不斷優(yōu)化和升級信息采集技術(shù)。現(xiàn)今數(shù)據(jù)采集技術(shù)可以有效地挖掘和分析各種數(shù)據(jù)源,通過結(jié)構(gòu)化信息,使用數(shù)據(jù)庫對數(shù)據(jù)進(jìn)行維護(hù)和管理,讓生產(chǎn)、交易、業(yè)務(wù)、個(gè)人等信息具有一定的操作規(guī)范,應(yīng)用范圍變得更加廣泛,這也是對過去的突破以及未來發(fā)展的指向。
信息存儲技術(shù)是計(jì)算機(jī)信息處理技術(shù)的核心之一,伴隨著IT各行業(yè)的發(fā)展迅速成為熱點(diǎn)。現(xiàn)代社會數(shù)字化的迅猛發(fā)展,數(shù)據(jù)信息存儲量需求呈指數(shù)上漲,海量數(shù)據(jù)處理需求緊迫,單一節(jié)點(diǎn)存儲無法應(yīng)對數(shù)據(jù)管理的需要。過去信息存儲空間很小,在19世紀(jì)50年代計(jì)算機(jī)技術(shù)剛誕生的初期,信息存儲以千位字節(jié)計(jì)算。而在信息發(fā)展的現(xiàn)今數(shù)據(jù)存儲開始變得有些不足,以騰訊為例,每日生產(chǎn)萬億消息,信息存儲需求早已突破兆兆位計(jì)。為了完全存儲采集的信息,滿足生活、生產(chǎn)的需要,勢必要提高數(shù)據(jù)存儲的標(biāo)準(zhǔn),因此改善信息存儲空間成為信息處理技術(shù)的一個(gè)研究重點(diǎn)方向。評價(jià)存儲技術(shù)的指標(biāo)通常包括存儲密度、存取時(shí)間、更新難易、可靠性、成本等。這些指標(biāo)之間又是相互制衡的,幾乎不能同時(shí)滿足,對于磁儲存儲技術(shù)、縮微存儲技術(shù)、光盤存儲技術(shù)也各有特點(diǎn)。在未來,信息存儲技術(shù)將打破界限,結(jié)合發(fā)展已經(jīng)形成趨勢。由磁儲存儲與光盤存儲結(jié)合誕生的磁光存儲技術(shù),采用縮微片和光盤兩種存儲媒質(zhì)形成的復(fù)核系統(tǒng)等,都能更好推動信息存儲技術(shù)領(lǐng)域的發(fā)展。
近幾年隨著網(wǎng)絡(luò)技術(shù)的不斷發(fā)展,智能手機(jī)、PC、平板等已經(jīng)成為人們生活、工作必不可少的工具。我們通過各種軟件、APP等實(shí)現(xiàn)信息共享,不斷產(chǎn)生大量的信息數(shù)據(jù)。據(jù)統(tǒng)計(jì),2006年個(gè)人用戶邁入TB時(shí)代,全球產(chǎn)生數(shù)據(jù)約180EB;2011年全球產(chǎn)生數(shù)據(jù)約1.8ZB;2020年全球數(shù)據(jù)約達(dá)到35.2ZB(1EB=260字節(jié),1ZB=270字節(jié))。如此龐大的數(shù)據(jù)量,為社會各行業(yè)的發(fā)展蘊(yùn)含了巨大的發(fā)展動力,同時(shí)也引發(fā)我們思考數(shù)據(jù)的安全隱患。國家軍事、電力、水利、政務(wù)、交通、銀行、金融、醫(yī)療、互聯(lián)網(wǎng)等重要機(jī)構(gòu)存儲著海量信息的保障,民眾的證件號碼、財(cái)產(chǎn)狀況、家庭成員、聯(lián)系方式、行蹤軌跡等個(gè)人信息的維護(hù),都是大數(shù)據(jù)信息處理的關(guān)鍵,是大數(shù)據(jù)信息安全的重要指標(biāo)。網(wǎng)絡(luò)流量增高的同時(shí),數(shù)據(jù)信息安全的難度也在增大。目前信息安全的主要威脅來源于四個(gè)方面:計(jì)算機(jī)病毒破壞數(shù)據(jù)、盜取信息,甚至導(dǎo)致系統(tǒng)癱瘓;黑客攻擊網(wǎng)絡(luò)、電腦等存在的漏洞,獲取單位資料、賬號信息等;物理層次上因自然災(zāi)害、設(shè)備故障等導(dǎo)致的存儲介質(zhì)損壞;數(shù)據(jù)管理自身不完善而引發(fā)的問題。數(shù)據(jù)安全隱患可能帶來巨大損失,我們可以從法律、管理、技術(shù)三大層面上尋求信息安全的維護(hù)方法。技術(shù)層面上,越來越多的應(yīng)對和處理方法應(yīng)運(yùn)而生,通過對加密保護(hù)技術(shù)、文件訪問控制技術(shù)、匿名化保護(hù)技術(shù)、可信計(jì)算技術(shù)等的探索,讓信息安全得到相對保證。隨著人們越來越關(guān)注數(shù)據(jù)信息的安全性,數(shù)據(jù)信息安全技術(shù)領(lǐng)域?qū)⒃絹碓绞艿礁鱾€(gè)行業(yè)的重視。
傳統(tǒng)的IT基礎(chǔ)設(shè)施中,我們已經(jīng)非常熟悉將非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù),并使用關(guān)系型數(shù)據(jù)庫對數(shù)據(jù)實(shí)施管理。因其大數(shù)據(jù)的雜、大、快的特點(diǎn),使用傳統(tǒng)方式轉(zhuǎn)化的時(shí)效較低,我們需要更加高效的新型基礎(chǔ)設(shè)施。這并非意味著舍棄原有基礎(chǔ)設(shè)施,從經(jīng)濟(jì)成本、人力成本、技術(shù)成本等各方面考慮,基礎(chǔ)設(shè)施建設(shè)應(yīng)更加注重融合共存,在現(xiàn)有設(shè)施上尋求整合,基于多個(gè)服務(wù)器集群上搭建大數(shù)據(jù)平臺,同時(shí)在硬件新材料、新器材上尋求突破。跨越單一儲存功能實(shí)現(xiàn)與計(jì)算能力相結(jié)合的存儲服務(wù)器,將軟件硬件整合在一起而誕生的一體機(jī)硬件形態(tài),采用高性能磁陣加高密度服務(wù)器陣列方式組建的硬件架構(gòu)等的誕生……系列新技術(shù)新材料的誕生將為大數(shù)據(jù)基礎(chǔ)架構(gòu)提供更好支撐。
計(jì)算機(jī)網(wǎng)絡(luò)隨著處理信息量的增多,應(yīng)用程序規(guī)模不斷增大,數(shù)據(jù)傳輸中經(jīng)過的網(wǎng)絡(luò)節(jié)點(diǎn)更多,對數(shù)據(jù)的傳輸效率、穩(wěn)定性、安全性等的要求越來越高。大量數(shù)據(jù)在網(wǎng)絡(luò)中傳輸,可能會因?yàn)閾砣麑?dǎo)致數(shù)據(jù)隊(duì)列延遲甚至重轉(zhuǎn),加大傳輸負(fù)載。要減少擁塞需要網(wǎng)絡(luò)路徑具有較好的多樣性,實(shí)現(xiàn)將數(shù)據(jù)流量分散在不同的路徑上進(jìn)行處理。通過網(wǎng)絡(luò)分割,將大數(shù)據(jù)流量與其他網(wǎng)絡(luò)流量分離,單個(gè)應(yīng)用程序?qū)τ诹髁康奶幚聿粫绊懫渌绦颉S纱耍枰⒁鈶?yīng)用程序的同步性,保證作業(yè)在并行的同時(shí)不會存在太大的區(qū)別。
云計(jì)算是時(shí)代發(fā)展提出的一種應(yīng)用概念,使用戶不受空間限制獲取網(wǎng)絡(luò)資源,為用戶提供了一種全新的體驗(yàn)。云計(jì)算將大規(guī)模的數(shù)據(jù)處理任務(wù)分解,通過多部服務(wù)器計(jì)算處理后進(jìn)行反饋,可在數(shù)秒之內(nèi)處理數(shù)以億計(jì)的信息,具有很強(qiáng)的虛擬化、靈活性、可擴(kuò)展性等。近幾年混合云逐漸成為云計(jì)算的發(fā)展重點(diǎn),用戶將數(shù)據(jù)存放在私有云中,有可以使用公有云的計(jì)算資源,采用混合云架構(gòu),將私有云和公有云進(jìn)行混合、匹配,實(shí)現(xiàn)數(shù)據(jù)高效運(yùn)算的同時(shí)又保證數(shù)據(jù)的安全穩(wěn)定,達(dá)到降低成本的目的。
綜上所述,計(jì)算機(jī)信息處理技術(shù)的發(fā)展是時(shí)代要求,已成為社會經(jīng)濟(jì)發(fā)展的重要因素,逐漸滲透到各個(gè)行業(yè),對于我們的生活、生產(chǎn)等都存在著巨大的影響。要不斷優(yōu)化計(jì)算機(jī)信息處理技術(shù),增加該技術(shù)的應(yīng)用價(jià)值并滿足最新的開發(fā)需求,為大數(shù)據(jù)時(shí)代的發(fā)展提供強(qiáng)力支持。
[1]熊勇.大數(shù)據(jù)時(shí)代背景下計(jì)算機(jī)信息處理技術(shù)分析[J].電腦知識與技術(shù),2021,17(01):32-33+40.
[2]宮昌盛.大數(shù)據(jù)時(shí)代背景下計(jì)算機(jī)信息處理技術(shù)分析[J].信息記錄材料,2021,22(01):118-119.
[3]陳俊杰.大數(shù)據(jù)時(shí)代下計(jì)算機(jī)信息處理技術(shù)分析[J].信息記錄材料,2020,21(12):197-198.
[4]李昭.大數(shù)據(jù)時(shí)代背景下計(jì)算機(jī)信息處理技術(shù)分析[J].數(shù)碼世界,2020(11):80-81.