董楠楠+牟有靜+文楠
摘 要
隨著計算機技術的開發與普及,云計算時代正式來臨,基于云計算的大批量的數據挖掘,也自然成為了解決傳統集中式數據挖掘無法適應大量數據不斷增長這一問題的主要方法。故文章將主要對云計算含義進行探討,對云計算特點進行分析,并且深入討論數據挖掘技術優勢,以供參考。
【關鍵詞】云計算 數據挖掘技術 技術改革
數據挖掘主要是指從復雜的、大量的、模糊的、隨機的數據當中進行探索與篩選,并集中識別出清晰的、有效的、新穎的、有實質作用的數據的過程。基于網絡平臺上大批量且持續增長的數據進行查找與篩選,最然有了更多資源作為基礎,但同時也大幅度提升了數據挖掘的難度,故文中將主要針對基于云計算的數據挖掘技術進行分析,提供改革意見。
1 云計算的具體含義分析
云計算技術具有先進的科學理念,借助于當前網絡中復雜的計算機處理程序,把大程序拆分成多個小程序,并且利用錯綜復雜的服務器網絡進行細化搜索和計算,在成功發掘和搜索之后,需要把相應的處理結果回饋給相關的用戶。利用這種先進的技術,使用這種服務的用戶可以在短時間內有效的處理大量的信息內容,并且完成相應的網絡工作。當前的網絡平臺中,云計算技術比較常見,比如網絡信箱以及搜尋引擎等等。相關的使用者需要使用加密信息和帳號,進而方便的獲得針對性的信息內容。在將來的科技發展中,通過使用手機和GPS等設備可以利用云計算技術來拓展種類繁多的服務形式。在當前云計算技術發展的流程中,云計算可以完成更為復雜和先進的工作,可以擺脫資料分析和搜尋的限制,進而完成DNA結構分析,完成對于基因圖譜的定序等較為復雜的任務內容。當前大規模的分布式計算技術已經相對成熟,這就是云計算概念的發源。只要在有網絡的地區,我們已經完全可以拋棄U盤等移動設備,只需要登入網絡大數據平臺,便可以快捷獲取數據并分享數據,這樣的數據共享與存儲模式顯然是更加便利的,但同時也有很大的風險需要去規避,那便是安全隱患,只有不斷開發并升級網絡安保技術,才能確保云計算技術的優勢進一步發揮出來。
2 云計算的特點分析
2.1 超大規模的特點
“云”這一概念本指無局限的領域,說明著這項技術的數據存儲與互傳空間具有很大的規模。當前國際知名的Google公司,為運行其云計算平臺,已經先后開啟了100多萬臺的服務器,除此以外,亞馬遜、微軟、IBM、雅虎等大型互聯網企業所建立的云平臺,均擁有幾十萬臺的服務器。這些服務器能夠進一步提升網絡平臺數據運算、存儲及交互的效率。
2.2 虛擬化的特點
借助云計算技術,網絡用戶能在任意的位置、使用各類終端獲取應用服務。在網絡平臺上所請求的資源均來自云平臺,并不是固定有形的實體。無論是儲存、搜索或是互傳,都在不存在實體的云平臺中運行,但除去技術人員以外,實際上網絡用戶在應用過程中并不需要詳細了解運行的具體位置。只需要一臺電腦或是一部手機,就可以借助網絡服務來獲取所需要的信息,甚至完成數據的秒速上傳與下載。
2.3 高可靠性的特點
云平臺普遍使用數據多副本容錯及計算節點同構可互換等措施來確保數據上傳、下載、存儲及互傳等服務的可靠性,部分類型的平臺上,數據即便丟失也有可能找回的渠道,比起使用計算機自帶硬盤,使用網絡云計算平臺更為可靠。
2.4 通用性的特點
云計算技術的應用,并不具備很強的針對性,只要是在網絡平臺上建設平臺,且具備了充足的服務器,便可完成,在云計算技術的支撐下,技術人員能夠構造出千變萬化的應用,同一個云平臺可以同時支撐不同設備的應用運行。
2.5 可擴展性的特點
云平臺的規模普遍是可以動態伸縮的,進而滿足不同類型企業及個人用戶的需求,用戶能夠根據自身的需求去定制所需空間的大小、功能等等,是十分人性化的,這樣的特點能夠使平臺應用更具針對性。
2.6 按需服務
云平臺是龐大的資源池,但用戶所要存儲、調用或是傳輸的數據是有限的,所以在云平臺提供了充足空間的前提下,用戶可以按需購入,這樣能夠避免對網絡空間的過度占用,云平臺也可以作為資源,如同水、電及天然氣等資源那樣計費是十分科學的。
2.7 建設成本低
由于云平臺有著特殊的容錯措施,因此可以采用很多的節點去構成一個無縫的數據網,云平臺的自動化集中式管理,使得許多的企業都無需負擔日益高昂的數據中心建設與管理成本。這不僅有助于平臺規模的拓展,而且企業建設云平臺的成本低廉,用戶便也可以以低廉的價格獲取自身專屬云空間及服務,只要能夠確保環境安全,必然會成為未來的大勢所趨。
3 基于云計算的數據挖掘的優勢
鑒于數據挖掘處理工作過程中所涉及的數據是大批量并且不斷增長的,因此為完成信息的上傳、下載、存儲及互傳,網絡用戶必須要從大批量的數據當中進行挖掘篩選,最終在無法預計的巨大數據群中篩選出符合自身需求的數據信息。同時,因為互聯網中的數據增長速度極為驚人,所以需要利用更為復雜的方法來發掘數據,在實際的發掘中,需要構建完善的開發環境和應用環境,同時需要持續的優化發掘思路和手段。利用這種方式,可以完善當前基于云計算平臺的數據挖掘環境。與此同時,利用云計算技術,可以構建發揮云計算功能的分布式計算環境,企業通過應用這方面的技術可以降低自己的運營成本,同時可以提升網絡應用的效率,可以快速的處理網絡平臺中的關鍵數據,這樣顯著提升了容錯率,并且擴充了結點。
4 結語
綜上所述,本文探討了云計算的概念和相關的理論,分析了當前云計算應用的特征以及今后的發展方向、主要發展趨勢等等。一方面,分析了云計算技術在數據發掘和研究方面的巨大優勢,一方面看到了云計算技術在數據發掘方面的能力和碰到的嚴峻挑戰,對此,需要給出相對合理的解決思路和建議,并且落實相應的改革措施。最近幾年來,世界范圍內各個國家都開始關于云計算技術,在不遠的將來,云計算技術可以再一次突破技術的平靜,進而在數據發掘方面實現新的飛躍,這是不可否認的必然趨勢,需要得到所有網絡技術人員的重視。
參考文獻
[1]尹雪婷,程強,許惠惠.基于云計算的數據挖掘技術[J].信息與電腦(理論版),2015(21):60+63.
[2]朱江.基于云計算的數據挖掘平臺架構及其關鍵技術研究[J].計算機光盤軟件與應用,2014,17(21):111+113.
[3]宋秋銀.基于云計算的數據挖掘技術研究[J].電腦編程技巧與維護,2013(08):87-88+91.
作者單位
遼寧大學 遼寧省沈陽市 110035endprint