肖鳳春
(貴州城市職業學院,貴州 貴陽 550025)
人們逐漸重視大數據分析的目的主要是想通過對海量的數據進行分析之后發現一些實際的問題,同時通過數據分析找到一些解決這些問題的正確方法。對大數據的分析應用絕不能僅僅停留在表面的重視。大數據平臺自身具有很多的優勢和利用價值。例如大數據平臺內部收集的數據量非常之大。同時其運算速度超乎人們的想象。這些方面的特征使得大數據分析平臺在科研、經濟發展等各個領域都得到了廣泛的應用。
任何科技的研究及使用最終目的都是為了讓其更好的為我們人類造福的。大數據平臺的應用,市場潛力巨大。大數據分析平臺對不同類型數據的分析方法也是有一定區分的。對于復雜數據的統計分析對數據的分析方法也是要求更高一些。通過科學上的不斷研究探索,現在已經將數據圖形、計算機自動化分析模式引用了進來。使對各類數據的分析都具備了科學性和可靠性。通過我國科學家的不斷努力,現在我國大數據分析平臺已經具備了其自身獨特的架構模型和運算程序。目前我國大數據分析平臺在實際應用過程,還在進行著其自身的發展完善。
我們有可能對大數據分析平臺對數據的存儲方面的需求不太清楚。其實大數據分析平臺對數據保存的空間需求巨大,是我們傳統所認知的存儲設備所不能滿足的。在大數據分析平臺中的數據存儲是一種動態的數據存儲。這種動態的存儲要求具體的講就是數據的往復調取流轉。需要我們及時的建立一個能夠滿足實際需求的數據存儲倉庫。并且要滿足數據調度的各種實際工況。所以總的來說,對于如何改善數據存儲方面的不足問題,還有很多工作要做。
任何在科學領域的數據分析都離不開數據模型的建立。并且在數據分析中建立數據模型都是極為關鍵的一項工作[1]。我們需要對現有數據進行系統的分析整合來作為數據模型建立的基礎架構。大數據分析平臺在工作過程當中每時每刻都面對著大量的數據篩查工作。所以憑借以往的數據模型是很難完成現有的工作任務的。需要我們建立科學的數據模型與之相匹配。
大數據當中充滿著很多的不固定的因素。包括對實時數據的統計,就是一項很難量化的工作。并且數據分析平臺內的數據還具有變動的屬性。這也為大數據分析平臺的建立制造了很多未知的情況。并且在大數據分析平臺的實際運營過程中,人們總是希望平臺能提高工作的性價比。這些都導致了數據在選取過程中難度頗大的問題出現。
從客觀上來說,數據的存在都代表著客觀世界當中的某種事物的軌跡。因此,各方面的數據是極其具有價值的東西。隨著科技的發展,我們今天開始逐步的認識到了這些數據的重要意義。但是由于現有技術的不足,到目前為止我們還缺乏一種高度集成化的數據分析系統來與現實的數據分析平臺相匹配。
大數據平臺的建立是為了滿足人類社會發展的各種需求的。但是數據的原始狀態是非常復雜甚至是雜亂無章的。這也造成了數據在開發利用上的巨大阻礙。數據的篩選上的問題就會越來越明顯。數據的具體實用價值在現實中就會被大打折扣。現如今世界各國對這方面的重視程度還遠遠不夠。在數據采集的準確性、規范性、安全性等方面還有許多問題需要及時解決。
數據分析平臺是具備多種使用功能的。通過對原始數據的收集,實現對數據的整理、分析、發現數據內部存在的客觀規律以及最終得出具體結論。大數據分析系統對于數據分析平臺的意義十分重大。因此一定要建立海量存儲空間的數據庫。并且將收集的數據進行及時的整理分類。對于利用價值較大的數據進行及時的編組存儲,而對于利用價值不大的數據,為了節約存儲空間就要進行及時的刪除處理。并且通過對有用的數據進行梳理,最終找出這些數據中存在的具體規律。
大數據分析平臺所收集的各種數據的過程是具有一定的客觀規律的。這些數據的特點可以被整理出具有一定循環規律的數據類型。同時有些數據在被認定為不具備這種具有循環規律的數據類型[2]。所以對數據的分類整理是十分有必要的。因為不同類型的數據都對應著不同的調用方式和系統。在數據具體篩查過程中我們就要建立起不同的數據篩選機制。實現對數據選取過程的完美匹配。以滿足不同工況下的實際需求。
一般情況下我們通過對數據的分析,就能夠得到想要的數據分析結果。并將這些數據分析結果進行必要的保存或者刪除。通常為了滿足實際的工作需要,數據分析平臺當中都會存在著多組數據分析模型。這些個數據分析模型會在遇到不同的數據類型的時候被自動匹配使用。從實際的數據分析過程來看,要對復雜的海量數據進行及時的調用篩選其實是一項非常艱巨的任務。因此為了滿足實際分析數據過程的需要,一定要對數據分析系統進行不斷的改良完善。
結束語:大數據分析平臺的建設現在已經引起了世界各國的廣泛關注。我國目前在大數據分析平臺的研發建設上相比較下還是具備一定優勢的。當然也存在文中敘述的種種不足的情況,筆者針對這些不足提出了幾點具體的優化策略。希望能夠為我國大數據分析平臺的建設和應用提供些許幫助。