傅顯然
摘要:隨著我國信息技術水平的不斷進步,通訊等數據信息系統在各個領域的影響力度逐漸擴大,信息量的積累使得大數據概念隨之出現,更加促進了信息技術的快速發展。如何從海量的數據中提煉出有效的數據資源,挖掘大數據的信息價值成為當前急需解決的重要問題,本文通過對大數據出現的背景、數據的來源和處理挖掘進行研究,探討數學在大數據挖掘中的運用方式。
關鍵詞:大數據;數學;挖掘信息;
全球信息化時代的步入,使得信息技術滲透到生活的各個角落,逐漸成為提升生產力水平的重要因素,隨著支付寶、微信支付等第三方支付手段的進步,人們也開始改變傳統的消費模式,這也進一步推動了大數據的發展。在大數據時代,海量的數據提煉和挖掘一直是各行各業關注的重點和難點,數學作為數據分析處理過程的主要手段,在數據的挖掘中發揮著極其重要的作用。合理運用數學知識可以提升大數據的分析效率,輔助管理者和決策者從海量數據中獲取高價值的信息,這也逐漸成為了當前眾多專家和數據處理人員研究的方向。
一、大數據的主要特征
大數據的產生是基于計算機技術的發展和全球互聯網融合度的不斷提高,各行各業產生的數據信息不斷的匯集到互聯網信息中,通過數十年的積累,成為了海量的大數據,當然,不同行業的數據信息有著不同的價值,人們需要從數據信息中挖掘出高價值信息,幫助管理者和決策者做出科學判斷。其實,大數據的實質是指無法通過常規的數據收集手段如調查、收集等方式獲取的信息集合,具有數據量龐雜、數據類型多樣、數據價值低、數據真實性不明等多個特征,與傳統的數據儲備相比,大數據數據分析中最大的難點就是數據檢索和處理的難度高,有效信息的提取需要借助先進的處理技術,優化數據的處理能力。在大數據的研究中,數據挖掘是核心,其原理是對復雜、多樣、無規律的海量數據進行分析處理,挖掘有價值的信息。當前,大數據已經廣泛應用在通訊、工程、營銷、制造等多個信息行業中,在大數據的信息挖掘應用中,數學知識的應用至關重要,計算機信息處理的基礎就是在計算機中寫入數學公式,通過計算機的快速計算能力縮短人們的信息處理時間,因此,數學專業知識融入到大數據的挖掘工作中,可以有效解決大數據信息分析難的問題,提高對數據的分析處理效率[1]。
二、大數據挖掘的必要性
數據挖掘工作是隨著大數據的發展而出現的新興產業,對于數據挖掘的側重點不同,其運算方法和運算規律也有一定的差異。最早的數據挖掘是指全面的數據分析處理,但是因我國步入信息化時代已經有數十年,數據的信息儲備達到了空前的規模,而且還在不斷的增加中,這就造成了傳統的全面數據處理難度和耗費的資源巨大,不利于管理層的決策。現如今,在海量的大數據信息資源中篩選出適用于各個行業、領域的相關信息,將其進行歸納分類,如:市場營銷、教育科研、工程管理等類別,進而在這些同類信息中提出潛在的有價值的信息,為決策者提供更為客觀的數據參考具有十分重要的現實意義。
三、數學在大數據挖掘中的應用
(一)數據處理中的應用
大數據的初步處理是數據挖掘中的重點,因大數據具有時效性強的特點,在對數據進行挖掘處理的過程中對處理時效的要求較高,在有限的時間內,通過對大量數據的初步處理,既要保持數據處理的效果,還要確保處理時間上的有效性。如果原始數據不完整或有殘缺,就需要對數據進行預處理,篩選出其中的重要數據進行研究。數學在數據處理中的應用,最常見的就是線型回歸分析和相關分析法,通常,我們將這兩種方法相互結合,通過觀察多個變量的變化關系,找出其中的規律,再建立數學模型,進而通過數學模型推導出未知變量,達到數據預測的效果,為管理者和決策者提供風險判斷依據,有效的降低決策風險。當然,數學模型的建立不能僅僅是靜態模型,還需要在模型中加入動態數據的計算方式,以模型指導算法,結合獲取到的有效信息對模型進行修正,通過反復的計算、修正來達到算法與模型的平衡[3]。
(二)數據挖掘中的應用
大數據通過初步的數據處理,就需要進行數據的挖掘,數據挖掘具有集合性、應用性等多個特點。在數據的挖掘過程中,數學的作用無可替代,常用的數學挖掘方法有聚類分析法、關聯分析法等,其中最主要的還是聚類分析法,目前,該方法已經廣泛的應用在醫學、統計、營銷等多個行業。聚類分析法,其實質是將同類或相似的數據歸納到一起,劃分不同的數據集合,再通過對不同數據集合的分析處理,最后將各個集合內經過處理的數據匯集到一起,從而提取出不同數據中的高價值信息,達到數據挖掘的目的。實際上,聚類分析法常常在我們的日常生活中出現,各種數據分析、圖像處理中都會將關鍵性的數據進行分類,再通過逐個對數據集合的處理匯總達到提取有效數據的目的。另外,區間值算法也是大數據挖掘處理找那個的常用數學方法,其主要是針對不完整信息的處理。大數據具有數據來源龐雜,數據價值低的特征,區間值算法就是提取殘缺信息中的有效數據,對其有效區間值進行確定,當獲取這些信息后,既可以通過統計學方法進行確定,也可以由經驗豐富的專家確定,由專業的技術人員對數據價值進行進一步分析,達到高效、準確的信息分析和數據挖掘目的[4]。
結束語:
綜上所述,大數據時代給我們的生活帶來的極大的便利,逐漸融入到人們生活中的方方面面,當前社會的發展也離不開大數據的支持,數學作為支撐大數據挖掘分析的基礎,如何利用數學知識處理海量的數據已經成為大數據發展的關鍵,數學在數據處理中有著不可替代的作用,研究人員要善于運用數學方法,發揮出數學專業的價值作用,優化數據處理中的模型建立技術,利用大數據的發展帶動社會步入人工智能和智慧城市的信息時代。
參考文獻:
[1]林潘能.淺談大數據挖掘中數學的運用[J].現代交際,2018(09):253+252.
[2]吳雨伶,夏敏.基于極課大數據的高中數學教學優化策略研究[J].江蘇教育研究,2018(01):76-79.
[3]馬梓程.淺議大數據分析中統計學知識的運用[J].數學大世界(中旬),2018(02):37-38.