全思皓
摘要:Excel軟件是一種應用性與功能性較強的辦公室應用軟件,不同于Word這種文本工具,Excel是一種常用的數據處理工具,在數據挖掘與處理方面有讀到的優勢,本文基于這一前提,就Excel下數據挖掘與處理方法進行分析,并探討Excel下數據挖掘與處理技術的實踐應用,在大數據時代的今天,Excel軟件的這一應用優勢無疑是非常重要的。
關鍵詞:Excel;數據挖掘;數據分析
中圖分類號:TP317 文獻標識碼:A 文章編號:1007-9416(2018)05-0214-01
隨著大數據時代的到來,各行各業都逐漸明確數據對于行業乃至企業發展的重要作用,數據挖掘技術也更多的應用于客戶分析、精準營銷、企業管理等各方面,并發揮出日益重要的作用。但就目前而言,除了少數專業人士之外,越來越多不具備專業知識的普通人也開始從事數據挖掘與分析的工作,相較于價格高昂、專業性強、應用難度大的公式與軟件,Excel這種廉價高效的軟件更加值得普通人嘗試與應用。
1 Excel下數據挖掘處理方法
1.1 數據挖掘方法
在大數據時代,智能移動終端的逐漸普及使得各行各業與生產生活的各個環節都產生了大量的數據信息,這種情況下,要想從數據信息中發掘價值信息,僅僅依靠傳統的手工計算方法是無法實現的,這種情況下,以計算機技術與信息技術為基礎的數據挖掘技術應運而生。顧名思義,“數據挖掘”就是從數據信息中挖掘重要信息,在大數據時代下,各種數據挖掘技術與軟件層出不窮,比如S-PLUS、SPSS等軟件都在數據挖掘方面有著較好的應用效果。但同時,這些軟件的應用也對使用者的專業性提出了較高的要求。Excel軟件是一種表格軟件,不僅能夠制作表格、生成圖表,還可以利用各種函數計算工具進行計算,同時兼具數據挖掘功能。比如,Excel軟件中的數據透視表,就可以有效實現數據表的分層處理,而數據分層是數據挖掘的重要環節與重要內容;規劃求解是數據挖掘中求取最優解的重要工具。
1.2 數據處理與分析
Excel軟件的數據處理最為常見的方法是“篩選”“排序”等功能,以及常用的Excel軟件函數功能對數據信息進行處理,以便于更加清晰明確地分析與處理數據。在對數據信息進行分析時,常用的方法是Excel軟件中的數據透視表、透視圖、柱狀圖、散點圖、描述性統計等功能,還可以運用其Z-test功能與回歸模型進行數據信息的分析,以便于通過數據分析來對市場變動、消費者需求與商品采購等活動提供數據參考[1]。
2 Excel下數據挖掘的應用
2.1 規劃求解的加載
為了更好地探討與分析Excel軟件在數據挖掘與數據處理方面的應用,本文以最優化問題為例進行分析與研究,以分析Excel軟件在就最優化問題進行數據挖掘與處理方面的優勢。一般來說,在安裝Excel軟件時,軟件本身并不會直接反映與顯示出來Excel規劃求解功能,還需要進行重新加載處理,這個過程的操作順序為:office按鈕→Excel選項→加載項→轉到…→規劃求解加載項→確定。
2.2 最優化問題的提出
為了更好地分析Excel在規劃求解方面的應用,更好地分析最優化問題,以某超市M為例,該超市為大型綜合性超市,銷售商品包括日用百貨、衣服鞋帽、水果蔬菜、禽畜肉蛋等各種品類,在實際的運營過程中,就需要從全國各地批量購買大量百貨商品乃至蔬果肉蛋。以M超市所銷售的桃子為例,該超市采購的桃子主要來源于A、B、C三個城市,并且分別運輸至BJ、XA、CS與LZ四個城市的分店,這四個城市分店分布于全國各地,桃子的運輸路線及運輸方式自然不同,這種情況下,平均每一箱桃子的運輸費用與成本投入也就不同。假設該超市的四個分店所采買的桃子在A、B、C三個城市中并不品質與種類上的差別,那么出于經濟最大化的考量,為了在最大程度上減少桃子運輸成本的投入,則考慮到每個產地的生產能力與采購能力有限,在滿足A、B、C三個城市市場需求的前提下,如何確定最佳的運輸源頭及消費區、最佳的運輸路線與最佳的運輸數量。
2.3 對數據信息的整理與歸納
為了更好地應對與處理這一問題,首先需要制作相應的工作表格并對相應數據信息進行整理與歸納。運用Excel軟件對M超市商品采購成本最小化的確定過程中,需要基于相應的數據信息為基礎,在實際的數據挖掘與處理過程中,所采用的函數為SUM與SUMPRODUCT兩種,通過這兩種函數來計算M超市在每個桃子產地的總采購量、運輸量與運輸總成本。
2.4 設置“規劃求解參數”
并基于以上前提,對“規劃求解”加載項進行運行,在相應的“規劃求解參數”中進行相應參數的設置,并確定約束條件,在約束條件的限定費范圍內進行數據挖掘與計算。本次計算包含三個約束條件,分別包括:(1)桃子在運輸過程中的單位為箱,指定箱數為整數,沒有零數;(2)桃子從產地向消費區的運輸,要充分滿足當地對于桃子的市場需求,因此供應量大于需求量;(3)從桃子產地運輸的桃子總量,不能超過產地的供應能力與采購能力。同時考慮到這是一個實際應用問題,因此運輸量決不能小于零,因此在規劃求解參數設置中,必須設置“假定非負”這一項。
2.5 最優化問題的求解
在完成“規劃求解參數”的設置之后,就可以單擊規劃求解中的“求解”這一按鈕,就可以自動生成最優化運輸量。經過計算,可以確定的是桃子產地A需要向CS分店運輸桃子1200箱;桃子產地B需要向XA分店運輸桃子800箱,性LZ分店運輸桃子700箱;桃子產地C需要向BJ分店運輸桃子1500箱。通過這種運輸方式可以實現運輸成本的最小化,為280000元[2]。
3 結語
為了更好地分析Excel中的數據挖掘處理功能的應用,以某超市為例提出了商品采購運輸總成本最優化的分析。實際上,在大數據時代,充分熟練掌握Excel軟件的應用技術與應用方法,可以有效實現對市場營銷的優化,進一步提高企業運營質量與運營效率,減少運營成本的不必要消耗。另外,這種數據挖掘與處理方式,還可以應用于對產品性能的提升與研發領域。
參考文獻
[1]崇美英,曲夢琪,黃宏博,王遵剛.基于Excel的數據挖掘處理及應用分析[J].北京信息科技大學學報(自然科學版),2016,31(01):90-93.
[2]彭娟.Excel在數據挖掘中的應用研究[J].電子技術與軟件工程,2013,(14):142.