葉敏
【摘要】本文通過從數據挖掘技術的研究歷程開始,介紹了幾種常用的數據挖掘的技術,以及數據挖掘的過程;重點說明了數據挖掘技術在物流企業決策系統、倉儲管理以及電子商務中的應用,同時指出數據挖掘技術存在的問題。
【關鍵詞】數據挖掘技術 物流企業
一、數據挖掘技術研究現狀
(一)數據挖掘的定義
數據挖掘(Data Mining)是從海量的噪聲數據中識別提取具有應用價值的數據的過程。這里的數據源必須是真實的、大量的、含噪聲的。
(二)國外研究現狀
世界上對數據挖掘的正式研究開始于1989年8月舉行的第一屆KDD國際學術會議,數據庫中的知識的發現(Konwledge Dis-covery in Database)在這次會議中第一次被提出。研究重點逐漸從發現方法轉向系統應用,并且注重多種策略和技術的集成和多種學科的相互滲透。國外在應用方面發明了多款用于數據挖據的軟件,如spss model等,并開發了hadoop和spark等支持數據挖掘的框架,使得數據挖掘技術的發展空間更為寬廣。
(三)國內研究現狀
國內對數據挖掘的研究相對國外較晚,1993年國家自然科學基金首次支持中科院合肥分校對該領域的研究項目,目前進行的大多數研究是由政府資助進行,如863計劃、“九五”計劃等。
在數據挖掘軟件平臺上,MSMiner平臺是由中科院計算技術研究所智能信息處理實驗室開發的。
二、數據挖掘常用的技術
(一)人工神經網絡
人工神經網絡從信息處理方面對人腦神經元網絡進行抽象簡單的模型,它為解決大復雜度問題提供了一種相對來說比較有效的簡單方法。神經網絡可以很容易的解決具有上百個參數的問題。
(二)決策樹
決策樹是一種樹形結構,每個節點表示一個屬性的測試值,每個分支代表一個測試輸出,每個葉節點代表一種類別。
(三)數據挖掘過程
數據挖掘的過程一般由三個主要的階段組成:數據準備、數據采集、結果表達和解釋。①數據準備。數據準備對數據挖掘的成功應用至關重要,如果沒有對數據進行預處理,那么可能會得到一些沒有意義甚至是錯誤的結論.數據準備大致分為3步:數據集成,數據選擇,數據轉化。②數據采集。作為數據挖掘技術的核心,數據采集主要由以下幾部分構成:確定數據挖掘的類型,確定要實現的目標和任務的類型情況;選擇對應的技術來挖掘數據,根據挖掘任務來選擇適合的挖掘數據技術;選擇相應的算法:根據選定的技術選擇一種具體的算法;挖掘數據信息:用選定的算法組合在模式空間中進行反復迭代的搜索,從數據中找出有價值的數據信息。③結果表達與解釋。通過對數據挖掘發現的結果來解釋,過濾掉一些無用的數據,給用戶呈現出具有實際意義有用的信息。
三、數據挖掘技術在物流企業中的應用
(一)數據挖掘技術在物流決策系統中的應用
物流決策系統是一種結合了數據挖掘技術和人工智能技術的物流決策系統,通過人工智能對原料采購、加工生產、分銷配送到商品銷售的各個環節的數據進行收集,并通過使用數據挖掘等技術進行分析和處理,來確定制定的決策策略。從物流決策系統來看主要有以下幾個方面情況:
(1)人機界面:人機界面主要是通過與公司業務營銷部門的溝通,以此獲取產品的主生產計劃和相關的采購要求,通過采購入員反饋的采購完成數據輸入和輸出采購訂單。
(2)聯機分析:根據采購入員反饋的完成情況,結合局部的知識庫和數據倉庫,為各種物流選出適合的采購材料供貨商。
(3)推理機:推理機是一個數據挖掘智能決策系統的核心,它是根據用戶對采購的具體要求,并且結合了局部數鋸倉庫中數據和知識庫中的知識,以此為決策者提供有價值的信息,并且對包含的所有用戶進行預測分析。
(二)數據挖掘技術在倉儲管理中的具體應用
(1)倉庫選址問題。倉庫的選址問題就是求解配送成本、固定成本和變動處理成本之和的最小化問題。可以通過用數據挖掘技術中的分類樹的方法來解決這個問題。通過這個分類樹的方法,不僅確定了每年每個倉庫的配送量,同時確定了倉庫的位置,使得企業使用合適的庫存量,并且減少庫存資金。
(2)合理安排貨品的儲存位置。對于貨物的存放,我們怎么合理安排貨品的存儲,減少貨物的存儲成本,哪些貨物放在一起可以提高揀選的效率,我們可以通過使用數據挖掘的光聯模式來分析這些問題。
(三)數據挖掘技術在電子商務領域中的應用
電子商務在營運過程中積累的巨大的數據量,這些數據中有挖掘的價值需求,并且隨著電子商務的迅猛發展,數據的安全性和保密性要求也越來越高,這也對數據挖掘技術提出了更高的要求。
(四)數據挖掘技術在零售業中應用
在零售業中,數據挖掘技術可以根據銷售,顧客、產品、時間和地區進行多維度分析,基于有效數據挖掘的數據倉庫的設計和構造進行分析,數據挖掘技術可以分析促銷活動的有效性可以顧客忠誠度,以及對產品推銷和產品的交叉推動的關聯性進行分析,對各類關聯度高的產品進行重新下布局,從而提高顧客購買力。
四、數據挖掘技術存在的問題
(一)數據模型的可靠性
數據模型包括物理模型、邏輯數據模型等。目前的很多數據挖掘模型都不是很成熟,都有各自的優缺點。數據的可靠性很關鍵,因為不同的數據模型使用不同的方法,可能產生不同的結果。
(二)數據趨勢的預測
如何在數據挖掘過程中發現規律信息,做出合理的趨勢預測,這是數據挖掘難點。電子商務大量的數據信息,表現了電子商務一定的趨勢情況,這些數據的趨勢預測十分重要,特別是對于客戶信息和產品信息,有效的預測分析可以幫助企業有效決策,可以獲得更大的利潤。
(三)數據挖掘結果的不確定性
數據挖掘結果具有不確定性的特點,因為數據挖掘的目的不同,最終的結果也會出現各種情況,對此我們需要與數據挖掘的目標相結合,來做出理性的判斷,使得企業做出正確的決策選擇,進而達到提高企業經濟效益,獲得更多利潤的目的。
五、結論與展望
數據挖掘技術在物流企業決策系統、倉儲管理以及電子商務中的成功應用的同時,也存在一些問題。隨著數據挖掘技術的不斷進步,這些問題也會逐漸迎刃而解。