摘要:隨著現代科學技術尤其是因特網的發展,人類積累的數據量正以前所未有的速度增長。物流業和其他行業一樣,信息化的物流網絡體系產生巨大的數據流,如何準確、及時的收集和分析這些信息就成為一個難題。而數據挖掘技術通過去偽存真、去粗存精、由此及彼、由表及里從海量的信息中挖掘出有效的準確的信息,從而幫助企業迅速的做出決策,制定科學的物流管理方案,提高運作效率,降低運作成本,取得良好的效益。
關鍵詞:數據挖掘 物流管理 信息系統
0 引言
現代物流系統是一個復雜的系統,包括運輸、倉儲、配送、搬運、包裝和物流再加工等諸多環節,信息流量十分巨大。巨大的數據流,使得企業很難對這些數據進行準確、高效的收集和及時處理,因此決策者也就很難做出快速、準確地決策,實現對物流過程的控制,降低整個過程的物流成本。隨著知識經濟和現代信息技術的迅猛發展,信息技術特別是網絡技術的發展,為物流發展提供了強有力的支撐。物流管理信息系統是企業信息系統和企業信息化的基礎,能夠利用信息技術對物流中的各種信息進行實時、集中、統一管理。
1 數據挖掘技術
1.1 數據挖掘 數據挖掘是從大量的、不完全的、有噪聲的、模糊的、隨機的、數據中提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程。它從已知數據集合中發現各種模型、概要和導出值。數據挖掘不是統計學、機器學習以及其他方法和工具的隨意應用,它不是在分析技術空間里面亂闖,而是一個精心策劃和深思熟慮過的,決定什么才是最有用的、最有前景的和最有啟迪作用的一個過程,是知識發現的關鍵步驟。
數據挖掘的對象根據信息存儲格式分類有關系數據庫、面向對象數據庫、數據倉庫、文本數據源、多媒體數據庫、空間數據庫、時態數據庫、異質數據庫以及Internet等。
數據挖掘的主要技術有集合論法、決策樹法、遺傳算法、神經網絡方法等。集合論法又分為粗(糙)集理論方法、概念樹方法、覆蓋正例排斥反例方法等。決策樹法又分為ID3算法、CLS算法、IBLE算法等。遺傳算法又分為分布并行遺傳算法、進化算法等。
1.2 數據挖掘的流程
1.2.1 確定業務對象 清晰地定義出業務問題,認清數據挖掘的目的是數據挖掘的重要一步。挖掘的最后結構是不可預測的,但要探索的問題應是有預見的,為了數據挖掘而數據挖掘則帶有盲目性,是不會成功的。
1.2.2 數據準備 ①數據的選擇:搜索所有與業務對象有關的內部和外部數據信息,并從中選擇出適用于數據挖掘應用的數據。②數據的預處理:研究數據的質量,為進一步的分析作準備,并確定將要進行的挖掘操作的類型。③數據轉換:講數據轉換成一個分析模型。這個分析模型是針對挖掘算法建立的,建立一個真正適合挖掘算法的分析模型是數據挖掘成功的關鍵。
1.2.3 數據挖掘 對所得到的經過轉換的數據進行挖掘,除了完善從選擇合適的挖掘算法外,其余一切工作都能自動地完成。
1.2.4 結果分析 解釋并評估結果。其使用的分析方法一般應作數據挖掘操作而定,通常會用到可視化技術。
1.2.5 將分析所得到的知識集成到業務信息系統的組織結構中去。
2 數據挖掘在物流信息系統中的應用
隨著集成化物流管理信息系統的建立,以及網絡技術、EDI、人工智能、條形碼與POS等各種先進技術的應用,物流信息的商品化、物流信息收集的數據庫化和代碼、物流信息處理的電子化和計算機化,把挖掘到的規則與物流管理各方面有機地結合,就能極大地提高企業的競爭力。物流決策系統是一種結合了數據挖掘技術和人工智能的新型經營決策系統,主要通過人工智能對原料采購、加工生產、分銷配送到商品銷售的各個環節的大量信息進行采集,并利用數據倉庫和數據挖掘技術對其進行分析處理,并據此確定相應的經營策略。
2.1 數據倉庫的建立 數據倉庫作為數據挖掘的基礎,不同于傳統的聯機事務處理系統,它具有面向主題的、集成的、不可更新以及隨時間變化的特性。各個聯機事務處理系統作為數據倉庫的原始數據源,以文件方式提供企業在日常活動中收集的包括定貨單、存貨單、應付賬、交易條款、客戶情況等在內的大量數據資料和報表,同時還有大量的外部信息等數據。數據倉庫通過ETL過程( 抽取、轉換和加載)處理這些接口文件,并且按不同的主題域組織、存儲和管理這些客戶數據。通過數據倉庫接口,對數據倉庫中的數據進行聯機分析和數據挖掘。在建立完成企業級的信息數據倉庫之后,可以基于這個數據倉庫平臺進行數據挖掘工作。
2.2 基于數據挖掘的物流信息系統的體系結構 基于數據挖掘的物流信息的體系結構主要由以下幾部分組成:
2.2.1 物流信息收集與處理:記錄物流管理活動中的各類信息,對物流活動的各種信息進行采集、處理、傳輸,并按照統一的格式存入到數據倉庫。
2.2.2 數據挖掘的物流信息管理系統:把收集得到的數據匯總到數據倉庫,再根據數據挖掘送來的數據,為管理決策人員提供最新的和最有價值的信息或知識,幫助其快速、正確地做出決策。
2.2.3 數據挖掘:根據決策者提出的問題特點,確定挖掘的任務或目的,對數據倉庫中的相關數據進行精簡和預處理,再從精簡后的數據中挖掘出新的、有效的新知識,提供給數據挖掘的物流信息管理系統,由它給決策者提供有效的知識。
2.2.4 知識庫:包括基于部門的數據倉庫的組成結構、隸屬函數等知識。
2.2.5 開發人員和專家接口:開發人員和專家通過這個接口對知識庫中的知識進行定義和維護。
2.3 基于數據挖掘的物流信息系統的的功能模塊 數據挖掘物流信息的體系結構主要由以下幾部分組成:
2.3.1 采購進貨管理系統 采購進貨管理系統是數據挖掘物流信息體系的重要組成部分,是物流管理的起始階段,包括向廠商發出訂購信息、接收廠商的發貨、采購決策、存貨控制、采購價格管理等信息管理子系統。在對采購進貨管理系統進行數據挖掘時應主要采用基本統計分析方法,依據現有樣本的數量接受廠商的發貨,依據樣本價格估計總體價格。
2.3.2 銷貨出貨管理系統 銷貨出貨管理系統主要負責對客戶的需求類型及愛好進行收集、整理,記錄好客戶的購買情況以及各種類型的銷售情況,確定好合理的銷售價格,處理好應收貨款及退款等。回歸分析在銷貨出貨管理系統中應用的最為廣泛,分析客戶的需求及愛好,根據客戶的購買情況確立銷貨出貨與收貨款及退款的關系,確立回歸方程,利用回歸方程對相關內容進行分析。
2.3.3 庫存儲位管理系統 庫存儲位管理系統包括儲存貨管理、進貨訂貨管理等功能子系統,根據貨存情況及時作出決策,保證貨品的供應量以及流通加工的順利進行。
2.3.4 財務管理系統 財務管理系統主要功能是對采貨、進貨以及銷售管理所形成的應付、應收賬進行會計操作,對整個物流中心的資金進行平衡、測算和分析,編制財務報表,做好銀行轉賬工作,保證資金周轉以及整個物流管理順利進行。
2.3.5 運輸配送管理系統 運輸配送管理系統主要包括出貨配送管理、運輸調度計劃、分配計劃等功能子系統。
2.3.6 物流分析系統 其主要功能是應用相關技術對整個物流運作模式進行分析,完善物流運輸方案。
2.3.7 物流決策支持系統 物流決策支持系統的功能主要是在深入了解內部各系統業務信息和外部信息的基礎上編制各種報告,提供分析圖表。通過建立決策支持系統,及時地了解和掌握商流、物流、資金流和信息流所產生的信息,綜合運用數據挖掘工具對歷史數據從多角度、多方位進行分析,實現對物流中心的資源的綜合管理。物流決策支持系統應綜合利用相關分析與時間序列分析兩種方法,根據內部信息和外部信息綜合分析物流的運作情況,對物流運作的歷史數據進行全面分析,根據過去預測未來,實現物流的順暢運作。
3 關鍵技術分析
基于數據挖掘的物流管理信息系統的關鍵技術主要包括數據倉庫、數據挖掘、數據分析工具等。
3.1 數據倉庫技術。數據倉庫是來自多個源的數據的存儲庫,它可通過Internet將不同的數據庫連接起來,并將數據全部或部分復制到一個數據存儲中心。數據倉庫傾向于一個邏輯的概念,它建立在一定數量的數據庫之上,這些數據庫在物理上是可以分開的。數據倉庫通過Internet打破地域界限,將它們合成一個邏輯整體,把一個海量的數據庫展現在用戶面前。數據倉庫管理系統的一項重要工作是實現對傳統數據庫進行提取、清理和轉載到數據倉庫中。
3.2 數據挖掘技術。這是整個系統的難點和重點,主要涉及模式模型和挖掘算法。目前,己形成了多種數據挖掘方法,如分類知識發現、數據總結、數據聚類、關聯規則發現、序列模式發現、依賴關系或依賴模型發現、異常發現、趨勢預測等。各種方法均有它一定的優點,也有它的不足。幾種技術并不是單一的使用,而是根據實際情況綜合的加以應用。現在一些流行的數據挖掘工具一般都包括了幾種方法。
3.3 數據分析工具。數據倉庫雖然存有大量數據,但提供輔助決策的信息需要利用各種分析工具,如聯機分析處理(OLAP)工具、統計分析和查詢優化工具等。這些工具的性能對管理決策的效果有著重要的影響。目前已出現具有智能功能的強大的數據分析工具,這些分析工具不僅能在系統運行時采集和處理數據,同時也支持對其他業務系統的數據進行采集。
參考文獻:
[1]劉同明.數據挖掘技術及其應用[M].北京國防工業出版社.2009.
[2]Margaret H,Dunham.數據挖掘教程(郭崇慧,田鳳占,靳曉明等)[M].北京:清華大學出版社.2005.
[3]陳京民.數據倉庫與數據挖掘技.北京:電子工業出版社.2007,48-65.
[4]余志兵.基于OLAP技術的用戶銷售與采購分析系統的構建:[碩士學位論文].南充:西華師范大學.2005.