張柳葉 吳潔 薛遷 郭小強
摘 要:本文提出了以大數據為基礎的城市配送的動態車輛調度平臺。首先介紹了Hadoop技術以及構成Hadoop的兩個主要模塊,分別為HDFS和MapReduce并行運算框架。然后根據城市配送的需求,設計了城市配送的動態車輛調度平臺,并對數據存儲層、調度算法層、可視化展示層進行具體設計。
關鍵詞:大數據;城市配送;Hadoop技術
0 引言
隨著電子商務越來越深入影響人們的生活方式,物流行業得到了飛躍式發展。物流行業一直都是國民經濟發展的重要環節,也被人們譽為“企業第三利潤源”。2017年中國社會物流總額達252.8萬億元,同比增長6.7%[1]。同時,中國2017年社會物流總額占GDP總量的14.6%,約為12.1萬億[2],而發達國家的物流總額占GDP的11%,中等發達國家的物流成本占比不到13%[3]。因此中國的物流業還有很大的發展空間。降低物流成本不僅能提高企業的經濟效益,還能改善社會物流運行效率。
城市配送是整條物流鏈的最后一個環節,也是物流配送的“最后一公里”。傳統的靜態車輛調度已經無法滿足如今的物流配送需求。動態車輛調度受時間因素制約,隨著時間的推移,輸入信息可能發生改變。一旦數據發生改變,必須在短時間內獲得新的調度方案。
為了解決上述問題,本文提出了以大數據為基礎的車輛調度平臺,研究動態車輛路徑調度方案及對應的調度智能算法。
1 大數據概述
大數據處理需要強勁的數據處理能力,提升處理能力有兩種方式:第一是提升處理器的計算性能,但成本高。第二是采用并行計算技術。基于Hadoop的應用可以快速、便捷地處理海量數據的分布式并行程序,并運行于大規模的由廉價PC端組成的集群中,成本低。因此動態車輛調度平臺基于Hadoop平臺實現車輛調度。
1.1Hadoop技術
Hadoop一個開源的、可靠的、分布式計算框架, 主要用于大數據的高效存儲、管理和分析。Hadoop將硬件故障視為常態,保證了軟件的可靠性。Hadoop主要包括兩個主核心模塊:HDFS以及MapReduce。HDFS分布式文件系統用于存儲海量數據,并為網絡中的大量客戶端提供數據訪問。MapReduce實現任務分解和調度[4]。
1.2 HBase
HBase 是一個高性能、分布式、面向列、多維度的存儲系統。在設計上具備高性能和高可用性。HBase表是一個稀疏的、持久化的多維度有序映射表。HBase對HBase表中的數據實現下面4種操作[7]:獲取(Get),存入(Put),掃描(San),刪除(Delete),
由于HDFS只支持在文件上做少數的操作,但不包括任何更新的操作,不提供數據的本地緩存機制,而車輛調度需要實時更新。因此本文結合HBase與HDFS進行數據存儲。HDFS作為HBase持久的數據存儲,HBase對數據進行實時更新。
1.3 MapReduce
MapReduce框架是Google提出的一個軟件框架。MapReduce編程模型由Mapper階段和Reducer階段。Map()函數以
2 基于Hadoop的城市配送中動態車輛調度平臺構建
借助于Hadoop強大的云計算能力,協同統一物流企業的信息流及物流,使物流的各個環節、各個對象功能需求和信息需求得到充分滿足,為城市配送提供實時、準確的配送路線,提高配送效率,實現所有物流相關信息、企業資源得到高效利用,增強企業的核心競爭力。
在城市配送過程中存在較多的重復性資源浪費,如:車輛空載率高、大范圍跨區配送、配送路線隨意性大[9]。物流行業在新形勢的要求下需要提高配送效率、降低企業成本,傳統的物流配送模式難以適應行業未來的發展。而以Hadoop為基礎建立一個城市配送的動態車輛調度平臺具有及時搜索元數據能力,存儲和管理海量運單數據的能力,分布式計算最佳配送路徑的能力,以及數據可視化的能力。
2.1 城市配送的動態車輛調度平臺設計
顧客在購物平臺上提交訂單信息后跳轉至物流配送環節,由商家上傳運單信息,然后物流企業對運單信息進行分類、整合。但是電子商務的快速發展,導致每天有數以萬計的運單信息,傳統的信息處理方式已經無法處理這些海量的運單數據。因此,本文設計的車輛調度平臺分為數據存儲層、調度算法層、可視化展示層。
2.1.1數據存儲層
電商提供的運單、收件人居住地的地理信息以及收件人的接收狀態是調度系統的主要數據來源。數據寫入HDFS的過程包括以下七步:①當需要向HDFS寫入數據時,物流企業整合信息后統一向NameNode發送數據寫入請求;②NameNode先判斷傳送地址的合法性和數據文件的大小,若合法,則NameNode向物流企業發送指令,允許寫入數據;③然后,企業客戶端收到允許指令后,將文件分為128MB大小的塊(block),并向NameNode申請第一個block的存儲位置;④接著,NameNode經過計算后將對應的DateNode節點返回客戶端,假設返回3個DateNode;⑤物流企業客戶端開始分別向3個DateNode請求建立傳輸通道;⑥DateNode依次返回連接成功的應答,然后開始傳輸數據。⑦傳輸結束后,由企業客戶端返回NameNode寫入成功的信息,NameNode將相關數據保存到元數據中。
而HBase的客戶端則通過RPC調用將put、delete的數據請求提交到對應的Regionserver,Regionserver對兩種數據請求進行處理,并將數據寫入Hfile中,最后將HFile和WAL 日志存儲到HDFS。
2.1.2可視化展示層
可視化展示層主要是配送者設計最優配送路線。當配送者查詢某區域的配送路線時,經過客戶端查詢在 HBase 系統中運單數據,進而讓算法調度層生成的調度路線、實時變化的運單信息、運輸車輛位置及載貨余量等信息反饋至主界面呈現給使用者。
3 總結
本文在大數據的基礎上,運用Hadoop計算框架設計了城市配送的動態車輛調度平臺。并提出Hadoop計算框架提高了算法實時動態處理能力和尋優能力,能夠快速制定車輛調度路線,滿足城市配送的動態車輛調度平臺對時效性的要求。在后期的研究中,將研究基于MapReduce的量子蟻群算法處理大數據物流問題,從而制定出最優的車輛調度路線,為決策者提供多種決策方案。
參考文獻:
[1]《2017年前三季度物流運行穩中有進》[J].中國物流與采購,2017.
[2]崔曉迪.對社會物流成本與競爭力衡量指標的新思考[J].中國流通經濟,2018,32(09):11-19.