肖治鑫 楊西龍 姜玉宏
(陸軍勤務學院 重慶 401331)
戰備物資儲備是為保障部隊及時應對戰爭和非戰爭軍事行動需要而預先進行的物資儲備,充足、合理的戰備物資儲備,是我軍遂行各項軍事任務的基礎[1~2]。由于我軍戰備物資儲備長期缺乏嚴格科學定量分析,儲備量的確定比較模糊,致使儲備效益不高,浪費較為嚴重。雖然戰備物資儲備的研究逐漸受到軍內外的專家、學者廣泛重視,形成了一批較大影響的學術研究成果[3],但從整體上來看,戰備物資儲備的理論研究仍是一個新興的領域。
如今,隨著時代的發展,“大數據”一詞進入人們的視線。隨后,大數據更是不斷地向各個領域滲透,己經廣泛地應用于互聯網、金融、教育等各個行業。根據IDC 作出的估測,數據一直都在以每年50%的速度增長,也就是每兩年增長一倍(大數據摩爾定律)。人類在最近兩年產生的數據量相當于之前產生的全部數據量。預計到2020 年,全球將總共擁有35ZB 的數據量。相較于2010 年,數據量將增長近30倍[4]。
軍隊戰備物資儲備種類繁多,數量龐大,其中存在著巨大可被挖掘的有價值信息。若是利用大數據技術對戰備物資儲備進行研究,將成為一種新的儲備決策研究方式,為我軍戰備物資儲備以及后勤保障的建設提供借鑒與參考。
大數據技術包括數據的采集、數據的存儲和管理、數據的處理與分析、數據的隱私和安全。其中的關鍵是數據的存儲管理與數據的處理分析,歸結起來為兩大核心技術,一是數據分布式存儲,二是數據分布式處理[5]。也就是說,在單臺計算機無法滿足海量數據的存儲管理與處理分析的時候,采用整個計算機集群網絡來對龐大的數據進行存儲和處理。下面將對本文所要利用的大數據相關技術進行簡單介紹[6]。
Hadoop是Apache軟件基金會旗下的一個開源分布式計算平臺,為用戶提供了系統底層細節透明的分布式基礎架構。
Hadoop 并不是一門單一的技術,實際上是一系列大數據技術的集合體,是一整套解決方案的統稱,可以看作一個項目。對于這么一個項目,有兩大技術核心:分布式文件系統HDFS 以及分布式并行框架MapReduce。這兩大核心解決了大數據領域中的兩個問題:海量數據的分布式存儲、海量數據的分布式處理[7]。
HDFS 的全稱是Hadoop 平臺上的分布式文件系統(Hadoop Distributed File System)。HDFS 是整個Hadoop 平臺上面兩大核心組件之一,解決了海量數據的分布式存儲問題。
分布式文件系統在物理結構上由計算機集群中的眾多節點所構成。在計算機集群中,存在一臺作為主節點,也被稱作“名稱節點”;其余的作為從節點,或被稱為“數據節點”。主節點承擔起數據目錄,也即是元數據的服務。主節點主要負責文件和目錄的創建、刪除、重命名等工作,同時主節點還管理著從節點和文件塊的映射關系,因此客戶端須先訪問主節點才能找到所需要的文件塊所在位置,進而到相應位置讀取所需文件塊[8]。從節點則完成相關數據存儲和讀取任務。在存儲數據時,主節點分配數據存儲的位置,由客戶端把數據直接寫入相應從節點;讀取數據時,客戶端從主節點獲取從節點和文件塊的映射關系,然后就可以到相應位置訪問文件塊。同時,從節點要根據主節點的命令來創建、刪除數據塊。分布式文件系統結構如圖1所示。
MapReduce 正如它的名字那樣,主要分為Map(映射)和Reduce(化簡)兩個階段。MapReduce 將復雜的、運行于大規模集群上的并行計算過程高度地抽象為兩個函數:Map 和Reduce,這兩個函數及其核心都源自函數式編程語言。在MapReduce中,一個存儲在分布式文件系統中的大規模數據集會被切分成許多獨立的小數據塊,這些小數據塊可以被多個Map 任務并行處理。MapReduce 框架會為每個Map 任務輸入一個數據子集,Map 任務生成的結果會繼續作為Reduce 任務的輸入,最終由Reduce任務輸出最后結果,并寫入分布式文件系統[9]。

圖1 分布式文件系統結構
MapReduce 設計的一個理念就是“計算向數據靠攏”,而不是“數據向計算靠攏”,因為移動數據需要大量的網絡傳輸開銷,尤其是在大規模數據環境下,這種開銷尤為驚人。所以,移動計算要比移動數據更加經濟。本著這個理念,在一個集群中,只要有可能,MapReduce 框架就會將Map 程序就近地在HDFS 數據所在節點運行,即將計算節點和存儲節點放在一起運行,從而減少了節點間的數據移動開銷。
HBase 是一個高可靠、高性能、面向列、可伸縮的分布式數據庫。HBase 是一個分布式存儲系統,HBase 最主要的特點是用來存儲非結構化和半結構化的松散數據。HBase 是架構在底層分布式文件系統HDFS 基礎上的,同時MapReduce 可以對HBase相關數據進行處理[10]。
對于傳統關系型數據庫而言,其擴展能力又非常有限,導致對數據的存儲能力捉襟見肘。并且,目前很多數據結構經常發生變化,關系數據庫模式確定后就很難變更。HBase 的出現,有效地彌補了傳統關系型數據庫的缺陷。
Hive 是一個基于Hadoop 文件系統之上的數據倉庫,支持大規模數據的存儲分析。Hive和傳統的數據倉庫是不同的,傳統的數據倉庫既是數據存儲的產品,又是數據處理分析的產品。Hive本身并不支持數據存儲和處理分析,可以將它看作一個面向用戶的編程接口,給用戶提供了一種編程語言,讓用戶通過類似SQL的編程語言去編寫分析需求[11]。
Hive 是架構在底層Hadoop 核心組件基礎之上的。Hadoop 平臺有一個支持大規模數據存儲的組件HDFS,還有一個可以支持大規模數據處理的組件MapReduce。Hive 就借助于這兩個組件,完成數據的存儲和處理分析。Hive 與Hadoop 生態系統中各個組件的關系如圖2所示。

圖2 Hive與Hadoop生態系統的關系
如圖2所示,Hive是架構在整個Hadoop體系結構頂層的,是建立在Hadoop 平臺上的數據倉庫,是基于底層的HDFS、HBase、MapReduce等組件。
戰備物資是保障作戰行動的重要物質支撐力量,在有效履行后勤保障任務中有著不可替代的作用。戰備物資儲備量測算分析是科學確定戰備物資儲備的基礎和依托,是圍繞軍事斗爭準備提升后勤保障能力的具體體現。
本文結合我軍當前實際,按照物資消耗特性和保障特點,建立戰備物資儲備量測算模型。基于大數據對模型參數進行分析研究,輔助完善戰備物資儲備量測算模型,對戰備物資儲備提供科學合理方案。
戰備物資涉及全軍數十個儲備專業,數十萬種儲備物資,具有種類繁多數量龐大的特點。不同的專業之間存在著一定的交叉性和各自的特性,統一建立模型和逐個專業建立模型都較為困難。
本文從保障綜合需求出發,將戰備物資分作兩大類進行建模,其中又根據戰備物資儲備影響因素,考慮戰備物資的消耗、生產以及和軍事供應鏈其他環節協調程度,建立如下戰備物資儲備量測算表達式:

其中,Q 表示戰備物資的消耗量,下文將對其進行分類,分成消耗型Qx和使用型Qs兩類;P 表示戰備物資的生產補給量,該生產補給量是指在軍民融合環境下,由地方企業生產提供且用于部隊需求的戰備物資量與軍隊內部對于該物資生產量的總和;δ 表示戰備物資自然損耗率,該損耗率與保障方向的自然環境有關;S 表示決策戰備物資儲備量,即是上級部門最終決定某戰備物資所需要的儲備量;S'表示戰備物資實際需求量,因此S'等于戰備物資消耗量減去生產補給量的值,由于存在自然損耗,S'則又等于決策儲備量去除自然損耗量的值。
3.2.1 戰備物資消耗分類
戰備物資消耗量的測算是確定戰備物資實際需求量的基礎,對戰備物資消耗進行分類建模研究是為了適應不同戰備物資既存在差異性又具有一定相似性的客觀要求。區別于之前不少學者研究主要從戰備物資所屬專業為出發點對各專業中不同的物資進行建模計算,本文根據戰備物資消耗規律的特點,結合已有消耗標準、配備標準,對戰備物資消耗進行分類建模。
從戰備物資消耗特點來看,戰備物資可分為兩類,一是使用即減少的消耗型物資,如油料、彈藥、醫療繃帶等;二是可重復進行使用的物資,如車材、儀器設備、帳篷、被裝等。

從戰備物資消耗的計算模型上來看,這兩種模型總體上具有一定的相似性,都是圍繞多種后勤保障力量,考慮多種保障形式,對同一種物資消耗需求量進行測算的研究。
3.2.2 消耗型戰備物資建模
消耗型物資消耗量模型為

Qx表示消耗型戰備物資的消耗量;n 表示保障單位的數量;N 表示保障單元的數量,即是保障單位中裝備或者人員等的數量;C 表示消耗標準,即是保障單元在每個單位時間或者單位里程的物資消耗量;t 表示保障時間、保障里程、消耗次數、消耗件數、消耗個數等。
消耗型物資一般為消耗規律與保障時間、保障里程等密切相關的物資,其保障對象消耗量通常按照對應的消耗標準計算,如彈藥、醫用藥品、給養物資中的單兵食品、艦艇遠航食品、油料裝置中的液壓油過濾裝置、常規油料化驗儀器及主油中的汽油、航煤、柴油等。
消耗型戰備物資起著基礎性的保障作用,它的保障對象為所有對該類物資具有消耗需求的單元,其消耗不考慮裝備是否受損。該類物資還具有一次性消耗的特點,一般該類物資使用即減少,不考慮重復使用。
在對消耗型戰備物資建立模型時,將保障環境以及受保障單元的自身性質對戰備物資的影響一同計算到t 中。受保障環境和受保障單元的自身性質的影響,使得消耗型戰備物資的消耗量越多,則t 的值越大;反之,t 的值越小。
3.2.3 使用型戰備物資建模
使用型物資消耗量模型為

Qs表示使用型戰備物資的消耗量;R 表示戰備物資保障配備標準;K 物資使用次數;θx表示保障環境影響系數;θy表示保障類型影響系數;θb戰備物資補償系數;n,N 表示意義同上。
使用型戰備物資具有能夠多次使用的特征,該類物資對應其保障對象有相應的配備標準,一般按基數計算,如軍需物資中的被裝、作戰靴、作戰頭盔、睡具睡袋,野營物資中的充氣床墊、行軍床、鋪板、油料裝備中的軟體油罐、軟質輸油管線,特種機具中的通風除濕設備、給排水設備、發電設備、凈水設備等。
根據戰備物資影響因素以及使用型戰備物資特點來看,該類物資主要受保障環境θx的影響,需要考慮氣候、海拔對戰備物資帶來的影響。同時,由于保障單元自身性質的差異,各單元對于使用型物資的消耗量也不相同。比如野戰單位、后勤保障單位、機關單位、軍事院校等,或是同一個單元戰時與平時對于同一種使用型物資的需求量是有差別的,這主要根據受保障單元自身性質以及情況來進行判斷。
同時,通常對于使用型物資的配備按批次進行計算,若不考慮每次作戰的回收,不僅將造成大量物資的浪費,同時也加大了后勤部隊保障任務的難度。在此,本文引入物資使用補償系數θb,根據不同物資性質,對物資在每次使用后進行一定的損耗補償,以恢復原有保障水平。
在對戰備物資生產補給量測算分析時,應將“軍民融合”這個因素考慮進去,根據地域經濟能力與企業的生產水平結合軍隊內部物資生產水平,對于快速生產類的戰備物資就可以減少存儲,甚至不儲。保障活動若是和地方企業聯系不緊密,甚至籌措戰備物資只靠軍隊內部生產,物資的供應能力肯定較前者弱,物資則應該根據實際情況適當多儲[8]。
鑒于以上因素,對于戰備物資生產補給量建立如下模型:

m 表示參與“軍民融合”的地方企業與軍內物資生產部門數量總和;L 表示企業生產某戰備物資的單位時間產量;T 表示生產時間;θz表示供應鏈影響系數。
在整條軍事供應鏈中與戰備物資儲備緊密關聯的有運輸、裝卸搬運、配送等環節。利用地方企業對戰備物資儲備進行生產補給,整個過程對于流通性有著較高的要求。因此,引入供應鏈影響系數θz,該系數用來表示在供應鏈過程中由于單位時間的運輸量低或者裝卸搬運的效率不高等造成的影響。如果戰備物資儲備與軍事供應鏈其他環節都能協調配合,緊密聯系,則這方面的影響因素不予考慮。
上述模型中,對于保障單位的數量n,保障單位中裝備或者人員等的數量N ,參與“軍民融合”的地方企業與軍內物資生產部門數量總和m,物資使用次數K ,企業生產某戰備物資的單位時間產量L,生產時間T 等主要根據具體實際進行判斷;消耗標準C ,戰備物資保障配備標準R 的確定主要根據已有的消耗標準和配備標準進行取值,各專業有較為詳盡的研究。以上參數在此不做探討,本文主要利用大數據技術對戰備物資自然損耗率δ,保障時間、保障里程、消耗次數、消耗件數、消耗個數等t ,保障環境影響系數θx,保障類型影響系數θy,戰備物資補償系數θb,供應鏈影響系數θz進行分析。
3.4.1 數據的采集
利用大數據技術對模型參數的確定前需要對各參數所涉及到的數據進行采集。其中戰備物資自然損耗率δ,保障時間、保障里程、消耗次數、消耗件數、消耗個數等t 以及保障環境影響系數θx這三個參數均受保障自然環境的影響,因此在數據采集的過程中,將采集各類戰備物資在不同保障環境下的歷史消耗量。保障自然環境通常分為城市、山地、江河、荒漠草原、水網稻田、熱帶叢林、高寒山地、嚴寒地區等。在保持其余參數相同的情況下,采集在不同保障環境下的數據,則能夠反映保障自然環境對戰備物資儲備帶來的影響。
對于保障類型影響系數θy,通常采集不同類別的保障單元對物資的消耗情況。根據采集不同類別保障單元對同種物資的消耗數量,進行對比則能夠反映保障類型對戰備物資儲備帶來的影響。比如野戰部隊對于作戰靴、作戰頭盔、野營帳篷、行軍床等的消耗較高;科研單位對于此類物資的消耗就相對低很多。
對于供應鏈影響系數θz,對涉及到在整條軍事供應鏈中與戰備物資儲備緊密關聯的環節歷史情況數據,比如該地區的交通事故發生頻率、地方物流發展狀況等數據進行采集,反映供應鏈流通性對戰備物資儲備補給帶來的影響。
對于戰備物資補償系數θb,根據查詢或者導入各保障單元對于使用型戰備物資的歷史消耗情況、數據來分析確定。
3.4.2 數據的存儲
在擁有大量數據后,使用分布式文件系統HDFS 實現戰備物資儲備海量數據存儲。HDFS 是面對海量數據存儲才應運而生的,另外,HDFS對硬件的要求很低,可以運行在廉價服務器甚至個人電腦上,當數據上傳到HDFS 系統中時會在主節點的控制下存儲到不同的數據節點上,避免了存儲系統中的單點故障問題,隨著數據量的增加,HDFS可以方便水平擴展[12]。
3.4.3 數據的分析處理
本文將采用數據倉庫Hive 與分布式數據庫HBase 相結合的方式對海量數據進行分析與處理。因為Hive 和HBase 本身就是架構在分布式文件系統HDFS上的。Hive借助HDFS完成整個大規模數據的分布式存儲,借助于MapReduce完成整個大規模數據的分布式并行處理[13~14]。HBase架構在底層分布式文件系統HDFS 基礎上,同時MapReduce 可以對HBase 相關數據進行處理。其中,HBase和Hive之間形成互補的關系,Hive適合進行海量數據批處理;HBase 是支持實時交互式查詢的數據庫,適合交互式實時查詢分析,彌補了HDFS不支持隨機讀寫的缺陷[15]。
對有關模型參數的海量數據進行處理分析或者實時查詢,從而對戰備物資儲備量進行決策。整個大數據技術框架如圖3所示。

圖3 大數據技術框架
其中,大數據層采用的就是相關大數據技術,也是Hadoop 平臺軟件框架中的技術。最底層采用HDFS分布式文件存儲系統來滿足戰備物資中海量數據存儲的需求;存儲完數據后對數據進行分析,其中離線分析是指對數據進行批量處理,Hadoop中的MapReduce最擅長的便是批量處理,即圖中的MR。除了MapReduce 以外,還有圖中所示的數據倉庫Hive 和Pig;對于數據實時查詢,可以利用Hbase分布式數據庫進行實現。
對戰備物資儲備量的探究,以建立戰備物資儲備量測算模型,基于大數據技術對模型進行分析處理,完善模型的方式,使戰備物資儲備決策更加科學、高效;使我軍戰備物資儲備決策能力與國家科技水平、未來復雜戰爭形態下軍事背景與作戰需求、國防軍事實力以及后勤保障能力的發展相適應。戰備物資儲備量的研究是新軍事變革對于后勤保障的客觀需求,對于提高后勤保障能力具有重要意義。