勞鈺鈔,劉秀峰,楊錦禮,蔣 志
(1.廣州中醫(yī)藥大學(xué)醫(yī)學(xué)信息工程學(xué)院,廣東 廣州 510006;2.廣州奧賽軟件有限公司,廣東 廣州 510006)
全球經(jīng)濟(jì)一體化發(fā)展的背景下,港口行業(yè)迅速發(fā)展,全球港口集裝箱吞吐量大幅增加,2021 年上半年全球主要港口吞吐量報(bào)告(apecpsn.org)顯示,2021 年上半年全球主要港口吞吐量十大集裝箱港口中有七大港口為中國(guó)港口,其完成集裝箱吞吐量超過(guò)9500萬(wàn)TEU,占比約為71.60%,較2016 年上半年約增加了14.51%。自2020 年新冠肺炎疫情在全球爆發(fā)以來(lái),中國(guó)港口在世界集裝箱港口行業(yè)中的作用和重要性不僅沒(méi)有下降,反而上升,詳見(jiàn)表1。

表1 2021 年上半年全球主要港口吞吐量
港口行業(yè)發(fā)展勢(shì)力迅猛,集裝箱船不斷朝著大型化發(fā)展,國(guó)內(nèi)外部分老舊港口堆場(chǎng)資源相對(duì)有限,堆場(chǎng)趨于飽和致港口作業(yè)成本升高的現(xiàn)象在老舊港口成為常態(tài),部分港區(qū)開(kāi)始出現(xiàn)嚴(yán)重的擁堵問(wèn)題,嚴(yán)重制約港口作業(yè)和集疏運(yùn)效率[1,2]。
在多數(shù)自動(dòng)化程度不高的港口里,集裝箱的堆放位置由吊機(jī)人員和堆場(chǎng)策劃人員隨機(jī)安排,無(wú)序度高。當(dāng)前港口堆場(chǎng)翻箱的主要形式有3 種:(1)出口裝船造成翻箱;(2)進(jìn)口外貿(mào)客戶(hù)提箱造成翻箱;(3)由于商品檢驗(yàn)、轉(zhuǎn)堆等對(duì)集裝箱進(jìn)行移箱造成翻箱,致使港口耗費(fèi)多余的電力、人力。隨著國(guó)際航運(yùn)行業(yè)的快速發(fā)展,集裝箱的吞吐量在逐年上升,但是港口資源卻始終有限,港口能容納的集裝箱數(shù)量逐步飽和[2,3],堆存高度在港口面積有限的情況下,堆存高度不斷增加,翻箱率亦隨之升高[3]。如何降低港口中集裝箱翻箱一直以來(lái)都是國(guó)內(nèi)外學(xué)者關(guān)注的問(wèn)題。
根據(jù)王志明《基于遺傳算法的集裝箱后方堆場(chǎng)箱位分配策略》一文指出,若能準(zhǔn)確預(yù)測(cè)卸船時(shí)集裝箱的堆存時(shí)間,在集裝箱進(jìn)港口時(shí)將集裝箱合理策劃位置,堆存時(shí)間較長(zhǎng)的箱下層放置,堆存時(shí)間短的上層放置,則可大幅度減少集裝箱出場(chǎng)時(shí)的翻箱,促進(jìn)港口經(jīng)濟(jì)發(fā)展[4]。
目前已有關(guān)于集裝箱翻箱的研究主要集中在翻箱路徑的仿真和NP 問(wèn)題模型的構(gòu)建,旨在構(gòu)建和優(yōu)化集裝箱的翻箱路徑規(guī)則[4,5],側(cè)重于對(duì)集裝箱的規(guī)則庫(kù)的研究和應(yīng)用,但目前研究多處于翻箱時(shí)各貝位都為靜態(tài)的模型,而本研究的方向?yàn)閷?duì)集裝箱堆存時(shí)間的預(yù)測(cè),旨在通過(guò)預(yù)測(cè)集裝箱堆存時(shí)間,對(duì)集裝箱進(jìn)場(chǎng)時(shí)進(jìn)行合理的堆位策劃,以減少集裝箱翻箱造成的無(wú)效成本,無(wú)需考慮各吊機(jī)的協(xié)同性合作以及各貝位在后續(xù)翻箱中位置的變化,在前者的基礎(chǔ)上更側(cè)重于應(yīng)用。
當(dāng)前此類(lèi)研究在國(guó)內(nèi)外鮮有人涉足,完成后會(huì)為國(guó)內(nèi)外眾多港口行業(yè)應(yīng)用于生產(chǎn)提供更多方法,提高港口的效率及減少港口的作業(yè)成本,從而促進(jìn)港口行業(yè)發(fā)展。
本研究納入廣州某港口2021 年1 月1 日-2022年10 月31 日業(yè)務(wù)數(shù)據(jù)共計(jì)689956 例曾在堆場(chǎng)停留的集裝箱的出場(chǎng)記錄,根據(jù)港口實(shí)際要求將堆存時(shí)間分類(lèi)設(shè)為0~5 天,6~10 天,10 天以上3 個(gè)類(lèi)別進(jìn)行以預(yù)測(cè)。納入標(biāo)準(zhǔn):(1)剔除在業(yè)務(wù)數(shù)據(jù)庫(kù)中重復(fù)錄入的集裝箱進(jìn)場(chǎng)、商檢、翻箱的業(yè)務(wù)數(shù)據(jù);(2)剔除直裝直卸,不經(jīng)過(guò)堆場(chǎng)堆放的集裝箱的出場(chǎng)記錄;(3)符合業(yè)務(wù)規(guī)則及較為完整的集裝箱出場(chǎng)數(shù)據(jù)。
當(dāng)前試點(diǎn)港口中吞吐量逐年上升,堆場(chǎng)容納量日趨飽和,翻箱情況嚴(yán)峻,造成港口運(yùn)營(yíng)成本不斷升高。經(jīng)統(tǒng)計(jì)得知,2021 年1 月到10 月經(jīng)過(guò)堆場(chǎng)的離場(chǎng)集裝箱數(shù)約為69 w,平均翻箱次數(shù)(平均翻箱次數(shù)= 離場(chǎng)時(shí)總翻箱次數(shù)/ 出場(chǎng)目標(biāo)箱數(shù))為49/100,圖1 為反映2021 年1-10 月的翻箱情況折線(xiàn)圖,即每100 個(gè)集裝箱離場(chǎng),平均需要造成49 次翻倒,根據(jù)試點(diǎn)港口的成本估算每次翻箱成本為50 元,則2021 年1 月到10 月,該試點(diǎn)港口僅在翻箱上就產(chǎn)生作業(yè)成本,而用于翻箱的成本對(duì)于港口運(yùn)營(yíng)來(lái)說(shuō)是無(wú)價(jià)值的支出,若能減低翻箱,則可以把節(jié)約的成本用于公司運(yùn)營(yíng)[6]。

圖1 2021 年1 月到10 月翻箱情況折線(xiàn)圖
通過(guò)前期數(shù)據(jù)分析,港口業(yè)務(wù)數(shù)據(jù)共149 個(gè)字段,從中選取持箱人、空重箱、箱型、收貨人、發(fā)貨人、貨物、載貨港、卸貨港等與內(nèi)容較為完整,與翻箱關(guān)聯(lián)性較大的維度作為預(yù)測(cè)模型的特征。
選取出的持箱人、空重箱、箱型、收貨人、發(fā)貨人、貨物、載貨港、卸貨港等數(shù)據(jù)為高基類(lèi)數(shù)據(jù),將其進(jìn)行序列編碼,并將進(jìn)場(chǎng)時(shí)間轉(zhuǎn)換成星期時(shí)間加入特征。
隨機(jī)森林分類(lèi)是由很多決策樹(shù)分類(lèi)模型{h(XΘk),k= 1,…,}組成的組合分類(lèi)模型,且參數(shù)集{Θk}是獨(dú)立同分布的隨機(jī)箱量,在給定自變量x下,每個(gè)決策樹(shù)分類(lèi)模型都由一票投票權(quán)來(lái)選擇最優(yōu)的分類(lèi)結(jié)果。隨機(jī)森林的基本思想為:首先利用bootstrap 抽樣從原始訓(xùn)練集抽取k個(gè)樣本,且每個(gè)樣本的樣本容量斗魚(yú)原始訓(xùn)練集一樣;其次,對(duì)k個(gè)樣本分別建立k個(gè)決策樹(shù)模型,得到k中分類(lèi)結(jié)果;最后根據(jù)k種分類(lèi)結(jié)果對(duì)每個(gè)記錄進(jìn)行投票表決,決定其最終分類(lèi)[7-12],如圖2。

圖2 隨機(jī)森林原理圖
考慮不同時(shí)間段的船舶對(duì)集裝箱業(yè)務(wù)數(shù)據(jù)的影響,因而不采取數(shù)據(jù)集中隨機(jī)抽取的方法,而是根據(jù)時(shí)間順序劃分?jǐn)?shù)據(jù)集,并進(jìn)行測(cè)試。在該數(shù)據(jù)集中,本研究采用多種數(shù)據(jù)集分類(lèi)方式進(jìn)行預(yù)測(cè),以驗(yàn)證該模型的泛化性和穩(wěn)定性。
采用2021 年1 月1 日到2021 年8 月31 日的數(shù)據(jù)共546814 例作為訓(xùn)練集,2021 年9 月1 日到2021年10 月31 日數(shù)據(jù)共143142 例作為測(cè)試集,準(zhǔn)確率為69.2%;采用2021 年1 月1 日到2021 年9 月30日的數(shù)據(jù)共612419 例作為訓(xùn)練集,2021 年10 月1日到2021 年10 月31 日數(shù)據(jù)共77537 例作為測(cè)試集,其預(yù)測(cè)準(zhǔn)確率為72.02%,劃分情況如圖3。

圖3 數(shù)據(jù)集劃分圖示
兩種數(shù)據(jù)集劃分對(duì)比得出,訓(xùn)練集數(shù)據(jù)量較大的情況下,測(cè)試結(jié)果較好,測(cè)試結(jié)果詳見(jiàn)表2;后續(xù)將采用第二種劃分?jǐn)?shù)據(jù)集方法,對(duì)測(cè)試數(shù)據(jù)進(jìn)一步進(jìn)行測(cè)試和開(kāi)展試點(diǎn)的實(shí)船測(cè)試。

表2 2021 年業(yè)務(wù)數(shù)據(jù)按時(shí)間劃分?jǐn)?shù)據(jù)集
采用2021 年1 月1 日到2021 年9 月30 日的數(shù)據(jù)共612419 例作為訓(xùn)練集,將2021 年10 月1 日到2021 年10 月31 日數(shù)據(jù)按業(yè)務(wù)類(lèi)型進(jìn)行測(cè)試,通過(guò)進(jìn)口外貿(mào)、進(jìn)口內(nèi)貿(mào)、出口外貿(mào)、出口內(nèi)貿(mào)四個(gè)基本業(yè)務(wù)類(lèi)型分別進(jìn)行預(yù)測(cè),查看具體業(yè)務(wù)類(lèi)型的預(yù)測(cè)效果,以進(jìn)行對(duì)比驗(yàn)證,準(zhǔn)確分類(lèi)的范圍在42% ~87%之間,其中進(jìn)口外貿(mào)的預(yù)測(cè)準(zhǔn)確率最低,僅為42.01%;外貿(mào)出口的準(zhǔn)確率最高,為87.31%,詳見(jiàn)表3。

表3 2021 年數(shù)據(jù)按業(yè)務(wù)類(lèi)型測(cè)試預(yù)測(cè)效果
結(jié)合測(cè)試結(jié)果和實(shí)際業(yè)務(wù)情景下分析得知,不同業(yè)務(wù)類(lèi)型的預(yù)測(cè)準(zhǔn)確率因?yàn)闃I(yè)務(wù)場(chǎng)景的差異確有明顯差異,因?yàn)楦劭谥羞M(jìn)口外貿(mào)的集裝箱堆存時(shí)間受到海關(guān)查驗(yàn),海關(guān)放行,國(guó)外環(huán)境形勢(shì)等不可控因素影響較大,且貨主信息在業(yè)務(wù)數(shù)據(jù)中數(shù)據(jù)準(zhǔn)確性低,貨主提貨時(shí)間隨意性較大,導(dǎo)致進(jìn)口外貿(mào)在主要業(yè)務(wù)類(lèi)型中的預(yù)測(cè)效果最低,其預(yù)測(cè)準(zhǔn)確性與實(shí)際業(yè)務(wù)情況相吻合。
通過(guò)統(tǒng)計(jì)得知,進(jìn)口外貿(mào)在堆場(chǎng)中的翻箱最多,其2021 年1 月到10 月的平均翻箱次數(shù)為130/100,造成的無(wú)效作業(yè)成本最高,是降低港口翻箱的重點(diǎn)分析方向。
進(jìn)一步對(duì)11 月的進(jìn)口外貿(mào)船進(jìn)行抽樣測(cè)試,以驗(yàn)證外貿(mào)進(jìn)口業(yè)務(wù)類(lèi)型的實(shí)際預(yù)測(cè)效果,分析外貿(mào)進(jìn)口業(yè)務(wù)類(lèi)型準(zhǔn)確率較低的影響因素,對(duì)測(cè)試結(jié)果進(jìn)一步分析和評(píng)價(jià),外貿(mào)進(jìn)口船測(cè)試情況詳見(jiàn)表4。

表4 2021 年10 月外貿(mào)進(jìn)口船數(shù)據(jù)測(cè)試情況
共測(cè)試了10 月卸船的集裝箱數(shù)量較多的6 個(gè)外貿(mào)進(jìn)口船,測(cè)試結(jié)果得其準(zhǔn)確分類(lèi)范圍落在40% ~56%之間,根據(jù)實(shí)際業(yè)務(wù)數(shù)據(jù)分析得知,在6 個(gè)測(cè)試船之中,分類(lèi)準(zhǔn)確率最低的為SPX 船,僅為40.95%,其數(shù)據(jù)特征中,貨主的信息最為不完善,經(jīng)統(tǒng)計(jì),在貨主信息中有21.6%的貨主字段信息空缺, 且貨物字段數(shù)據(jù)中空缺數(shù)據(jù)較多,有3%的占比為空缺數(shù)據(jù);而在分類(lèi)準(zhǔn)確率最高的SBA 船,其準(zhǔn)確率為56.68%,其貨主信息中僅有12.3%的貨主字段信息空缺,且貨物字段數(shù)據(jù)空缺較少,僅有1 個(gè)空缺貨物字段內(nèi)容;同驗(yàn)證其余外貿(mào)進(jìn)口船的數(shù)據(jù)情況,如上述一致,可知,外貿(mào)進(jìn)口的數(shù)據(jù)內(nèi)容完整性不高,加上商檢等業(yè)務(wù)影響,導(dǎo)致其準(zhǔn)確性在同月份的其他類(lèi)型對(duì)比中稍顯劣勢(shì)。
模型進(jìn)行測(cè)試和優(yōu)化的同時(shí),試點(diǎn)中同步進(jìn)行實(shí)際進(jìn)口外貿(mào)的船舶測(cè)試,驗(yàn)證構(gòu)建集裝箱堆存時(shí)間預(yù)測(cè)分類(lèi)器方案對(duì)于港口降低翻箱的實(shí)際效果。
實(shí)船測(cè)試流程如下:(1)在外貿(mào)進(jìn)口船舶靠泊前,試點(diǎn)港口提交即將靠泊的外貿(mào)進(jìn)口船舶集裝箱數(shù)據(jù)于港口業(yè)務(wù)操作系統(tǒng);(2)操作系統(tǒng)觸發(fā)集裝箱堆存時(shí)間預(yù)測(cè)分類(lèi)器,預(yù)測(cè)提交集裝箱的堆存時(shí)間,港口根據(jù)預(yù)測(cè)結(jié)果進(jìn)行堆場(chǎng)策劃,堆存時(shí)間短的集裝箱壓堆存時(shí)間長(zhǎng)的集裝箱,對(duì)預(yù)測(cè)結(jié)果為同一時(shí)間段的集裝箱分類(lèi)存放;(3)集裝箱在堆場(chǎng)堆存一定時(shí)間段后被提箱出場(chǎng),統(tǒng)計(jì)集裝箱實(shí)際堆存時(shí)間和翻箱情況,驗(yàn)證預(yù)測(cè)分類(lèi)器準(zhǔn)確率和分析預(yù)測(cè)分類(lèi)器對(duì)實(shí)際翻箱的效果[13]。
實(shí)船測(cè)試共進(jìn)行5 次,分別是船名ZYB 航次2139W 的140 個(gè)集裝箱,船名SBA 航次1041S 的364個(gè)集裝箱,船名ZYB 航次2142W 的135 個(gè)集裝箱,船名SPX 航次2121S 的356 個(gè)集裝箱以及船名SBA航次1043S 的366 個(gè)集裝箱,本次測(cè)試實(shí)船的業(yè)務(wù)類(lèi)型都為外貿(mào)進(jìn)口,其船過(guò)往航次的平均翻箱次數(shù)和測(cè)試后的實(shí)際平均翻箱次數(shù)如表5 所示,其中預(yù)測(cè)準(zhǔn)確率在42%~82%之間,其中過(guò)往平均翻箱次數(shù)和實(shí)際測(cè)試船的平均翻箱次數(shù)相比較,測(cè)試過(guò)的實(shí)船,其平均翻箱次數(shù)都呈下降趨勢(shì),且下降范圍在10/100~28/100 次。

表5 2021 年測(cè)試實(shí)船翻箱情況
由實(shí)船測(cè)試結(jié)果可知,基于隨機(jī)森林算法構(gòu)建集裝箱堆存時(shí)間分類(lèi)器的方案對(duì)港口行業(yè)實(shí)現(xiàn)降低翻箱成本目標(biāo)具有實(shí)際應(yīng)用價(jià)值,從側(cè)面也說(shuō)明了機(jī)器學(xué)習(xí)算法在港口行業(yè)的有效性和應(yīng)用性。
隨著集裝箱港口行業(yè)的發(fā)展和自動(dòng)化程度的提高,國(guó)內(nèi)老舊港口堆場(chǎng)難以本研究通過(guò)數(shù)據(jù)處理,構(gòu)建機(jī)器學(xué)習(xí)預(yù)測(cè)分類(lèi)器、模型測(cè)試以及實(shí)船驗(yàn)證等過(guò)程,可得出利用機(jī)器學(xué)習(xí)等方法預(yù)測(cè)集裝箱堆存時(shí)間,將預(yù)測(cè)得出的堆存時(shí)間用于港口堆場(chǎng)策劃輔助得方案,對(duì)港口堆場(chǎng)降低翻箱有明確的應(yīng)用價(jià)值;且本研究通過(guò)對(duì)業(yè)務(wù)數(shù)據(jù)的分析和再利用,可實(shí)現(xiàn)港口運(yùn)營(yíng)成本的控制和作業(yè)效率的提升。
由于港口行業(yè)中業(yè)務(wù)類(lèi)型繁雜,僅是提箱作業(yè)就是一個(gè)復(fù)雜的系統(tǒng)工程,要解決當(dāng)前港口中翻箱的嚴(yán)峻情況更需要不斷加深當(dāng)前研究,并不斷嘗試新方向,以改善老舊港口的嚴(yán)峻的翻箱現(xiàn)狀。已有研究的不足之處表現(xiàn)在:
(1)特征數(shù)據(jù)質(zhì)量不高,模型預(yù)測(cè)的準(zhǔn)確率較低,無(wú)法有效減少翻箱。
(2)目前對(duì)堆存時(shí)間的預(yù)測(cè)采用了分類(lèi)的方式,在分類(lèi)的時(shí)間段內(nèi),還是會(huì)產(chǎn)生較多翻箱。
(3)當(dāng)前僅對(duì)進(jìn)口外貿(mào)業(yè)務(wù)進(jìn)行實(shí)船測(cè)試,沒(méi)有擴(kuò)展至整個(gè)港口堆場(chǎng)進(jìn)行實(shí)船測(cè)試。
(4)降低翻箱的方法當(dāng)前僅從集裝箱卸船前的堆場(chǎng)策劃中出發(fā),沒(méi)有從二次翻箱的角度對(duì)翻箱路徑優(yōu)化方面進(jìn)行考慮來(lái)降低堆場(chǎng)翻箱[14-18]。
本研究雖然從實(shí)船測(cè)試中取得一定效果,但還需要進(jìn)一步研究,以實(shí)現(xiàn)最佳的降低翻箱方案。從當(dāng)前研究的不足之處開(kāi)始,進(jìn)一步的研究方向可從以下幾個(gè)方面開(kāi)始:
(1)嘗試從數(shù)據(jù)角度思考,從試點(diǎn)中采取措施規(guī)范數(shù)據(jù)錄入,或找到最合適的數(shù)據(jù)處理方法,提高數(shù)據(jù)質(zhì)量及預(yù)測(cè)的準(zhǔn)確性。
(2)嘗試從模型角度思考,進(jìn)行模型優(yōu)化,提高模型準(zhǔn)確性。
(3)擴(kuò)大堆場(chǎng)的測(cè)試范圍,進(jìn)一步驗(yàn)證該研究對(duì)降低堆場(chǎng)翻箱情況的實(shí)際效果。
(4)從其他作業(yè)出發(fā),找到降低翻箱的最優(yōu)方案[19-22]。
(5)考慮構(gòu)建影響集裝箱堆存時(shí)間的相關(guān)特征,并加以分析和建模。