霍晴晴, 郭健全
(1. 上海理工大學 管理學院,上海 200093;2. 上海理工大學 中德國際學院,上海 200093)
由于人口增長和醫療技術領域的發展,醫療廢棄物的數量和組成在過去30年中急劇增加[1]??焖僭鲩L的醫療廢棄物如果不能及時回收,將對自然環境和人類健康造成嚴重影響[2]。因此,有必要建立可持續性回收網絡,科學有效地回收處理醫療廢棄物[3]。Hong等[4]運用生命周期法評估了醫療廢棄物處理對環境與經濟的影響。文獻[5]運用故障樹方法分析了傳染性醫療廢棄物對人類和環境的影響。文獻[6]以波蘭為例,研究可持續醫療廢棄物管理系統的物流約束因素。當前對醫療廢棄物可持續性回收的研究尚未構建其系統性的數學模型,且未考慮回收網絡中的社會效益。然而部分醫療廢棄物具有高毒性、高傳染性,處理及運輸過程中可能對工人健康造成危害[7],社會效益的研究對相關人口福利的影響是重大的[8]。因此,本文以醫療廢棄物為研究對象,考慮回收網絡經濟成本與環境影響的同時,統籌社會效益,從整體上構建可持續性回收網絡模型。
物流網絡的運作是一個周期性的過程[9],多周期運作對物流網絡系統中設施選址與配送路徑規劃具有重要影響[10]。John等[11]以利潤最大化為目標,構建了廢舊冰箱多周期逆向物流網絡。Kumar等[12]考慮成本和利潤構建了多周期逆向物流模型,規劃車輛最優路徑,并用進化算法求解。周向紅等[13]考慮再制造回收過程的多周期性,以及不同回收成本的構成,研究了回收量和目標調節系數變化對選址規劃的影響。醫療廢棄物發生傳染性的風險會隨回收時間的延長而增大[14],多周期能提高其回收頻率,降低風險。然而,當前文獻尚未研究如何將多周期規劃運用于醫療廢棄物可持續性回收網絡的設計,因此,本文構建醫療廢棄物多目標可持續網絡模型的同時,考慮其多周期規劃。
不確定參數是物流網絡規劃中重要的影響因素[15]。許闖來等[16]考慮快遞需求的不確定性,構建基于情景集的魯棒優化模型。李進等[17]以供應鏈網絡的總成本和碳排放總量最小化為目標,建立了機會約束多目標隨機規劃模型。楊曉華等[18]考慮生鮮產品需求與退貨的不確定問題,構建了新零售下生鮮閉環物流網絡模糊規劃模型。魯棒優化能有效應對模糊參數的變化和擾動,但過于注重置信水平,求解結果較為保守[19]。隨機規劃缺少對歷史統計數據精確性的考慮,且多場景求解具有高復雜性[20]。模糊規劃可解決缺少參數真實值的問題,且根據決策者態度限定約束的置信水平,具有一定的靈活性,符合企業決策的實際情況[21]?;诖?,本文采用模糊規劃規避回收量不確定性在醫療廢棄物回收網絡中的影響。
綜上,本文以最小經濟成本、最小環境影響、最大社會效益為目標,考慮醫療廢棄物回收量的不確定性,構建了模糊環境下醫療廢棄物多目標多周期可持續性回收網絡模型。經濟成本包括回收網絡中各節點的固定建設成本、運營成本與設施維持成本;環境影響包括各節點間車輛運輸中產生的碳排放;社會效益包含為降低處理過程中員工可能受到危害而提供的培訓時長。為求解該模型,利用模糊機會約束規劃方法等價轉換為清晰式,并通過定義目標隸屬度對模型中的子優化目標進行模糊化,將原始優化問題轉換為基于最大滿意度的單目標優化問題。以上海市某醫療廢棄物回收企業為例,通過遺傳算法(GA)分別對單周期與多周期的單目標與多目標求解,通過對比分析計算結果,驗證了模型的有效性。
醫療廢棄物回收網絡結構如圖1所示,主要由醫療機構、暫存處置中心、分類檢測中心、處理廠、回收加工廠5部分組成。

圖 1 醫療廢棄物回收網絡結構圖Fig.1 Structure of the medical waste recycling network
在一個周期內,運輸車輛在規定時間內將各醫療機構的醫療廢棄物運送至附近的暫存處置中心進行集中;暫存處置中心將一定數量的醫療廢棄物集中運送至分類檢測中心進行分類處理;分類檢測中心將可循環利用的廢棄醫療器械等廢棄物消毒處理后運送至回收加工廠進行再循環,與此同時,將不可再利用的廢棄物送至處理廠進行無害化處理。
1.2.1 模型假設
a. 醫療機構、處理廠、回收加工廠的位置和數量已知;
b. 暫存處置中心、分類檢測中心的候選位置與數量已知;
c. 各節點間的運輸成本與運輸量和運輸距離成正比[22];
d. 運營成本包含運輸成本;
e. 節點間的距離并非兩點間的直線距離,而是貨車行駛距離;
f. 各節點CO2排放量與醫療廢棄物處理量成正比;
g. 運輸過程中CO2排放量與運輸量和運輸距離成正比;
h. 員工經過培訓而減少的工傷請假時數由節點歷史數據預估得出;
i. 各運輸車輛與節點設施均符合醫療廢棄物運輸與處置特殊要求。
1.2.2 符號
c代 表 醫療 機 構,c∈{1,2,· · ·,C};s代表 暫 存處置中心,s∈{1,2,· · ·,S};d代表分類檢測中心,d∈{1,2,· · ·,D};p代表處理廠,p∈{1,2,· · ·,P};r代表回收加工廠,r∈{1,2,· · ·,R};v代表運輸車輛,v∈{1,2,···,V};k代表運輸路線,k∈{1,2,· · ·,K}。
1.2.3 參數
Fs代表暫存處置中心的固定建設成本;Fd代表分類檢測中心的固定建設成本;Fp代表處理廠的固定建設成本;Fr代表回收加工廠的固定建設成本;Os代表暫存處置中心的運營成本;Od代表分類檢測中心的運營成本;Op代表處理廠的運營成本;Or代表回收加工廠的運營成本;mas代表暫存處置中心的設備維持成本;mad代表分類檢測中心的設備維持成本;map代表處理廠的設備維持成本;mar代表回收加工廠的設備維持成本;discs,dissd,disdp,disdr分 別 代 表 兩 節 點 間的 距 離 ;Qcs,Qsd,Qdp,Qdr分別代表兩節點間的運輸量;qCO2代表車輛載重單位重量的醫療廢棄物行駛單位距離排放的 C O2;hs代表暫存處置中心為員工提供的培訓時數;hd代表分類檢測中心為員工提供的培訓時數;hp代表處理廠為員工提供的培訓時數;hr代表回收加工廠為員工提供的培訓時數;cac,cas,cad,cap,car分別代表各節點的處理能力;rert代表t時期醫療廢棄物回收量的模糊值。
1.2.4 決策變量
Xst為0-1變量,若在t時期選擇候選暫存處置中心,則Xst=1,否則為0;Xdt為0-1變量,若在t時期選擇候選分類檢測中心d,則Xdt=1,否則為0;Xpt為0-1變量,若在t時期選擇處理廠p,則Xpt=1,否則為0;Xrt為0-1變量,若在t時期選擇回收加工 廠r, 則Xrt=1, 否則 為0;kcst,ksdt,kdpt,kdrt為0-1變量,若t時期在兩節點間運輸時選擇路線k,kcst,ksdt,kdpt,kdrt為1,否則為0。
1.2.5 數學模型的建立
單周期經濟成本

多周期經濟成本

各個周期的環境影響

各個周期的社會效益

式(1),(2)分別表示醫療廢棄物回收網絡中單周期、多周期的各類經濟成本之和。經濟成本包括節點固定建設成本、運營成本、維持成本。其中,固定建設成本為建設節點所需的固定成本;運營成本包括節點運營所需的人力、物力成本;維持成本為節點維持運轉的設備維護費用。
式(3)表示醫療廢棄物回收網絡中各個周期的環境影響,由于運輸是該系統的主要活動,因此,考慮運輸過程中產生的CO2排放量[23]。CO2排放量由各節點間的距離、單位排放量決定。
式(4)表示醫療廢棄物回收網絡中各個周期的社會效益。在社會效益指標的選取上存在很大差異,Ramos等[24]指出有關就業和健康影響的指標相對來說較為重要。由于培訓可提高員工技能,減少工傷,因此,本文將為員工提供的培訓時數作為社會效益的指標。


式(5)、(6)表示流量均衡約束,式(7)~(11)表示容量均衡約束,式(12)~(15)表示至少選擇一個暫存處置中心、分類檢測中心、處理廠和回收加工廠,式(16)表示至少有一條完整的線路完成整個回收網絡的運輸,式(17)表示運輸量非負。
醫療廢棄物回收量rert為模糊參數,因此,醫療廢棄物回收網絡模型為約束條件不清晰的規劃問題。模糊機會約束規劃方法(FCCP)因能規避不確定參數的影響而被廣泛應用于此類復雜問題的求解[25]。通過將回收量看作三角模糊參數,即其中,rert1為企業制定的置信水平上界,rert3為企業制定的置信水平下界,rert2為最可能值。同時控制約束條件成立的概率在企業制定的置信水平之上,使模糊對應式轉變為等價的清晰約束。其模糊隸屬函數如式(18)所示。

根據FCCP的清晰化定義及引理可知[26]:若三角模糊數r為則對任意給定的置信水 平α( 0≤α≤1) , 當 且 僅 當 滿 足 特 定 條 件成立。
根據引理[26],約束(5)可轉換為如下清晰等價約束:

不同于單目標優化,多目標的子目標間往往存在沖突,各子目標優化的同時會引起其他子目標性能的降低,從而影響多目標的最優解[27]。模糊多目標規劃通過選擇合適的隸屬度函數,對多個相互沖突的子目標分別進行組合優化,從而得到多目標最優解的集合[28]。參考文獻[29],選擇如下隸屬度函數:

式中:gs表示越小越優型目標函數;gv表示越大越優型目標函數; μg(x)表示E的隸屬度函數;μ的大小反映了優化結果的滿意度, 0 ≤μ≤ 1;λ和γ分別表示形狀系數,λ,γ> 0 且不為 1;gvmin,gvmax和gsmin,gsmax分 別表示gv和gs的最小值、最大值。
引入變量ζ,將原目標函數轉化為約束條件,即 μg(x)≥ ξ(0≤ζ≤1),則此時模型可轉化為 m axξ的單目標函數。根據上述原理,本研究所構建的多目標模型可表示為 m axξ,此時約束條件除包括式(5)~(17),還包括


在所有約束條件下先求出各子目標的最優解,再根據這些最優解確定隸屬度函數,使交集的隸屬度函數取最大值,即為多目標問題的最優解。
遺傳算法是根據遺傳學機理和達爾文自然選擇理論而形成的元啟發式算法,具有全局搜索、高效、智能及并行等特點,被廣泛應用于大規模網絡構建等問題的求解[30]。在生物進化過程中,每個生物體都有自己獨一無二的基因序列,因此,通過不同的編碼序列可以表示各種多目標組合,具體操作如下:
a. 染色體編碼與初始化。根據企業制定的置信水平在所有多目標組合中選擇初始種群本體,計算機中每個種群本體都有與其對應的染色體基因編碼。多目標集合由n個多目標組合組成,表示為E={E1,E2,E3,···,En},每個多目標組合又包括3個子目標,子目標矩陣表示為E=每個子目標矩陣對應唯一的二進制編碼,如圖2所示。

圖 2 染色體組Fig.2 Genome
b. 適應度評估與選擇。對各子目標進行綜合評價,計算初始本體各項性能的適應度值,然后根據優化準則進一步進行優化,保留適應度值高于上一代的本體,并將其作為新一代本體,同時淘汰適應度值低的個體。本文選取的適應度函數

c. 交叉與變異。按照一定的交叉和變異方法生成新的子代種群,并作為新的一代融入多目標組合集。交叉操作決定遺傳算法的全局搜索能力,變異操作增強算法的局部搜索能力。
d. 終止條件。在優化過程中,種群個體相同且連續20代個體都無任何改進或者達到預先設定的最大迭代次數,即可終止迭代。設置最大迭代次數為400,交叉概率為0.9,變異概率為0.05。
現以上海市某醫療廢棄物回收企業為例,該企業服務的醫療機構分布在上海各區,選取各區回收量最大的一家醫療機構為代表,各代表機構位置坐標及各周期廢棄物回收模糊量、距候選暫存處置中心的距離如表1所示。2個候選暫存處置中心位置坐標為s1(3.5,7.0),s2(5.1,17.3),2個候選分類回收中心位置坐標為d1(8.5,11),d2(0.5,17.0),處理廠的位置坐標為p(1.1,3.7),回收加工廠位置坐標為r(1.9,1.9)。假設回收車輛回收醫療廢棄物單周期長度為2 d(我國醫療廢物回收政策規定醫療廢物必須在48 h內完全回收[31]),多周期中分為3個周期(精確的周期長度劃分依照廢棄品總量及暫存產生的有害性決定),其他參數值如表2所示。

表 1 各醫療機構相關參數Tab.1 Related parameters of medical institutions
采用Matlab2018a軟件編寫GA代碼,首先對醫療廢棄物可持續回收網絡各周期的3個子目標進行尋優,接著對子優化目標進行模糊化,將原始多目標問題轉化為基于最大滿意度的單目標優化問題,進而求得多目標問題的最優解。進一步將CPLEX算法與GA算法迭代曲線對比,驗證了算法的有效性。GA迭代計算后各周期各目標的優化結果如表3所示,單周期多目標的最優路徑如圖3所示,多周期各周期多目標的最優路徑如圖4~6所示。CPLEX與GA算法對應的多目標規劃方案的滿意度分別如圖7和圖8所示。

表 2 其他相關參數Tab.2 Other relevant parameters
從多周期角度結果分析可得:a. 多周期經濟成本低于單周期成本。單周期回收路徑與設施選址均固定,不利于企業根據實際回收量與回收需求及時調整路徑與開放相應容量的設施點,從而造成資源浪費。b. 多周期環境影響大于單周期影響。多周期回收頻率增加,車輛行駛里程增加,二氧化碳排放量也相應上升。c. 多周期社會效益大于單周期效益。多周期中工人處理廢棄物的頻率上升,熟練度增加,同時單次任務量下降,均有利于減少處理過程中的傷害。
從多目標結果分析可得:a. 多目標最優組合中經濟成本均高于經濟目標最優時的成本,但低于環境、社會目標最優時的成本。b. 多目標最優組合中環境影響均大于環境目標最優時的影響,但小于經濟、社會目標最優時的影響。c. 多目標最優組合中社會效益均小于社會目標最優時的效益,但高于經濟、環境目標最優時的效益。

表 3 各周期各目標最優 GA 計算結果Tab.3 Calculation results of the optimal GA for each target in each period

圖 3 單周期多目標最優Fig. 3 Multi-objective optimization in a single period

圖 4 第一周期多目標最優Fig. 4 Multi-objective optimization in the first period

圖 5 第二周期多目標最優Fig. 5 Multi-objective optimization in the second period

圖 6 第三周期多目標最優Fig. 6 Multi-objective optimization in the third period
綜上,多周期回收網絡路徑規劃、設施選址更加靈活;多目標組合中各子目標均未達到最優,但總體優化結果優于單目標優化,在優化成本的同時兼顧了環境影響、社會效益,更加符合企業實際情況。

圖 7 CPLEX 收斂性Fig. 7 CPLEX convergence

圖 8 GA 收斂性Fig. 8 GA convergence
本文以回收量不確定條件下醫療廢棄物多周期回收網絡可持續性為背景,在考慮經濟成本、環境影響的同時,將社會效益納入可持續回收網絡多目標模型,并以上海市某醫療廢棄物回收企業為例,通過GA求解各周期各目標最優解組合。將模型運用于實例進行研究,GA尋優結果表明多周期多目標回收網絡比單周期單目標更能兼顧系統各目標的平衡,從而驗證了模型的有效性。該模型不僅適用于醫療廢棄物回收網絡,也為其他危險廢棄物回收網絡構建提供借鑒。
本文在多周期下僅考慮了與單周期的對比,并未考慮不同周期長度下各多周期對比,可進一步探討多周期下如何選取最佳周期長度;在求解算例時,運用了遺傳算法,然而求解復雜物流網絡規劃的元啟發式算法是多樣的,下一步可探討如何將魚群算法、粒子群算法等應用到模型求解中;在算例部分,僅針對醫療廢棄物進行了研究,下一步可考慮模型對于其他危險廢棄物回收問題的適用性。