胡長英,李 飛,董鎖成
(1.中國人民大學數學學院,北京 100872;2.中國科學院地理科學與資源研究所,北京 100101)
黨的十九大報告把污染防治作為決勝全面建成小康社會的三大攻堅戰之一,提出構建以政府為主導、企業為主體的環境治理體系,落實企業環境治理主體責任重大戰略任務。排污者是污染治理的責任主體,強化其環保責任有助于改善環境質量,推動形成規范公平的市場競爭環境。中央政府制定了一系列的法律、法規來防治工業污染,如《中華人民共和國固體廢物污染環境防治法》《中華人民共和國水污染防治法》《中華人民共和國大氣污染防治法》等,規定各方在生態環境保護、污染防治等領域全方位開展工作;我國現行有效的國家污染物排放(控制)標準達160余項,對重點地區重點行業執行更加嚴格的污染物排放限值,在促進技術創新和推動企業升級改造方面發揮了重要作用。地方政府要根據改善環境質量的需要和經濟、技術條件制定切實措施達到污染物排放目標;而環境保護如何與地方產業協調發展,是地方政府面臨的突出問題。地方政府寄希望于企業自主提高環境意識,自我環境約束達到國家排放標準目標還面臨諸多問題。應規定企業對其產生的污染要承擔的責任和義務,以及采取切實可行的獎懲措施,督促企業完成“三廢”治理工作,切實做到外部成本內部化。地方政府該如何制定獎懲措施,才能既使企業的排污工作達到環境標準,又不影響企業的生產積極性?本文將嘗試建立政府和企業之間的雙層優化環境治理模型,研究地方政府加強環境管理,督促企業積極改善污染排放的可行方案。
區域環境問題的政企博弈在主導產業重工業化特征明顯、企業長期粗放式生產排污嚴重、地方政府環境監管有待加強、西北生態安全屏障和黃河流域健康發展受到嚴重威脅的寧蒙沿黃地帶表現典型[1-6],部分文獻對重污染產業區企業污染問題進行了研究[7-18],但很多是對企業的污染行為進行分析,強有力的環境管治措施研究有待加強,尤其缺乏數理推導研究。發達國家企業對其產生的污染責任明晰,尤其是ISO14001環境標準頒布后,企業相繼加入環境認證。但很多企業環境責任承擔嚴重不足,也沒有考慮加入ISO14001體系,環境管理一直處于滯后狀態,很多企業為了節省成本將“三廢”直接排放,我國以寧蒙沿黃地帶為代表的廣大西北地區尤為典型。經調研發現,出現污染事故的企業大多都清楚超標排放污染物屬違規行為,也清楚工業垃圾對環境的危害,更知道該如何避免或減少環境污染。但是處理“三廢”不但需要購買各種過濾、凈化設備以及改進技術等,還需要租用場所、培訓工人等,增加企業支出,很多企業為了降低生產成本而不愿治理[19]。雙層規劃法(主從決策法)在20世紀70年代由Chandler和Norton等人最早提出,雙層規劃法考慮了決策過程中不同決策者(上層和下層,又稱領導與隨從)的作用和表現,現在已被廣泛地應用于經濟管理、金融、交通、環境保護等領域。近些年,一些學者開始關注環保問題,借助雙層優化環境治理模型來探討實際生產中,如何讓企業在追求經濟效益的同時主動保護環境,如基于環境保護的雙層優化選址模型[20]、產品回收再生產的閉環雙層物流模型[21]等。目前用雙層優化方法來探索地方政府如何制定獎懲措施來督促企業排污達標的研究還有待完善,尤其西北重污染區相關研究較為缺乏。本研究將建立以地方政府為上層、企業(尤其重污染企業)為下層的雙層優化環境治理模型,討論上層地方政府如何制定獎懲措施和污染稅費比例,能使下層企業在追求經濟利益的同時主動治理其產生的污染,達到環境治理目標。首先,基于地方政府決策變量與企業決策變量,確定上層—下層目標函數及約束條件,建立地方政府與企業之間關于治理廢水、廢氣和廢渣的雙層優化環境治理模型,研究地方政府環境獎罰政策與企業利潤及環境行為的關聯性;然后,給出模型解的存在性條件,提出模型“樂觀最優解”與“悲觀最優解”及地方政府獎懲機制最優解;最后,進一步分析政府的環境治理獎懲方式和稅費比例對企業利潤及環境行為的影響,并進行政策討論,以期為寧蒙沿黃地帶及類似地區強化排污者責任、實現國家排放標準目標、實現環境經濟協調可持續發展提供參考。
寧蒙沿黃地帶是我國西北老工業基地和典型資源型城市的集聚區域,是我國西北乃至整個西部的重要增長極[1],基本形成了以能源、建材、冶金、裝備制造業等為主導的重化工業體系,寧東能源重化工基地和陜北新興能源重化工基地,也是我國“西煤東運”“西氣東輸”“西電東送”的重要基地之一[2,3]。寧蒙沿黃地帶總體處于工業化初中期階段,二產比重60%左右,重工業比重在80%以上,而三產比重低,很多企業采用的是能耗高、污染重、資源利用率低的傳統生產模式,給當地本來就脆弱的生態系統帶來了巨大壓力,如近20年內蒙古烏海、阿拉善、鄂爾多斯等地在黃河兩岸數十公里的狹長地帶開設工業園區,且多以高能耗、高污染的企業為引進對象,對黃河的環境安全產生了嚴重影響。在沿黃地區經過合理處理處置的城市垃圾、工業垃圾比重不到10%,飲用水源、大氣環境影響著3/4以上的居民[4]。寧蒙沿黃地帶成為我國環境污染最為突出的區域[1-5],單位工業產值“三廢”排放量,特別是大氣污染排放量遠高于全國平均水平,污染治理水平有待提高。地方政府環境規制失位、監管不力是區域環境問題的重要原因。①廢水污染,主要來自化工、冶金、有色金屬等行業。近20年黃河排污量增加了1倍,干流近40%的河段水體功能影響嚴重。從青海經甘肅、寧夏至內蒙古的黃河沿岸,能源、重化工、有色金屬、造紙等高污染工業廢水排放量逐年增大[5]。②大氣污染,主要來自燃料燃燒和工業生產過程。前者污染物主要為顆粒物、硫氧化物和氮氧化物等,涉及火電、鋼鐵、焦化等行業;后者污染物主要有粉塵、含硫化合物、VOC、含氮化合物以及鹵素化合物等,涉及化工、石化、鋼鐵、水泥等行業。沿黃地區工業SO2排放量仍是全國平均水平的2倍左右。在2018年全國空氣污染城市排名中,石嘴山、包頭、蘭州、銀川、呼和浩特等沿黃城市的污染程度均在前列。③固體廢棄物污染,主要包括礦山尾礦、粉煤灰、鍋爐渣、冶煉廢渣等。很多工業垃圾未經處理直接排放,直接威脅生態系統安全[6]。

其中,y1,y2,y3分別表示企業每月治理廢水、廢氣和廢渣的量,是企業決策變量;表示企業治理“三廢”的總和,政府希望通過調整處罰方案z=(z1l,z2m,z3n)來促使下層企業盡可能大;為企業治理效果的稅收獎勵。若企業治理的“三廢”全部達標,則,企業稅收獎勵為正。因此,政府希望通過調整(z,u)來增加這一部分的值,數值越大,說明企業治理的效果越好。故上層政府的規劃為:

約束條件表示地方政府對企業的處罰金額是非負的(政府的處罰不能高于某個企業所能接受的最大數值);稅收比例介于0和1之間。
設企業只生產一種產品(多種產品同理),其決策變量為(x,y)=(x,y1,y2,y3),其中x表示企業每月的總產量,y=(y1,y2,y3)表示企業每月治理的“三廢”的量,故下層企業的目標函數利潤為:

其中,εi xi中i=1,2,3表示企業每月產生的廢水、廢氣和廢渣的量(常量);εi中i=1,2,3表示總產量為x時產生的廢水、廢氣和廢渣的比例(常量);p,c分別表示該種產品的平均單位價格和平均單位成本(常量);(p-c)x表示企業生產該種產品的月平均利潤。c1l(l=1,2,…L)表示企業治理單位廢水中第l種污染物的成本(常量);表示企業治理y1體積廢水需要花費成本;則表示企業因為沒有治理ε1x-y1的廢水而受到的懲罰金額。若ε1x=y1,即企業將產生的廢水全部治理,則受到的懲罰為零。同理,)(ε3x-y3)z3n]表示企業治理y2與y3的廢氣與廢渣而花費的成本和懲罰。表示企業應納稅的總額,其中α0是企業的正常稅費比例。表示政府對于企業已經治理的廢水、廢氣和廢渣的治理效果的納稅獎罰比例。故下層企業的規劃為:

其中,約束條件表示企業的月生產量非負且不超過月最大生產能力a(a是常量,由企業的生產能力決定);企業治理“三廢”的量yi,i=1,2,3不超過每月產生“三廢”的量εix;企業的生產成本cx和治理“三廢”的成本總和不能超過企業所能接受的最大值A。
標記整個雙層優化環境治理模型為(P),則由(P)可看出,地方政府每采取一個獎罰政策(z,u),企業會相應地給出使自己利潤最大的生產、治理方案(x,y),依據該方案企業制定產量及污染治理對策。地方政府可根據企業的決策方案調整其獎懲力度,實現區域環境目標。
記雙層優化環境治理模型(P)的可行集為:

滿足上層規劃約束條件,x,y滿足下層規劃約束條件。上層的約束集為:

對于給定的上層變量(z,u),記下層可行解集為:

滿足下層規劃約束條件。
下層的約束集是非空有界凸多面體,也是閉集。而下層最優解集記為:

滿足下層規劃約束條件。這里Ψ(z,u)是點到集合映射。
引理1[20]:如果上層約束集W是非空緊集,對于每個給定的上層變量(z,u)∈W,下層至多有一個最優解,且可行集S非空,則雙層優化問題(P)至少有一個最優解。
顯然,適當選取參數,可保證雙層優化問題(P)滿足引理1所有條件,使該模型至少存在一個最優解。
3.2.1 樂觀最優解
樂觀最優解是指上層領導者(地方政府)樂觀地認為其有能力去影響下層(重污染企業)的行為,使得后者選擇最利于上層目標函數的行動,此時求解模型得到的解為樂觀最優解。
令函數φo(z,u)=maxx,y{F(x,y,z,u):(x,y)∈Ψ(z,u)},則樂觀的雙層優化環境治理模型為:

引理2[22]:對于樂觀優化模型(P1),如果可行集S是非空緊集,下層問題在任何點(x,y)∈M(z,u)處滿足(MFCQ)條件,則問題(P1)如果存在可行解,一定存在全局最優解。
問題(P1)的全局最優解稱為原雙層優化問題(P)的全局樂觀最優解,在此認為不論企業是積極采取措施治理污染還是在政府的強制措施下治理污染,都是一種與政府合作的態度,故視為“樂觀”情形。
3.2.2 悲觀最優解
悲觀最優解是指政府無法保證企業會按照自己期望的方式治理污染,此時求解模型得到的解稱為悲觀最優解。本文中悲觀情形特指企業不愿治理污染,并將部分有危害的“三廢”直接排放到外界環境中。
令函數φp(z,u)=minx,y{F(x,y,z,u):(x,y)∈Ψ(z,u)},則悲觀的雙層優化環境治理模型為:

悲觀優化模型(P2)不能保證有解,但是當下層最優解集Ψ(z,u)滿足下半連續時,全局悲觀最優解存在。
引理3[22]:對于悲觀問題(P2),如果點到集映射Ψ(z)是下半連續的,且可行集S是非空緊集,則問題(P2)如果存在可行解,一定存在全局最優解。
問題(P2)的全局最優解稱為原雙層優化問題(P)的全局悲觀最優解。這樣不管是企業愿意與政府合作的樂觀情形,還是不情愿合作的悲觀情形,只要適當地調整模型的參數,就可以找到最優解。問題(P1)和(P2)是雙層優化問題(P)的兩個特殊情形,下面地方政府的獎懲及稅費措施對企業決策及效益的影響分析將會說明這兩種特殊情形的存在條件。而對于一般的雙層優化問題(P),用于求解該類模型的有效算法比較多,如罰函數算法[22-24]、信賴域算法[25]、SQP算法[26]、SLP算法[27]等。在此利用間隙函數將其轉化為單層模型后,采用罰函數方法求解。
設函數φ(z,u)=maxx,yf(x,y,z,u),定義間隙函數為G(x,y,z,u)=φ(z,u)-f(x,y,z,u)。
因此,雙層優化問題(P)可以等價于下面的單層優化問題(P3)[22,23,27,28]:

(P3)中約束G(x,y,z,u)=0使得模型不滿足一般的約束規格(如MFCQ條件、LICQ條件等),模型難以求解,故研究求解模型(P3)時,先去掉該約束G(x,y,z,u)=0,求解后對于給定的任意小正數ε>0,驗證不等式G(x,y,z,u)≤ε是否成立,如果成立,則認為得到了近似最優解,否則繼續迭代。算法結束時得到解(x*,y*,z*,u*),此時F(x*,y*,z*,u*)達到相對最大值,從而地方政府得到了最佳的獎懲政策(z*,u*),該政策既可最大限度地保護環境,又不影響企業的生產積極性,同時企業也相應地得到了使自己利潤最大的生產和污染治理方案該方案讓企業在獲得利潤的同時,也實現了綠色生產,提高了企業的競爭力和聲望,使政府和企業達到雙贏。
下面研究上層政府的處罰金額z對下層企業治理量y=(y1,y2,y3)的影響。因為


處罰z1l>c1lθ1l,l=1,2,…,L時,即地方政府對企業單位體積廢水中第l(l=1,2,…,L)種污染物超標部分的處罰金額嚴格大于企業治理該種污染物的單位成本的1lθ(l=1,2,…,L)倍時,企業目標函數(利潤)是污水治理量y1的增函數,即下層企業治理的污水量y1越多,利潤越大。故此時企業會愿意與政府合作,主動治理廢水中的各種污染物。為了探尋處罰上界,令其中y1=0,則解得令λ1=min{β1l-δ1l},則有,即在完全不考慮廢氣和廢渣的前提下,政府對企業污水這一項處罰的金額總和要遠小于
同理可分析z2m,z3n(m=1,2,…M,n=1,2,…,N)對下層目標函數的影響。為督促企業治理“三廢”,政府的處罰值應該大于企業治理污染物的單位成本的θ倍,但不要超過給定的上限。
結論1:對于雙層規劃模型(P):
(1)當z1l>c1lθ1l,l=1,…L(z2m>c2mθ2m,m=1,…,M,z3n>c3nθ3n,n=1,…,N),且時,企業利潤隨著廢水(廢氣、廢渣)的治理量的增加而增加,故企業愿意主動治理廢水(廢氣、廢渣)。
(2)當0≤z1l<c1lθ1l,l=1,2,…,L(0≤z2m<c2mθ2m,m=m=1,2,…,M,0≤z3n<c3nθ3n,n=1,2,…,N)時,企業的利潤隨著廢水(廢氣、廢渣)的治理量的增加而減少,故企業不愿意主動治理廢水(廢氣、廢渣)。
(3)z1l=c1lθ1l,l=1,2,…,L,(z2m=c2mθ2m,m=1,2,…,M,z3n=c3nθ3n,n=1,2,…,N)時,企業的利潤不受廢水(廢氣、廢渣)的治理量多少的影響。
模型解第一種情形為樂觀最優解。地方政府需要將處罰金額定在第一種情形的范圍內。第二種情形此時模型的解為悲觀最優解。第三種情形中,如果政府不能勸說下層企業治理污染,政府的目標函數值有可能達到最小值零。
結論2:地方政府制定的污染稅費比例u=(u1,u2,u3)在不同范圍時,企業的決策會有很大不同。

對于企業治理“三廢”,地方政府給予的污染稅費的比例不同,企業會有不同的決策反應。當污染費用的比例大過某個數值時,企業治理效果越好,利潤越高,自然會積極提高其“三廢”治理水平;而當污染費用的比例小過某個數值時,企業治理效果越好,利潤越低,此時企業不愿意提高治理效果;當污染稅費比例在某個范圍內變動時,企業治理效果不對其利潤產生影響,此時企業可以選擇治理達標或者不達標。
污染防治是決勝全面建成小康社會的三大攻堅戰之一。在我國環境法規與行業標準日益健全的情況下,如何加強地方政府環境監管,協調地方環境—經濟效益至為關鍵。我國很多重污染區,包括西北寧蒙沿黃地區雙高企業“三廢”排放嚴重影響區域生態環境安全,嚴重制約區域協調可持續發展及沿黃戰略性生態屏障建設;而地方政府環境管理缺位,尤其需要切實可行的獎懲機制來促使企業排污達到國家標準。如何制定獎懲標準是關鍵所在。為此,本研究建立了以地方政府為上層、企業為下層的雙層優化環境治理模型,促使企業經濟效益與環境效益共舉,能夠較為合理、可行地反映區域地方政府與企業的博弈過程。除了國家污染物排放標準(常數)外,模型其余參數均決定于地方企業,雖然不同企業的生產成本和排污技術水平不同,但對于每一企業在一定時期內給定的其他條件不變時其參數值與技術工藝水平關聯可視為常量。對于寧蒙沿黃地區重污染企業,可應用此模型來探索督促企業“三廢”治理工作,地方政府可根據不同企業類型制定不同的獎懲標準和污染稅費比例,對于企業“三廢”處罰金額要定在企業治理該污染物單位成本θ倍以上;而對于企業治理“三廢”部分,地方政府可將污染稅費比例u=(u1,u2,u3)定在模型求得數值以上,使企業實現自身利潤與環境治理良性循環。