蔣青嬗,黃 燦,李毅君
(1. 廣東外語外貿大學數學與統計學院,廣東 廣州 510006; 2. 廣東工業大學管理學院,廣東 廣州 510520;3. 中山大學嶺南學院,廣東 廣州 510275)
效率衡量現有水平下生產單元獲得最大產出的能力。隨機前沿模型是效率測算的常用方法,得到較多理論和實證研究[1-3]。經典的隨機前沿模型假定技術無效率項的分布是連續的,從而所有生產單元的技術無效率項均大于零,生產單元技術無效(技術無效率項大于零對應技術效率小于1,此時生產單元技術無效。技術無效率項等于零對應技術效率等于1,此時生產單元技術有效)。經典的隨機前沿模型以及后續的拓展隱含著生產單元技術無效的前提。
Kumbhakar等[4]首次構建了零無效率隨機前沿模型(Zero inefficiency stochastic frontier model,簡稱ZISF)。該模型屬于潛在類別模型(Latent class model),包含回歸模型和隨機前沿模型兩個分類,兩類模型各有一定的發生概率且概率之和為1。其中回歸模型可刻畫技術有效生產單元,隨機前沿模型可刻畫技術無效生產單元,因此ZISF能夠適用于技術有效和技術無效生產單元同時存在的情形。Kumbhakar等[4]和Abdulai和Abdulai[5]的實證分析表明,在技術無效和技術有效生產單元同時存在的情形,使用經典的隨機前沿模型導致技術效率的測算不準確,ZISF有存在必要性。
目前關于ZISF的理論拓展相對較少,主要集中在模型構建和估計方面。具體可歸納為:①非參數或半參數拓展。經典的ZISF假設自變量與因變量參數線性并假設回歸模型的發生概率與相應解釋變量參數線性,但上述兩組變量在許多情況下呈現非非線性關系。同時,經典的ZISF需事先設定生產函數(即前沿面)的形式,當函數關系不明確時容易出現函數形式誤設進而影響估計結果。Yao Feng等[6]在生產函數中引入非參函數,Tran和Tsionas[7]假設回歸模型的發生概率為非參函數,分別研究了目標模型的估計。②空間模型拓展。由于位置相鄰、模仿、溢出和測量誤差等原因,相鄰生產單元極可能存在空間相關性。忽略空間效應將導致估計量有偏且不一致,技術效率的估計也將不可靠。蔣青嬗和韓兆洲[8-9]首次在ZISF中引入空間效應并研究模型估計。隨機前沿模型也有相應空間拓展可以借鑒,如Kutlu[10]和Glass等[11]。③內生性拓展。經典的ZISF假設自變量與誤差項不相關,該假定相對嚴苛。違反該假定將引發內生性,相應估計量將有偏且不一致。Tran和Tsionas[12]首次研究了ZISF的內生性,使用有限信息極大似然方法得到無偏一致估計量。④其他拓展。如Rho和Schmidt[13]完善了ZISF的檢驗以及估計量的漸進性質。Orea和Jamasb[14]將ZISF中的隨機前沿模型的技術無效率項的分布放松為有限混合分布。目前暫無發現其他ZISF相關研究。
鑒于ZISF的理論研究相對不足且已有ZISF適用性相對較低,本文拓展ZISF模型。在ZISF中引入空間效應和非參數效應,構建了半參數空間ZISF。特別地,本文首次在生產函數和回歸模型的發生概率中同時引入非參數效應,適用性更廣且著重考察了不同引入方式對效率測算的影響。使用極大似然方法和JLMS法分別估計參數和技術效率,進行蒙特卡羅模擬考察方法的精度和模型的存在必要性。本文的創新之處在于:①本文模型同時引入空間效應和非參數效應。相比于經典的ZISF,本文模型能有效避免模型誤設(源于引入非參數效應)和忽略空間效應導致的有偏且不一致估計量(源于引入空間效應),因此適用性更佳。②更具體地研究了非參數效應的不同引入方式對效率測算的影響。歸納現有的非參數和半參數ZISF的文獻可知,已有研究分別在生產函數和回歸模型的發生概率中引入非參數效應,僅簡單研究了上述兩類非參數效應對估計精度的影響,得出忽略非參數效應導致精度降低的結論。暫無文獻研究了兩種不同引入方式對精度(估計精度和分類精度)的影響程度。本文模型在生產函數和發生概率同時引入非參數效應(即引入了兩類非參數效應),通過蒙特卡羅模擬考察兩類效應對效率測算的影響。蒙特卡羅結果表明,忽略生產函數的非參數效應僅稍微降低參數和技術無效率項的估計精度,但忽略發生概率的非參數效應會嚴重降低估計精度。因此發生概率的非參數效應更不容忽視。③本文研究了目標模型的估計,為實證研究提供了嚴謹的分析工具。④本文模型基于面板數據且引入隨時間變化的技術效率,相比于經典的ZISF適用性更佳。
Kumbhakar等[4]構建的ZISF包含兩個模型:經典的回歸模型和經典的隨機前沿模型。回歸模型發生時,技術無效率項等于零,此時生產單元技術有效。隨機前沿模型發生時,技術無效率項大于零,此時生產單元技術無效。兩類模型各有一定的發生概率,因此ZISF能同時度量技術有效和技術無效生產單元。在ZISF的基礎上,本文構建如下半參數空間ZISF:
(1)

上述模型等價于:
(2)
其中1{·}為示性函數,滿足括號內條件即為1,否則為0。uti=0的發生概率(即回歸模型的發生概率)為p(1{uti=0}=1)=f2(z2ti)。當f2(z2ti)≡0時,模型退化為經典的隨機前沿模型。當f2(z2ti)≡1時,模型退化為經典的回歸模型。當0 式(1)的生產函數同時包含線性關系和非線性關系,因此屬于半參數模型。相比于已有的ZISF拓展模型,本文構建的模型適用性更廣,具體體現在:①本文模型引入了空間效應,更符合實際情況且可有效避免忽略空間相關性導致的有偏且不一致估計量。目前ZISF的空間拓展非常少,僅蔣青嬗和韓兆洲[8-9]。②本文模型在生產函數和回歸模型的發生概率中同時引入了非參數函數,共計引入兩類非參數效應,適用性更佳。同類研究如Yao Feng等[6]、蔣青嬗和韓兆洲[9]僅在生產函數中引入非參數效應,Tran和Tsionas[7]僅在發生概率中引入非參數效應。而且蔣青嬗和韓兆洲[9]假設回歸模型的發生概率為固定常數,極大限制了模型的適用性。本文同時研究了兩類非參數效應,并在后續的蒙特卡羅模擬中研究兩種引入方式對效率測算的影響。③本文模型基于面板數據,具有面板數據的優勢。同類研究如Kumbhakar等[4]、Tran和Tsionas[7]均基于截面數據。 式(1)含非參數效應,此處首先進行模型轉化。由于B樣條在估計過程中充分利用了樣本的信息,估計的精度較高,此處使用B樣條估計非參函數。對于函數f1(·),參考Huang等[15]和蔣青嬗和韓兆洲[16]的設定,令z1ti有界,t=1,…,T,i=1,…,N。不失一般性,設zti∈[a,b],其中a (3) 令O1ti=(φ11(z1ti),…,φ1mn(z1ti)),τ1=(τ11,…,τ1mn)′。從而式(2)可轉化為式(4),此時式(4)的生產函數已不包含非參數效應。即: (4) (5) 令εti=vti+uti(1-1{uti=0})為復合誤差項。易知當uti=0時,有1{uti=0}=1且εti=vti。當uti≠0時,有1{uti=0}=0且εti=vti-uti。 當uti≠0時,推導可得此條件下εti的密度函數為: (6) 當uti=0時,推導可得此條件下εti的密度函數為: (7) 綜合uti≠0和uti=0的發生概率,可得εti的密度函數為: fε(εti)=p(uti≠0)fε(εti|uti≠0)+p(uti=0)fε(εti|uti=0)=(1-f2(z2ti)) (8) 去除常數項后,模型的對數似然函數可表示為: (9) 因此式(9)可繼續轉化為 (10) (11) 參考Kumbhakar等[4],使用JLMS法(Jondrow等[18],取自四位作者的首字母)測算技術效率。推導可得技術無效率項基于復合誤差項的條件期望為: E(uti|εti)=Euti=0|εtiE(uti|εti,uti=0)=p(uti=0|εti)E(uti|εti,uti=0)+p(uti≠0|εti)E(uti|εti,uti≠0)=p(uti≠0|εti)E(uti|εti,uti≠0) (12) 式(12)中,第三個等式的右邊的第一項p(uti≠0|εti)表示已知復合誤差項的情況下技術無效率項不等于零的概率,第二項E(uti|εti,uti≠0)表示已知技術無效率項不等于零的情況下復合誤差項基于技術無效率項的條件期望,即為技術無效率項不等于零時技術無效率項的點估計,該點估計與JLMS點估計[18]一致。 推導可得: (13) 從而技術無效率項基于復合誤差項的條件期望可表示為: E(uti|εti)= (14) 在原模型中,技術無效率項等于零的發生概率(即回歸模型的發生概率)為f2(z2ti)。在得到參數的估計量后,通過貝葉斯后驗概率,利用后驗信息可把技術無效率項等于零的發生概率更新為p(uti=0|εti)。與式(12)的推導一致,推導可得 p(uti=0|εti)= (15) 本文假設技術無效率項相互獨立,其發生概率不為固定常數且受相關外生變量影響。對于技術無效率項uti,其要么等于零要么不等于零,只有兩種可能。其中等于零的發生概率為p(uti=0|εti),不等于零的發生概率為1-p(uti=0|εti)。若p(uti=0|εti)≥1-p(uti=0|εti),即p(uti=0|εti)≥0.5,有理由認為uti以更大的概率等于零,從而可把uti判定為零。否則可認為uti不等于零并把uti判定為非零。因此基于該法則可確定反向確定技術無效率項的類別(即零或非零)。 為考察方法的有效性和模型的必要性,此處進行蒙特卡羅模擬。具體數據生成過程如下: (16) (17) (18) 此處將本文方法簡稱為MLE,采用三種情況進行對比分析:忽略空間效應的極大似然估計(簡稱為MLE-nSpa),忽略非參數效應f1(·)的極大似然估計(簡稱為MLE-nSemi1)和忽略非參數效應f2(·)的極大似然估計(簡稱為MLE-nSemi2)。上述三種方法有且僅忽略一種效應。MLE-nSp忽略了空間效應,對應模型為半參數ZISF。其對數似然函數為式(10)中去除雅克比項。MLE-nSemi1忽略了非參數效應f1(·),即對非參變量z1ti不采用B樣條展開。由于直接將z1ti以線性方式引入到模型會導致擬合不足,此處對z1ti采用三階多項式樣條展開。即用三階多項式函數c1z+c2z2+c3z3逼近f1(z),其中z為非參變量的任意取值,c0,c1和c2為回歸系數。該類處理在實證分析中較為常見。MLE-nSemi2忽略了非參數效應f2(·),對非參變量z2ti不采用B樣條展開而直接采用三階多項式展開,具體操作與MLE-nSemi1類似。值得強調的是,模型中含兩類非參數效應,MLE-nSemi1忽略了非參數效應f1(·),但并沒有忽略f2(·),對于變量z2ti仍然采用B樣條展開。同理,MLE-nSemi2忽略了非參數效應f2(·),但并沒有忽略f1(·),對于變量z1ti仍然采用B樣條展開。本文沒有研究同時忽略兩類非參數效應的情形,原因在于,模擬預期MLE-nSemi1和MLE-nSemi2的估計精度較低。若模擬結果驗證了該預期,忽略兩類非參數效應的情形估計精度只會更差。將上述三種方法與MLE進行對比,如果估計效果遠不及MLE,則文中文中模型和方法有存在必要性。為保證模擬的可靠性,模擬重復1000次。 表1 參數估計的精度 注:結果展示時將偏差、標準差和均方誤差三個指標上下排列。 圖1和圖2分別展示了f1(·)和f2(·)的擬合曲線和真實曲線。圖1中,True線呈中間高兩頭低的形態,左右兩端各含一個波谷。MLE,MLE-nSpa和MLE-nSemi2三線與True線非常貼合,而MLE-nSemi1與True線相差甚遠。圖2中,True線呈中間高兩頭低的形態,左右兩端各含一個波谷。MLE和MLE-nSemi1兩線與True線非常貼合,MLE-nSpa的形態與True線相似,但在波峰和波谷附近與True線有一定差距。MLE-nSemi2與True線相差甚遠。圖1和圖2表明,現有情況下三階多項式樣條函數無法擬合真實曲線。對于圖1,N=60時MLE與True線更貼合,特別是在波峰附近。對于圖2,N=60時MLE與True線更貼合,特別是在左右兩個波谷附近。從而增加樣本容量有助于提高MLE在非參函數的估計精度。 圖1 函數f1的擬合曲線注:True線為函數f1(·)的真實曲線。 圖2 函數f2的偏離程度注:True線為函數f2(·)的真實曲線。 圖3展示了技術無效率項估計量與真值的偏離程度。由圖3可知,MLE的箱線圖位置最低且箱寬最窄,說明MLE的技術無效率項的估計精度較高。MLE-nSemi1和MLE-nSpa的箱線圖位置偏高且箱寬偏寬,說明MLE-nSemi1和MLE-nSpa的技術無效率項的估計精度偏低。MLE-nSemi2的箱線圖比較特殊,其1/4和1/2分位數較低,接近MLE的1/4和1/2分位數且低于MLE-nSemi1和MLE-nSpa的1/4和1/2分位數。但MLE-nSemi2的3/4和4/4分位數明顯偏大(N=30時3/4和4/4分位數分別為1.2041和2.0592,N=60時3/4和4/4分位數分別為1.3872和1.8915),最終MLE-nSemi2的1/2分位數和3/4分位數之間的箱寬以及3/4分位數和4/4分位數之間的距離非常寬(N=30時MLE-nSemi2的兩寬度分別為1.0388和0.8551,N=60時MLE-nSemi2的兩寬度分別為1.2228和0.5043。而N=30時MLE-nSemi1的兩寬度僅為0.0257和0.2295,N=60時MLE-nSemi1的兩寬度僅為0.0174和0.0975)。上述分析表明MLE-nSemi2的估計精度較低,穩定性較差。對比MLE在N=30和N=60的表現可知,N=60時的箱線圖位置更低且箱寬更窄,說明增加樣本容量有助于提高MLE的技術無效率項的估計精度。 圖3 技術無效率項的偏離程度 圖4展示了技術無效率項估計量的核密度曲線,由圖可知MLE-nSemi1和MLE-nSpa的核密度曲線比較接近,兩者與MLE的核密度曲線形態相似但有一定的差距。MLE-nSemi2的核密度曲線與MLE差距更大,其在零附近更高聳,即在零附近取更大的概率。當樣本容量增加時(N=60時),MLE,MLE-nSemi1和MLE-nSpa的核密度曲線變化不大,但MLE-nSemi2的核密度曲線在零附近的概率增加且更加偏離MLE的核密度曲線。上述結果表明,MLE-nSemi1,MLE-nSpa和MLE-nSemi2的技術無效率項的估計精度偏低,其中MLE-nSemi2的估計精度最低且穩定性最差。 表2 技術無效率項的分類準確度 表2展示了技術無效率項的分類準確度。由表2可知,當N=30和N=60時,MLE的m_all,m0和F遠高于MLE-nSpa,MLE的m1略低于MLE-nSpa。MLE-nSpa的m1高于MLE的原因在于,MLE-nSpa以較大的概率把技術無效率項判定為零(圖3表明,MLE-nSpa在零附近的概率高于MLE),自然而然召回率偏高。綜合來說,MLE的分類精度高于MLE-nSpa。又由于當N=30和N=60時,MLE的m_all,m0,m1和F均高于MLE-nSemi1和MLE-nSemi2,從而MLE的分類準確度高于三種對比方法。對比MLE-nSemi1和MLE-nSemi2的分類精度,當N=30和N=60時,MLE-nSemi1的m_all,m1和F高于MLE-nSemi2,MLE-nSemi1的m0略低于MLE-nSemi2。綜合來說,MLE-nSemi1的分類精度高于MLE-nSpa。 本文在ZISF中引入空間效應和非參數效應,構建了半參數空間ZISF,使用極大似然方法估計模型并使用蒙特卡羅模擬考察參數和非參函數的估計精度以及技術無效率項的估計精度和分類精度。蒙特卡羅模擬的結果表明: ①MLE在參數和非參函數的估計精度以及技術無效率項的估計精度和分類精度均較高。增加樣本容量有助于提高MLE的估計精度。 ②對比方法(MLE-nSpa,MLE-nSemi1和MLE-nSemi2)的估計精度和分類精度均偏低,說明忽略空間效應或者非參數效應會降低估計精度和分類精度,文中模型有存在必要性。 ③MLE-nSemi1和MLE-nSemi2有且僅忽略一種非參數效應,但兩種方法的估計和分類精度存在差異性。相對來說,MLE-nSemi1的估計精度和分類精度高于MLE-nSemi2,MLE-nSemi1對應估計量的穩定性也優于MLE-nSemi2。忽略生產函數的非參數效應(對應MLE-nSemi1)僅稍微降低估計和分類精度,但忽略發生概率的非參數效應(對應MLE-nSemi2)會嚴重降低估計和分類精度。因此發生概率的非參數效應更不容忽視。2.2 模型轉化


2.3 參數估計


2.4 簡化最優化步驟




2.5 技術效率的估計

2.6 技術效率項的分類
3 蒙特卡羅模擬










4 結語