(天津財經大學 天津 300222)
StataimplementationofSFAmodelunderdifferentmodelsettings
Abstract:The problem of estimation of technical efficiency is often encountered in reality,and the stochastic frontier model is one of the parametric models widely used for this problem.This article uses Stata to estimate the SFA model under different model settings,and compares the differences in estimation results.
Keywords:stochastic frontier model;model settings;panel data;stata software
前沿生產函數測算技術效率的方法兩大類,分別是非參數法和參數法。非參數法以DEA為代表;參數法以SFA為代表。DEA方法的不足之處有兩點:(1)模型缺乏統計特性,不能做出更多統計分析;(2)缺乏風險考慮,將所有的對生產邊界或成本邊界的偏離都歸因于低效率,包括數據統計上的誤差。因此,在考慮投入和產出的數據選擇時,要求非常嚴格。這樣一來,研究創新效率的影響因素的難度就大大增加了。SFA方法較DEA方法有兩大優點:(1)體現了隨機誤差項的存在,消除了估計技術效率時出現的潛在偏差;(2)可以再深入分析技術效率的影響因素,因此拓寬了SFA方法應用的適用范圍。本文后續實證部分選用的方法就是SFA方法。
Stata軟件是Statacorp在1985年開發的統計軟件,逐漸得到了全球范圍內學者的廣泛應用,主要的應有領域有經濟學、社會學及流行病學等[6]。目前,諸多學者做隨機前沿分析(Stochastic Frontier Analysis,SFA)模型所用的軟件多為frontier4.1。隨著SFA模型的不斷發展,frontier4.1有時并不能完全解決學者所要研究的問題。1981年Pitt和Lee第一次將SFA應用到面板數據[7],自此面板數據SFA漸漸取代了截面數據SFA成為了SFA理論和應用研究的重要組成部分。眾多學者對于SFA模型的貢獻在Stata軟件中得到了充分的體現。
根據Kumbhakar和Lovell(2000)[1]所得的結論,實際產出、前沿產出、相對前沿技術效率三者之間有如下關系[2]
yit=f(xit;β)exp(vit-uit)
(1)

將(1)式兩邊取對數,得到
lnyit=lnf(xit;β)+vit-uit
(2)
隨機前沿分析的目的之一就是為了預測技術無效效應,技術效率測算的是地區實際產出與生產完全有效時地區使用相同投入所能得到的產出之間的相對差異。給定方程(2),技術效率(TE)被定義為
(3)
技術效率在0~1之間,當uit=0時,TE=1,技術是有效的;當uit<0時,TE<1,技術是無效的。
關于SFA方法的模型設定參見文獻[4]。本文僅展示通過具體數據利用Stata軟件實現不同模型設定下的隨機前沿模型。
本文接下來主要介紹一下Pitt和Lee(1981)、Battese和Coelli(1988)、Schmidt和Sickles(1984)、Cornwell等人(1990)、Lee和Schmidt(1993)、Kumbhakar(1990)、Battese和Coelli(1992)、Greene(2005)以及Wang和Ho(2010)的模型在Stata15軟件中的實現。所有可用選項的完整說明參見對應的幫助文件。
為了更具體地看出不同SFA模型對各個決策單位效率大小估計結果的差異,我們選取了2009-2015年中國30個省份的大中型工業企業研發面板數據為樣本,所用數據均來自《中國統計年鑒》和《工業企業科技活動統計年鑒》,實證估計各地區工業企業的研發創新效率,其中研發投入數據采用R&D資本存量[5]和R&D人員全時當量數據,研發產出數據采用新產品開發項目數。在具體選擇生產函數時,本文選擇柯布-道格拉斯生產函數形式
Y=AKαLβeZ,
(4)
其中A是R&D活動效率,Z是影響R&D活動效率的因素。取對數后,(4)式寫為
lnY=lnA+αlnK+βlnL+λZ+u+ε,(5)
其中K和L分別表示研發的資本投入和研發勞動投入,誤差項u表示非觀測效應,ε表示特異性誤差。


表1 不同模型設定下估計的的描述性統計結果