摘?要:文章通過利用蘭溪市2021年規下工業用工人數、用電量、稅收收入等指標,進行實證分析,試圖通過建立多元線性回歸模型,以及單變量測算的經濟總量,以歸一化的回歸系數為權數,加權綜合估算蘭溪市規模以下工業經濟總量,為蘭溪市、金華市乃至浙江省的整體規下工業經濟總量計算進行制度重塑、方法重建、復制推廣提供參考,為第五次經濟普查準確了解蘭溪市規下工業經濟總量提供理論和實踐支撐。
關鍵詞:蘭溪;工業經濟;規下工業;經濟總量
中圖分類號:F402.4文獻標識碼:A文章編號:1005-6432(2024)09-0086-04
DOI:10.13939/j.cnki.zgsc.2024.09.021
1?研究背景
規模以下工業統計調查是反映中小微企業和個體經營單位的基本情況、經濟總量、發展狀況及面臨困難的重要調查,也是國民經濟核算的重要基礎數據。為全面了解蘭溪市規模以下工業運行情況,掌握全市規模以下工業經濟總量,更好地為黨委政府科學決策提供優質統計服務,2021年蘭溪市獲得浙江省規模以下工業經濟總量調查試點工作,旨在實現用部門數據測算全市規下工業經濟總量,為蘭溪市后續乃至全省規下工業經濟總量測算進行制度重塑、方法重建、復制推廣提供參考,為第五次經濟普查準確了解我市規下工業經濟總量和結構提供基數數據參考。
2?蘭溪工業基本情況
蘭溪是一座典型的工業城市,工業發展雖經跌宕起伏,但經過幾十年的發展,在國民經濟中的主導地位日漸穩固。蘭溪規上工業目前已形成以紡織、電力、冶金、水泥、醫藥、化工、機械七大行業為主導的產業結構,涵蓋32個行業大類、99個行業中類、178個行業小類的工業體系。2021年蘭溪工業增加值212.61億元,其中規上工業增加值162.2億元,在金華各縣(市、區)中排名第三,工業增加值占GDP比重47.46%,位于金華各縣(市、區)第三位。
截至2021年12月月底,全市名錄庫中規模以下工業企業3278家,涉及35個行業大類、155個行業中類、373個行業小類。現階段規模以下工業采用以抽樣調查為主體的“四下”企業統計制度方法,2021年1月至11月,全市共有92家規下工業樣本企業,其中61家企業正常經營,關閉、注銷、停產、升規等情況企業31家。經與上級部門對接,根據1月至11月國家樣本企業推算,2021年蘭溪市規下工業經濟總量推算為80.34億元。
3?現行制度下存在的問題
(1)不能直觀反映規模以下工業經濟總量。現階段規模以下工業采用以抽樣調查為主體的“四下”企業統計制度方法,以票據為基礎的統計調查制度存在企業現金交易等數據無法入統、上報數據無法全面體現實際生產經營的情況。規模以下工業企業大部分為中小微企業,日常生產銷售中存在預付定金、部分款項以現金支付等現狀,這部分數據一般未能在財務報表中體現。且上級統計部門最終反饋數據僅為規下工業增加值增速,無法根據樣本企業直報數據了解全市規模以下工業企業經濟總量。
(2)樣本企業代表性差,一經確定無法替換。規模以下工業樣本企業的抽取以四經普企業框為基礎,一旦確定后五年一輪換。實施固定樣本調查,存在諸多弊端:一是在不能確保五年調查期內企業是否持續正常經營。規模以下工業主要為中小微工業企業和個體經營戶,規模相對較小,隨著時間的變化,企業經營狀況也不斷變化,大量企業在規上、規下之間來回轉換,特別是小微企業,停產、關閉等情況大量存在。2022年1月至5月,蘭溪市共有103家規下工業樣本企業,正常經營為57家,其中關閉、注銷、停產、升規等情況企業46家。二是樣本企業無法體現經濟結構特性。規下樣本企業新增來源于樣本村內新增企業,因地域、當地政策等情況,新增樣本不能全面涵蓋大部分行業,無法代表全市區域內規模以下新增企業的總體結構。截至2022年5月,蘭溪市103家樣本企業并未涵蓋本市七大主要行業(紡織、醫藥、冶金、電力、化工、機械、水泥)。
(3)名錄庫企業數據維護更新難度大。名錄庫是實施抽樣調查的基礎數據,名錄庫中企業單位及相關信息情況差異越少,越有利于提高抽樣樣本的質量。規模以下工業企業和個體經營戶數量巨大,消亡和新生頻率較為頻繁,變化更新速度快。現有規下名錄庫企業抽樣框主要為經濟普查時進行大規模一次性更新,日常更新維護以獲取市場監管數據為基礎,企業相關信息情況存在滯后性,關閉、停產等情況無法及時掌握。實際操作過程中,因沒有足夠的人力保障和支持,名錄專業人員很難掌握規模以下工業企業的增加和減少情況,致使抽樣框的維護和更新難度大。
4?模型構建思路
總體思路是數字化改革為牽引,實現經信、稅務、商務、供電等部門間的數據匯集,利用部門數據與統計抽樣調查數據進行數據建模,形成以獲取部門數據推算出我市規模以下工業企業的整體營業收入的制度方法。
以基本單位名錄庫為基礎,梳理出名錄庫中規模以下工業企業(年主營業務收入小于2000萬元的工業企業)名單,采取分層等距抽樣法,按抽樣比抽取的企業作為樣本企業。根據《小企業會計準則》設計企業經營狀況抽樣調查表,通過實地調查形式摸清企業實際營業收入數據,后續利用調查的營業收入數據與指標數據(稅收、用工人數、用電量數據)進行統計建模,推算出全市規下工業企業經濟總量。
5?實施過程
(1)制定調查方案。市統計局召開規模以下工業經濟總量調查試點工作會議,研究整體工作思路和工作方法,部署相關工作,就后期可能遇到的各方面困難及問題進行研判商討,制定規下工業經濟總量調查方案。
(2)獲取數據資料。名錄專業人員梳理出截至名錄庫中3278家規模以下工業企業名單。在此名單的基礎上,市統計局積極與稅務、經信、商務、發改等部門進行對接,獲取規下工業企業銷售收入、實繳稅金、畝均效益評價、出口企業名單、用電量等數據。
(3)進行企業抽樣。1983家有銷售收入企業中剔除銷售收入大于2000萬的企業,共有1957家。將企業按照銷售收入進行排序,采用不等概率的分層抽樣方法,即內曼分配,每個元素的抽樣概率取決于其所在層的元素個數和樣本量,抽出300家企業作為樣本企業。
(4)進行實地調查。對此次抽取的樣本進行實地調查,為了提高調查數據的準確性和完整性,特委托第三方專業統計調查機構進行獨立調查,調查完成后市統計局對調查質量進行評估,并對異常或者可疑數據進行再次核對,確保調查數據質量。
(5)構建統計模型。根據前期收集匯總的數據,對出口額占銷售收入50%以上、畝均效益評價為A、B類企業與有銷售收入、用電量企業按行業大類進行分類,計算單位用電量營業收入。同時根據抽樣調查獲取的企業相關數據,進行統計建模,對樣本企業結果進行比對驗算。
6?總量估算
6.1?抽樣方法
抽樣方法采用不等概率的分層抽樣方法,即內曼分配(Neyman?allocation),每個元素的抽樣概率取決于其所在層的元素個數和樣本量。
(1)確定分層數。具體應用累計平方根法,按照銷售收入規模進行分層。第一步將各組的頻數開方;第二步將開方后的平方根進行累計;第三步選擇適合的層數,將平方根累計總數除以層數,根據得到的商數選擇最接近該數的點作為臨界點,理論上證明這樣的結果接近于內曼分配,根據蘭溪實際規下工業企業數據計算出分為6層。
(2)確定樣本量。考慮經費和人員等因素,以及樣本消亡和無回答等情況,確定共抽取不少于300個樣本。
(3)分配樣本。在規模層內分配樣本量,原則是大企業給予高的抽樣比,另外層與層之間的抽樣比相差要較小,根據內曼分配公式確定出每個層內的樣本數。
(4)確定每層內具體樣本。層內采用等距抽樣,具體使用Excel中的Rand函數產生隨機數,來確定起點,然后每隔一定的間隔抽取需要的樣本。
6.2?模型簡介
多元線性回歸模型(multivariable?linear?regression?model)在實際經濟問題中,一個變量往往受到多個變量的影響。
6.2.1?模型的結構
多元線性回歸模型通常用來描述變量y和x之間的隨機線性關系,即:
y=β0+β1x1+…+βkxk+ζ
其中,x1,…,xk是非隨機的變量;y是隨機的因變量;β0,…,βk是回歸系數;ζ是隨機誤差項。
如果對y和x進行了n次觀測,得到n組觀察值yi,x1i,…,xki(i=1,2,…,n),其滿足以下關系式:
y=β0+β1x1+…+βkxk+ζ
其中,x1,…,xk是非隨機的變量;y是隨機的因變量;β0,…,βk是回歸系數;ζ是隨機誤差項。
yi=β0+β1x1i+…+βkxki+ζi
用矩陣表示:
y=y1y2yn,x=1?x11?…?xk11?x12?…?xk2???1?x1n?…?xkn,β=β0β1βk,ζ=ε1ε2εn
這時模型可以寫作:
y=Xβ+ζ
6.2.2?模型參數的檢驗
在正態假定下,如果X是列滿秩的,則普通線性回歸模型的參數最小二乘估計為:
β^=(xTx)-1xTy
于是y的估計值為:
y^=xβ^
記殘差向量為e=y-y^=y-Xβ^,則隨機誤差方差σ2的最小二乘估計為:
σ^2=eTen-k-1
得到回歸模型參數的估計值后,需要對回歸方程和回歸系數進行顯著性檢驗。
(1)回歸方程的顯著性檢驗
原假設H0:β1=…=βk=0,備擇假設H1:β1,…,βk不完全為0,當假設成立時,檢驗統計量:
F=SSR/kSSE/(n-k-1)~F(k,n-k-1)
其中,SSR=∑ni=1(y^i-y—)2是回歸平方和;SSE=∑ni=1(yi-y^i)2是殘差平方和。對于給定的顯著性水平α,檢驗的拒絕域F>Fα(k,n-k-1)。
(2)回歸系數的顯著性檢驗
原假設H0:βj=0,備擇假設H1:βj≠0(j=0,1,…,k),當原假設成立時,檢驗統計量:
Fj=SSEj-SSESSE/(n-k-1)~F(1,n-k-1)
其中,SSEj是去掉xj后的殘差平方和。對于給定的顯著水平α,檢驗的拒絕域為Fj>Fα(1,n-k-1)。
也可以用檢驗統計量:
tj=β^jσ^cjj~t(n-k-1)
其中,cjj是c=(xTx)-1對角線上第j(j=0,1,…,k)個元素。對于給定的顯著性水平α,檢驗的拒絕域為︳tj︳>tα/2(n-k-1)。
6.3?總量測算
利用SPSS軟件對相關數據進行線性回歸,根據300家抽樣企業的調查數據和部門數據(營業收入、稅收、用電量、用工人數),統計建模確定2021年全市規下工業經濟總量。
對數據進行整理,去除樣本企業中數據為空、數據不存在的樣本單位,剩余281家進行多元線性回歸,自變量為稅收、用電量、用工人數,因變量為營業收入,如表1所示。
根據單位用電量、單位用工人數、單位稅收分別實現的營業收入三種方法推算出全市經濟總量。
方法一:根據300家抽樣企業的調查數據(營業收入、用電量),去除樣本企業中數據為空的樣本單位,剩余290家計算出每萬千瓦時實現的營業收入14.40萬元,2021年全市規下工業用電量90645.98萬千瓦時,推算出2021年經濟總量為130.49億元。
方法二:根據300家抽樣企業的調查數據(營業收入、稅收),去除樣本企業中數據為空的樣本單位,剩余282家計算出每萬元稅收實現的營業收入42.33萬元,2021年全市規下工業稅收3.65億元,推算出2021年經濟總量為154.51億元。
方法三:根據300家抽樣企業的調查數據(營業收入、用工人數),去除樣本企業中數據為空、部分極值的樣本單位,剩余261家計算出每萬人實現的營業收入42.05萬元,2021年規下用工人數4.56萬人,推算出2021年經濟總量為191.85億元。
為了科學反映規下工業經濟總量,客觀反映各變量的重要性,綜合考慮采用以概率為權數,利用多元線性回歸模型,得到各自變量回歸標準化系數,然后對自變量回歸標準化系數進行歸一化,得到用工人數歸一化系數為0.30;用電量歸一化系數為0.25;稅收歸一化系數為0.45。
綜合單位用電量、單位稅收、單位用工推算的數據,利用歸一化系數作為權重,分別乘以用工人數、用電量、稅收單變量推算的總量,得出2021年全市規下工業營業收入為159.71億元。
7?結果應用
(1)可以利用多部門數據的增速核算規下工業增速。規下工業企業整體營業收入和用工、稅收、用電量三個指標關聯性較大,因此在后續工作中建議利用人社部門的用工人數、稅務部門的稅收、供電公司的用電量等數據的增速,將各項增速賦予相應系數,算出規下工業增速,基于第五次經濟普查的數據后續推算全市規下工業經濟增速和總量。
(2)地市級統計部門分行業測算經濟總量。相同行業小類的企業生產工藝流程較為接近,用電量和營業收入指標匹配程度較高,因此選取規模較大的行業進行分行業規模測算會較為準確。在本次試點工作中,因受行業小類樣本量不足影響,無法進行分行業總量測算,地市級統計可以獲得足夠的行業小類樣本,因此建議地市級部門分行業測算經濟總量。
(3)為第五次全國經濟普查的順利開展進行方法試探。經濟普查工作是對經濟發展的一次全面體檢,2023年年底將進行第五次全國經濟普查,文章通過對規下工業經濟總量的測算試探,以期做到對規下工業經濟總量計算的流程、制度、方法的試探,測算數據可以與第五次全國經濟普查數據進行比對,為規下工業經濟總量的測算流程、制度和方法積累經驗。
參考文獻:
[1]羅寧.規模以下工業抽樣調查改革之我見[J].中國統計,2013(6):55-56.
[2]陳三銘.規模以下工業抽樣調查的實踐與思考[J].浙江統計,2008(10):43-44.
[3]王祉懿.云南主要農產品出口貿易對云南經濟增長的影響——基于多元線性回歸模型的實證分析[J].中國商貿,2012(5):205-206.
[4]盧鶴挺.基于多元線性回歸分析的用電量研究[J].中國新技術新產品,2015(14):99-100.
[作者簡介]趙三武,碩士研究生,畢業于浙江工商大學統計與數學學院,中級統計師,就職于蘭溪市統計局,研究方向:統計學。