舒服華
基于高斯混合聚類的環保企業盈利能力評價
舒服華
(武漢理工大學繼續教育學院,湖北武漢 430070)
上市環保企業的盈利能力研究對促進我國環保行業的發展具有重要的意義。高斯混合聚類屬于軟聚類,它以概率作為依據,從隨機性和不確定性中體現肯定性和穩定性,屬于高度的人工智能范疇,聚類準確客觀,提供的信息量更加詳細。利用高斯混合聚類對我國26家上市環保企業的盈利能力進行分類,按盈利能力的強弱分為4個類別,聚類結果顯示:分類比較客觀準確,與它們的實際經營狀況基本吻合。
環保企業;盈利能力;評價;聚類;GMM;
隨著我國經濟的持續高速發展,環境污染成為當下我國經濟發展面臨的嚴峻問題。環境污染不僅嚴重威脅著人們的健康,還威脅著生態系統的平衡,更是給經濟社會可持續發展造成嚴重負面的影響。“十三五”以來,我國把保護生態環境放在突出重要的位置,環境惡化問題得到明顯遏制,這不僅歸功于各級地方政府和各職能部門的努力,還歸功于從事環保事業的經濟實體的發展。在國家的重視和政策的扶持下,以及環保市場的需求驅動下,我國環保行業發展很快,企業數量以每年12%的速度增長,僅上市企業就接近100家。客觀評價我國上市環保企業的盈利能力,對促進企業乃至行業高質量發展具有重要的意義。
聚類是常用的一種評價方法,將優劣、好壞、強弱、大小等性能和特點不同的對象劃歸為不同類別。聚類算法大多數都是以相似度為尺度,按照距離大小來衡量對象之間的聯系,從而進行聚類。高斯聚類是帶有隨機性和不確定性特點的分類方法,最終將決策轉化為穩定性和肯定性的結果,屬于機器學習和人工智能的范疇。高斯混合模型(Gaussian Mixture model,GMM)聚類以概率作為依據,根據評價觀察點隸屬于某一類概率值的大小,確定它所歸屬的類別,而不是簡單地判別個體屬于哪個類別。既完成了識別個體所屬的類別,又給出了其屬于該類別的可能性大小,決策更為客觀,分類信息更為詳細,成功應用于很多領域[1-10]。本文運用GMM對我國部分上市環保企業的盈利能力進行聚類,以促進企業的高質量發展。
高斯混合模型是由多個獨立的高斯分布函數線性組合而成的多元高斯分布函數。理論上,GMM可以擬合出任意類型的分布,通常用于解決同一集合下的數據包含多個不同分布的情形,并使用了期望最大算法估計模型的參數,能夠提供很強的描述能力,能對研究對象進行精確量化。高斯混合模型的一個重要用途是聚類。通過該模型進行聚類,既能使聚類結果更加客觀,又能使聚類的信息量更加豐富。
設有個觀察數據x,x,…,x,若將它們分為個類別,則高斯混合模型可表示為:



EM算法的具體計算步驟如下:
(1)確定分類的類別數量。一個類別對應一個高斯分布,由此組合成多元混合高斯分布函數。
(2)確定函數參數的初值。隨機賦予每個高斯分布函數的均值和方差,以及它們組合為混合高斯分布函數的混合系數。
(3)計算每個樣本在各個高斯分布下的概率。

(4)求第個高斯分布平均值的最大似然函數(為樣本總數,N為第類樣本數)。

(5)求第個高斯分布的方差最大似然函數。

(6)求混合系數的最大似然函數。

(7)重復步驟(2)~(5),直到模型收斂。
從EM算法的步驟可知,其核心是給定變量的初始值后,根據似然值更新參數,一步步迭代優化,使似然函數值逐步增大,最終找到最優參數,使模型似然函數值最大者即為其值。通過使用EM算法來擬合數據,是基于各觀測量來計算各成分密度的后驗概率。
確定評價指標。環保企業的盈利能力強弱可以通過其財務指標反映出來。衡量盈利能力的財務指標較多,但有些指標內涵交叉重疊,有些指標反映不充分,把它們全部用于評價,不僅沒有必要,還使問題變得復雜化。因此,選取典型性、代表性、核心性財務指標評價盈利能力是行之有效的辦法。對于上市公司而言,不能僅憑每股收益的多少來判斷盈利能力的強弱,因為不同規模的公司,每股凈資產不同,經營的優勢不同,導致每股收益出現很大的差異,這導致評價失之偏頗。衡量上市公司的盈利應全面系統地綜合考察,主要看它的投入與收益是否相匹配。凈資產收益率(ROE)和資產報酬率(ROA)被公認為是衡量上市公司盈利能力的核心指標;成本費用利潤率反映了公司獲取利潤付出的代價,既體現了企業成本控制能力,又體現了企業的盈利能力;每股收益能最直接表現企業盈利能力,是大多數股票投資人所關注的指標;每股凈資產反映了每股資產的現值,其值越大,按道理帶來的收益應越大;負債經營是企業的慣例,是企業“借雞下蛋”的經營策略,負債率越高,可用于經營的資本越雄厚,按常理應該給企業帶來更多的利潤。評價環保企業的盈利能力,還要觀察企業主營業務方面的盈利情況,非主營業務具有隨機性、不確定性,但有時可以對公司的盈利帶來正面影響。該指標可以通過主營業務和非主營業務利潤率的比重來體現。因此,以凈資產收益率(X)、資產報酬率(X)、主營業務利潤率(X)、成本費用利潤率(X)、每股收益(X)、每股凈資產(X)、資產負債率(X)、非主營比重(X)8個指標作為上市環保企業盈利能力評價指標。在100多家上市環保企業中,業績參差不齊,不乏經營虧損的,故選取26家經營業績相對較好的企業進行聚類評價,這樣才有一定的現實意義。8個評價指標的數據如表1所示(數據來源于各上市公司2020年度年報)。

表1 聚類對象盈利能力的相關指標值
數據歸一化。由于各數據的量綱不同,并且指標中既有效益型數據,又有成本型數據,而衡量盈利能力指標最理想的是效益型數據,直接利用原始數據進行聚類,客觀性稍差。為了提高聚類的可靠性,將原始數據先進行歸一化處理,并將所有指標數據轉化為效益型數據,在此基礎上再進行聚類,準確性會得到有效提高。數據歸一化按以下方法進行。

在8個評價指標中,每股凈資產(X)、資產負債率(X)為成本型指標,其余指標則為效益型指標,原始數據歸一化結果如表2所示。

表2 數據歸一化結果

續表2
按高斯混合聚類模型對這26家上市環保企業的盈利能力進行聚類,將它們分為4類,那么,高斯混合模型由4個單高斯模型線性組成。按照步驟(2)~(5)編程運算,最后模型收斂,得到聚類結果,聚類直觀圖如圖1所示。

圖1 聚類直觀圖
高斯混合聚類法,將每個對象劃歸某一類都有一定的概率,最后以概率最大的所在類為準則,判定其為最終所屬類別,但為了提高分辨率,將各類的概率值轉化為得分,并按某種比例拉開差距,讓非所屬的類別得分壓縮為0,這樣,各對象所歸屬的類別就一目了然。最終分類結果如表3所示。

表3 聚類結果
從表3可知,創業環保、中原環保等6家企業的盈利能力為第1類;龍馬環衛、長青集團等7家企業為第2類;高能環保、維爾利等6家企業為第3類,首創股份、興蓉環保等7家企業為第4類。從圖1聚類中心點(聚類中心離圓點距離越遠越優)可知,4個類別的盈利能力強弱依次為:第2類>第4類>第1類>第3類。從表1中各評價對象8個評價指標的取值來看,分類基本與實際情況相吻合,表明高斯混合聚類方法有一定的準確性和客觀性。如屬于第2類的龍馬環衛凈資產收益率、資產報酬率、主營業務利潤率、成本費用利潤率、每股收益都比屬于第3類的高能環保要高,而資產負債率、主營業務利潤率又都比其低,只是每股凈資產比其稍高,所以龍馬環衛的盈利能力要比高能環保強很多。
研究上市環保企業的盈利能力,對改善環保實體經營狀況,實現經濟效益和社會效益雙贏,提高自我發展能力,更好地為環保事業作貢獻具有重要意義。高斯混合模型屬于一種強大的無監督學習技術,常用于聚類。與其他聚類方法不同的是,高斯混合模型聚類是通過選擇成分最大化后驗概率來完成聚類,并使用迭代優化算法,最終實現收斂到局部最優。高斯混合模型聚類屬于軟聚類方法,它根據各觀察點的后驗概率描述它們屬于各個類別的可能性。一個觀測量屬于各個類別并沒有完全排除,都存在一定的概率,而不是完全肯定屬于某個類。具有聚類準確性和效率高、對噪聲數據不敏感等優點,適合于對距離或密度聚類反映不敏感,觀察數據多、維度高、差異大等各種特征的聚類。利用高斯混合聚類對我國26家上市環保企業的盈利能力進行了聚類分析,歸類較為客觀準確,與這些環保企業實際經營狀況基本吻合。
[1] 張發才,李喜旺,樊國旗.基于高斯混合聚類的風電出力場景劃分[J].計算機系統應用,2021(1):146-153.
[2] 范敬雅,鄒玉梅.基于EM算法的高斯混合模型的聚類分析——以2015年各省份GDP為例[J].發展研究,2017(6):52-54.
[3] 王一妹,劉輝,宋鵬,等.基于高斯混合模型聚類的風電場短期功率預測方法[J].電力系統自動化[J].2021(7):37-43.
[4] 尹楠.基于高斯混合模型的期望最大化聚類算法[J].統計與決策,2017(4):87-89.
[5] 熊偉,顧祥岐,徐從安.基于高斯混合EM聚類的多編隊航跡起始方法[J].系統工程與電子技術,2019(11):2421-2430.
[6] 曹丹陽,孔淑麒,高磊.基于高斯混合模型的鋁電解槽況聚類研究[J].輕金屬,2020(2):26-30.
[7] 柴秀俊,王宏偉,王林,等.基于高斯混合聚類的切換系統的辨識[J].控制理論與應用,2020(12):1-7.
[9] 李佳瑋,吳克河,張波.基于高斯混合聚類的電力工控系統異常檢測研究[J].信息網絡安全,2021(3):54-63.
[10] 何慶,易娜,汪新勇.基于高斯混合模型的最大期望聚類算法研究[J].微型電腦應用,2018(5):52-52+75.
Profitability Evaluation of Listed Environment Protection Enterprises Based on GMM
SHU Fuhua
It is of great significance to study the profitability of listed environment protection enterprises, to sum up their experience, to find out their deficiencies, rectify and to improve them, which will form a good atmosphere of learning and catching up, so as to promote the effective and powerful development of retail enterprises industry. Gaussian mixture clustering is soft clustering, which is based on probability and reflects certainty and stability from randomness and uncertainty. It belongs to the category of high level artificial intelligence, clustering is accurate and objective, and provides more detailed information. GMM was used to classify the profitability of 26 listed environment protection enterprises in China, and divides them into four categories according to their profitability. The results show that the classification is objective and accurate, which is basically consistent with their actual operating conditions.
environment protection enterprise; profitability; evaluation; clustering; GMM
舒服華(1964—),男,湖北武漢人,博士,教授,主要研究計量經濟學。
湖北省自然科學基金項目“運籌學與統計學決策技術研究”(2019CFB174)。
TP391
A
1009-8135(2022)01-0064-09
(責任編輯:張建升)