蔡晗昀、王冠生、郭麗莉
(國家統計局上海調查總隊,上海 200003)
基于聚類分析的企業人才結構與經濟效益研究——以非公有制企業為例
蔡晗昀、王冠生、郭麗莉
(國家統計局上海調查總隊,上海200003)
當前,構建合理的人才結構已成為實現產業結構調整戰略的重要課題。在經濟新常態的大背景下,研究企業人才結構與企業經營發展各維度的關系,對于揭示人才效應、促進人才引進、優化產業布局有著重要的意義。本文以非公有制企業為例,運用創新性的統計量化分析方法進行描述和研究,挖掘人才結構與企業經營情況之間隱藏的數據關系,運用聚類分析探索為不同產業帶來高貢獻率的人才結構特征,并開展比較分析。
人力資本結構;企業經濟效益;非公有制企業
近年來,非公有制經濟發展迅速,在國民經濟發展中的作用越來越突出。至2015年底,上海市非公有制經濟增加值12919.43億元,占全市生產總值的51.8%。非公有制領域從業人員855.39萬人,其中人才353.67萬人,成為推動經濟社會發展的重要力量。
對于非公有制企業而言,缺乏公有制企業在資金、技術、壟斷等方面的先天優勢,人才在推動企業發展、技術創新、管理創新的積極作用更為明顯。在經濟新常態的大背景下,研究非公企業人力資本結構與企業經營發展各維度的關系,探索不同產業中人力資本結構對企業效益的影響,對于進一步揭示人才效應、促進人才引進、優化產業布局有著重要的意義。
國內外學者對人力資本結構進行過大量的研究,主要集中在三方面:一是人力資本結構與經濟增長、經濟轉型的關系研究。二是某產業或上市企業的人力資本結構與產業/企業發展關系研究。三是企業人力資本配置研究。
從眾多學者的研究內容可以看出,對人力資本結構與企業發展的探索或集中在某幾個因素的研究上、缺乏綜合考慮,或以定性分析為主、缺少統計模型的有力支撐,尤其是專門研究企業人力資本結構與經濟效益的定量分析幾乎沒有。
針對上述問題,本文采用2013年上海市第三次經濟普查數據及2013年上海市非公人才抽樣調查數據對非公企業的人才結構運用創新性的統計量化分析方法進行描述和研究,挖掘人才結構與企業經營情況之間隱藏的數據關系。通過聚類分析探索為不同產業帶來高貢獻率的人才結構特征,并開展比較分析。
本文采用的原始記錄數據是2013年上海市第三次經濟普查中“非四上”非公企業數據(以下簡稱“三經普數據”)及2013年上海市非公人才抽樣調查數據(以下簡稱“非公人才數據”)。
將三經普數據與非公人才數據通過企業的組織機構代碼進行匹配,并清理不屬于研究范圍的記錄之后,得到建模的基礎數據庫,共計2845條企業記錄。涵蓋非公有制“非四上”企業的經營情況和人才結構約360個維度的變量。
(一)預處理
為聚焦研究對象,將一部分需要重點研究的行業單獨列出,如C制造業、I信息傳輸、軟件和信息技術服務業、J金融業和K房地產業等;而將其他具有共性的行業門類進行歸類,如將E建筑業,G交通運輸、倉儲和郵政業,L租賃和商務服務業和M科學研究和技術服務業歸類為生產性服務業,將F批發和零售業,H住宿和餐飲業,O居民服務、修理和其他服務業,P教育,Q衛生和社會工作和R文化、體育和娛樂業歸類為生活性服務業,將A農、林、牧、漁業,D電力、熱力、燃氣及水生產和供應業和N水利、環境和公共設施管理業歸類為其他行業等。重新歸類后行業分布情況如表1。

表1 重新歸類行業分布表
(二)變量選擇與降維
本文采取的變量篩選與降維方法主要分為三個方面:一是從人才調查專業經驗的角度對變量進行篩選,關注變量對于企業經營情況和人才結構特征的解釋能力,剔除了對研究目的幫助不大的變量。二是從精簡變量的角度考慮,剔除了部分包含信息有一定重復的字段和過于細分的字段。三是對初步篩選后的企業經營情況變量和人才結構變量分別進行因子分析,通過將相同本質的變量歸入一個因子的方法減少變量的數目,并檢驗變量間關系的假設。
1.企業經營情況評價。首先需要建立起統一的企業經營情況評價體系。經過初步篩選和精簡后,獲得了反映企業經營狀況的基礎變量:資產總計、營業收入、營業利潤、和從業人員期末人數共四個變量。由于上述變量均為絕對量指標,難以反映企業真實的盈利能力和效益水平,需通過計算一系列相對指標來縮小企業規模的影響,并得到如下幾類評價指標(表2)。

表2 企業經營情況評價指標
考慮到行業特征的差異,因子分析采取分行業的方式進行。此處以制造業“非四上”非公企業數據為例,運用SPSS version22軟件,采取主成分法的因子分析結果如下:
(1)特征值和累積貢獻率。當選到第4個因子時,累積貢獻率達到75.19%,即選取4個即可解釋原始變量的75.19%的信息,一定程度上達到了降維的效果。
(2)共同度。9個變量中有6個提取了80%以上的信息,包括營業收入、營業利潤、從業人員期末人數、人均營業收入、總資產報酬率和總資產使用率等。
(3)旋轉后載荷矩陣。由于原始載荷矩陣因子意義不十分明顯,因此采用方差最大正交旋轉,以達到每個因子具有明確的含義。旋轉后的因子載荷矩陣見表3。

表3 旋轉之后的因子載荷矩陣
(4)進一步精簡變量并進行因子分析。考慮到4個因子對后續分析研究仍然維度過多,需進一步精簡變量,將評價維度聚焦在對企業發展規模和盈利能力兩個關鍵方面。經過多次篩選和調整變量、進行因子分析、觀察因子提取結果之后,將企業經營情況的評價指標精簡為如下幾個變量:

表4 精簡后的企業經營情況的評價指標
仍以制造業“非四上”非公企業數據為例,對精簡后的五個變量采取主成分法的因子分析,并采用方差最大正交旋轉,旋轉后的因子載荷矩陣如下:

表5 旋轉之后的因子載荷矩陣
從表5中可見,因子1在從業人數(cyrs)、營業收入(yysr)上的載荷均在0.9左右,在資產總計(zczj)上的載荷接近0.6,可以將因子1定義為“企業規模因子”;因子2在總資產報酬率(zzcbcl)和營業利潤率(yylrl)上的載荷均在0.7左右,可以將因子2定義為“企業效益因子”。
因子分析的結果較為符合一般經驗判斷的結果,也能夠簡潔清晰地描述企業經營的總體狀況。經過對各行業分別進行因子分析后發現,“企業規模因子”和“企業效益因子”均能夠得到適用。
2.人才結構評價。對于企業中的人才結構,同樣需要建立起綜合評價體系,充分反映各類人才的情況。由于人才結構數據維度較高,在經過初步篩選和精簡后,仍然有多達29個變量,過多的變量、過細的分類不利于對提取出的因子進行解釋,因此需要進一步對變量進行精簡,主要采取兩種方法。一是將過于細分的人才合并歸類;二是刪減過多的分類類別。最后得到如下幾類評價指標。

表6 調整后的人才結構指標
因子分析仍然采取分行業的方式進行。以制造業“非四上”非公企業數據為例,采取主成分法的因子分析結果如下:
(1)特征值和累積貢獻率。當選到第3個因子時,累積貢獻率達到84.95%,即選取3個即可解釋原始變量的84.95%的信息,達到降維的效果。
(2)共同度。14個變量中有11個提取了80%以上的信息,包括勞務派遣人員、中共黨員、使用的外省市勞動力、使用的國(境)外勞動力、技能人員、高學歷、低學歷、較高年齡、中等年齡和較低年齡等。
(3)旋轉后載荷矩陣。采用方差最大正交旋轉,旋轉后的因子載荷矩陣見表7。

表7 旋轉之后的因子載荷矩陣
從表7中可見,因子1在較低年齡(nl_d)、中等年齡(nl_z)、學歷低(xl_d)、勞務派遣(w04)、外省市人員(d05)、技能人員(d14)上的載荷均在0.8以上,可以將因子1定義為“較初級人才因子”;因子2在學歷高(xl_g)、經營管理人員(d07)、國(境)外人員(d06)、黨員(n04)上的載荷均在0.8以上,在專業技術人員(d08)上的載荷在0.6以上,可以將因子2定義為“較高端管理型人才因子”;因子3在較高年齡(nl_g)、管理崗位上的專業技術人員(d09)上的載荷均在0.8以上,在高級技能人員(d14g)上的載荷在0.6以上,可以將因子3定義為“較高端技術型人才因子”。
即對制造業“非四上”非公企業而言,人才結構特征可以通過“較初級人才因子”、“較高端管理型人才因子”、“較高端技術型人才因子”三項因子加以描述。
(4)各行業人才結構因子分析比較。與企業經營情況評價因子對各行業普遍適用不同,行業間人才結構差異較為明顯,提取的因子數量、結構均有所不同,較難使用一套完全一致的評價體系。為了充分反映每個行業的人才結構的特征,本文對每個行業的人才結構使用其自身適用的評價標準。各行業人才結構因子見表8。

表8 各行業人才結構因子
從上表可見,各行業提取的人才結構因子基本符合行業的特征,如信息傳輸、軟件和信息技術服務業中的“專業技術型人才因子”、金融業中的“較高端中青年人才因子”、生活性服務業中的“高技能青年人才因子”等,均在一定程度上反映出該行業與其他行業人才結構的差異之處。值得一提的是房地產業的人才結構因子提取結果不甚理想,因子1涵蓋了大部分的人才結構指標,因此定義為“綜合人才因子”。考慮到房地產業是高度資本密集的行業,人才的影響因素相對較小,可能因此導致人才結構未能體現出明顯的特征。
(一)建模準備
為了更簡明清晰地描述企業經營情況和人才結構特征,避免評價層次過多造成標準混亂,統一將企業經營情況評價因子和人才結構評價因子處理為二分變量,即因子較低的一半賦值為1,較高的一半賦值為2。例如“企業規模因子”數值較低的一半即代表“規模小”,較高的一半即代表“規模大”;“企業效益因子”數值較低的一半即代表“效益小”,較高的一半即代表“效益大”。同理對人才結構評價因子進行處理。
(二)聚類分析
從研究目的來考慮,本文或者期望能夠將具有相似經營情況的企業分別聚類,以便觀察相應的人才結構;或者期望能夠將具有相似人才結構的企業分別聚類,以便觀察相應的企業經營情況。依然以制造業“非四上”非公企業數據為例,由于企業經營情況評價有2個評價因子,各有2個評價層次,因此可以聚為4類;而人才結構評價有3個評價因子,各有2個評價層次,因此可以聚為8類。綜合考慮,合理的叢集個數應當在4-8個之間。
綜合K取值為4-8的全部聚類結果來看,每個K均能反映4類經營情況的企業及對應的人才結構。但是當K值偏小時,可能存在部分企業特征被掩蓋。當K取值變大時,能夠對被掩蓋的人才結構特征進行進一步細分。但是也并非K取值越大越好,由于本文的研究目的更關注能夠為企業帶來高貢獻率的人才結構,即企業效益因子取值2時對應的人才結構,而對于規模小效益小的企業的人才結構進行過度的細分并沒有太大意義。綜合考慮,K=5的聚類結果最為合理。

表9 K=5的最終叢集中心
對于K等于5的聚類結果,5個叢集中心的企業經營情況因子能夠充分反映4類經營情況的企業。從人才結構因子來看,5個叢集均具有顯著特征。相比K=4,K取值5后,有相當數量的觀測值從規模大效益大的企業叢集中被分離出來,可見K=4時有一部分企業未能得到合理分類。而當K取值6及以上時,可以發現得到進一步細分的主要是規模小效益小的企業,而這對于本文的研究目的沒有明顯幫助,而效益好的兩類企業基本較為穩定,因此認為K=5是較為合理的聚類叢集取值。
(三)各行業聚類結果比較
依照同樣的方法對各行業進行聚類后,可以得出每個行業的分析結果(限于篇幅,此處僅舉例說明,原文備索)。
(1)對于制造業“非四上”非公企業而言,K=5的聚類結果最為合理。規模大效益也大的企業主要是三類人才因子水平都較高的企業;規模小而效益大的企業可能主要是較高端技術型人才因子水平較高的企業,較初級人才和較高端管理型人才的作用較少;規模大而效益小的企業可能正好相反,較初級人才和較高端管理型人才因子水平較高,而較高端技術型人才作用較少。

表10 制造業較合理的聚類叢集(K=5)
(2)對于信息傳輸、軟件和信息技術服務業“非四上”非公企業而言,K=4的聚類結果最為合理。規模大效益也大的企業,主要是較初級技能型人才因子水平較高的企業,其他人才作用相對較少;規模小而效益大的企業,主要是較初級技能型人才和專業技術性人才因子水平較高的企業,或有部分其他人才因素的企業,較高端管理型人才的作用相對較少;規模大而效益小的企業,主要是較高端管理型人才和專業技術型人才因子水平較高的企業,較初級技能型人才作用較少。

表11 信息技術服務業較合理的聚類叢集(K=4)
(四)模型的不足
模型建立的企業數據來自第三次經濟普查和非公人才調查數據,兩類數據源各有局限性:首先是第三次經濟普查數據中可得的企業規模和效益指標只包括“非四上”企業,缺乏傳統統計意義上關注更多的“四上”企業,導致模型結果更適用于較小規模企業;其次是非公人才調查數據僅包括非公有制領域企業和民辦非企業單位,缺乏占上海經濟總量半數以上的國有和集體企業;第三是兩項調查結果的交叉僅涵蓋非公有制“非四上”企業的經濟效益和人才數據,無法反映人才和企業經濟效益的整體關系。
(一)人才結構差異與經濟效益差異間具有較明顯的關系。聚類分析的主要結果顯示,人才結構對經濟效益具有較明顯的作用。同一行業內、同等規模的非公企業,人才結構配置的不同,企業的經濟效益也會在一定程度上產生高低差異。具備行業人才要求的企業,其經濟效益也有明顯優勢。
(二)行業間人才結構差異明顯,對不同行業的產生高貢獻度的人才結構也不同。從規模小效益高的非公有制企業聚類結果看,制造業企業受益于較高端技術型人才,信息技術服務業受益于較初級技能型人才和專業技術性人才,金融業企業受益于國境外人才。服務業企業的高貢獻度人才與具體行業相關,其中勞務派遣人才、高技能青年人才、技術型人才和國(境)外人才的貢獻度較高。
(三)為實現高效益,不同行業的人才結構調整策略不同。具體來看,制造業企業應盡量提高較高端技術型人才比重;信息傳輸、軟件和信息技術服務業企業應提高專業技術型人才和較初級技能型人才比重;金融業企業應提高較初級技能型人才和國(境)外人才比重;房地產業企業應提高投資規模,減少高端人才的成本支出;生產性服務業企業應提高較高端管理型人才和低成本勞務派遣人員的比重;生活性服務業企業應提高高技能青年人才比重,其他行業企業應提高較初級人才比重,降低總用工成本。
(四)中小型非公企業的人才配置不應一味追求高端。由于企業性質和發展階段的不同,中小型非公企業的人才結構配置應避免錯位。具體而言,信息技術服務業企業應避免過多重視較高端管理型人才,金融業企業應避免過多重視較高端中青年人才,生產性服務業不應追求國(境)外人才比重,房地產業企業應減少高端人才的成本支出。
(責任編輯:曹家樂)