郭銳敏 常宗平 孫瑞華△ 李 歡 徐 凱 虞康達 肖 暢 吳婉玲
?
運用主成分聚類分析法評估醫院科室科研績效
郭銳敏1常宗平2孫瑞華2△李 歡1徐 凱1虞康達1肖 暢1吳婉玲1
主成分聚類分析法是將主成分分析與聚類分析有機結合的一種新方法,該方法克服了眾多指標之間的共線性,提取出能夠代表大部分信息的綜合指標,利用綜合得分聚類后,能夠合理準確地突出各個類別的能力和優勢。目前在采礦業[1]、農業[2]、經濟學[3]等領域有應用。本文將以北京市某綜合醫院2015年度的學科評估數據為例,運用主成分聚類分析法對各業務科室的科研績效進行分析評價,以期為科研績效評估提供一種新的研究方法和思路。
1.資料來源
本文資料來源于北京市某三級甲等綜合醫院2015年度學科評估數據,評估數據內容包括65個業務科室的八項評估指標,各項評估指標分數不設上限。其中,65個業務科室中,外科占20個,內科占23個,中醫類科室占15個,醫技類科室占12個。八項評估指標包括:課題(x1)、論文教材/專著(x2)、獎勵(x3)、專利(x4)、兼職(x5)、平臺(x6)、團隊榮譽(x7)、標準制定(x8)。
2.方法
主成分聚類分析法是應用主成分提取少數主成分,代替原始指標,計算綜合得分并對綜合得分排序,最后進行聚類的一種方法[4]。由于主成分分析能在基本不損失原始指標信息的基礎上,提取出彼此信息不重疊的主成分,因此可以先對原始指標體系進行主成分分析,然后將主成分代替原始指標進行聚類[5]。聚類分析又稱集群分析,它首先使各個業務科室各自成一類,然后將距離最近的2個科室合并成一個新類,重新計算新類與其他類的距離,再按最小距離歸類,這樣每次縮小一類,直至所有業務科室成為一類為止[6]。利用綜合得分進行聚類分析,可以突出各類業務科室的突出能力和優勢產出,主成分聚類分析法能從整體上準確反映醫院科室科研績效產出情況。
主成分聚類分析法的過程分為以下幾個步驟:(1)評估指標的標準化處理;(2)建立相關系數矩陣,得到相關系數矩陣的特征向量、特征值、貢獻率和累計貢獻率;(3)確定主成分個數并解釋各主成分;(4)計算綜合評價得分;(5)利用綜合評價得分將評估對象聚類。
1.評估指標的標準化


2.建立相關系數矩陣
在標準化數據的基礎上,借助SAS 9.1.3軟件計算原始指標的相關系數矩陣,得到相關系數矩陣的特征向量、特征值、貢獻率和累計貢獻率,見表1~2。其中,特征向量是主成分Zj的線性表達式中原始指標(已標準化)的組合系數,特征值則是主成分Zj的方差,方差越大,則對總變異的貢獻越大。

表1 相關系數矩陣的特征向量
3.確定主成分個數
在實際應用中,為了達到數據簡化的目的,通常按累計貢獻率大于或等于70%的原則提取前m個主成分[7]。上述數據中,前六個主成分的累計貢獻率為90.4%,遠大于70%,說明采用六個主成分已經能夠反映原始數據包含的大部分信息,故考慮取前六個主成分。即利用主成分分析法把原來的八個指標綜合成六個主成分,能夠反映原始指標的總體特征。

表2 各項指標的特征值和累計貢獻率
第一主成分在課題這一指標上有較高正載荷,其余各指標上載荷均大于零,但是科研項目水平明顯較強,可認為主要是反映綜合實力的因素。
第二主成分在課題和獎勵兩個指標上有較高的負載荷,在兼職上有較高正載荷,可認為這一主成分主要是反映學術兼職貢獻的因素。
第三主成分在專利上有較高的正載荷,說明這一主成分主要反映的是成果方面的因素,可作為制造成果的因子。
第四主成分在標準制定上有較高的正載荷,可認為主要是反映參與標準制定的因素,作為引領行業發展態勢的因子。
第五主成分在團隊榮譽這一指標上有較高正載荷,可認為這一主成分主要是反映人才團隊榮譽建設的因素。
第六主成分在論文專著這一指標上有較高負載荷,在平臺這一指標上有較高的正載荷,可認為該主成分主要是反映平臺建設的因素,發表論文專著的水平較弱。
4.計算綜合評價得分
由表1的特征向量與標準化后的數據相乘可以計算得到主成分的得分Fj(j=1、2、3、4、5、6),以每個主成分的貢獻率作為權數,計算各科室的綜合評價得分(f),并以綜合評價得分進行排序。
5.將65個業務科室分類


表3 科室聚類一覽表
優秀類,綜合評價得分均值為1.634,各主成分得分均值都大于零,這類學科第一主成分均分較高,即科研項目水平較高。該類別屬于綜合實力較強的類別,與實際數據相符。
良好類,綜合評價得分均值為0.544,該類學科的第二主成分均分較高,在學術兼職方面有較大優勢。第一主成分均分雖不及第一類,但也較高,科研課題水平略低于第一類科室,較第三類、第四類相對較高,與實際相符。

表4 四類業務科室綜合得分均值一覽表
中等類,綜合評價得分均值為0.076,相比于第一類科室,該類科室各主成分得分均值都相對較低,第四主成分均分相對較高,即在引領行業標準方面這類科室有較大貢獻。第五主成分均分較低,團隊榮譽和人才建設這方面還有待加強。
較差類,綜合評價得分均值為-0.386,這類科室各方面得分均較低,因此在科研項目、學術兼職等各項科研績效產出方面均較弱,該類別科室整體實力較弱。
運用主成分聚類分析法評估科研績效,實際是把主成分分析與聚類分析有機結合的一種應用方法。主成分分析法可以對評估指標進行降維,把多維的指標信息歸納為可以反映大部分信息的少數幾個主成分,既有利于歸納分析科研績效的主要貢獻成分,也可以滿足有效的聚類分析信息要求,同時可以根據各主成分,分析各科室科研績效的主要貢獻內容。本文中,我們通過主成分分析,發現科研績效得分最主要的貢獻在于課題指標,其次是獎勵、專利、標準制定等,為科研績效的提高指明了方向。
本文通過聚類分析法將65個科室分成四個等級,從優秀類科室到較差類科室的科室數量逐漸增多,并不符合績效管理的“強制正態分布法”,即分數“中間大、兩頭小”的分布規律[8]。但從65個科室的績效分數分布看,可見等級劃分是符合實際的。
[1]陳建宏,蔣權,鄭海力,等.基于主成分聚類分析的采礦方法優選.科技導報,2011,29(27):36-41.
[2]李國鋒,王莉,肖遠淑,等.基于主成分聚類分析評價棉花品質的研究.現代紡織技術,2016,1(1):5-7.
[3]呂巖威,孫慧,周好杰,等.基于主成分聚類分析的西部地區經濟實力評價.科技管理研究,2009,29(12):157-160.
[4]李秀樓,程霓虹,陳英,等.運用主成分聚類方法評估綜合醫院臨床科主任能力.中國衛生統計,2012,29(2):249-250+253.
[5]王德青,朱建平,謝邦昌,等.主成分聚類分析有效性的思考.統計研究,2012,29(11):86-87.
[6]胡春娥.聚類分析在醫院管理中的應用.中國衛生統計,2007,24(1):92-93.
[7]孫振球.醫學統計學.人民衛生出版社,2010,8:358.
[8]李玉萍,蘭社云.績效管理中的“強制正態分布法”.經濟研究導刊,2011,12(122):128-129.
(責任編輯:劉 壯)
1.北京中醫藥大學(100029)
2.中日友好醫院
△通信作者:孫瑞華,E-mail:sunruihua@263.net