[摘要] 通過對標準遺傳算法遺傳算子的改進和擴充,提高基于此改進遺傳算法的模糊聚類分析方法的運行效率和準確度,并將其應用于人力資源管理系統中,對企業銷售人員的業績進行科學合理的評價。
[關鍵詞] 模糊聚類遺傳算法績效評價
當前眾多的企業都擁有自身的管理系統,包括人力資源管理系統、銷售管理系統等。系統中的數據隨著企業的發展在數據庫中越積越多,而面對紛繁的數據,管理者能從中得到什么有利于人力資源管理的信息呢?尤其是在當前買方市場條件下,如何利用已有的數據對銷售人員進行科學合理的業績評價,并以評價結論作為執行激勵報酬契約的依據,進而在有效發揮激勵功能的基礎上促進企業銷售業績的增長,更是企業人力資源管理者必須解決的問題。本文正是基于此,應用一種基于改進的遺傳算法的模糊聚類于人力資源管理系統中,對企業銷售人員的業績進行科學合理的績效評價。
一、績效評價指標體系的設立
體現績效評價內容的客觀載體和外在表現是績效評價指標,因此設立恰當的績效評價指標體系十分關鍵。科學合理的績效評價指標一般要遵循“SMART”原則:
S=Specific,即“具體的”,指績效指標要切中特定的工作目標;
M=Measurable,即“可度量的”,指績效指標或者是數量化的,或者是行為化的,驗證這些績效指標的數據或信息是可測量和可獲得的;
A=Attainable,即“可實現的”,是指績效指標在付出努力的情況下可以實現,避免目標設立過高或過低;
R=Realistic,即“現實的”,是指績效指標是現實存在并可驗證和觀察,并不是假設的;
T=Timely,即“有時限的”,指設定完成這些績效指標的期限,必須在確定的時限內完成。
銷售人員是企業中一個特殊的崗位群體,其工作具有時空上的寬泛性、外延性和靈活性等特點,工作方式具有獨立性,因此其工作行為和活動過程難以量化和考核。這里我們采用KPI(關鍵業績指標)設立銷售人員績效評價指標體系。關鍵業績指標來自于對企業總體戰略目標的分解,反映最能有效影響企業價值創造的關鍵驅動因素,是用來衡量某一崗位工作人員業績表現的具體量化指標,是對工作完成效果的最直接衡量方式,因此也很適合于對銷售人員的業績進行考評。
根據“SMART”原則,以及KPI思路,我們設立銷售人員績效評價指標體系如表1所示。
二、數據處理
設立評價指標體系后,便可提取和計算出與銷售人員績效評價指標體系相關的數據,作為之后聚類分析的輸入數據。而把銷售系統和人力資源管理系統平時產生的數據直接作為聚類分析的數據來源是不合適的,應事先進行數據預處理,以滿足聚類分析所需數據的要求。
1.數據取樣
根據設立的銷售人員績效評價指標體系,在進行數據取樣時選擇如下粗糙數據集:一個銷售員對應一個員工ID號,根據該ID號把所有相關的數據從銷售管理系統和人力資源管理系統的數據庫中提取出來。主要包括:員工ID(Id)、銷售價格(P)、銷售數量(N)、銷售時間(T)、銷售額(As)、每天銷售額(S)、每天回款額(Ad)、銷售計劃(Sp)、客戶數量(Cn)、客戶拜訪(Cv)、團隊合作精神(Ts)﹑命令執行度(O)、創新能力(Ia)等。
2.數據重組
對于以上選定的粗糙數據,還要加工處理,檢查數據的完整性和一致性,剔除噪音數據,修正嚴重錯誤的數據,對丟失的數據進行填補,以可以保證聚類分析的效率和準確度。對于取樣后的數據,需要計算并重組得出適應績效評價指標體系的聚類分析數據。如其中的崗位適應性指標(D)數據主要由相關人員對人力資源管理系統中的團隊合作精神(Ts)﹑命令執行度(O),以及創新能力(Ia)等二級指標進行評分,并按對應權重值綜合計算得出。這里只列出銷售額增長率、貨款回收率這兩項關鍵指標數據的計算式。
(1)銷售額增長率(A)
與上一次時間段相比,銷售額的變動記為△Asp;與上一年同一時期相比,銷售額的變動記為記為△Ass。則:
△Asp1= 0;
△Aspi=Asi-As(i-1)(Asi代表某段時間內的銷售額,其中i=2,3,4,…);
△Assi=0(i=1,2,3,…,第一年各個時間段的銷售額的同比變化都是0);
△Assj= Asj-Ask(Asj表示當前年中的某時間段的銷售額,Ask表示上一年中的對應時間段中的銷售額,j=1,2,3,…;k=1,2,3,…,其中,j>k);
于是,銷售額增長率A =△Assj/Ask。
(2)貨款回收率(B)
回款率=(回款額/銷售額)×100%。
則,回款率H=(Ad1+Ad2+…+Adj)/(S1+S2+…+Sj)×100%。
其中,j表示截止當前時間段,過去所有的天數。
三、聚類分析
銷售人員績效評價這一問題有兩個特點:一是影響因素眾多,且各因素之間關系錯綜復雜,其中一些因素可通過檢測和試驗等方法來獲取信息,另外一些因素卻因檢測手段的局限而無法測度,因此該問題具有模糊性;二是模糊性的累積會使績效評價結果的精度降低。因此,在評價過程中,精確性與模糊性形成一對十分突出的矛盾,而基于以下改進的遺傳算法的模糊聚類是解決這一矛盾的有效方法。
遺傳算法是一種借鑒基因遺傳機理和達爾文適者生存的自然選擇原則,模擬自然進化過程,基于群體的隨機化搜索算法,目前已廣泛應用于組合優化、復雜系統設計、自動控制、信號處理等領域。標準遺傳算法(GA)的二進制編碼策略及其相應的交叉和變異算子,以模式定理和積木塊假設為基礎,其特點是簡單、適用面廣。然而標準的遺傳算法(GA)存在以下無法克服的問題:各代群體中的最優個體未得到保護;由于后代完全替代雙親,優良的基因結構被交叉破壞的可能性很大;采用適應度作為選種的選擇壓力,如果選擇壓力不足或者波動,導致迭代過程過早收斂或發生振蕩。因此,本文的算法對遺傳算子加以了改進和擴充。
用遺傳算法求解聚類問題,要解決三個問題:如何將聚類問題的解編碼到基因串中;如何構造適應度函數來衡量每條基因串對聚類問題的適應程度;如何選擇各個遺傳算子。以下便是基于改進的遺傳算法的模糊聚類對以上問題的解決方案。
1.將聚類問題的解編碼到基因串中
設定聚類的目標函數是Jm(U,P),聚類的最終目標是獲得樣本集X的一個模糊劃分矩陣U和聚類的原型P,而U和P是相關的,即已知其一解可求得另一個的解,因此,可有兩種編碼方案。
在第一種編碼方案中,我們對硬劃分矩陣U進行編碼,設n個樣本要劃分為c類,用基因串
a={α1,α2,…,αi,…,αn} (1)
來表示某一類分類結果,其中αi∈{1,2,…,c},i=1,2,…,n。當αi取為k(1≤k≤c)時,表示第i個樣本屬于第k類。
在第二種編碼方案中,我們對聚類原型矩陣P進行編碼,把c組表示聚類原型的參數連接起來,根據各自的取值范圍,將其量化值(用二進制串表示)編碼成基因串:
(2)
其中每一個聚類原型Vi都有一組參數與之對應。例如:
(1)對于FCM算法就對其聚類中心量化編碼:
(2)FCL算法可對其原型(直線)上的兩點v1,v2量化編碼:
bFCL= Ec{V1(1),V1(2),V2(1),V2(2),…,Vc(1),Vc(2)}
2.聚類問題適應度函數的構造
對于基于目標函數的模糊聚類問題,其最優聚類結果對應于目標函數的極小值,即聚類效果越好,則目標函數越小,而此時適應度應越大,因此我們可以借助目標函數Jm(U,P)來定義標準遺傳算法(GA)的適應度算法:
(3)
其中,ζ為一給定的常數,對于不同原型的模糊聚類,只需給定相應的相似性測度函數D(xk,pi),即可按式(3)構造不同類型的模糊聚類算法。下面以模糊c線聚類算法(FCL)為例介紹適應度函數值的計算步驟。
算法:FCL聚類遺傳算法中適應度函數的計算步驟
步驟一:對于某一基因串進行編碼,得到{vi(1),vi(2);i=1,2,…,c},其中,vi(1),vi(2)∈Rs;
步驟二:由{vi(1),vi(2);i=1,2,…,c} 得到c條直線pi的單位方向矢量di,
其中:表示之間的歐式距離;
步驟三:由{vi,di;i=1,2,…,c}計算第k個樣本xk到第i類的距離,vi∈,
D2(xk,pi)=(xk-vi)T(xk-vi)-(
步驟四:由下式計算隸屬度矩陣:
其中:
步驟五:由μik,D(xk,pi),i=1,2,…,c及式(3)計算個體適應度函數的值。
2.選擇各遺傳算子
在解碼,適應度函數的構造之后,就可以用GA求解聚類問題了,但在此之前還要確定算子集T中算子的選取。在基于GA的聚類算法中我們對所有算子都選用,只不過賦予其不同的使用概率,使其按概率進行操作。針對GA的不足,這里對遺傳算子做了以下改進和擴充。
(1)單純形算子:Td(·)
Td(·)算子是為了產生新的個體而設置的,它通過對三個個體操作而產生第四個個體。其基本算法如下:
Td1:隨機獲得三個選種得到的個體的基因串S1,S2,S3,假定
ff(I1)≥ff(I2)≥ff(I3),Ii=Dc(Si),i=1,2,3
Td2:對于三個個體基因串的每一比特位,
IFS1i=S2iTHENS4i=S1i
ELSES4i=Neg(S3i)
其中,Pd為該算子操作的概率參數,Neg(·)為取反操作,對于每一二進制比特位可取為:
Neg(α)=1-α,α∈{0,1}。
(2)雙點交叉算子:T`c(·)
為了獲取理想的搜索結果,我們對交叉算子Tc進行改進,由原來的單點交叉變為雙點交叉T`c,具體如下操作:
其中:k,l分別為用Rand(L)產生的(0,L)之間均勻分布的整數。
(3)梯度算子:Tg(·)
我們增加了一個梯度算子Tg(·),它以概率1對適應度值最高的基因串所對應的解作為初始點作梯度優化獲得極值點,同時以概率Pi對其他串對應的解進行梯度優化,從而保證每次都能至少搜索到極值點。
(4)解釋算子:Te(·)
解釋算子是對原來的解碼算子Dc(·)的擴展。由于我們用一定比特位的二進制代碼表示了一個區間[Ai-Bi/2,Ai+Bi/2],因此必須用解釋算子把解碼得到的實數轉換為編碼區間所對應的值:
其中,Ai為對應Si的實數編碼區間中心點,B為編碼區間的大小,C為L比特位的二進制碼的全1串所表示的實數值。
四、應用實例
在此聚類分析的實例應用中,遺傳算法與傳統的模糊聚類算法實際上在同時運行,因而基于這種改進遺傳算法的模糊聚類算法有機地把這兩者結合起來了。同時,在應用中還有機地結合了進化結束的準則和傳統算法的終止準則。這樣不僅提高了算法的聚類分析性能,也提高了算法的收斂速度。
實例收集了某制藥企業8個不同區域銷售代表的原始數據,原始數據包括員工ID(Id)、銷售價格(P)、銷售數量(N)、銷售時間(T)、銷售額(As)、每天銷售額(S)、每天回款額(Ad)、銷售計劃(Sp)、客戶數量(Cn)、客戶拜訪(Cv)、團隊合作精神(Ts)、命令執行度(O)、創新能力(Ia)等等。對這些原始數據進行清洗取樣重組并綜合處理,得到銷售人員績效評價KPI指標數據如表2所示。
從人力資源管理系統中調用基于以上聚類分析算法的銷售員工績效評價模塊,輸入KPI指標數據,進行聚類分析。模塊中調度算法的類結構形式化描述為:
Class salval {
private:
string commandlist;//用于存儲用戶命令序列
float * val; //指針val指向被分析變量序列
public:
commandlist=Get(string cmdlist);//獲取用戶命令序列
Quick_cluster(float val)//運行模糊聚類算法
}
通過調用改進遺傳算法的模糊聚類算法,經9次迭代,取種規模N=8,變異概率Pm=0.5,交叉概率Pc=0.2,得到這8個銷售代表的聚類分析結果為{8,3},{2,7},{6,4,5},{1}
由以上分析結果我們可以得出結論:銷售員8,3的業績為“優秀”,銷售員2,7的業績為“好”,銷售員6,4,5的業績為“一般”,銷售員1的業績為“差”。
五、結束語
隨著數據挖掘技術的更廣泛應用,將為企業人力資源管理者的管理決策提供更多智能化的解決方法。而聚類(clustering)作為數據挖掘領域最為常見的技術之一,能用于發現在數據庫中未知的對象類,能考察個體或數據對象間的相似性,能合理地劃分相似性條件的個體或數據對象。對于企業來說聚類技術能把企業中眾多的員工按工作績效進行分組類聚,使管理者可以清楚的知道每個員工所屬的業績類型,并且可以分析這一類型的員工最大的特點是什么,管理者可以根據這些特點制定合適的管理手段以刺激其工作的積極性。當然,充分利用聚類技術做更多深層次決策信息的挖掘,是值得我們進行深入探索的課題。
參考文獻:
[1]卿濤:人力資源管理概論[M].北京:清華大學出版社,2006.235~236
[2]劉向鋒:數據挖掘在銷售管理系統中的設計和實現[J].計算機應用研究,2004,21(6):190
[3]Holland J.H. Adaptation in natural and artificial systems[M].Ann Arbor:The University of Michigan press,1975 reprinted MIT Press,1992
[4]覃俊華張洪偉趙世政:基于遺傳算法的模糊聚類研究及其應用[J].計算機應用,2007,27(1):53