唐 賀, 楊 濤, 阮華斌
(清華大學a.生命科學學院;b.蛋白質研究技術中心,北京 100084)
生物計算平臺成立于2013 年(以下簡稱“計算平臺”),機房和設施位于清華大學生物新館、醫學樓、生物醫學館和生物技術館等處。平臺通過搭建專用的圖形工作站[1]、高性能計算集群和GPU 服務器,以更好地滿足生物醫學和交叉科學不斷提出新的要求和挑戰。計算平臺面向3 個學院提供IT 支撐相關的各項任務,科研柔性大,任務多而雜,交互接口復雜,且時效性高。計算平臺在日常的管理中發現,常規“面對面”管理方式效率低下,平臺主管任務繁重,每日面對向下布置具體工作內容就顯得過于“奢侈”,且難以考核工作的完成情況。隨著社會的發展,企業和組織的管理不斷完善,使之可以完成各自的目標使命,因此計算平臺迫切需要引入一套行之有效的扁平化管理方法[2]。
在近代管理中有兩種應用最廣泛的理念和模式,即關鍵績效指標(KPI:Key Performance Indicator)和目標關鍵結果(OKR:Objectives and Key Results)。
KPI的理論基礎來源于意大利經濟學家帕累托提出的一個經濟學原理:社會上20%的人占有80%的社會財富,這就是被后人稱作的80/20 法則[3]。對于一個企業,如果抓住了20%的關鍵主體,也就等同于創造了80%的工作價值,因此對戰略目標根據關鍵指標自上而下進行層層分解,以關鍵的節點作為績效考核的指標再自然不過。企業在設計KPI 時必須遵守SMART 原則[4],即Specific、Measurable、Attainable、Relevant、Time-based。
1992 年,Robert 等[5]提出平衡計分卡(BSC:Balanced Scorecard)的概念和理論框架。該理論首次將各種非財務指標與財務指標同一起來,并與KPI 完美結合,盡管存在著一些問題[6-8],但其依舊成為工業時代企業績效評估的主流方法。
(1)KPI模式的優點。KPI 在管理體系中引入了嚴格的量化考核指標參照系,并根據實際情況進行權重調整,從而適應了復雜管理的量化考核需求。
(2)KPI 模式的缺點。隨著21 世紀信息時代的到來,傳統的KPI加BSC模式逐漸展現出其不適應時代一面。不同于工業時代傳統制造企業專注于生產制造,現代企業目標多變,傳統KPI 不易改變目標;現代企業產品快速迭代,傳統企業無法用固定的KPI 績效指標進行考核;信息時代很難以工作量進行衡量,如Douglas McGregor的X-Y理論強調的知識型人才已不再以金錢為首要目的,而是以創造多少社會價值來體現個人價值[9],傳統KPI不能起到有效的激勵。
與此同時,有先見之明的企業已經開始探索新的管理方式,就在這樣的環境下OKR 運用而生,逐漸成為符合這個時代的企業管理方法[10]。
目標管理(MBO:Management By Objectives)于1954 年由管理學大師Drucker[11]提出,強調自我控制管理,其激勵效果比被動管理更加有效。作為英特爾公司CEO,Andy Grove在此基礎上創立并向全公司推行了OKR管理方法,使公司成為PC 產業中的超級企業。隨后,英特爾的前高管John Doerr,以投資人的身份將OKR引入Google公司并將之發揚光大[12]。
(1)OKR模式的優點。OKR 與KPI 的企業管理方法也是近些年學者們的研究重點[13-14]。相比較傳統的KPI模式,OKR 的優勢不言而喻,主要體現在以下5 個方面:①O 與KR 相互轉化。O 與KR 并不是固定不變的,上一層的KR又是下一層的O,如圖1 所示。也就是說公司制定總體Objectives 后,分配對應的Key Results給下一層級執行人員,在接到Key Results 后將其作為Objectives,分配給下級Key Results。這種層級金字塔式的目標導向使公司上下各層都參與到目標的制定當中,形成層層支撐。②注重自我管理。不同于KPI的被動式管理,OKR主張員工的自我管理與激勵,盡管制定了Key Results,但是并沒有具體的執行步驟與標準,員工若要完成任務,需要自我學習,自我進步,這樣才能激發創造力,完成有難度的KR 任務,甚至是超額完成。③增強團隊合作意識。由于OKR的透明公開設計原則,有利于公司、團隊和員工的目標的統一,增進團隊的合作,體現出員工貢獻價值的公平與公正。④關注企業整體目標。得益于OKR的層層分解,O 與KR 相互轉化的特點,使公司在完成每一層級的Objectives 時都是對上一個層級的支撐,這種層層支撐最終匯總到最終的目標戰略中,達到企業員工整體一心的效果。⑤目標的快速調整。由于企業戰略上的目標調整,OKR 可以讓企業在確定總體目標后,逐漸進行層級目標調整,并不會對企業的管理進行太大的調整。
(2)OKR 模式的缺點。盡管OKR 有上述優點,然而OKR的實施需要員工有良好的自我學習和創造能力,這樣才能完成具有挑戰的Objectives。
盡管計算平臺嘗試過使用KPI 進行目標管理,但是并沒有達到預期效果[15]。隨著Google、Facebook、LinkedIn[16]等大型跨國公司成功應用OKR,計算平臺引入OKR管理模式,將重點敘述平臺應用OKR 的具體細節。
(1)目標有進取心。設置過于簡單的目標,員工將失去工作的動力,而有進取心的目標能有效激發員工的創造力及活力。
(2)可量化。所有的關鍵要在時間和數量上可以衡量,不可以過于籠統和主觀。
(3)公開透明。所有人的OKR都是可以看到,其中包含內容和評分。
(4)扇度適中。Objectives 最多5 個,每個Objectives最多4 個Key Results,內容以一頁紙為宜。
(5)自上而下。由公司頂層,層層分配到部門,最后詳細到組和個人。
(6)源于底層。管理層應充分聽取員工的聲音,其工作才能更有動力。
(7)不是績效考核的工具。只作為明確目標與跟蹤工作進度的目的。
(8)分數不重要。評分為1 盡管代表著已經完成,但也有可能是難度設置低了,低分數也不代表著工作沒有完成,而是要在分數中明確什么是不重要的和發現新問題。
(9)周期性調整。公司應以月度、季度、半年、年度為周期進行OKR 打分,并根據實際情況調整Objectives和Key Results。
作為服務學校科研工作的計算平臺,其宗旨只有一個:為生命學科各實驗室提供優質的科研支撐服務。
為達成總體目標,計算平臺將其拆分成穩定的集群存儲能力、強大的集群計算能力、優質用戶服務質量、雄厚的成果產出能力四大細分目標,這些目標相互影響,共同支撐為清華大學生命學科各實驗室提供優質的科研支撐服務這一總體目標,如圖2 所示。
(1)穩定的數據存儲能力。清華大學冷凍電鏡實驗項目每日下機數據量高達TB 級,作為科研的第一手寶貴原始數據,要為這些數據提供穩定,充裕、快速讀寫、安全的存儲服務。為保證上述要就需要及時擴大存儲容量、實時進行讀寫測試、對數據進行災備處理。老存儲需要更新換代的,在保證不影響用戶使用的情況下,完成快速的數據轉儲,以更好地服務支撐科研工作。為此,Key Results 設計如下:①保證不低于30%的容量剩余;②存儲讀寫測試時間連續10 min低于300 ms(8.1M電鏡mrc 脫敏數據);③保證生產存儲使用年限不超過5 年;④對不少于80%的重點電鏡數據進行備份。
(2)強大的集群計算能力。由于涉及大量生物方面計算,因此平臺需要支撐CPU 及GPU 的計算需求。在這方面,不希望看到大量的資源空閑,調度中提交的任務不應長時間等待,更不應發生提交失敗的問題。為此,Key Results 設計如下:①CPU 使用率不低于60%;②調度任務平均排隊時間不超過12 h;③集群可用率不低于99%;④支持應用不少于100 種。
(3)提供優質服務。平臺的核心目標是提供優質科研服務,在服務過程中會收到用戶反饋的各種問題,計算平臺需要及時響應和解決,同一類問題多次反饋需要制定解決此類問題的相關文檔操縱手冊,一方面快速提供解決方案,另一方面提高平臺的工作效率。此外,面對新用戶需要進行定期和不定期的培訓,并做及時的用戶反饋工作。為此,Key Results設計如下:①用戶問題響應時間小于15 min;②同一類問題反饋3次以上建立標準化處置文檔;③每年進行用戶培訓10次以上;④每年進行用戶交流會5 次以上。
(4)雄厚的成果產出能力。計算平臺提供高質量的存儲及計算服務支撐,將以CNS等高水平期刊論文的發表數量,或者國際國內專利發明的數目,作為支撐各實驗高水平成果產出的支撐力度。與此同時,平臺應結合實際科研支撐服務的經驗,總結各類管理及技術類文章,以期刊或專利的形式進行推廣。另外,平臺應借助自身技術優勢對校內外進行技術支撐。為此,Key Results設計如下:①每年支撐高水平論文不低于30 篇;②每年平臺發表文章或國家發明專利數不低于12 個;③提供校內其他院系技術支撐不低于10次;④為校外提供服務不低于6 次。
基于以上規劃,平臺制定了年度OKR 季度評分表,如表1 所示。

表1 年度OKR季度評分表
計算平臺與代謝平臺合作搭建一個為代謝實驗提供可以快速、準確檢索的數據庫網站,盡管國外有相關技術類網站,但是由于限制等原因無法正常使用,因此搭建這樣一個網站勢在必行。
此項目是計算平臺提供校內提供技術支撐不低于6 次的Key Result 子項目,因此團隊完成此項目就是在為清華大學生命學科各實驗室提供優質的科研支撐服務。
以下為具體的OKR設計及項目完成時評分。
項目Objective:上線運行代謝數據庫檢索網站
|___ Objective 1:完善的需求分析
|___ Key Result 1:面對面需求討論不少于10次0.7
|___ Key Result 2:需求文檔版本數不少于30版0.6
|___ Key Result 3:需求分析文檔字數不少于1 萬字0.7
|___ Objective 2:詳細的設計方案
|___ Key Result 1:設計說明書版本數不少于10版0.7
|___ Key Result 2:與需求方review設計方案不少于3 次0.9
|___ Key Result 3:設計文檔字數不少于1 萬字0.6
|___ Objective 3:高效的代碼編寫
|___ Key Result 1:千行代碼bug 數不高于1個0.7
|___ Key Result 2:四大主流瀏覽器內核覆蓋率100% 0.7
|___ Key Result 3:網站響應時間不長于1000 ms 0.6
|___ Objective 4:全面的網站測試
|___ Key Result 1:單元測試不少于3 輪0.6
|___ Key Result 2:內部整體測試不少于3 輪0.7
|___ Key Result 3:用戶功能測試不少于3 輪0.6
在OKR的管理方法下,此項目經過60 人天的工作量,于2019 年6 月按時交付,1.0.0 版本正是在清華校園網上線,同時進行內部測試。
計算平臺為提供穩定的集群存儲能力,我們定期將舊存儲的數據轉儲到新存儲中。
以下為具體的OKR設計及項目完成時評分。
項目Objective:新老數據服務器快速準確轉儲
|___ Objective 1:全面的數據摸底
|___ Key Result 1:文件數統計覆蓋不少于90% 0.8
|___ Key Result 2:文件大小統計覆蓋不少于90% 0.8
|___ Key Result 3:文件夾平均大小及深度統計覆蓋不少于90% 0.6
|___ Objective 2:詳細的數據拆解
|___ Key Result 1:對不少于80%的文件夾進行拆解0.7
|___ Key Result 2:拆解后的文件夾數不少于3 個0.9
|___ Objective 3:快速完全的數據搬運
|___ Key Result 1:轉儲橋設備不少于8 臺0.9
|___ Key Result 2:轉儲時間不多于7 天0.8
|___ Objective 4:完善的數據驗證
|___ Key Result 1:腳本化率不低于80% 0.6
|___ Key Result 2:“ls-Rl”比對率不低于99% 0.8
|___ Key Result 3:文件內容比對采樣率不低于1% 0.8
在OKR的管理方法下,計算平臺6 位工作人員加班加點,于2019 年5 月經過5 天時間,快速、準確的完成總共3000 萬文件數、總大小320TB 的數據緊急轉儲任務,確保各實驗室科研任務正常進行。
計算平臺通過引入OKR管理模式,應用到實際的管理工作中,激勵全員工進行自我管理,以透明公平的績效管理方式,使全平臺統一目標,提高工作效率,更好為生命學科各實驗室提供優質的科研支撐服務。