摘要:技能人才評價對高質量發展至關重要。傳統評價體系面臨指標設計主觀、數據可信度低、評價過程不透明及難以評估潛在能力等挑戰。該文提出一種融合區塊鏈與多維圖聚類的技能人才評價模型。該模型利用區塊鏈技術保障評價數據的不可篡改與可追溯性,構建可信數據基礎。在此基礎上,通過構建多維能力圖譜,應用圖聚類算法識別具有相似能力特征的學生群體,從而實現對人才技能水平的客觀、深度挖掘。通過對“通信網絡應用”專業的真實學生數據進行案例分析,結果表明,該模型能夠有效識別不同能力維度的學生群體,驗證了其在技能人才評價與選拔中的有效性和可行性。
關鍵詞:技能人才;評價體系;人工智能;區塊鏈;聚類
中圖分類號:TP391.41?" " " " 文獻標識碼:A
文章編號:1009-3044(2025)28-0045-03
開放科學(資源服務) 標識碼(OSID)
0 引言
隨著產業結構升級與技術發展,技能人才培養與評價日益成為教育與產業共同關注的焦點。在產教融合背景下,構建科學、高效、公正的評價體系成為關鍵問題。2022年10月,《關于加強新時代高技能人才隊伍建設的意見》提出,技能人才需具備創新與新技術適應能力、職業素養,注重實踐、提升綜合素質與參與競賽鍛煉[1]。但傳統評價方式存在一定不足:1) 指標復雜(涵蓋理論、技能、素養、學習、創新等方面) ;2) 加權/正則化易導致單指標失真;3) 佐證材料缺失或真實性難驗證,結果不透明;4) 新晉人才(如新生) 因數據缺失無法進行評價與選拔。這些問題可能共同導致了評價結果的“高分低能”現象,無法滿足新時代對高技能人才動態化、多維度、精準化選拔的需求。針對上述問題,本文提出結合區塊鏈與數據挖掘技術的技能人才評價選拔體系。本研究旨在優化技能人才評價機制,為精準選拔提供支撐,具有實踐參考意義。
1 相關技術
1.1 區塊鏈技術
區塊鏈技術[2]是一種有序連接數據區塊、基于密碼學保證不可篡改和可追溯的分布式數據庫技術。它通過提供可信數據記錄有效解決信任問題,是信任和價值交換的基石。在本模型中,區塊鏈主要用于解決評價數據的信任問題。學生的思想品德、學業成績、競賽獲獎等關鍵信息一經記錄便不可篡改,確保了后續數據分析的數據源的真實性與完整性,為實現公正評價提供了技術保障[3]。
1.2 圖聚類算法
聚類算法[4]是一種無監督學習方法,用于將無標簽數據集自動劃分為多個組,使組內數據相似、組間數據相異。圖是一種由頂點集合和邊集合構成的抽象數據結構,用于表示實體間關系。本文中,圖用于表示學生間的直接聯系(如同班、同俱樂部、同成績區間等) [5]。
傳統評價方法將學生視為孤立的個體進行打分,而圖聚類算法能夠將學生抽象為圖中的節點,將他們在不同維度上的相似性(如成績相近、共同參與項目等) 抽象為邊。通過分析圖的拓撲結構,算法能夠自動發現“競賽型”“學術型”“實踐型”等不同特質的學生群體,這種基于群體相似性的發現式評價,是對傳統個體賦分模式的有效補充和深化。
2 圖聚類數據挖掘下的技能人才評價體系
本文研究框架如圖1所示,包含3個主體:學校管理部門、二級學院、數據分析中心。所需原始數據分為兩類:學校部門提供的公共數據與伴隨式收集的學生數據。數據加密上傳至區塊鏈,確保防篡改、可追溯。分析中心從鏈上下載數據,清洗后通過圖聚類算法挖掘,生成技能人才評價結果并回傳區塊鏈保存。
2.1 伴隨式數據收集內容
數據主要通過校學生信息管理系統、教學云平臺、成績管理平臺、競賽管理平臺獲取[6]。各項指標的基礎分值與加分細則,是基于對專業人才培養方案、行業用人標準及專家訪談的綜合分析而初步設定,并可在系統中進行動態調整。指標內容包括:
2.1.1 思想品德
1) 指標設計
該指標旨在量化學生的職業素養與道德品質,這是技能人才不可或缺的基本素質。
2) 評分細則及方法
[S=A×0.6+B×0.4]" " "(1)
式中:S為思想品德得分,取值范圍為[0,100];A為平均操行分,B為平均考勤分。
平均操行分A的計算方法:
[A=1ni=1nCi]" " " " " " "(2)
式中:Ci 為第i學期的操行分,n為在校總學期數(由入學時間與系統當前時間自動計算) 。
平均考勤分B的計算方法:
[B=1ni=1nDi]" " " " " (3)
式中:Di為第i學期的考勤分,n定義同上一個公式。
原始數據來源于班主任提供的學生每學期操行分與考勤分。
2.1.2 學業成績
1) 指標設計
該指標旨在量化學生的綜合學習能力與學術素養,這是技能人才提升專業技能、適應行業發展的核心基礎。
2) 評分細則及方法
課程學習成績得分以在校已修課程(含必修課、限選課、任選課) 的平均分為依據,取值范圍為 [0,100],計算公式如下:
[E=1ni=1nFi]" " " " " " " " " " " " " "(4)
式中:E為課程學習成績得分,n為在校已修課程總數,Fi為第i門課程的最終成績。原始數據來源于校教務系統的學年學期成績。
2.1.3 社團實踐
1) 指標設計
該指標旨在量化學生的社會適應能力與綜合素養,這是技能人才融入團隊、服務社會的重要素養。
2) 評分細則及方法
分數取值范圍為[0,100],具體細則如下:
學生在校期間每參加1項校級以上社團或社會實踐:10分/學期;任組織者+2分/次;個人突出成績+3分/次。
原始數據:校學生處社聯提供的各社團成員名單及其他佐證材料。
2.1.4 技能競賽
1) 指標設計
該指標旨在量化學生的專業技能應用水平與綜合競技素養,這是技能人才展現專業實力、提升核心競爭力的關鍵能力。
2) 評分細則及方法
分數取值范圍為[0,100],具體細則如下:
本專業中級及以上證書計60分。個人獲世界級、國家級、省部級、市廳級、校級技能競賽一二三等獎及優秀獎,依次加:世界級40/36/32/28;國家級32/28/24/20;省部級24/20/16/12;市廳級16/12/8/4;校級4/3/2/1。團隊獲獎按個人同檔×排名系數。
原始數據:相關等級證書、獲獎證書。
2.1.5 企業項目
1) 指標設計
該指標旨在量化學生的實踐應用能力與職業素養,這是技能人才適應企業需求、勝任崗位工作的必備素質。
2) 評分細則及方法
分數取值范圍為[0,100],具體細則如下:
能夠參與企業項目計60分;項目完成后個人或團隊負責的部分能夠實現項目目標加20分;個人或團隊負責的部分能夠得到企業的認可加20分。
原始數據:項目成員名單及企業評價表。
2.1.6 擔任職務
1) 指標設計
該指標旨在量化學生的領導組織能力與綜合素養,這是技能人才發揮團隊引領作用、提升協作效能的重要素養。
2) 評分細則及方法
分數取值范圍為[0,100],具體細則如下:
學生在校期間:校級、系級、班級學生干部(含干事) 分別計40、30、20分;校、系、班級優秀干部每次加20、15、10分;任職滿1/2/3年再加10/20/30分,不疊加;擔任校、系、班最高核心職務各加10、6、3分;兼任多職按最高級別計。
原始數據:學校提供的班團委和干事名單、相關證書。
2.1.7 科研成果
1) 指標設計
該指標旨在量化學生的科研創新能力與協作攻堅素養,這是技能人才推動技術突破、解決復雜問題的核心潛能。
2) 評分細則及方法
分數取值范圍為[0,100],具體細則如下:
個人發明專利、實用新型、軟件著作權及外觀設計專利分別計100、40、30、20分/項;著名檢索、核心期刊及非核心專業期刊論文分別計100、80、60分/篇。若團隊獲獎,則個人加分為同級別個人加分×排名系數。
原始數據:相關專利證書、論文發表憑證等佐證材料。
2.1.8 體育鍛煉
1) 指標設計
該指標旨在量化學生的身體素質與健康素養,這是技能人才保持高效工作狀態、實現長遠發展的基礎保障。
2) 評分細則及方法
分數取值范圍為[0,100],具體細則如下:
體育課程學期總評成績合格每學期計10分;校運會獲獎:個人/團隊一等獎、獲獎名單的前10%:每項加4分;個人/團隊二等獎、獲獎名單的前11%~30%:每項加3分;個人/團隊三等獎、獲獎名單的前31%~60%:每項加2分;個人/團隊優秀獎、獲獎名單的后40%:每項加1分。
原始數據:體育成績、獲獎證書。
2.2 圖聚類算法
圖聚類算法(Graph Cluster Algorithm, GCA) 基于結構聚類算法SCAN。GCA的目的是通過對多維子空間的聚類得到對象交互更緊密的社區(團體) 。本文將每個學生的數據收集后,通過圖聚類算法對學生進行聚類,可以將能力相近的學生聚合成一個團體[7]。這個團體中的學生能力相近,比如我們可以挑選技能競賽、科研成果兩個指標,對所有學生這兩個指標進行聚類,獲得的每個分類中的學生在競賽能力和科研成果上的能力相近。這對新入校的學生選拔有很強的指導作用。
算法1. GCA([G,ε,μ])
輸入:多維度圖G,參數[ε,μ]
輸出:子空間聚類集合C
1. 初始化集合[C];
2. k =1
3. while [k≤d] do
4. " 計算所有k維度子空間組合[CanSk;]
5. " for each [Scan∈CanSk] do" //求每個子空間的核心節點
6. " " [CoreScan=?;]
7. " " for each [v∈V(Scan)] do" //對屬于該子空間的節點進行計算
8. " " "compute [NScanεv;]
9. " " "if [|NScanεv|≥μ] then [CoreScan?CoreScan∪v;] //將核心節點存放[CoreScan]中
10. " " if [CoreScan≠?] then
11. " " " [CScan =GenerateCluster(CoreScan,Scan)] //通過[Scan]維度的核心節點進行聚類
12. " " " [C?C∪CScan]
13. " k=k+1
其中,代碼中的部分變量解釋如下:
[Si]:[G]中所有的子空間組合,[ i=1,2,…,2d-1];
[CoreSi]:[Si]下所有核心節點;
[Dk]:[k]維度下的所有核心節點集[k=1,2,…,d];
[Sk]:[k]維度下的所有子空間[k=1,2,…,d];
[CSi]:[Si]下所有聚類集合;
算法1在第一次迭代首先生成一維度下所有子空間的組合[CanS1](行4) ,如生成一維聚類的3個子空間:競賽、科研,學習。接著選取[CanSk]中的所有子空間[Scan],分別在參數[ε, μ]下求出核心節點,并存于[CoreScan]中(行5-9) 。算法首先計算子空間內所有節點的[ε]-鄰居數[NScanεv],如滿足[|NScanεv|≥μ],則將v存放到[CoreScan]中,如計算的是“學習”子空間,則存于[CoreS學習]中。當子空間所有節點[ε]-鄰居計算完成后,調用算法2[ GenerateCluster(CoreScan,Scan)]生成一維度上的所有子空間的聚類(10-12) 。對于剛才的例子來說,就是生成了一維度下3個子空間的三個聚類集(有可能為空集,即該子空間不存在聚類) 。下一步迭代計算高一維空間的聚類(行13) ,直到完成第d維下所有子空間的聚類,因為只考慮競賽、科研、學習三個維度,所以d=3。
3 結束語
技能人才評價對高質量發展至關重要。本文運用區塊鏈實現數據可追溯、智能合約自動化與高效資源共享,并采用多維圖聚類算法挖掘人才真實技能水平。本研究的評價指標權重設定尚依賴于專家經驗,未來可探索基于數據驅動的自適應權重學習方法。同時受限于實驗數據的不完整性,部分聯系緊密的節點(學生) 并未在聚類中體現。未來,我們將使用更大更完備的學生脫敏數據對算法進行測試;為了更深入地挖掘具備相似能力的技能人才,后續將使用更完善的學生數據測試算法,并根據技能教育發展持續更新評價指標。
參考文獻:
[1] 中共中央辦公廳,國務院辦公廳.關于加強新時代高技能人才隊伍建設的意見[EB/OL].[2022-10-07][2024-11-05].https://www.gov.cn/zhengce/2022-10/07/content_5716030.htm
[2] SIDHU J.Syscoin:a peer-to-peer electronic cash system with blockchain-based services for E-business[C]//2017 26th International Conference on Computer Communication and Networks (ICCCN),2017.
[3] 王文杰.基于區塊鏈技術的供應鏈金融與中小企業融資瓶頸研究[J].長春師范大學學報,2018(7):58-62.
[4] 趙殿國.面向無監督學習的大數據聚類方法及其應用研究[J].統計與咨詢,2023(6):7-11.
[5] 劉鵬儀,胡節,王紅軍,等.基于對比共識圖學習的多視圖屬性圖聚類算法[J].計算機科學,2024,51(11):73-80.
[6] 潘雪.混合式學習的伴隨式評價設計與實踐研究[D].曲阜:曲阜師范大學,2022.
[7] 李振軍,代強強,李榮華,等.多維圖結構聚類的社交關系挖掘算法[J].軟件學報,2018,29(3):839-852.
【通聯編輯:代影】