謝銳兵
(浙江廣廈建設職業技術大學,東陽322100)
智慧校園伴隨著互聯網科技、通信技術特別是5G技術以及人工智能、大數據等科技的不斷發展,越來越受各個高校的重視,其技術和應用日趨完善,特別是在黨的十九大明確提出教育現代化后。當前,已經有不少針對高校教學、教務、考務、學籍、檔案、一卡通等應用的智慧校園管理數據系統案例[1]。黨的政治建設的作為統領和工作首位,是高校的育人工作中的重要組成部分,如何在信息化大潮流中,利用互聯網、5G、人工智能等科技手段,改進高校黨建的管理和工作模式,打造高校智慧黨建模式,是一個重大命題。隨著智慧校園應用的不斷深入,越來越多的學者和高校已經將目光投入到高校的智慧黨建的研究和應用中。
目前,在高校智慧黨建研究中主要集中在智慧平臺的建設、數據管理機制、互聯網背景下黨建機制等方面,其機能主要體現在工作流程的信息化、學習過程的信息化、數據管理的信息化等層面。然而,在高校的黨建過程中,對學生發展對象以及學生黨員的考察、監督、評判是非常重要的環節。在傳統的黨建工作過程中,往往依托于基層黨支部以及入黨介紹人在日常的學習、生活、實習過程中,通過學習成績、活動的積極性、思想匯報等環節對其進行人為的考察、監督和評判,由于關注力度的不確定性、信息獲得的片面性和滯后性、感情因素的隨意性等,會造成考察的不全面及監督教育的不及時,對可能影響考察結果的因素無法做出合理的預判,進而提前進行干預和引導,特別是針對校外實習的學生考察對象。在智慧校園平臺和智慧黨建平臺的基礎上,我們可以通過數據挖掘技術,獲得學生發展對象以及學生黨員的成績、考評、黨校學習效果、行為表現、思想動態等影響因素的量化參數,利用智能算法構建預警機制,對考察對象進行科學合理的預判,以幫助組織加強監督要教育。
預警作為一種結果預測和評估的手段,在很多領域都廣為應用,特別是在生產活動、自然災害以及醫療事故的風險預測和安全評估方面,研究和應用更為廣泛,帶來了很大的社會效果和經濟效益。將預警機制的原理應用于高校教育,通過對學生的成績等進行預測,從而對學生的學業發出預警,以便實現危機學生的有效關注、提前干預,已經被廣為研究。在知網以“學業預警”為關鍵字查詢,獲得400余條期刊文獻記錄,最早可以追溯到2005年,近五年最為集中,文獻記錄數量超過70%。通過文獻查閱發現,當前對學業預警研究的方向,主要體現在兩個方面,一是高校學業預警的管理模式、制度設計、指標研究等機制研究,二是基于功能實現的平臺設計研究和算法研究。魏茜[2]提出建設院級預警指標來補充校級預警指標,以此來克服校級預警在以學業成績進行預警處理的滯后性。何偉[3]認為高校思想政治教育是大學生學業預警機制的重要部分,提出提高素質、創新協同要素以及有序銜接來發揮其功能。尹建平等人[4]重點研究了學業預警后幫扶措施,從而改善學業效果,降低預警率。在算法和平臺開發的研究方面,向東旭、薛夢婷等人[5-6]提出的基于協同過濾推薦算法的高校預警功能實現;宋楚平等人[7]研究了改進的神經網絡算法在學業預警的應用;陶佰睿等人[8]在學業預警中采用了核函數的模糊均值聚類(KFCM)改進支持向量機(SVM)數據決策算法,取得了較好的效果。
當前針對智慧黨建的研究和應用比較多,研究主題涵蓋了智慧黨建的意義、要求、措施、機制、功能設計、平臺開發、效果分析等,但是將預警機制引入到黨建工作中的研究,相對較少,知網中能查詢到的研究文獻寥寥無幾。除周鳴、楊芳菲等人[9]通過制度建設、隊伍建設、平臺建設當方面分析了高校學生黨員考評與預警機制以及徐一凡[10]分析了“互聯網+黨員預警機制”的可行性和平臺建設外,暫未查閱到其他有價值的文獻。高校黨建工作是高校育人的重要陣地,學生黨員發展和監督教育是大學生學業的重要部分,在高校研究智慧黨建的過程中,將預警機制引入到高校黨建工作中,以創新高校黨建工作模式,提高高校黨建效果,是非常值得研究的課題。
在高校黨建工作中,對學生發展對象以及學生黨員的考察監督涵蓋的面較多,不同的學校、支部評價的因素權重也有所區別。預警機制的建立,首先必須充分考慮能影響預警結果的各個特征因素,并且能進行量化對比,才能有效推測出預警結果。然而在預警機制的實際量化分析過程中,部分特征因素受個體主觀影響等,很難比較科學客觀地通過量化來體現,還有部分要素對預警結果影響較小但原始數據收集較困難,因此在預警機制建立的過程中,如何科學地選取影響因素、準確的參數量化,是影響預警功能實現和效果的關鍵。通過查閱黨建相關文件資料,并對黨建專家、思政教育專家、教育管理專家以及基層黨務工作者的訪問調研,預警機制選取了高校黨建中對學生發展對象以及學生黨員進行監督考察的主要特征因素:課程平均成績、教師綜合評價、組織生活評價、黨的理論學習評價、群眾反饋評價、支部黨員評價、思想動態評價等7大項。
在智慧校園和智慧黨建平臺應用的基礎上,預警機制中的特征因素數據獲得途徑比較規范和容易,例如在智慧校園的教務、考務、學籍等大數據平臺中,可以獲得課程平均成績、教師綜合評價等相關權威數據,在智慧黨建的管理、學習、宣傳等數據平臺中,可以獲得組織生活評價、黨的理論學習評價、群眾反饋評價、支部黨員評價、思想動態評價等有效數據,這對預警機制的功能實現,提供了前提。通過調查發現,在高校學生黨員發展對象和學生黨員的考察監督過程中,不同的因素對考察的結果的影響也有區別,因此在預警機制中,按其重要性對各個特征因素進行加權,根據權值的不同,來代表其占的比重。
在本預警機制中,特征因素的總權值為1,各個因素的權值分配如表1所示。

表1 特征因素權值分配
在智慧黨建的預警系統中,通過基于用戶的協同過濾推薦算法來實現預警機制。系統將學生黨員和發展對象作為一個項目,將課程平均成績、教師綜合評價、組織生活評價、黨的理論學習評價、群眾反饋評價、支部黨員評價、思想動態評價作為計算相似度的特征向量。利用特征向量,計算項目之間的相似度,再將達到一定相似度的項目的各個特征向量進行推薦計算,從而達到預測結果,實現預警效果。預警機制流程圖如圖1所示。

圖1 預警機制流程圖
協同過濾推薦算法是一種資源推薦類算法,其主要思想是通過用戶的行為信息,計算用戶對資源的興趣度,并將不同用戶、不同資源的興趣度建立矩陣關系,通過矩陣關系,來計算和選擇達到一定相似度的用戶群體,然后將某些相似用戶已經訪問過的資源推薦給其他還未訪問這些資料的相似用戶[11]。系統認為,具有一定相似度的用戶群,其對資源的興趣度也可能相似,這樣通過群體對比實現的資源推薦,具有較高的準確性。協同過濾推薦算法在很多資源、產品推薦類平臺已經廣為應用,如郵件推薦系統、電子商務平臺、個性化學習平臺等,通過實際體驗和查閱相關研究文獻發現,協同過濾推薦算法的應用的確能實現資源的有效推薦,提升用戶的個性化需求度。
協同過濾推薦算法經過不斷的發展,目前存在不同的分類,其中主要包括基于用戶的協同過濾推薦算法和基于項目的協同過濾推薦算法[12]。基于用戶的協同過濾推薦算法是目前應用相對更為廣泛的一種類型。基于用戶的協同過濾推薦算法繼承了協同過濾算法的主要思想,即通過用戶行為計算相似用戶,并選擇相似用戶使用過的而用戶還未使用過的資源推薦給用戶。基于用戶的協同過濾推薦算法需要依賴于足夠多的用戶行為數據作為分析基礎,因此在實際使用過程中,特別是新系統中,往往會出現數據稀缺等問題,影響推薦效果。基于項目的協同過濾推薦算法有別于基于用戶的協同過濾推薦算法,它是先獲取項目的信息,并對這些基本信息進行一定的特征化,再將這些特征與用戶設定的喜好特征進行相似度匹配,并按相似度排序,達到某個相似度節點的項目,則推薦給用戶,相似度越高的項目,推薦優先級則越高。
在智慧校園平臺和智慧黨建平臺中,對預警對象的特征因素進行量化評價,評價方式用百分制,即對系統中學生黨員發展對象以及學生黨員以往已經形成的課程平均成績、綜合評價、黨的理論學習、群眾評價等通過0-100分的形式進行評價保存。利用這些量化的特征因素,建立初始預警特征矩陣(以學期為單位):

此特征矩陣中的ti1-ti7分別表示第i個學生的課程平均成績、教師綜合評價、組織生活評價、黨的理論學習評價、群眾反饋評價、支部黨員評價、思想動態評價等7個主要特征因素量化評價值。
對7個特征因素分別加權,分別用Z1-Z7表示,其權的具體值見上文中的表1。依據特征因素量化評價值和權值,計算出學生i的第j個特征因素的權化值:

協同過濾推薦算法的核心思想是基于相似群體的推薦,其前提是通過計算彼此間的相似程度,并通過相似程度來推斷用戶之間的偏好是否接近,相似度越高,則認為對相同資源的偏好度就越接近,推薦度就越高。因此協同過濾推薦算法中的相似度計算方法至關重要。協同過濾推薦算法目前的主要相似度計算方法有余弦相似度計算方法、調整余弦相似度計算方法、基于條件概率相似性計算方法、皮爾遜相關性計算方法等[12]。相對最簡單的余弦相似度計算方法而言,調整余弦相似度計算方法、基于條件概率相似性計算方法、皮爾遜相關性計算方法更具合理和科學性,因為余弦相似度計算方法未考慮不同用戶評分范圍和評分標準的差異性問題,調整余弦相似度計算方法、皮爾遜相關性計算方法則將不同用戶的評分差異性的影響有了最大程度的降低[12]。智慧黨建預警系統中,采用調整余弦相似度計算方法來計算相關相似度。
利用初始預警特征權化矩陣和平均權化矩陣,通過學生a和b的各個特征因素權化值和所有因素平均權化值,采用的調整余弦相似度計算公式如下:

設定Sim(a,b)的閾值,認為相似度大于設定閾值的群體為高相似群體,建立用戶a的高相似矩陣:

預警結果生成的原理是:需要對學生黨員或發展對象a的當前學期考察情況進行預警,先判斷學生a當前處于高校學歷的第幾學期,再通過學生a的高相似矩陣S′,從初始預警特征矩陣中挑選出高相似學生的該學期相關特征因素值,建立相似預警特征矩陣,再對預警特征矩陣中的特征值乘相似度求和,再求平均后與平均相似度相除,得出預警結果特征矩陣,生成預警結果。
相似預警特征矩陣為:

n代表的是某個學期。特征因素J的預警結果生成公式為:

系統選擇浙江某職業技術大學20年秋季學期的50名學生黨員和學生發展對象作為預警對象,在選擇預警對象時,考慮到高校學生入黨的考察規則和流程,以及避免協同過濾推薦算法使用中出現數據稀缺問題,50名學生黨員和學生發展對象全部來自大二、大三的學生對象。同時選擇了該職業技術大學2015年到2020年的500名學生黨員和學生發展對象,對其進行特征因素量化,作為預警系統的原始數據。
預警結果的準確率和有效性,是判斷預警機制是否有效的關鍵,受事務發展不確定性影響,任何預警機制的預警結果都不可能和實際結果完全一致,因此通過直觀的比對特征因素的實際結果和預警結果是否一致來分析實驗結果并作出判斷是不合理的。為了更為合理地判斷預警機制的效果,采用允許偏差內占比率和絕對誤差平均值兩個評價指標[6]來對實驗結果進行分析。
允許偏差內占比率指預警結果和實際結果比較誤差小于允許偏差值的特征因素個數在總的特征因素中的占比,其值越接近1,則預警結果越準確。實驗中允許偏差為[-5,+5],其公式表示如下:

絕對誤差平均值指預警結果Pi和實際結果ti的誤差絕對值的平均值,其值越小,則預警結果越準確。公式表示如下:

分別取相似度閾值0.6、0.7、0.8、0.9,0.95,實驗結果的允許偏差內占比率和絕對誤差平均值如圖2和圖3所示。

圖2 允許偏差內占比率

圖3 絕對誤差平均值
通過實驗結果分析可以看出,選擇不同的相似度閾值時,預警結果的準確性不同,原理上相似度閾值越高,相似群體的相似度越高,其生成的預警結果應該也越高,但從實驗結果來看,相似度閾值在0.8~0.9之間,準確度最高,再往上,則出現下降趨勢,其原因在于相似度越高,則生成的相似群體越少,當數量降低到一定程度時,由于計算數據太少影響了個體差異的消除度,使得預警結果偏差較大。因此在選擇相似度閾值時,要充分考慮系統中用戶群體數量。
為了驗證預警機制的功能可行性和有效性,在設置實驗數據時,對實驗數據進行了一定的優化和過濾,使得實驗數據在結構上和屬性上都更加規范和有序,然而,在真實的高校智慧黨建預警機制運用中,需要面對更加復雜、更加無序、大量非結構化的數據,因此,要讓預警機制更加有效,還要解決如下問題:
(1)預警特征因素不全的問題。目前預警機制中只考慮了課程平均成績、教師評價等7個特征因素,在高校黨建工作中,對學生黨員和考察對象進行監督考察的范圍遠不止這7個,例如學生的獎勵情況、懲罰情況、興趣愛好情況、心理活動情況等等。后續要進一步對黨建工作的工作機制和考察范圍進行研究,健全預警機制的預警因素。
(2)預警信息數據初始化問題。預警實驗過程中,直接對數據進行百分制初始化,初始化過程中,花費了大量的人力和時間,而且初始化過程中,由于缺少評價轉化的標準化,類似教師評價、思想動態評價等因素在量化時存在偏差。在智慧黨建預警應用中,數據初始化應該交由系統自動收集和統一標準量化,這需要在數據挖掘和處理上加大研究和應用,讓預警機制的信息更科學、標準。
(3)基于協同過濾推薦算法的數據稀缺和冷啟動問題?;趨f同過濾推薦算法需要基于一定基礎的用戶數據才能進行有效的預測和推薦,高校智慧黨建預警機制中,對于大一的學生黨員和發展對象,學生數據稀缺,不利于算法的有效運算,在后續的研究中,可以通過改進算法和引入其前置學歷過程中的數據和高考成績的方法來進行改善。
高校黨建工作是高校育人工作的重要部分,預警機制的引入和應用,能更及時、更有效地發現問題解決問題,能提高高校黨建工作中的教育考察和監督的效果。智慧校園和智慧黨建的研究與應用,為預警機制的實現提供了數據基礎,依托于智慧校園和智慧黨建平臺的功能和數據,可以通過大數據分析和智能算法進行科學的預測分析?;趨f同過濾推薦算法利用相似度原理可以實現結果的預測,從而達到預警的效果。通過實驗數據分析,基于協同過濾推薦算法實現的預警機制,其預測結果具有一定準確性,預警結果有一定的代表性。同時也可以看出,由于預警機制的復雜性和算法本身的缺陷,預警機制還存在不足,在接下來的研究中,重點要加大大數據的挖掘分析,算法的改進,提高預警效果。