彭玉蛟 王宏平 馬雪靜 蔣劍軍






摘要:大學(xué)生作為有知識(shí)有文化有理想的青年一代,參與公益事業(yè)并推動(dòng)公益事業(yè)發(fā)展是不可回避的社會(huì)責(zé)任。如何更好地培養(yǎng)大學(xué)生的公益意識(shí),為公益事業(yè)的發(fā)展培養(yǎng)更多的青年力量,也成為近年來公益事業(yè)思考的重要議題。文章通過調(diào)查問卷獲得大學(xué)生參與公益活動(dòng)現(xiàn)狀的數(shù)據(jù),引入機(jī)器學(xué)習(xí)方法量化分析大學(xué)生對(duì)公益認(rèn)知和參與情況的影響因素。首先利用斯皮爾曼相關(guān)系數(shù)分析大學(xué)生參與公益活動(dòng)積極性與其他因素之間的相關(guān)性;然后引入有序多分類logistic回歸模型挖掘大學(xué)生參與公益活動(dòng)積極性的顯著影響因素;最后應(yīng)用隨機(jī)森林和lightGBM模型對(duì)顯著影響因素進(jìn)行重要性評(píng)估,得到顯著性影響因素的重要性排序。由量化分析結(jié)果得出結(jié)論:“公益廣告大賽-我是公益人”活動(dòng)是大學(xué)生了解公益事業(yè)的最重要渠道,騰訊公司發(fā)起并資助的“樂捐、月捐、一起捐”是大學(xué)生最常參與的公益活動(dòng),參與公益活動(dòng)最大的收益是獲得證書。
關(guān)鍵詞:大學(xué)生公益活動(dòng);影響因素分析;有序多分類logistic回歸模型;隨機(jī)森林;LightGBM模型
中圖分類號(hào):TP311? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1009-3044(2023)34-0119-04
開放科學(xué)(資源服務(wù))標(biāo)識(shí)碼(OSID)
0 引言
國(guó)家的全面發(fā)展激活了國(guó)民的公益意識(shí)[1]。大學(xué)生作為有知識(shí)有文化有理想的青年一代,了解并參與公益事業(yè)進(jìn)而推動(dòng)公益事業(yè)的發(fā)展是不可回避的社會(huì)責(zé)任[2-4]。關(guān)于大學(xué)生公益活動(dòng)參與現(xiàn)狀研究是近年來的熱點(diǎn),結(jié)出了豐碩的成果。比如,王趙基于對(duì)江蘇省10所高校的實(shí)證調(diào)查對(duì)大學(xué)生微公益活動(dòng)參與的現(xiàn)狀、影響因素進(jìn)行了研究,并提出來大學(xué)生參與公益事業(yè)的引導(dǎo)對(duì)策[5];高雪平、楊淑涵則基于浙江高校的調(diào)查提出了大學(xué)生互聯(lián)網(wǎng)公益參與度的提升路徑[6];張潤(rùn)姣、陽慧玲對(duì)大學(xué)生公益的“互聯(lián)網(wǎng)+微公益”模式進(jìn)行了調(diào)查研究,并提出對(duì)策鼓勵(lì)在校大學(xué)生更多地開展線上公益行為[7];馬越以西北政法大學(xué)為例對(duì)大學(xué)生網(wǎng)絡(luò)公益活動(dòng)參與狀況進(jìn)行了細(xì)致的思考[8]。在豐富的成果中,關(guān)于大學(xué)生參與公益活動(dòng)影響因素的研究,特別是研究中引入量化方法,并不多見,而且大學(xué)生對(duì)于公益的認(rèn)知與參與度有待進(jìn)一步細(xì)致的了解,并進(jìn)行實(shí)證分析。本文通過設(shè)計(jì)并發(fā)布《關(guān)于大學(xué)生公益認(rèn)知及參與情況的調(diào)查問卷》獲得大學(xué)生對(duì)公益的認(rèn)知及參與情況的第一手資料,再應(yīng)用機(jī)器學(xué)習(xí)方法量化分析大學(xué)生參與公益的影響因素的顯著性,并評(píng)估顯著性因素的重要程度,分析結(jié)果對(duì)推動(dòng)大學(xué)生公益事業(yè)發(fā)展有現(xiàn)實(shí)意義。
1 關(guān)于大學(xué)生公益認(rèn)知及參與情況的調(diào)查
本文自主設(shè)計(jì)了《關(guān)于大學(xué)生公益認(rèn)知及參與情況的調(diào)查問卷》,共有包括“性別”“年級(jí)”“學(xué)科”等共20個(gè)問題,其中單選問題9個(gè),多選問題11個(gè)。調(diào)查問卷編制完成后發(fā)布在騰訊問卷平臺(tái)上,歷時(shí)15天收回有效問卷 378 份。調(diào)查問卷及采集到的數(shù)據(jù)已保存在百度網(wǎng)盤,鏈接:https://pan.baidu.com/s/1jOsw3 H8KZOvunFi1snhkLw?pwd=kj4x,提取碼:kj4x。
2 數(shù)據(jù)預(yù)處理
本文的目的是對(duì)大學(xué)生公益認(rèn)知及參與情況的影響因素進(jìn)行研究,所以本文以問卷中問題10“您參與公益活動(dòng)的頻率”為響應(yīng)變量,記為[Y],其他各問為影響因素。
調(diào)查問卷中所有題項(xiàng)對(duì)應(yīng)的因素都是定性的,數(shù)據(jù)預(yù)處理的主要任務(wù)是對(duì)定性變量進(jìn)行賦值。響應(yīng)變量[Y]有五個(gè)取值:經(jīng)常、一般、偶爾、幾乎不、沒有。在研究[Y]與其他因素的相關(guān)性時(shí)對(duì)[Y]進(jìn)行獨(dú)立編碼;在研究[Y]與其他因素的因果關(guān)系時(shí)對(duì)[Y]賦值如下:
[Y=1, 當(dāng)Y=“經(jīng)常”2, 當(dāng)Y=“一般”3, 當(dāng)Y=“偶爾”4, 當(dāng)Y=“幾乎不”5, 當(dāng)Y=“沒有”]
影響因素中,單選題對(duì)應(yīng)的變量按獨(dú)熱編碼賦值,對(duì)多選題對(duì)應(yīng)的變量則按多熱編碼賦值。賦值完成后,影響因素從原來的18個(gè)變?yōu)?16個(gè)(各問題下的各選項(xiàng)都成為了變量),記為[X1,X2,…,X116]。預(yù)處理后的數(shù)據(jù)已保存在百度網(wǎng)盤,鏈接:https://pan.baidu.com/s/1hvqUmtBzennykn4t15_aXQ?pwd=w9e3,提取碼:w9e3。
3 大學(xué)生公益活動(dòng)認(rèn)知及參與情況影響因素分析
本小節(jié)研究路線如圖1所示。
3.1 “大學(xué)生參與公益活動(dòng)的頻率”與其他因素的相關(guān)性分析
本文引入斯皮爾曼相關(guān)系數(shù)研究影響因素的各選項(xiàng)對(duì)響應(yīng)變量[Y]的各選項(xiàng)的相關(guān)性,挖掘參與公益的頻率分別為“經(jīng)常”“一般”“偶爾”“幾乎不”“沒有”相關(guān)性強(qiáng)的因素。計(jì)算部分結(jié)果見表 2。
表 2羅列的是對(duì)響應(yīng)變量[Y]的各選項(xiàng)“經(jīng)常”“一般”“偶爾”“幾乎不”“沒有”正相關(guān)前三和負(fù)相關(guān)前三的因素。從相關(guān)系數(shù)看,有下述結(jié)論:
1) “[X32]=所在的學(xué)校有關(guān)于公益活動(dòng)的社團(tuán)嗎?_有,活動(dòng)較多,經(jīng)常宣傳鼓勵(lì)大家參與”與大學(xué)生“經(jīng)常”參與公益活動(dòng)是正相關(guān)的,也是影響大學(xué)生“幾乎不”參與公益活動(dòng)的首要因素;而“[X31]=所在的學(xué)校有關(guān)于公益活動(dòng)的社團(tuán)嗎?_有,但活動(dòng)較少”是影響大學(xué)生“經(jīng)常”參與公益活動(dòng)的首要因素。
2) “[X35]=是否參與過公益_參與過”既與“一般”也與“偶爾”正相關(guān),還與大學(xué)生“沒有”參與過公益活動(dòng)強(qiáng)負(fù)相關(guān)(相關(guān)系數(shù)為[-1]) 。
3) “[X36]=是否參與過公益_B.沒有”與大學(xué)生“沒有”參與公益活動(dòng)強(qiáng)正相關(guān)(相關(guān)系數(shù)為[1]) ,也是影響大學(xué)生“一般”或“偶爾”參與公益活動(dòng)的首要因素。
4) “[X74]=對(duì)什么類型最感興趣及原因:二級(jí)標(biāo)題_聯(lián)通社交功能,偷取能量”是導(dǎo)致大學(xué)生“幾乎不”參與公益活動(dòng)的首要因素。
上述結(jié)論都與常識(shí)相符。
3.2 “參與公益的頻率”與其他因素因果關(guān)系分析
3.2.1 有序多分類logistic回歸模型
有序多分類logistic回歸模型是典型的多元統(tǒng)計(jì)分析方法,廣泛應(yīng)用于因變量為有序變量的因果推斷[9]。在大學(xué)生參與公益活動(dòng)影響因素分析中,易知響應(yīng)變量[Y]是有序變量,即其取值“經(jīng)常、一般、偶爾、幾乎不、沒有”呈現(xiàn)出一種遞減的趨勢(shì)。所以,本文引入有序多分類logistic回歸模型來研究[Y]與[X1,X2,...,X116]的因果關(guān)系,挖掘?qū)Y]有顯著影響的因素。本文[Y]關(guān)于[X1,X2,...,X116]的有序多分類logistic回歸模型的表達(dá)式如下:
[lnp(Y≤j/X1,…,X116)1-p(Y≤j/X1,…,X116)=μj-β0+i=1116βiXi] (1)
[pY≤j/X1,…,X116=μj-β0+i=1116βiXi1+eμj-β0+i=1116βiXi] (2)
式[1]和式[2]中,[β0]為截距項(xiàng),[βi]為模型的偏回歸系數(shù),表示[Xi]對(duì)[Y]影響的方向和程度;[μj]為分界點(diǎn)。
3.2.2 SPSS實(shí)現(xiàn)
由SPSS輸出的參數(shù)估計(jì)結(jié)果顯示,在5%的顯著性水平下,有11個(gè)變量對(duì)因變量影響顯著,而其余105個(gè)變量對(duì)因變量的影響并不顯著。篩選出的顯著性變量如表 3所示。
其中11個(gè)顯著性變量的含義如表4所示。
從表3各變量的回歸系數(shù)看,正向影響因素有8個(gè):[X25,X29,X32,X37,X45,X48,X49,X99],負(fù)向影響因素有3個(gè):[X10,X83,X88]。
3.3 “參與公益活動(dòng)頻率”顯著影響因素的重要性
表3列出了對(duì)“大學(xué)生參與公益活動(dòng)的頻率”有顯著影響的因素。這些因素對(duì)[Y]的影響程度是不同的,因此需要對(duì)它們的影響力進(jìn)行量化,并據(jù)此對(duì)它們按影響力排序。變量的影響力也稱為變量的重要性,本文引入兩種機(jī)器學(xué)習(xí)方法——隨機(jī)森林及LightGBM,來挖掘變量的重要性。
3.3.1 隨機(jī)森林
隨機(jī)森林是一種集成學(xué)習(xí)方法,因其預(yù)測(cè)精度高、數(shù)據(jù)兼容性強(qiáng)而應(yīng)用廣泛。隨機(jī)森林既可用于回歸[10]也能用于分類,還能評(píng)估因素的重要性。隨機(jī)森林對(duì)變量重要性的評(píng)估是通過基尼系數(shù)的平均變化量或袋外誤差率的平均變化量來實(shí)現(xiàn)的。本文應(yīng)用隨機(jī)森林以袋外誤差率的平均變化量來評(píng)估表3中11個(gè)顯著性變量的重要性,結(jié)果見表 5隨機(jī)森林所在列。
3.3.2 LightGBM模型
LightGBM(輕梯度提升機(jī)器)模型是一種基于GBDT的集成學(xué)習(xí)方法,廣泛應(yīng)用于回歸[11]或分類。LightGBM使用回歸樹作為弱學(xué)習(xí)器,以每個(gè)預(yù)測(cè)結(jié)果與目標(biāo)值的殘差作為下一個(gè)學(xué)習(xí)目標(biāo),每棵樹都學(xué)習(xí)所有先前樹的結(jié)論與殘差,將多棵決策樹的結(jié)果加在一起作為最終預(yù)測(cè)輸出,是一種高效率、高精度、高性能的分類算法。
由于LightGBM算法使用梯度提升決策樹作為基學(xué)習(xí)器,所以可記錄每個(gè)特征在樹節(jié)點(diǎn)中出現(xiàn)的次數(shù),一個(gè)特征出現(xiàn)的次數(shù)越多說明對(duì)分類做出的貢獻(xiàn)越大,即特征的重要性定義為該特征在所有樹中作為劃分屬性的次數(shù)。本文應(yīng)用lightGBM提取的顯著性變量的重要性見表 5中l(wèi)ightGBM列。
變量的重要性可視化如圖2(圖中l(wèi)ightGBM評(píng)估的重要性做了除以1000運(yùn)算)。
從表4或圖2可以看出,兩種方法評(píng)估的變量的重要性基本一致,重要性的大小說明11個(gè)顯著性變量對(duì)大學(xué)生參與公益活動(dòng)的影響力是有明顯差異的。
4 結(jié)論
通過對(duì)大學(xué)生認(rèn)知和參與公益活動(dòng)的影響因素分析,本文獲得如下結(jié)論。
4.1 基于影響因素的顯著性
應(yīng)用有序多分類logistic回歸模型,從116個(gè)變量提取了11個(gè)顯著性變量。從這11個(gè)顯著性變量的回歸系數(shù)看,對(duì)大學(xué)生參與公益活動(dòng)的頻率有正向影響的因素共8個(gè),負(fù)向影響的因素共3個(gè)。
8 個(gè)正向影響因素為學(xué)校組織公益活動(dòng)是建立激勵(lì)機(jī)制提供了方向,比如“您參與公益活動(dòng)有哪些收益:獲得證書”([X99]) ,則在制定獎(jiǎng)勵(lì)方案時(shí),“證書”是必要的激勵(lì)項(xiàng)。
3 個(gè)負(fù)向影響因素分別是,“大一”([X10]) 、“志愿工作任務(wù)繁重,志愿時(shí)間長(zhǎng)”([X83]) 、“H.其他”([X88]) 。“大一”負(fù)向影響了大學(xué)生對(duì)公益的參與程度,說明大一學(xué)生尚在逐步熟悉大學(xué)生活的過程中,對(duì)公益活動(dòng)的認(rèn)知尚未建立起來;“志愿工作任務(wù)繁重,志愿時(shí)間長(zhǎng)”影響了大學(xué)生參與公益活動(dòng)的熱情,符合常理;影響大學(xué)生參與公益活動(dòng)的“H.其他”選項(xiàng),則道出了大學(xué)生對(duì)公益事業(yè)真實(shí)而又難以言表的心情。
4.2 基于顯著性變量的重要性
從顯著性變量的重要性看來,對(duì)大學(xué)生參與公益活動(dòng)影響前三的因素是[X25,X29,X99],都是正向影響因素,表明“公益廣告大賽-我是公益人”([X25]) 活動(dòng)是大學(xué)生了解公益事業(yè)的最重要渠道,騰訊公司發(fā)起并資助的“樂捐、月捐、一起捐”([X29]) 是大學(xué)生最常參與的公益活動(dòng),參與公益活動(dòng)最大的收益是獲得證書([X99]) 。
在負(fù)向影響因素中最重要的是“志愿工作任務(wù)繁重,志愿時(shí)間長(zhǎng)”([X83]) ,這提醒學(xué)校志愿活動(dòng)組織者,在組織志愿活動(dòng)時(shí)在志愿任務(wù)和志愿時(shí)間上要有綜合考慮,否則可能會(huì)讓志愿活動(dòng)效果適得其反。
參考文獻(xiàn):
[1] 王宇深.高校共青團(tuán)服務(wù)大學(xué)生微公益意識(shí)培育的路徑探索[J]. 智庫時(shí)代,2018(46): 94-95.
[2] 陳彥同, 秦崇勝.如何通過組織大學(xué)生公益活動(dòng)引導(dǎo)大學(xué)生思想政治教育:論公益活動(dòng)對(duì)大學(xué)生思想政治教育的如何有效開展[J]. 明日風(fēng)尚,2018(6) : 222,251.
[3] 尹玉力.大學(xué)生公益活動(dòng)的思想政治教育功能研究[D].太原:太原理工大學(xué),2017.
[4] 賀雪嬌.大學(xué)生公益活動(dòng)參與現(xiàn)狀研究[D].昆明:云南大學(xué),2017.
[5] 王趙.大學(xué)生微公益活動(dòng)參與的現(xiàn)狀、影響因素及引導(dǎo)對(duì)策:基于對(duì)江蘇省10所高校的實(shí)證調(diào)查[J].無錫商業(yè)職業(yè)技術(shù)學(xué)院學(xué)報(bào),2022,22(1):82-88.
[6] 高雪平,楊淑涵. 大學(xué)生互聯(lián)網(wǎng)公益參與度提升路徑研究:基于浙江高校調(diào)查[J].湖北開放職業(yè)學(xué)院學(xué)報(bào),2021,34(3):50-52.
[7] 張潤(rùn)姣,陽慧玲.“互聯(lián)網(wǎng)+微公益”視域下在校大學(xué)生公益狀況調(diào)查[J]. 高教學(xué)刊,2019,116(20):187-189,193.
[8] 馬越.大學(xué)生網(wǎng)絡(luò)公益活動(dòng)參與狀況考量:以西北政法大學(xué)為例[J].文化創(chuàng)新比較研究,2018,2(19):57-58.
[9] 石峰,胡燕.高校畢業(yè)生創(chuàng)業(yè)意愿的影響因素分析:基于有序多分類Logistic回歸模型[J].生產(chǎn)力研究,2021,343(2):131-135,161.
[10] 劉亞琴,劉瑞卿,顏中玉.基于粗糙集和隨機(jī)森林算法的數(shù)學(xué)師范生就業(yè)預(yù)測(cè)研究[J].湖南師范大學(xué)自然科學(xué)學(xué)報(bào),2023,46(1):136-142.
[11] 歐陽群文. 基于LightGBM的水質(zhì)預(yù)測(cè)模型研究與應(yīng)用[J].智能城市,2022,8(11):84-87.
【通聯(lián)編輯:李雅琪】