999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于概率軟邏輯推理模型的高校貧困生識別

2024-05-19 14:36:42張嘉王嬌王志星
電腦知識與技術 2024年7期

張嘉 王嬌 王志星

摘要:貧困大學生作為一個特殊群體在高校大學生中占有較高比例,國家對于高校資助工作的開展一直高度重視。如何精準識別大學生的貧困程度并為其提供資助是眾多高校一直著力解決的長期性問題。該研究提出了一種基于概率軟邏輯推理模型來預測大學生貧困等級的方法,該方法通過軟約束構建規則和邏輯謂詞方式將人為可理解的貧困生判別標準和常識引入概率軟邏輯推理模型進行推理預測。在高校學生真實數據上的大量實驗表明,該方法的識別正確率可達到90%以上。此外,與支持向量機、邏輯回歸、決策樹等機器學習算法相比,該方法具有更高的推理識別精度,因此,對于大學生的貧困程度識別該方法具有巨大的潛力。

關鍵詞:概率軟邏輯;貧困生識別;推理;預測;精準資助

中圖分類號:TP181? ? ? 文獻標識碼:A

文章編號:1009-3044(2024)07-0001-03

開放科學(資源服務)標識碼(OSID)

0 引言

2013年11月3日,習近平總書記首次提出“精準扶貧”理念[1],為從根本上解決貧困學生問題,國家、社會和各學校積極探索并建立了全面且完善的貧困學生資助體系。2022年,全國累計資助大學生4588.24萬人,資助金額達1675.59億元。高校精準資助模式是精準扶貧理念的具體實踐[2],精準資助非常重要,但目前在國內高校內,貧困生認定和識別依然是勞動密集型且耗時的工作,當前國內各高校原則上每學年開展一次家庭經濟困難學生認定工作,認定程序主要包括公布政策、學生個人申請、輔導員及學院學校評審、結果公示等步驟。然而,在實踐中還有很多因素可能影響識別結果,例如:

1) 在申請環節,申請者為了隱藏個人敏感信息或者為了獲得更大額度的資助金額,可能填寫虛假家庭和個人狀況;

2) 在評議環節,評審者(同學或老師)可能會受到主觀因素的影響;

3) 同一高校,不同學院在實施過程中的執行標準可能因為各種因素而出現差別。

如何將新技術思維科學地運用到高校貧困生資助中,不僅需要我們轉變資助思維,更需要利用先進技術對傳統方法進行改進和創新。近年來,數據的可用性大幅提高,研究人員開始利用大數據和機器學習技術來識別學生貧困水平,它們已經成為預測貧困水平最流行的技術之一。其中,支持向量機[3]、邏輯回歸[4]、決策樹[5]、貝葉斯網絡[6]、KNN[7]等機器學習算法都被證明在貧困生識別領域擁有較好效果,但是相比概率軟邏輯推理模型(PSL,Probabilistic soft logic) [8],它們在預測過程中面向人類的可理解性上還稍顯不足[9]。

1 概率軟邏輯理論基礎

概率軟邏輯(PSL)是一種概率編程模型,它能夠有效地對結構化數據進行推理。PSL模型是通過一組加權的一階邏輯規則進行定義,這些邏輯規則的輸入原子和推理結果可以被定義或解釋為[0,1]之間的連續軟真值,而不是僅僅使用布爾值0或1來代表概率。加權邏輯規則通常采用以下形式:

[w: P1(A,B) ∧ P2(B,C) >> P2(A,C)] (1)

其中w是規則的權重(也可解釋為對應規則的重要性),P1(A,B)∧P2(B,C)部分被稱為規則體,右邊的P2(A,C)被稱為規則頭,P1、P2被稱為謂詞,A、B、C是隨機變量,謂詞一般用于定義隨機變量之間的關系,每個謂詞的計算值都可被表示為[0, 1]區間內的連續隨機變量。例如,若有規則Friend(A,B)∧know (A,C)>>know(B,C),其中Friend(A,B)表示A和B是朋友,know(A,C)表示A認識C,經過PSL在這條規則上推理后得出的know(B,C)的值即是B認識C的概率。每條規則表示了特殊類型馬爾可夫隨機場(PSL模型內稱為鉸鏈損失馬爾可夫隨機場 ,簡稱HL-MRF)中的一個函數集合[8]。HL-MRF的概率密度由式(2) 給出:

[PY|X=1Z(Y)exp-i=1mwi?i(Y, X))] (2)

[ZY=Yexp-i=1mwi?i(Y, X))] (3)

其中,[?i=max0,?iY,Xdi;di∈{1, 2}], [?i] 是規則對應的鉸鏈損失勢函數,X和Y在[0, 1]范圍內,m是勢函數的數量,?i是線性函數,[di]規定了規則不被滿足時的鉸鏈損失方式,它使得我們可以靈活地在線性和平方鉸鏈損失之間進行選擇,在大部分情況,平方鉸鏈損失被證明表現出更好的效果,[wi]是與規則相關的權重[8]。推理計算可以由式(4) 表示:

[Y*=argminYi=1mwifi(Y, X))=argminYLmap(w,Y, X)]? (4)

上述表達式是使用交替方向乘子法(ADMM)[10]求解的。

2 模型構建

2.1 模型結構

基于概率軟邏輯推理模型來預測大學生貧困等級的方法整體實現流程如圖 1所示,包括數據輸入、編碼、規則定義、推理和結果評估等多個過程。

各模塊具體解釋如下:

1) 數據輸入:用于實驗的貧困生數據集,包含學生基本屬性字段和貧困等級認定結果字段。

2) 數據編碼模塊:原生PSL無法定義中文謂詞數據,本文研究為其開發數據編碼模塊,推理運行前編碼,輸出結果時解碼。

3) 訓練集/驗證集劃分:劃分輸入數據為訓練集和驗證集,用于訓練模型和驗證實驗結果。

4) 規則學習模塊:本文方法一部分規則通過使用C5.0算法訓練得來。

5) 人工規則定義模塊:雖然人工定義規則具有較強的不確定性和主觀性,但是人類認知的知識往往是機器學習算法所欠缺的,比如在貧困生識別過程中,一條很淺顯的規則是“若某同學在2022年和2023年被認定為貧困生,那么他很可能在2024年也被認定為貧困生”。

6) 規則優化模塊:使用最大似然估計法[8]對每條規則的權重進行調整。

7)? PSL推理模塊:執行推理運算,其中R1 -Rn 表示為運算過程中謂詞所對應關系的計算原子。

8)? 結果評估:對實驗結果進行驗證,主要使用推理的正確率值來度量。

2.2 模型規則定義

1) 自動規則。對于本文方法所構建的模型,一個很重要的子模塊即是規則自動學習模塊,它能集合傳統機器學習算法決策樹C5.0的優點從數據中提取規則,挖掘得到的規則示例如圖2所示。

2) 人工規則定義。PSL和支持向量機、邏輯回歸等傳統機器學習算法最大的區別在于,PSL易于構建數據之間的關聯關系,簡單地講,也就是PSL能夠將人類世界的常識和知識轉化為機器能夠使用的規則。因此,除了C5.0已經挖掘得到的規則,我們額外通過手工定義的方式將一些較為重要的貧困生識別的知識轉化為規則輸入模型。

(1) 【延續性舉例】通過過往數據,已知某同學在2022年和2023年因家庭經濟情況困難被認定為特殊困難等級的貧困生,那么有很大可能他在2024年也將被認定為特殊困難等級的貧困生。該描述被轉化為以下規則:

RecognitionLevel (Stu,Y1,Lev) ∧RecognitionLevel (Stu,Y3,Lev) ∧ToBeRecognized (Stu,Y3) ? RecognitionLevel (Stu,Y3, Lev)

以上規則一定程度上闡述了學生經濟狀態的延續性,RecognitionLevel 表示認定等級,ToBeRecognized 表示待認定數據,Stu代表待評定學生,Y1、Y2、Y3表示學年年份,lev表示認定等級。

(2) 【關聯性舉例】通過學生日常數據,得知某同學在2023年存在助學貸款,并且該同學在校內勤工助學系統申請過多次勤工助學崗位,那么有很大可能他在2024年將被認定為困難或特殊困難等級的貧困生。它們將被轉化為以下規則:

StudentLoan (Stu,Y1,money) ∧WorkStudyProgram (Stu,Y1,type)

∧ToBeRecognized (Stu,Y2,Lev) ? RecognitionLevel (Stu,Y2, Lev)

以上規則闡述了學生經濟和日常狀態的關聯性,StudentLoan表示助學貸款,WorkStudyProgram表示勤工助學項目參加情況,Y1、Y2表示學年年份,lev表示認定等級,money表示助學貸款數額,type表示勤工助學崗位。

(3) 【模糊性舉例】模糊規則代表了人類認知的部分感受,它們不能作為貧困生認定的直接標準,但是在最終的推理結果數據上,它們將對概率值產生積極影響,比如缺乏這些規則的時候,學生Stu經過推理模型后,被評定為經濟困難的概率可能為0,但擁有了這些規則,該生被評定為經濟困難的概率為0.3,這種結果更符合我們的直觀感受。例如:

a.食堂有消費,但每日消費數額越少越可能評定為更高貧困等級。

CanteenConsumption (Stu,Y1, money) ∧ToBeRecognized (Stu,Y2) ? RecognitionLevel (Stu,Y2, Lev)

b.購買生活必需品頻率越低,越可能評定為更高貧困等級。

PurchaseEssentialItems (Stu,Y1, num) ∧ToBeRecognized (Stu,Y2) ? RecognitionLevel (Stu,Y2, Lev)

c.網購數量越少,越可能評定為更高貧困等級。

OnlineShopping (Stu,Y1, money) ∧ToBeRecognized (Stu,Y2) ? RecognitionLevel (Stu,Y2, Lev)

3 實驗驗證

3.1 對比模型構建

對比模型使用Spss Model建模軟件進行構建,本文主要構建了CHAID樹、支持向量機、邏輯回歸、貝葉斯網絡、KNN等五種機器學習算法的對比模型,結構如圖 3所示。

3.2 實驗數據描述

本文數據通過西南某高校學生信息管理系統收集,它包含12 015條貧困生認定數據,其中有特殊困難、困難、一般困難、不困難等4種不同的貧困類型,每條數據具有多個屬性,具體如表 1所示。

3.3 實驗結果

本文研究將數據按8:2的比例隨機劃分為訓練數據和測試數據,進行的8次實驗運行結果如圖 4和圖 5所示,圖 4是模型在未添加人工定義規則時,僅使用C5.0算法訓練得到的規則輸入PSL模型進行推理產生的實驗結果,可以看到,此時本文方法已經得到了較好的實驗效果,但是和支持向量機算法相比,在推理正確率上依然有一定差距。當加入人工定義規則時,傳統機器學習算法無法添加的常識規則和知識被加入模型, 圖 5所見即為實驗結果,可以看到本文方法實驗效果已經基本和SVM算法持平,并且其中有5次實驗的推理正確率已超過SVM算法。

4 總結

本文研究提出了一種基于概率軟邏輯推理模型來預測大學生的貧困等級的方法,該方法通過結合C5.0算法的規則提取能力,為概率軟邏輯推理模型提供科學的輸入規則,同時,使用軟約束構建規則和邏輯謂詞的方式將人類可理解的貧困生判別標準和常識引入概率軟邏輯推理模型進行推理預測,在與額外的5種不同的分類算法進行對比實驗后,本文方法取得了較好的對比效果。最終結果表明:1) 本文所提方法是可行的,并且在本文所用數據集上的實驗效果已多次超過SVM算法;2) 基于概率軟邏輯推理模型的方法在貧困等級預測工作中取得了可喜的成果,多次實驗的平均識別正確率達到90%以上。下一步,筆者將收集和整理額外的數據來完善當前方法,爭取取得更有益的實驗成果。

參考文獻:

[1] 讓青春沿著總書記指引的方向閃閃發光——寫在習近平總書記親臨湘西州視察并提出精準扶貧重要理念十周年之際[J].中國共青團,2023(19):2,1.

[2] 教育部全國學生資助管理中心.2022年中國學生資助發展報告[N].人民日報,2023-11-03(014).

[3] 陳瑞虹.不平衡數據的SVM分類研究及在高校貧困生識別的應用[D].泉州:華僑大學,2019.

[4] 李步青.基于組合logistic回歸模型的高校貧困生認定研究[J].網絡安全技術與應用,2021(1):59-61.

[5] 李明江,盧玉,劉彥.一種基于C4.5決策樹的貴州省高校貧困生評定方法[J].科技通報,2013,29(8):223-224,233.

[6] 張麗娟,夏艷,程雪平,等.基于伯努利貝葉斯模型的高校貧困生預測研究[J].信息技術與信息化,2021(11):159-161.

[7] 劉曉娜,王愷,王成德,等.基于KNN算法的高校困難生認定研究[J].電子元器件與信息技術,2023,7(8):88-92.

[8] BACH S H,BROECHELER M,HUANG B,et al.Hinge-loss Markov random fields and probabilistic soft logic[J].ArXiv e-Prints,2015:arXiv:1505.04406.

[9] 張嘉,張暉,趙旭劍,等.規則半自動學習的概率軟邏輯推理模型[J].計算機應用,2018,38(11):3144-3149,3155.

[10] BOYD S,PARIKH N,CHU E,et al.Distributed optimization and statistical learning via the alternating direction method of multipliers[J].Foundations and Trends in Machine Learning,2011,3(1):1-122.

【通聯編輯:李雅琪】

主站蜘蛛池模板: 青青青伊人色综合久久| 九九九九热精品视频| 国产麻豆91网在线看| 99久久精品免费看国产免费软件| 久久综合成人| 五月婷婷丁香色| 欧美综合成人| 99视频在线免费观看| 欧美成人在线免费| 国产成人亚洲日韩欧美电影| 国产真实二区一区在线亚洲| 久久黄色免费电影| 高清视频一区| 天堂成人av| 精品91自产拍在线| 欧美日韩中文国产va另类| 风韵丰满熟妇啪啪区老熟熟女| 欧美午夜在线视频| 亚洲综合一区国产精品| 国产日韩丝袜一二三区| 国产精品网曝门免费视频| 成人午夜视频在线| 亚洲第一国产综合| 欧美 国产 人人视频| 91麻豆精品国产高清在线| 中国黄色一级视频| 免费在线播放毛片| 国产喷水视频| 国产真实乱子伦视频播放| AⅤ色综合久久天堂AV色综合| 国产欧美性爱网| 亚洲嫩模喷白浆| 国产一级视频久久| 在线国产欧美| 国产jizzjizz视频| 久爱午夜精品免费视频| 色老头综合网| 亚洲天堂视频网站| a级毛片在线免费观看| 91精品aⅴ无码中文字字幕蜜桃| 久久久久无码国产精品不卡 | 国产成人精品视频一区二区电影| 欧美日韩午夜视频在线观看| 国产一级毛片在线| 亚洲精品日产精品乱码不卡| 成人国产免费| 亚洲一区二区三区香蕉| 伊人久综合| 国产在线观看一区二区三区| 午夜一区二区三区| 香蕉色综合| 9啪在线视频| 二级特黄绝大片免费视频大片| 噜噜噜久久| 国产欧美日韩在线在线不卡视频| 一级在线毛片| 色吊丝av中文字幕| 麻豆AV网站免费进入| 久久综合色88| 国内精品小视频在线| 男女性色大片免费网站| 国产性猛交XXXX免费看| 中文字幕人成乱码熟女免费| 免费A级毛片无码无遮挡| 男人天堂伊人网| 欧美乱妇高清无乱码免费| 无码日韩视频| AV在线天堂进入| 国产理论最新国产精品视频| 久久大香香蕉国产免费网站| 欧美性色综合网| 国产凹凸一区在线观看视频| 久久中文字幕av不卡一区二区| 人人看人人鲁狠狠高清| 午夜日b视频| 成人免费黄色小视频| 在线毛片网站| 欧美亚洲日韩中文| 丝袜无码一区二区三区| 中文字幕在线欧美| 精品无码国产一区二区三区AV| 免费毛片全部不收费的|