李麗英,羅志坤,唐敬軍,廖麗萍,李愛元,付強
(1.國網湖南省電力有限公司株洲供電分公司,湖南 株洲 412000;2.國網湖南省電力有限公司,湖南 長沙 410004;3.國網湖南省電力有限公司信息通信公司,湖南 長沙 410004)
2021 年,脫貧攻堅戰取得了全面勝利,中國完成了消除絕對貧困的艱巨任務[1]。脫貧摘帽不是終點,讓脫貧基礎更加穩固、成效更可持續,實現全面脫貧與鄉村振興有效銜接,要加快建立防止返貧監測和幫扶機制[2],就需要對易返貧致貧人口加強監測。
對于部分已脫貧但質量不高、不穩的脫貧戶,構建和完善科學合理的預警與監測機制,銜接推進和進一步鞏固擴大脫貧攻堅成果尤為重要,現階段脫貧人口返貧預警監測系統大致分四個步驟[2]:建立返貧檔案數據、進行返貧信息判斷、啟動幫扶機制、返貧風險解除。
目前初步形成了先創建返貧預警制度,在返貧事件發生前就做到篩查與及時幫扶,利用大數據技術手段,分析脫貧戶返貧的概率、及時發出預警。同時組織基層干部定期跟蹤回訪,形成事前預防、事中幫扶、事后跟蹤監測的“閉環” 防返貧預警監測機制[3]。國內利用大數據監測技術實現防返貧監測方案主要是兩種:一種是充分利用全國扶貧辦開發信息系統、各省(市縣) 精準脫貧大數據管理平臺、各種移動應用軟件對居民信息進行收集,對監測對象生產狀況、收入來源、政策落實、教育學費、看病報銷、受災支出等加強監測;二是疾病依舊是致貧、返貧的主要原因[4]。針對此現象有學者如張瑜、魏曉光、趙穎等人針對醫療大數據構建防返貧體系[5]。通過醫療大數據將政府、醫院、個人與保險公司聯系起來,為防返貧提供決策分析。
通過國內外現狀調查研究,發現上述兩種返貧預警監測系統都存在數據收集不連續、覆蓋不全面等問題。而電力大數據特性恰恰可以彌補上述不足,所以本文首次提出了基于電力大數據分析模型構建防返貧預警監測應用。
電力大數據具有連續性好、實時性強、準確度高、覆蓋面廣等特點[6-7],本文利用電力大數據特點,充分發揮電力數據這一“富礦”,首次基于電力大數據分析模型構建防返貧預警監測應用,篩選疑似返貧致貧用戶信息,實現防返貧監測預警,為脫貧戶返貧風險監測和幫扶長效機制建立提供決策依據。
返貧預警監測應用阿里云大數據開發平臺[8-11],涉及鄉村振興局、電力公司營銷業務系統等數據,與政府需求對接,獲取當地脫貧戶、脫貧縣市區、脫貧行政村、各村常住人口等檔案。對脫貧戶、脫貧縣市區、脫貧行政村各村常住人口開展調研,分析其用電行為,研究構建返貧預警監測,形成模型數據需求清單。確認扶貧檔案管理、電力返貧監測看板、構建分析模型、構建扶貧畫像、預警模型管理、預警信息推送等六項功能需求。
對接鄉村振興局數據,對脫貧對象進行梳理與溯源。包括姓名、身份證號、家庭住址(省、市、區縣、鎮、村)、家庭人數、類別、戶主身份證號碼、電能表戶號等。數據通過專線進行推送,中臺提供接口。涉及到數據需求梳理與溯源的有數據檔案庫數據應用、涉貧用電量分析數據應用、返貧預警分析數據應用、檔案信息統計查詢數據應用、預警數據及推送數據應用。
從內、外部業務系統采集數據,基于數據中臺,提取出防返貧預警監測應用需求的數據。采集數據檔案庫數據、全省涉貧用電量數據、脫貧戶用電繳費數據等資料數據。
按照系統總體架構要求,根據數據應用需求,由中臺實現數據的接入,包括電力數據的接入頻度、數據的業務規則、數據類型、數據存量、數據增量等信息為輸入,完成數據接入技術路線。數據中臺以統一數據模型為標準,匯聚海量數據,提煉共性的數據服務能力,構建場景化數據產品,為前端應用提供數據共享服務和產品,防返貧監測應用遵循阿里云中臺架構[10],即一切數據由數據中臺接入。來源內部系統的營銷數據包含用電量、客戶基礎信息等,這部分數據已存儲在數據中臺的倉庫。涉及的數據應用有數據檔案庫數據、涉貧用電量分析數據、返貧預警分析數據、檔案信息統計查詢數據、預警數據及推送數據。
脫貧戶數據通過政務專線或離線的導入方式接入數據中臺以進行匹配,形成檔案庫數據應用;每月從中臺營銷系統與脫貧戶數據結合用電情況,以省、市、區縣為基礎建立涉貧月度用電分析數據、脫貧戶用電數據,包括用電量情況、繳費情況、停電時長、同比環比增量、趨勢變化等。基于數據檔案庫、用電分析等數據建立數據模型,制定預警規則,形成月度返貧預警分析數據應用。將不同預警規則生成對應的預警數據進行記錄,形成預警數據及推送應用數據,同時推送至政府政務平臺。
分析鄉村振興局與中臺營銷數據差異,整合轉換數據檔案庫數據。根據模型數據對營銷系統用電量、繳費金額、繳費次數等數據進行整合轉換,形成涉貧用電分析數據應用、脫貧戶用電分析數據應用等。基于防返貧預警數據及推送數據應用,進行數據整合轉換。制定數據檔案庫數據應用、涉貧用電分析數據應用、脫貧戶用電分析數據應用、預警數據及推送數據應用整體數據清洗策略,形成標準化的數據格式用于數據展示及結構化處理。
結合應用場景需求,制定相應的數據安全規則,并根據規則進行數據脫敏、變形等低級數據安全處理[12],對全局傳輸的數據進行加密處理[13],保障數據的安全。結合低收入群體監測系統項目數據應用場景需求,為保障脫貧戶數據、電力營銷數據傳輸及展示的數據安全,對涉密字段如身份證、聯系方式、電力明細數據等制定相應的數據安全規則,并根據規則進行數據脫敏、變形等低級數據安全處理,將數據檔案庫數據的人員信息進行脫敏處理;將涉貧用電分析數據的用電詳情進行脫敏處理;脫貧戶用電分析數據中用電詳情進行脫敏處理;將防返貧預警數據及推送數據應用的敏感數據進行脫敏處理。
1.3.1 分析模型設計
防返貧預警監測系統數據應用分析主題場景,結合需求分析結構,借助統計分析、數據挖掘等方法構建維度模型和指標模型,對業務需求進行抽象化表達,構建適用于本分析主題的算法模型。對脫貧戶數據建模,涉及到模型設計的脫貧戶用電分析數據應用、預警數據及推送數據應用。
1.3.2 構建脫貧戶用電分析數據模型
如需持續跟蹤脫貧戶的經濟、生活狀況,用電行為數據是一個重要且實用的指標,判斷一個脫貧戶的用電水平與全省脫貧戶未脫貧之前的日均電量以及脫貧后日均電量的差距、脫貧戶一年之中欠費次數、繳費金額以及欠費停電時長可以反映出脫貧戶的生活狀況。
1) 設置脫貧戶當年日平均用電量為M,脫貧之前日均電量為Np,全省脫貧戶后10%、后20%的當年日均電量臨界值分別為N1、N2,設置差距分別為E1、E2、E3,脫貧戶去年日平均用電量為Q。

若E1<0,說明該脫貧戶脫貧后的用電量比未脫貧之前的全省日均電量低,判定為脫貧戶用電量異常。
若E2<0 且E1>0,說明該脫貧戶脫貧后的用電量已經快接近湖南省脫貧戶未脫貧之前的日均電量,判定為脫貧戶用電量異常。
若E2≥0、E3<0 且M 2) 設置脫貧戶當年欠費次數為M,欠費次數閾值Mth;月平均繳費金額為N元,平均繳費金額閾值Nth元。 若M >Mth且N 3) 設置脫貧戶欠費停電時間為M,脫貧戶繳費后復電時間為N,停電間隔S,閾值為Sth。 若S≥Sth,說明該用戶欠費停電時長已超過閾值才恢復用電的情況,判定為脫貧戶欠費停電復電異常。 基于上述脫貧戶日均電量、停電繳費次數及金額、欠費停電時長三個維度電力大數據分析模型建立分級分類預警規則,依據“分類監測、分級預警” 的原則,確定監測內容、預警類型、預警頻度及要求。根據三個維度分析模型設計5 條貧困戶返貧預警規則。 ①規則一:欠費停電時間長。脫貧戶欠費停電后,間隔閾值或閾值以上才恢復用電的情況,則判定為紅色預警。 ②規則二:欠費次數多。根據脫貧戶一年之中欠費次數和繳費金額來判斷,欠費次數大于閾值同時繳費金額小于閾值時,則判定為紅色預警。 ③規則三:日均電量處于全省后10%~20%區間,根據脫貧戶當年累計日平均用電量處于湖南省脫貧戶后10%~20%區間時,則判定為藍色預警。 ④規則四:日均電量處于湖南省后10%區間。根據脫貧戶當年累計日平均用電量處于湖南省脫貧戶后10%區間,且大于貧困戶日均電量時,則判斷為黃色預警。 ⑤規則五:日均電量低于全省貧困戶日均電量。根據脫貧戶當年日平均用電量與全省貧困戶日均電量的進行比較。如果當年日平均用電量小于湖南省貧困戶日均電量,則判定為紅色預警。 通過規則體系開展貧困戶用電數據監測和分析,對潛在返貧風險的用電戶,根據不同的用電異常程度分“紅、黃、藍” 三級預警,紅色為最嚴重等級,黃色次之,藍色則只代表需引起關注,通過數據中臺與政府打通的專線通道,將預警數據脫敏后推送給當地政務云平臺,為返貧監測提供持續且穩定的數據支撐。 提取2018 年底脫貧的貧困戶2017 年的年日均用電量進行抽樣數據驗證,計算貧困戶日平均用電量;提取株洲市2021 年1 月至5 月脫貧戶,依據日均電量異常預警模型產生的預警戶進行抽樣調研,驗證全省日均用電量后10%的脫貧戶、湖南省日均用電量后20%的脫貧戶模型閾值;提取株洲市脫貧戶2021 年欠費停電時長數據作為樣本數據,分析欠費停電時長的預警閾值;選取株洲茶陵縣雙泉村106戶脫貧戶作為調研對象,實地了解脫貧戶的欠費次數以及繳費情況等信息,確定預警模型閾值。 ①選取2017 年株洲市的貧困戶(選取日均用電量波動值小于1 kW·h 的用戶) 作為樣本數據。選取株洲市2017 年的年日均用電量波動值小于1 kW·h的貧困戶作為樣本數據,共計5 411 條,求取平均值為0.694 06,因此設定全省貧困戶日均電量的閾值為0.7。 ②選取株洲市的脫貧戶進行2021 年脫貧戶10%、20%的臨界值進行計算,株洲市脫貧戶總數48 722 戶,剔除0 電量用戶計算見表1、表2。 表1 2021 年1—5 月湖南省脫貧戶后10%臨界戶日均電量 表2 2021 年1—5 月湖南省脫貧戶后20%臨界戶日均電量 ③欠費停電時長閾值計算。欠費停電時長設置閾值為48 h,從當前欠費停電時長來看,90%的脫貧用戶欠費停電時長不超過1 h,考慮到人員臨時外出情況,選取48 h 作為模型閾值。 ④欠費次數預警模型驗證分析。根據株洲市貧困村實地考察調研,走訪脫貧戶以及多地扶貧辦駐村工作人員的經驗,了解欠費停電情況,脫貧戶如因欠費停電無法繳納電費的用戶基本屬于零散用工方式的勞動力人員,采用外出打散工幾天獲取報酬,一次繳納電費10~50 元不等,每月一般出去工作3 次。因此欠費次數閾值為3 次,繳費金額閾值為20 元。 基于業務需求,根據脫貧戶用電分析數據應用模型,監測出“紅”、“黃”、“藍” 三級預警數據,通過對三級預警數據的比對、核查,推算分析模型的準確性,并在不通過改變模型參數和模型結構的同時,通過多次隨機提取樣本數據計算出閾值,提升模型的精度、執行速度等,不斷優化預警規則,保障監測模型的穩定性及監測數據的準確性[14]。 基于電力大數據分析模型構建的防返貧預警應用,對所供電范圍內的脫貧戶日均用電量所在區間、年累計繳費次數以及停電時長進行統計分析,對潛在返貧風險的脫貧戶進行“紅” “黃” “藍”三級預警,總共向政府 “政務云平臺” 輸出預警信息3 118 條,其中紅色預警數1 158 條。選取紅色預警結果中326 戶脫貧戶作為驗證對象,通過電話訪問、實地走訪考察等多種方式,調研其用戶電量低、繳費次數多、單次繳費金額低的原因。其中用戶電量低于貧困戶日均電量0.7 的306戶中,留守老人、外出務工、無人居住占比近65% (如圖1 所示)。將306 戶用電量劃分七個用電量段(表3),分析其在各個電量段的占比,日均電量在0.1 kWh以下占比最高是脫貧戶外出務工基本未用電原因外,其他電量段留守老人占比最高。 圖1 脫貧戶日均電量低于貧困戶日均電量占比 表3 脫貧戶日均電量低于貧困戶日均電量統計戶 另20 戶為繳費次數多、單次繳費金額低導致紅色預警,分析其社會原因,其中12 戶因臨時務工占比60%,另4 戶為留守老人每次停電后再去繳費占比20% (如圖2 所示)。 圖2 脫貧戶繳費次數多、繳費金額低占比 通過上述數據分析,經核實發現具有返貧風險的脫貧戶3 戶。其中一戶預警原因為系統監測發現該戶多次繳費且每次繳費低于20 元,核查該戶主系突發情況至殘導致返貧;另兩戶預警原因為日均電量低于湖南省貧困戶日均電量,核查原因為主要勞動力之一生病致收入驟減。對此,政府將以上3戶具有返貧風險的脫貧戶納入重點監測幫扶范圍,提前采取針對性的幫扶措施,及時消除返貧風險,助力政府扶貧監管由全面普查轉為重點核查,大大提升了監測效率。 本文研究基于電力大數據分析模型的防返貧預警監測應用,在國內目前已部署于湖南地區,并已擬定陸續向全國推廣,防返貧預警監測應用具有低成本、高效率、易操作、可復制等優點,可為各地區的脫貧戶、脫貧縣市區、脫貧行政村防返貧提供分析與預警功能,為核實和消除返貧風險提供線索,為鞏固拓展脫貧攻堅成果、建立長效幫扶機制提供決策依據,有助于有序推進與鄉村振興的有效銜接。
1.4 基于數據分析模型構建防返貧預警規則
1.5 防返貧預警規則閾值計算


1.6 分析模型優化
2 防返貧預警數據結果驗證分析



3 結論