999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

機器學習應用在精準扶貧中的方法和意義探討——基于云南省昭通市貧困情況進行研究

2018-02-27 13:29:44姜娜顧慶傳楊海燕
電腦知識與技術 2018年35期
關鍵詞:機器學習

姜娜 顧慶傳 楊海燕

摘要:昭通作為云南省貧困人口最多的地區,扶貧工作一直是不可忽視的重大問題。扶貧工作要穩定有效的持續進行,利用計算機平臺,將過去的人工管理貧困數據、主觀進行扶貧決策,逐步向基于大數據和機器學習的智能化的管理、決策方式過渡。該文基于機器學習,對精準扶貧系統中機器學習方法的研究和系統的現實意義進行了理論探討,在后期的系統分析與設計中,具有重要意義。

關鍵詞:扶貧;機器學習;預測;學習模型

中圖分類號:TP181? ? ? 文獻標識碼:A? ? ?文章編號:1009-3044(2018)35-0200-02

Abstract:? Zhaotong is the area with the most poverty population in Yunnan province. The poverty relief work has been an important problem that cannot be ignored and should be carried out steadily and effectively and continuously.? By using the technology of the computer, the past traditional manual management means should be transitioned to intelligent management and decision-making Based on big data and machine learning. Based on machine learning, this paper conducts a theoretical discussion on the research of machine learning methods in the precision poverty alleviation system and the practical significance of the system, which is of great significance in the later systematic analysis and design.

Key words: poverty alleviation; Machine Learning; prediction; learning model

云南位于中國西南邊陲,僅國家級貧困縣就達到70多個。特別是昭通地區的貧困人口就已接近云南省總貧困人口的四分之一,貧困人口居全省第一。近年來,在“互聯網+”和大數據的戰略發展背景下,昭通市精準扶貧系統逐步上線,通過對百萬貧困人員的相關基本信息的錄入,完成整個系統早期的數據庫建設[1]。

在此發展背景下,該文主要研究機器學習方法基于昭通精準扶貧數據可進行的一系列工作的現實意義,包括研究貧困人員的數量、貧困類型、根據貧困人員的基本信息預測貧困類型、進行扶貧工作之后的脫貧趨勢的統計,給出供參考的脫貧建議,亦可以為各行業的企業管理者提供助貧對象,真正實現全社會幫扶脫貧、長期堅持脫貧攻堅戰。

1 機器學習綜述

機器學習是通過計算機的計算手段,從已有數據中習得經驗,得到學習器(模型),再將學習器應用于新的數據中并得到預測結論的過程。在機器學習過程中涉及的數據有:用于訓練學習能力的訓練集,用于選擇學習器的驗證集,和用于測試學習器學習能力的測試集三類。[2]

在進行預測時,根據預測結果的不同可以將學習任務分為分類和回歸兩類,其中預測的是離散值的稱為分類,預測的是連續值得稱為回歸;根據訓練集是否擁有標記信息,可以將學習任務分為監督學習和無監督學習,其中,數據中含有標記信息的稱為監督學習,如分類和回歸,數據中不含標記信息的稱為無監督學習,如聚類。

在進行學習時,根據不同的學習任務,可以進行不同的模型的選擇。進行機器學習的最終目的是,在已有數據上得到的學習器用在新數據當中,并得到逼近真相的預測結論,即獲得強泛化能力的模型。機器學習開發流程如圖1所示[3]。

2 精準扶貧在機器學習中研究方法

在昭通市精準扶貧系統中,前期數據錄入包括每一位貧困人員的基本信息,貧困相關詳細信息等。通過昭通市精準扶貧系統,在系統中記錄人員相關信息并得到貧困類型,統計昭通市貧困人口數量及貧困趨勢,從貧困詳細信息亦可反映出昭通地區主要貧困分布、貧困程度等,進而分析各區域貧困主要原因,得出扶貧依據,給出相應的扶貧決策從而支撐精準扶貧。

1) 數據錄入以及貧困類型

數據的錄入,包括貧困人員基本信息(姓名、身份證號、年齡、籍貫、所在村鎮、文化程度、家庭人口、聯系電話、是否殘疾等)、貧困相關詳細信息(子女個數、子女文化程度、人均年收入等)的錄入工作。對貧困數據進行分析,令D={x1, x2, …,xn}表示n個貧困人員的數據集,第m個貧困人員的數據xm是由基本信息中A個數據構成的一個向量;若最終要預測的結論是根據某個貧困人員的基本信息預測貧困類型,則令第m個貧困人員的貧困類型是ym,則(xm, ym)就是數據集中的第m個樣例(擁有標記信息的示例)。通過對訓練集的學習,習得的模型f,在進行預測時,對于測試例x,可得到其預測標記y=f(x),即通過貧困人員的基本信息預測其貧困類型,如圖2所示:

依據昭通市貧困戶認定標準,根據人均純收入、住房、醫療、教育保障四方面進行認定。年人均純收入低于貧困標準(2010年2300元不變價)。年人均純收入=工資性收入+生產經營性收入+財產性凈收入+轉移性收入-生產經營性支出。住房方面:實際居住C級、D級危房且自身無力改造。醫療方面:家庭因病致貧,且成員未參加城鄉居民基本醫療保險。教育方面:家庭適齡成員因貧輟學,或家庭因學致貧[4]。根據此認定標準,得到貧困類型認定問題的假設空間如圖3所示:

在該系統中,貧困類型有3種,分別是一般貧困戶、低保貧困戶、五保貧困戶,屬于離散值,因此應用機器學習方法時其學習任務為分類問題,且是多分類學習任務;多分類學習任務是二分類問題的擴展,可將其拆分為多個二分類問題進行處理,從而得到個人的貧困類型[5]。通過對貧困戶特征信息的提取,結合該問題的假設空間樹形結構,將貧困戶關鍵特征作為二叉樹內部結點,特征的取值為“是”和“否”,左分支是取值為“是”的分支,右分支是取值為“否”的分支且每個葉子節點對應一個分數值,采用決策樹算法模型中的XGBoost算法進行貧困類別判斷,支持并行處理,對百萬貧困戶數據進行分析,更加高效。

將已確定貧困類型的貧困戶信息作為樣本,通過訓練獲得訓練樣本,并對XGBoost模型調參得到學習能力更強的判定貧困類別的最優模型,以此模型來獲得樣本外的貧苦戶的貧困類別。

2) 對基于機器學習得到貧困人數極其相應貧困類型進行整合分析,能夠以區域、年齡等方面分析貧困原因,從而給出有針對性的脫貧決策。

3) 在精準扶貧系統中,從早期的貧困人口基礎數據錄入、獲得各貧困戶的貧苦類型、到給出對應的貧困原因及脫貧決策,都離不開數據的支持。通過機器學習,找出隱藏在數據背后的貧困原因,以支持精準扶貧工作。通過對個人信息的多字段查詢,鼓勵企業管理人員聘用符合崗位需求的貧困戶;通過對貧困數據的及時更新以及對數據的可視化操作,統計各村鎮貧困人口、各年齡段貧困人口比重以及各階段脫貧人數、脫貧成效、脫貧趨勢,輔助政府進行區域性精準扶貧政策的制定。

3 現實意義

通過基于機器學習在精準扶貧中的理論研究,具有如下現實意義:

針對貧困戶:精準扶貧系統支持貧困戶對個人信息及貧困類型的認定結果查詢;更重要的是,基于機器學習方法得到的貧困分析和依據,可以給出供參考的扶貧決策,貧困戶可以根據各區域氣候情況、村鎮情況和個人實際情況選擇自助脫貧或者幫扶脫貧下的合理脫貧方式。

針對政府管理人員:精準扶貧系統支持各地區、各鄉鎮的貧困數據匯總和統計,給出各貧困戶的扶貧決策,政府管理人員以此為依據,同時根據各地區的氣候環境以及各貧苦戶的具體情況制定合理的扶貧脫貧政策;合理的脫貧扶貧政策錄入系統后為系統的更為精確的輔助決策提供了依據;每隔一段時期對扶貧成效進行統計反饋,如存在不合理的扶貧方式以便及時調整,行之有效的扶貧手段可以針對性的通過數據的統計,得到各地區各鄉鎮的脫貧趨勢,為之后脫貧方案的制定提供決策依據。

針對其他人員:社會企業單位或中小型公司管理人員,可以使用該系統,結合貧困戶個人情況和招聘崗位的實際需求,通過定向招聘的方式幫扶貧困人員脫貧。如,體力強度要求不高的崗位可以針對殘疾、體弱多病的貧困戶進行招聘。

4 未來研究方向

昭通作為扶貧攻堅的主戰場,扶貧工作須長期有效地持續下去。要保證扶貧工作的持續有效進行,除了貧困信息的準確錄入外,可以借助于現有的計算機知識和技術,給出針對各貧困戶實際情況的扶貧決策,早期結合人工方式,獲得符合環境和個人實際的決策信息,不斷強化機器學習模型,后期則可通過學習模型給出更為科學的扶貧決策。

該文對精準扶貧系統中貧困類型的評定給出了理論的機器學習方法,但要進行更貼合實際的研究,未來還需對機器學習模型算法的選擇和測試進行分析和實現。在實踐中不斷優化模型性能,為昭通地區的脫貧工作攻堅助力。

參考文獻:

[1] 沈迅,蔡侯友. 云南省首家精準扶貧管理系統正式開通[EB/OL]. http://www.lifeyn.net/article-1550316-1.html, 2016-04-29.

[2] 周志華.機器學習[M] .清華大學出版社, 2016.

[3] (美)哈林頓(Harrington,? P.) .機器學習實戰[M] .人民郵電出版社, 2013.

[4] 范淼,李超.Python機器學習及實現[M].清華大學出版社, 2016.

[5] 市扶貧辦.貧困村、貧困戶認定標準和申報程序[EB/OL].http://www.zt.gov.cn/lanmu/zwgk/contents/460/36550.html,2018-05-31.

[通聯編輯:梁書]

猜你喜歡
機器學習
基于詞典與機器學習的中文微博情感分析
基于網絡搜索數據的平遙旅游客流量預測分析
時代金融(2016年27期)2016-11-25 17:51:36
前綴字母為特征在維吾爾語文本情感分類中的研究
科教導刊(2016年26期)2016-11-15 20:19:33
下一代廣播電視網中“人工智能”的應用
活力(2016年8期)2016-11-12 17:30:08
基于支持向量機的金融數據分析研究
基于Spark的大數據計算模型
基于樸素貝葉斯算法的垃圾短信智能識別系統
基于圖的半監督學習方法綜述
機器學習理論在高中自主學習中的應用
極限學習機在圖像分割中的應用
主站蜘蛛池模板: 黄色网址手机国内免费在线观看| 日本人又色又爽的视频| 国产视频a| 国产永久免费视频m3u8| 色成人综合| 国产欧美精品一区aⅴ影院| 免费国产高清视频| 日韩一区二区三免费高清 | 欧美一区二区三区香蕉视| 亚洲欧美日本国产综合在线| 幺女国产一级毛片| 亚洲色精品国产一区二区三区| 亚洲欧美另类久久久精品播放的| 99视频精品在线观看| 亚洲中文制服丝袜欧美精品| 国产精品自在线天天看片| 日本精品影院| 亚洲va欧美va国产综合下载| 日本精品视频一区二区| 久久综合色天堂av| 在线观看视频一区二区| 18禁不卡免费网站| 中文字幕亚洲另类天堂| 国产91导航| 99偷拍视频精品一区二区| 国产美女人喷水在线观看| 国产精品高清国产三级囯产AV| 一区二区三区四区精品视频| 99久久国产综合精品2020| 精品国产免费人成在线观看| 一级毛片在线免费看| 久久精品这里只有精99品| 免费av一区二区三区在线| 色婷婷在线播放| 久综合日韩| AV色爱天堂网| 亚洲欧美一级一级a| 特级毛片免费视频| 亚洲国产中文在线二区三区免| 日韩午夜片| 香蕉国产精品视频| 高清亚洲欧美在线看| 日本久久网站| 久久这里只有精品23| 亚洲成年人网| 手机成人午夜在线视频| 亚洲中文字幕23页在线| 亚洲欧美日韩天堂| 亚洲精品va| 亚洲欧美日韩综合二区三区| 亚洲午夜天堂| 久久久久无码精品国产免费| 免费在线播放毛片| 极品国产一区二区三区| 91国内视频在线观看| 日韩成人在线视频| 国产欧美视频在线观看| 久久婷婷五月综合97色| 国产成人你懂的在线观看| 99性视频| 97在线公开视频| 亚洲国产一成久久精品国产成人综合| 尤物午夜福利视频| 中文字幕亚洲另类天堂| 欧美在线视频不卡| 怡春院欧美一区二区三区免费| 91青青视频| 欧美午夜小视频| 亚洲精品福利网站| 国产91在线免费视频| 中文字幕1区2区| 精品国产免费人成在线观看| 1769国产精品视频免费观看| 伊人欧美在线| 日韩高清成人| 超碰91免费人妻| 永久成人无码激情视频免费| 亚洲精品天堂自在久久77| AV色爱天堂网| 日韩一区精品视频一区二区| 亚洲人成色在线观看| 女人18毛片一级毛片在线 |