999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

電力基建施工問題文本分類研究

2019-09-10 07:22:44謝志煒馮鴻懷許銳埼李慧夫
現代信息科技 2019年17期

謝志煒 馮鴻懷 許銳埼 李慧夫

摘 ?要:針對實際電力基建施工問題數據集龐大,導致運監管理難度較大的問題,本文提出一種基于樸素貝葉斯分類器的電力基建施工問題文本分類方法,實現對施工問題的自動分類工作。首先整理收集施工問題數據集,然后將施工問題短文本進行中文分詞,構建特征向量空間,最后采用樸素貝葉斯分類器對施工問題文本進行分類,并通過實例分析證明了本文所用方法的有效性與優越性。

關鍵詞:施工問題;中文分詞;樸素貝葉斯;文本分類

中圖分類號:TP391;O212.8 ? ? 文獻標識碼:A 文章編號:2096-4706(2019)17-0017-03

Abstract:Aiming at the huge dataset of actual power infrastructure construction problems,it is difficult to manage the operation and supervision. This paper proposes a text classification method based on Naive Bayesian classifier for power infrastructure construction,which realizes the automatic classification of construction problems. Firstly,collect the construction problem data set,and then use the Chinese text segmentation of the short text of the construction problem to construct the feature vector space. Finally,the Naive Bayes classifier is used to classify the text of the construction problem. The validity and superiority of the method used in this paper are proved by an example analysis.

Keywords:construction problems;Chinese word segmentation;Naive Bayes;text classification

0 ?引 ?言

隨著經濟的快速發展,現有的電力供應能力無法滿足人們日益增長的需求,每年供電部門都會開展大量電力基建工程以解決此問題[1]。但由于基建施工是動態的立體作業過程,人員的流動性、生產設施的臨時性、施工工藝的標準性、生產過程的規范性、作業環境的多變性,形成了人、機、料、法、環等多維度施工問題集,所存在的問題會對工程項目建設的效率、質量以及水平造成一定的影響[2]。因此基建工程管理起著越來越關鍵的作用,也是電力建設事業必須注重的環節。

目前,基建項目管理主要手段為現場核查,核查后對施工現場狀況以及存在問題進行記錄。由于基建項目基數大,運監部門在處理記錄施工問題的文檔時較為低效,需要對每條記錄進行審閱,無法快速對現場狀況以及存在的問題進行定性的分析。

國內外有許多文本數據挖掘方法,它們也被應用到了電力領域:文獻[3]初步探討了文本挖掘技術在電力行業的應用,并講述了文本挖掘的概念、流程方法以及對客戶反饋信息進行情感分析的應用;文獻[4]針對電力客戶投訴文本展開數據挖掘研究,運用自然語言處理技術,通過構建文本分類器模型,實現投訴熱點的自動分類,進而實現差異化服務;文獻[5]針對電網生產管理系統中存在大量設備缺陷文本的特點,構建電力設備缺陷文本分類模型,減輕人工比對篩選的工作量。

現有文獻對施工問題的研究較少,故本文針對施工問題數據量龐大且缺乏相關處理技術使得監控管理存在較大難度的問題,提出一種基于樸素貝葉斯分類器的電力基建施工問題文本分類方法。首先向相關部門收集并整理施工問題數據集,利用Python平臺中的工具包對各條施工問題短文本進行中文分詞,進而構建特征向量空間。最后對樸素貝葉斯分類器進行訓練,進而實現施工問題文本分類,有助于提高運營監控管理水平和工作效率。

1 ?貝葉斯理論

1.1 ?貝葉斯理論介紹

目前,貝葉斯理論作為一種開放式的決策性體系,已廣泛地應用于國防軍事、資源評估、水利水電、風險投資、金融保險等各個社會領域[6]。貝葉斯理論的思想如圖1所示。

盡管樸素貝葉斯分類器的條件獨立性假設在一定程度上限制了其范圍,但在實際應用中發現,即使在屬性顯著相關的情況下,樸素貝葉斯網絡也顯示了更好的準確性和效率[9]。

2 ?施工問題文本分類步驟

施工問題文本分類是基于主流的文本挖掘技術開展的,所采取的挖掘步驟如圖3所示。

(1)數據預處理:在獲取文本數據后,要對數字字符和英文字符等對文本意義不大的內容進行刪除,同時將冗余、重復的樣本進行識別和刪除,留下對分類更有價值的數據。

(2)中文分詞:中文文本與英文文本不同,沒有單詞與單詞之間的明顯間隔,所以在進行中文文本挖掘時必定要進行中文分詞。一般分詞具有基于字典的方法、基于注釋的方法、基于規則的方法和基于統計的方法[10]。在Python中常用Jieba分詞工具。分完詞后,還需要使用停用詞庫對一些介詞或常用詞進行刪除。

(3)特征向量空間:分詞過后,文本被分解為一個個的特征詞。通過使用詞頻來度量每個特征詞,進而將文本數據轉化為特征向量空間。

(4)模型搭建:搭建文本分類模型,本文采用樸素貝葉斯分類器。將預處理好的樣本進行劃分,一部分作為訓練集導入分類器進行訓練,剩余部分作為測試集(驗證集)對分類器的性能進行檢測驗證。

(5)模型評估:本文采用AUC值對分類模型進行性能評價。AUC值是ROC曲線下方所圍成的面積值。分類器的AUC值等價于將隨機選擇的正樣本排序在隨機選擇的負樣本之前的概率。AUC值越大,說明該分類器的效果越好。

3 ?實例分析

本文從某供電局基建部門收集了共1000條的施工問題集。通過數據預處理,除去冗余、重復等意義不大的文本數據,取剩余800條文本作為實驗樣本。由于本文所采用的分類方法為有監督學習機制,故已請專家為這800條施工問題提前進行分類。為保證分類器能識別正常的狀態,施工問題集中保留了正常類別。該施工問題集所涉及類別如表1所示。

對施工問題文本進行中文分詞,采用Python中的Jieba分詞工具,隨機取10項進行分詞后的展示,如圖4所示。

由圖4可見,各條施工問題文本已被分為多個詞語,在每條施工問題后面還帶有其類別屬性。分詞后,采用sklearn工具包中的CountVectorizer將文本轉化為特征向量空間,利用詞頻對施工文本數據進行量化處理;最后,采用sklearn工具包中的MultinomialNB搭建分類預測模型:隨機取90%的樣本作為樸素貝葉斯分類器模型的訓練樣本,對分類器模型進行訓練。剩余10%作為測試樣本對訓練好的模型進行性能驗證。

為了證明本文所設計的模型具有更好的性能,還分別建立了常用的SVM分類模型以及KNN分類模型進行比較,所得這三種分類器的性能對比如表2所示。

由表2可得,本文所提樸素貝葉斯分類器的AUC值為0.88,比KNN(0.76)、SVM(0.80)分類器的分類效果更佳。

4 ?結 ?論

本文針對施工問題數據量龐大,導致監控管理存在難度較大、效率低下等問題,提出一種基于樸素貝葉斯分類器的電力基建施工問題文本分類方法。通過實例證明了本文所提模型具有有效性,且分類效果優于其他分類模型。本文研究有利于提高運營監控管理水平,提高工作效率,為電網精細化管理提供技術支持。

參考文獻:

[1] 韋錫芝.電力基建工程管理中常見問題及改進措施 [J].技術與市場,2016,23(2):98+100.

[2] 曹武明.當前電力建設工程施工安全管理問題分析與應對措施 [J].時代經貿,2009(11):101.

[3] 施萱軒,姜紅紅,梁浩,等.文本挖掘技術研究及其在電力行業的應用 [J].機電信息,2017(30):42-45+47.

[4] 吳剛勇,張千斌,吳恒超,等.基于自然語言處理技術的電力客戶投訴工單文本挖掘分析 [J].電力大數據,2018,21(10):68-73.

[5] 劉梓權,王慧芳,曹靖,等.基于卷積神經網絡的電力設備缺陷文本分類模型研究 [J].電網技術,2018,42(2):644-651.

[6] 莊晟.基于樸素貝葉斯的電力變壓器故障診斷 [D].上海:上海交通大學,2015.

[7] 岳全中,朱永利.基于樸素貝葉斯分類器的電流互感器狀態評估 [C]//中國高等學校電力系統及其自動化專業第二十四屆學術年會論文集.北京:中國農業大學,2008:208-211.

[8] 雍明超,呂俠,周鐘,等.基于樸素貝葉斯算法的電力變壓器故障診斷方法研究 [J].電氣應用,2017,36(14):32-35.

[9] 田炳偉,高釧.基于貝葉斯分類器的電力變壓器設備故障診斷研究 [J].電子設計工程,2017,25(15):54-57+61.

[10] 梁浩波.基于文本挖掘的用電客戶訴求智能聚類研究 [J].廣東電力,2016,29(8):45-50+66.

作者簡介:謝志煒(1984-),男,漢族,廣東廣州人,工程

師,碩士,研究方向:配電網工程管理、配電網工程造價管理、配電網規劃;馮鴻懷(1981-),男,漢族,廣東恩平人,信息系統項目管理師,研究方向:電力行業信息化、大數據分析;通訊作者:許銳埼(1995-),男,漢族,廣東潮陽人,碩士研究生,研究方向:電力數據挖掘分析;李慧夫(1994-),男,漢族,湖北咸寧人,碩士研究生,研究方向:電力數據挖掘分析。

主站蜘蛛池模板: 国产视频入口| 综合五月天网| 亚洲精品无码人妻无码| 国产乱人激情H在线观看| 小说区 亚洲 自拍 另类| 精品久久蜜桃| 999精品免费视频| 狠狠色噜噜狠狠狠狠色综合久| 久久亚洲国产最新网站| 久久永久视频| 国产第一福利影院| 一级毛片不卡片免费观看| 久久一级电影| 亚洲天堂区| 久久久亚洲色| 亚洲不卡无码av中文字幕| 香蕉精品在线| 国产午夜一级毛片| 亚洲人在线| a毛片免费看| 亚洲精品爱草草视频在线| 少妇露出福利视频| 国产视频入口| 亚洲a免费| 久久福利片| 青青热久免费精品视频6| 日日拍夜夜嗷嗷叫国产| 国产美女精品一区二区| 99精品伊人久久久大香线蕉| 亚洲日本中文字幕乱码中文| 四虎成人精品| 国产精品国产三级国产专业不| 91精品情国产情侣高潮对白蜜| 高潮毛片免费观看| 大学生久久香蕉国产线观看 | 国产福利一区视频| 黄色网在线免费观看| 五月婷婷伊人网| 亚洲成年人网| 国产网站免费观看| 国产鲁鲁视频在线观看| 国产色偷丝袜婷婷无码麻豆制服| 国产SUV精品一区二区| a级高清毛片| 精品国产黑色丝袜高跟鞋| 波多野结衣一区二区三区AV| 日韩人妻精品一区| 波多野衣结在线精品二区| 亚洲一区精品视频在线| 在线看片免费人成视久网下载| 亚洲V日韩V无码一区二区| 91午夜福利在线观看| 国产成人免费手机在线观看视频| 青青青视频91在线 | 国产成人亚洲综合A∨在线播放| 成人在线欧美| 久久精品丝袜| 成人福利在线看| 亚洲一欧洲中文字幕在线| 婷婷亚洲最大| 免费av一区二区三区在线| 综合色亚洲| 亚洲国产中文欧美在线人成大黄瓜| 日韩欧美中文字幕在线韩免费| 中文字幕亚洲专区第19页| 久久久久亚洲精品成人网 | 在线观看国产精美视频| 福利视频久久| 国产精品99r8在线观看| 国产黄色爱视频| 成年人国产网站| 波多野结衣在线一区二区| 99久久国产综合精品2023| 国产高清精品在线91| 国产成人久视频免费 | 国产精品区视频中文字幕| 成人福利在线免费观看| 免费观看男人免费桶女人视频| 国产免费羞羞视频| 欧美色丁香| 欧美日韩高清| 不卡无码h在线观看|