999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于機器學習的盾構螺旋輸送機轉速預測研究

2022-12-03 07:42:10王鵬峰周奇才陳傳林
起重運輸機械 2022年21期
關鍵詞:分類特征模型

趙 炯 王鵬峰 周奇才 張 恒 陳傳林

1同濟大學機械與能源工程學院 上海 201804 2上海地鐵盾構設備工程有限公司 上海 200120

0 引言

隨著我國經濟社會的發展和城市化進程步伐的加快,地鐵盾構成為各個主要城市交通發展的方向,全世界生產的盾構機已累計超過1萬余臺[1],地鐵也在緩解地上交通的壓力、促進提升自然資源利用率等方面起到越來越重要的作用。由于地上交通資源日趨緊張,相比地上交通的出行方式,地鐵出行的出行時間相對穩定,地鐵出行成為交通擁堵城市人們出行的重要選擇。地鐵的建設促進了我國社會的交通方式變革,也對我國的經濟社會發展起到了極大的促進作用[2]。

自從2008年我國制造了中國第一臺具有自主知識產權的復合式土壓平衡盾構機——中國中鐵1號以來,我國地鐵盾構技術飛速發展[3]。但是,在當今時代的要求下,盾構技術需要結合信息化技術才能緊跟時代步伐,實現盾構信息化、數字化的發展是當今需要解決的時代問題。其中地鐵盾構中重要的一環就是螺旋機的控制,利用盾構施工參數和數據研究螺旋機的轉速控制機理對于實現盾構施工作業的數字化發展具有重要意義[4]。盾構施工的智能化和數字化對于未來城市的數字化建設和管理等進程也具有非常重要的促進作用。

1 數據處理

現代盾構機普遍采用PLC進行控制和參數監測,同時盾構已經能夠實現遠程監控盾構過程中的各種施工參數,并將這些參數通過以太網傳送到遠程數據中心進行存儲。盾構歷史數據需要從盾構機的遠程數據庫中導出,具體可以通過遠程登錄連接傳輸或物理復制等手段取得。

國內某地鐵盾構公司的盾構機施工數據采用每臺盾構機一張數據表的形式存儲,每一列存儲一種參數,每一行存儲當前時刻采集到的各種參數的數據。不同廠家生產的盾構機型號有所差別,傳感器的安裝也不完全統一,不同的盾構機數據表會有差異,如參數順序不同、參數種類不同、參數命名方法不同、同一類別參數的個數不同等。此外,盾構數據在傳感器檢測采集、傳輸過程和存儲過程等各個環節都有可能出現疏漏,數據會有缺失和異常等各種情況,并且數據中存在很多無效數據,故數據處理是一項極其復雜和艱巨的任務。

地鐵盾構的歷史數據被保存到MySQL數據庫中,原始數據結構如圖1所示。圖1舉例展示的盾構機的歷史原始數據共有64 035行,504列。

圖1 原始數據

本文采用Python語言開展相關問題研究,使用Python的一個開源發行版本Anaconda進行本文編程環境的構建,程序的運行和調試在Anaconda的Jupyter lab交互式開發環境中進行。本文全程采用Python進行數據處理,通過SQLyog軟件將數據導出為csv格式方便后續處理,研究的目標為利用機器學習算法對盾構螺旋輸送機轉速進行預測,其余數據為此研究目標的特征數據。

數據處理的具體過程為:數據處理首先經過一次人工篩選,將如數據上傳時間、數據接收時間、PLC的通訊狀態等明顯與盾構螺旋輸送機轉速預測目標無關的特征刪除;本文所研究的是盾構螺旋輸送機轉速的預測,螺旋機轉速為零的樣本數據應被視為無效數據,故可刪除螺旋機轉速為零的無效樣本數據;獲得的數據中有很多空值,尤其是開關量D1-D200中有很多為空值,故可刪除這些全部為空值的開關量;刪除后只剩下2個開關量特征——D49和D129,經過查詢如圖2所示的盾構公司提供的盾構機參數資料,D49為膨潤土泵1變頻器故障,出現此故障時應停機檢修,故可刪除此特征;D129為外密封后腔計數不夠報警,只存在2個值為非缺失值(見圖3),且對整體的影響而言相對較小,故可刪除此特征。經過描述性統計發現,很多特征的所有樣本的值都相同,故可利用方差過濾法將特征方差值為零的特征刪除。需要說明的是,此時不可通過方差過濾將方差小于閾值的特征刪除或根據方差的大小進行特征選擇,因為盾構掘進數據的量綱沒有統一,如果通過以上方差過濾法進行特征選擇,會將值本來就很小的有用特征篩選掉,對后續螺旋機轉速的預測可能產生不利影響;在進行完上述的數據處理過程之后,對數據進行描述性統計(見圖4),其中count表示數據集中該特征的有效數值個數,即去除空值后的該特征數據個數,mean為該特征的平均值,std表示該特征的標準差,min表示該特征的最小值,max表示該特征的最大值,其余的百分比數值表示將該特征的數值從小到大排列后對應的百分比位置的數值大小,利用描述性統計能夠找出數據異常的特征,經分析刪除了部分異常特征(如A16為底部土倉壓力,其值從小到大排列后只有10%的數值與其余數值不同,因此本文認為底部土倉壓力數值異常)。

圖2 盾構機掘進參數

圖3 缺失值統計

圖4 描述性統計

經過上述數據預處理過程,得到了可供算法分析的初始數據,數據集包含3 177個樣本和163個特征(見圖5)。在實際建模過程中,由于不同模型對于數據集的要求不同,還需要對數據集進行無量綱化處理,如標準化和歸一化等縮放處理,以求模型在數據集上能有更好的表現[5]。

圖5 數據預處理

2 模型建立

本文采用機器學習算法對盾構數據進行研究,機器學習算法可以分為分類算法和回歸算法。盾構機施工數據由于機型的不同,螺旋輸送機的轉速值的記錄也有所不同,一部分采用整數值對螺旋輸送機的轉速進行記錄,而另一些則采用浮點數對轉速值進行記錄。本文研究的土壓平衡盾構機采用整數記錄螺旋輸送機的轉速,轉速值的范圍為0~14,并且分布不均衡。因此,采用Sklearn中的分類算法對盾構螺旋輸送機的轉速進行分析訓練和預測。Sklearn中的分類算法主要包含分類決策樹、分類隨機森林、邏輯回歸、支持向量機(Support Vector Machines,SVM)、樸素貝葉斯、極端梯度提升(eXtreme Gradient Boosting,XGBoost)和分類神經網絡等。本文主要采用決策樹、隨機森林、支持向量機和神經網絡4種算法對盾構螺旋輸送機轉速進行訓練和預測。

2.1 決策樹

作為一種有監督學習的分類模型,決策樹能夠在包含標簽和數據特征的數據集中做出決策,其原理易于理解,并且能夠畫出決策樹的樹狀圖,能夠很直觀地體現決策過程,同時決策樹也能處理多分類問題,并且對于數據的規范化要求不是很嚴格,因此其在各行業中得到了廣泛應用。

使用決策樹來對盾構螺旋輸送機轉速進行預測,需要對作為標簽數據的螺旋機轉速數據進行編碼處理,使其能夠被用來進行分類。本文采用Sklearn.Preprocessing庫中的LabelEncoder模塊對標簽進行編碼。本文基于的數據,其原始螺旋機轉速的值為整數數值。經過數據預處理的數據包含有162個特征,這對于具有過擬合性質的決策樹而言數據特征過多,故本文采用Sklearn.Feature_Selection庫中的Mutual_Info_Classif模塊互信息分類來篩選出30個最優特征來作為數據集進行訓練。以決策樹的深度作為橫坐標,評估指標(即決策樹的準確度)作為縱坐標,得出的學習曲線如圖6所示。

圖6 決策樹學習曲線圖

2.2 隨機森林

隨機森林屬于裝袋法的集成算法,是裝袋法的典型模型,裝袋法的核心思想是構建多個相互獨立的評估器,結果則根據對所有預測的輸出結果進行平均或按少數服從多數的原則得出。本文采用10折交叉驗證來探究隨機森林的樹的個數對于決策精確度的影響,得出的結果如圖7所示。

圖7 決策樹個數對決策的影響曲線圖

由圖7可以看出,對于螺旋機轉速的預測問題,使用隨機森林進行研究是非常不適合的,模型的準確度很差,得到的結果最高只有0.111 2的準確度。

2.3 支持向量機

支持向量機是機器學習最受關注的算法,可以進行有監督學習、無監督學習和半監督學習,應用非常廣泛,并且在各種實用問題中(如手寫數字識別、人臉識別、分類文本和超文本、圖像分類與分割和蛋白質分類等)都表現得很優秀。由于支持向量機對于數據的量綱具有很高的敏感性,故本文又在數據預處理的基礎上對原始數據進行了數據歸一化的處理。

本文分別使用Linear、Poly、Rbf和Sigmoid核函數的支持向量機對螺旋機轉速預測進行了訓練和測試,結果表明線性核函數的效果不理想,多項式核函數只能在一次的情況下運行出結果并且效果不理想,Rbf核函數不能運行出結果,Sigmoid核函數運行得到的結果較差。綜上所述,表明支持向量機對于如此多標簽類別和特征的分類問題不擅長,支持向量機不能很好地對螺旋機轉速的預測進行分類判斷。

2.4 神經網絡

神經網絡借鑒了仿生學的思想,利用計算機技術來模仿人類大腦神經元的結構和功能,采用分布式并行信息處理的方式來對信息進行處理。神經網絡通過調節內部節點之間的隱藏參數來適應并處理信息,進而得出計算結果。隨著計算機技術的發展,計算機的軟硬件水平不斷提高,神經網絡的應用越來越廣泛,在機器學習尤其是深度學習領域得到廣泛應用。

本文采用Sklearn的Neural_Network庫中的MLPClassifier模塊來對數據進行學習和預測。同樣地,需要先對數據進行標準化處理,由于特征數目太多導致模型對于數據的學習過于細致,導致模型過擬合,模型的泛化性差。因此本文通過互信息法選取特征,隨后用選取出來的特征進行神經網絡訓練,其中,神經網絡選取4層隱藏層,每層的隱藏神經元個數分別為80、80、80、60。模型的預測準確率與數據特征個數的關系如圖8所示。

圖8 不同特征個數的準確率

由于圖8繪制的曲線是在步長為10的基礎上進行訓練得到的結果,為了更加準確地得到學過最好的時候的特征個數,繼續選取步長為1進行訓練并將得到如下結果(見圖9),平均絕對誤差(MAE)的結果如圖10所示。

圖9 最佳特征個數

圖10 MAE結果

從結果看,神經網絡相比上述其余的模型對于螺旋機轉速的預測的準確率更好,準確率只有45%左右,但由于本文研究的是14分類問題,故此效果已經相對較好。平均絕對誤差的最理想結果是0,即預測與真實值毫無偏差,本文得出的結果與真實結果相差不到1,故效果可接受。但是,對于實際應用而言效果不完美,仍需進一步探索更為貼合轉速控制的模型。

另外,由于本文所采用的數據完全是由函數篩選而來,未經人工進行特征篩選,可能是造成模型效果不佳的重要原因。由于人工進行盾構機控制時人對于施工狀況的反應的滯后性,所采集到的數據可能是盾構司機對于先前盾構狀況所做出的決策,故可認為盾構數據的缺陷也是導致模型效果不佳的重要原因。此外,由于盾構機的螺旋輸送機轉速值分布不均衡,存在樣本不均衡的問題暫時無法解決,本文認為螺旋輸送機的轉速樣本不均衡同樣是導致模型效果不完美的重要原因之一。需要指出的是,對于不同的盾構機,模型的效果也是不同的并且有較大差距,本文認為盾構機的型號和運行等因素也是影響預測偏差的重要成因。

3 結論

影響盾構螺旋輸送機轉速的因素眾多,機器學習方法運用于盾構螺旋輸送機轉速預測這一14分類問題取得的一定的效果。相較于決策樹、隨機森林和支持向量機等模型,神經網絡分類算法的預測準確度效果好,預測結果的平均絕對誤差在0.9左右。但由于盾構施工作業需要防范風險,提高控制系統的可靠性,并且出于對算法的運行速度的考慮,實際應用中仍需提高預測精度,保證盾構施工更加科學、高效和安全。

猜你喜歡
分類特征模型
一半模型
分類算一算
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
分類討論求坐標
數據分析中的分類討論
教你一招:數的分類
抓住特征巧觀察
主站蜘蛛池模板: 91视频首页| 2020最新国产精品视频| 亚洲欧美在线综合图区| 久久人妻系列无码一区| 国产精品综合色区在线观看| 9啪在线视频| 无码专区国产精品一区| 亚洲中文无码av永久伊人| 亚洲成人动漫在线| 国产网站一区二区三区| 久久综合一个色综合网| 久久国产热| 无码在线激情片| 福利视频99| 精品丝袜美腿国产一区| 中文成人无码国产亚洲| 亚洲欧美国产五月天综合| 国产欧美视频综合二区| 91成人在线免费观看| 国产精品专区第1页| 国产一级在线播放| 国产欧美日韩视频怡春院| 九九久久精品国产av片囯产区| 成人一区在线| 一本色道久久88| 国产精品免费电影| 欧美日韩资源| 成年人视频一区二区| 国产精品网址你懂的| 国产特级毛片| 亚洲伊人天堂| 91九色视频网| 香蕉久久国产精品免| 久久婷婷五月综合色一区二区| 亚洲精品少妇熟女| 99re这里只有国产中文精品国产精品 | 亚洲Va中文字幕久久一区| 一级爆乳无码av| 国产欧美精品一区二区| 色爽网免费视频| 国产亚洲精久久久久久无码AV| 国产欧美日韩精品综合在线| 亚洲成人免费看| 色网站在线免费观看| 日本午夜影院| a毛片在线| 青青草国产精品久久久久| 国产国产人免费视频成18| 性69交片免费看| 四虎永久免费在线| 亚洲美女一区二区三区| 婷婷亚洲天堂| 精久久久久无码区中文字幕| 91视频国产高清| 亚洲swag精品自拍一区| 国产成人a在线观看视频| 中文字幕 欧美日韩| 亚洲日本中文字幕乱码中文| 特级做a爰片毛片免费69| 99re在线免费视频| 男女男免费视频网站国产| 日韩 欧美 国产 精品 综合| 婷婷色一二三区波多野衣| 亚洲欧美成人综合| 综合色88| 亚洲欧洲天堂色AV| 国产情侣一区| V一区无码内射国产| 波多野结衣视频一区二区| 少妇精品久久久一区二区三区| 国产在线一区视频| 日韩第九页| 制服丝袜国产精品| 亚洲欧洲日韩综合| 亚洲精品无码抽插日韩| 国产一级二级在线观看| 四虎国产精品永久一区| 97视频免费在线观看| 国产高潮视频在线观看| 国产成人亚洲无码淙合青草| 精品天海翼一区二区| 国产麻豆精品在线观看|