999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于條件深度循環生成對抗網絡和動作探索的行星輪軸承剩余壽命預測

2021-01-08 05:33:06于軍劉可郭帥于廣濱郭振宇
兵工學報 2020年11期
關鍵詞:動作模型

于軍, 劉可, 郭帥, 于廣濱, 郭振宇

(1.哈爾濱理工大學 先進制造智能化技術教育部重點實驗室, 黑龍江 哈爾濱 150080;2.礦冶過程自動控制技術國家重點實驗室, 北京 100089;3.哈爾濱理工大學 自動化學院, 黑龍江 哈爾濱 150080;4.中國船舶重工集團公司第703研究所 蒸汽輪機事業部, 黑龍江 哈爾濱 150078)

0 引言

因具有傳動比大和結構緊湊等特點,行星齒輪箱已廣泛應用于直升機、風力發電機和坦克車等機械設備中[1-2]。復雜惡劣的工作環境會增加行星輪軸承故障的風險[3]。這種難以預料的故障可能導致整個設備突然失靈,甚至造成巨大的經濟損失。因此,行星輪軸承剩余壽命預測對保障機械設備可靠運行和避免事故發生具有十分重要的意義。

近年來,國內外學者對典型旋轉機械的剩余壽命預測問題進行了深入研究[4],并提出了一些頗具代表性的軸承剩余壽命預測方法。這些方法主要分為3類:物理模型法、統計模型法和人工智能法。

物理模型法通過建立基于失效機理的數學模型,描述機械設備的退化過程。與材料特性相關的模型參數可通過專門的實驗或有限元分析方法獲得。典型的數學模型包括有限元模型、Paris模型[5]、動力學模型等。物理模型法雖然能實現軸承剩余壽命的準確預測,但在模型建立過程中需滿足多種假設,難以建立精確的剩余壽命預測模型。而且模型參數的確定依賴人工經驗,從而限制了物理模型法的廣泛應用。

統計模型法根據基于經驗知識的統計學模型預測機械設備的剩余壽命。統計模型中的隨機變量常用于描述各種變化源的不確定性,因此,統計模型法能有效描述退化過程的不確定性并準確估計機械設備的剩余壽命。常用的統計模型包括自適應回歸模型[6]、隨機系數模型[7]、Wiener過程模型[8]、全階乘模型[9]等。隨機變量的引入明顯提高了用于描述各種退化過程的模型柔性。然而,統計模型法的不足在于預測效果嚴重依賴歷史數據,導致剩余壽命預測得不準確。另外,隨機變量的概率分布需滿足多種假設,從而限制了統計模型法的實際應用。

人工智能法通過智能技術識別機械設備的退化狀態,而非構建物理模型或統計學模型。人工智能法能解決難于構建物理模型或統計學模型的復雜機械系統剩余壽命預測問題。因此,人工智能法在軸承的剩余壽命預測領域受到極大關注。典型的人工智能法包括人工神經網絡[10]、模糊邏輯系統、支持向量機(SVM)[11]、Gaussian過程回歸[12]等。人工智能法無需額外的先驗知識或精確的解析模型,通過歷史數據識別退化過程。因此,人工智能法在復雜系統的剩余壽命預測中具有重要的應用價值。

行星輪軸承不但自轉,還繞太陽輪公轉。其內圈安裝在行星輪軸上,相對于行星輪軸固定不動;外圈安裝在行星架上,隨著行星架的旋轉而旋轉。從故障位置到傳感器的時變振動傳遞路徑,使采集到的行星輪軸承振動信號具有非靜態的特點。此外,由于受到轉速和負載變化的影響,行星齒輪箱在變工況條件下運行,所采集到的振動信號往往是非線性的。行星輪軸承的疲勞壽命試驗耗時且投入巨大,僅能獲得有限的行星輪軸承全壽命周期樣本。行星輪軸承的剩余壽命預測需要大量訓練樣本,導致行星輪軸承的剩余壽命預測模型無法得到充分訓練。因此,小樣本和變工況下行星輪軸承的剩余壽命預測準確率較低。

本文將門控循環單元神經網絡(GRUNN)與條件生成對抗網絡(CGAN)相結合,構建一種深度學習模型,使該深度學習模型具有較強的非靜態和非線性信號處理能力,并能解決小樣本情況下行星輪軸承的剩余壽命預測問題,同時利用動作探索(AD)技術改善學習決策質量、減少迭代次數。

1 理論基礎

1.1 門控循環單元神經網絡

循環神經網絡(RNN)通過建立單元間的循環連接,記憶任意長度序列的輸入數據[13]。RNN的關鍵在于t時刻輸出ht是由當前輸入xt和前一時刻輸出ht-1決定的。計算公式為

(1)

式中:W″和H為轉換矩陣;b″為偏置向量;f為非線性激活函數。

然而,常規RNN的訓練過程可能導致梯度消失或梯度爆炸。為緩解這一問題,Chung等[14]開發了一種可實現狀態記憶和信息獲取的門控循環單元(GRU),用于構成GRUNN. GRU的結構如圖1所示。重置門r用于調整新輸入與之前記憶的合并,更新門z用于調控之前記憶中保留的信息。GRU中的轉換函數定義如下:

zt=σ(Wzxt+Vzht-1+bz),

(2)

rt=σ(Wrxt+Vrht-1+br),

(3)

(4)

(5)

圖1 GRU的結構Fig.1 Architecture of GRU

1.2 條件生成對抗網絡

生成對抗網絡(GAN)是2014年由Goodfellow等[15]提出的一種生成式模型,一經提出就成為人工智能領域的研究熱點之一。GAN并不是一個完整的網絡模型,而是一種網絡訓練框架。該框架僅有兩個組成部分:生成器和判別器。GAN的核心思想來源于博弈論中的零和博弈,將生成器和判別器看作博弈雙方。生成器用于生成盡量服從真實數據分布的樣本,判別器用于判斷輸入樣本是真實樣本還是生成樣本。優化目標是通過對抗機制達到納什均衡。

CGAN是在GAN基礎上加入了額外的條件c(如類標簽),通過額外的條件c指導數據的生成過程[16]。CGAN的模型結構如圖2所示。輸入隨機噪聲n的同時輸入相應條件c,使生成器G生成盡量服從真實數據分布Pdata(x)的樣本G(c,n);在條件c的指導下,判別器D判斷輸入樣本是真實數據x還是生成樣本G(c,n)。目標函數V(D,G)為

En~Pn(n)[lg(1-D(G(n|c)))],

(6)

式中:Pn(n)表示先驗噪聲分布;Ex~Pdata(x)[lgD(x|c)]表示將真實數據x與條件c輸入判別器D獲得是否為真實數據的概率;En~Pn(n)[lg(1-D(G(n|c)))]表示隨機噪聲n與條件c輸入生成器G產生的生成樣本,判別器D判別其為真實數據的概率。生成器G嘗試最小化目標函數,判別器D嘗試最大化目標函數。

圖2 CGAN的模型結構Fig.2 Model structure of CGAN

1.3 動作探索

作為一種重要的機器學習方法,強化學習(RL)已廣泛應用于控制工程、故障診斷和圖像處理等領域。它采用 “嘗試與失敗”機制,使智能體在與環境的交流中學習,利用評價性的反饋信號實現決策的優化[17]。RL可用于解決智能體如何學習近似最優行為策略的問題。RL的過程是一個試探與評價的過程,其基本框架如圖3所示。當環境狀態為st時,智能體執行一個動作at,獲得一個獎勵ut,并將該獎勵反饋給智能體。環境從而轉移成一個新的狀態st+1. 為了最大化長期的累積獎勵,智能體選擇一系列后續動作。t時刻的累積折扣獎勵定義如下:

(7)

式中:γ為折扣因子,可對成本函數進行一定折扣[20],γ∈(0,1];ut+k+1為t+k+1時刻的獎勵[18]。

圖3 RL的基本框架Fig.3 Basic framework of RL

AD是一種RL算法[19]。為尋求最優動作集,AD將動作集分離到每一個狀態。通過探索和評估新動作并執行,AD不僅避免了動作集的限制、改善了學習決策質量,還減少了獲取最優策略的迭代次數。AD采用成本函數p衡量新動作的復雜度。智能體從狀態st轉移到狀態st+1的成本為p(st,st+1)。此外,AD采用潛在函數φ(st)評估新動作。φ(st)可用于精確搜索目標、構造獎勵值以及降低采樣復雜度。采用了潛在函數φ(st)評估新動作可適用性的公式為

γp(st,st+2)φ(st+2)>(1+δ)γp(st,st+2)φ(st+1),

(8)

式中:δ為松弛變量,代表探索新動作的保守程度。對于深度神經網絡Q,AD通過最小化損失函數方式獲得神經網絡的參數集。損失函數的定義為

(9)

(10)

(11)

(12)

θi+1為第i+1次迭代時當前網絡Q的參數集,θi+j為第i+j次迭代時當前網絡Q的參數集,α為學習率。通過(11)式和(12)式可周期性地更新網絡參數θ和θ-. 在智能體執行動作后,根據當前環境,在滿足(13)式的情況下更新動作集。

[p(st,st+2)<∞]∧[a(st,st+2)?At(st)]∧
[γp(st,st+2)φ(st+2)>(1+δ)γp(st,st+2)φ(st+1)],

(13)

式中:At為t時刻的動作集。

2 行星輪軸承剩余壽命預測方法

2.1 行星輪軸承剩余壽命預測框架

作為一種新型RNN變體,GRUNN不但能處理時序數據或前后關聯數據,還能緩解常規RNN在訓練過程中可能導致的梯度消失問題。另外,GRUNN特殊的門結構能夠有效地解決長短時間序列上的變化問題。因此,可利用GRUNN從非靜態和非線性的行星輪軸承振動信號中提取故障特征,用于變工況下行星輪軸承的剩余壽命預測。CGAN是GAN的一個擴展,它通過額外條件c指導數據的生成過程,利用生成器G生成新樣本。因此可將行星輪軸承所處階段看作額外的條件c,指導生成器G生成服從真實數據分布的新樣本,從而增加訓練樣本數量,解決訓練樣本不足的問題。如果將GRUNN與CGAN相結合,構建一種條件深度循環生成對抗網絡(C-DRGAN),則該深度學習模型將具有較強的非靜態和非線性信號處理能力,并能解決小樣本情況下行星輪軸承的剩余壽命預測問題。作為一種新穎RL算法,AD將動作集分離到每一個狀態,尋求最優動作集。通過探索和評估新動作,不僅改善了學習決策質量,還減少了迭代次數。如果將剩余壽命預測問題看作智能體的決策過程,則該智能體將根據目標導向政策采取行動,以取得最佳長期回報。多元線性回歸(MLR)分類器[21]是一種傳統預測模型。對于非靜態和非線性信號,MLR無需繁瑣的迭代訓練過程與參數調整,能獲得精確的預測結果。因此,提出一種基于C-DRGAN和AD的行星輪軸承剩余壽命預測方法。方法框架(見圖4)為:構建C-DRGAN,從非靜態和非線性信號中提取故障特征;采用基于AD的訓練算法訓練C-DRGAN,提高收斂速度,降低訓練時間;根據訓練后的C-DRGAN,利用MLR分類器預測測試樣本中行星輪軸承的剩余壽命。

圖4 行星輪軸承剩余壽命預測框架Fig.4 RUL prediction framework of planet bearings

2.2 條件深度循環生成對抗網絡

如果將GRUNN與CGAN相結合,構建一種深度學習模型,則該模型將同時具備二者的優點。基于這個思路,本文開發一種C-DRGAN. 其模型結構如圖5所示,它主要由條件c、生成器G、判別器D和MLR分類器組成。真實數據x為訓練樣本。隨機噪聲n與條件c為生成器G的輸入。生成器G由一個GRUNN構成。生成器G的輸入為隨機噪聲n. 輸出為服從真實數據x分布的生成樣本G(c,n)。生成器G在條件c的指導下,利用隨機噪聲n生成服從真實數據分布的新樣本G(c,n)。判別器D由一個GRUNN構成。判別器D的輸入為真實數據x和生成樣本G(c,n),輸出為提取的故障特征。這些故障特征作為MLR分類器的輸入,MLR分類器的輸出為預測結果。該結果用于計算獎勵ut,并反饋給生成器G. 在本文中,真實數據x為行星輪軸承全壽命周期訓練樣本。條件c為行星輪軸承所處階段,指導生成器G生成服從真實數據分布的行星輪軸承全壽命周期樣本,增加訓練樣本數量,解決行星輪軸承剩余壽命預測時訓練樣本不足的問題。判別器D用于提取行星輪軸承的故障特征。MLR分類器根據輸入的故障特征,預測行星輪軸承的剩余壽命。根據預測結果計算獎勵ut,并利用采用基于AD的訓練算法調整生成器G和判別器D的網絡參數。

圖5 C-DRGAN的模型結構Fig.5 Model structure of C-DRGAN

2.3 基于AD的訓練算法

RL中,動作集通常是固定的。即使新的動作被發現,這些新動作也是根據原動作集來描述的。然而,能改進智能體表現的新動作,很可能既不包含于原動作集,也無法根據原動作集來描述。因此,通過探索和評估新動作,利用AD尋找最優動作集。如果將剩余壽命預測問題看作智能體的決策過程,則該智能體可根據目標導向政策采取行動,以取得最佳長期回報。為了改善學習決策質量,減少迭代次數,AD可用于訓練C-DRGAN。因此,給出一種基于AD的訓練算法。主要步驟如下:

步驟1設置松弛變量δ、折扣因子γ和學習率α. 初始化狀態s0、動作a0和動作集A0.

步驟2設置dropout率,并將dropout技術應用于C-DRGAN,防止過擬合現象的發生。

步驟3執行動作a0,觀察環境新狀態st+1,根據(7)式計算累積折扣獎勵。

步驟4根據(14)式計算判別器D的損失函數,

(14)

式中:Lc為類標簽的損失誤差;Ld為真實標簽的損失誤差;Θ為判別器D的參數集。

步驟5根據(15)式計算生成器G的損失函數,

(15)

式中:Lg為真實標簽的損失誤差;Θ′為生成器G的參數集。

步驟7根據(13)式搜索并評估新動作,更新動作集。

步驟8對下一時刻重復步驟3~步驟7, 直至判別器D和生成器G達到納什均衡。

3 試驗驗證

3.1 數據獲取

為了驗證所提方法的有效性,進行了行星輪軸承加速疲勞壽命試驗。圖6為行星輪軸承加速疲勞壽命試驗臺,主要由驅動電機、行星齒輪箱、負載電機和數據采集系統組成。行星輪軸承為NJ304EM圓柱滾子軸承。試驗中通過電路控制負載電機產生3種負載(3 000 N·m、4 000 N·m和5 000 N·m),驅動電機的輸出轉速分別為400 r/min、600 r/min和800 r/min. 因此,可獲得3種行星輪軸承運行工況:第1種(800 r/min和3 000 N·m)、第2種(600 r/min和4 000 N·m)、第3種(400 r/min和5 000 N·m)。行星齒輪箱上方的加速度傳感器用于采集行星輪軸承運行時的振動加速度信號,采樣間隔為10 s,采樣頻率為25.6 kHz,采樣時間為0.4 s. 當振動加速度信號幅值超過80g時,停止試驗。

圖6 行星輪軸承加速疲勞壽命試驗臺Fig.6 Accelerated fatigue life test rig for planet bearings

3.2 試驗結果

(16)

圖7 行星輪軸承的全壽命周期振動信號Fig.7 Full lifecycle vibration signal of planet

圖8 行星輪軸承的RRMS值隨時間變化曲線Fig.8 RRMS curve of planet bearing over time

使用的程序開發框架為Tensorflow1.1.0,編程語言為Python. 計算機配置為8核i7-6700處理器,16 GB內存。根據3種運行工況下的6組行星輪軸承全壽命周期訓練樣本,構建用于行星輪軸承剩余壽命預測的C-DRGAN. 該模型由具有2個GRU層的生成器G、具有兩個GRU層的判別器D和一個MLR分類器組成。GRU層的神經元數目設為240,輸入數據為45×45矩陣。通過基于AD的訓練算法,采用訓練樣本訓練C-DRGAN. 噪聲比例設為0.3,松弛變量δ設為0.1,折扣因子γ設為0.9,dropout率設為0.1,學習率α設為0.001. 根據訓練后的C-DRGAN,利用MLR分類器預測測試樣本中行星輪軸承的剩余壽命。由于MLR分類器的輸出為包含多個元素的列向量,該列向量的元素用于擬合測試樣本的RRMS值隨時間變化曲線。均方根誤差(RMSE)是一種常用的軸承剩余壽命預測方法效果評價指標。為了與其他方法進行對比,本文采用由RMSE計算獲得的預測準確率評估本文提出方法的效果。預測準確率的計算公式為

(17)

式中:eRMSE為均方根誤差;yI和I分別為第I個檢查點剩余壽命的真實值和預測值;N為檢查點個數。3種運行工況下行星輪軸承的剩余壽命預測準確率如表1所示。從表1中可以看出,負載越大,轉速越高,預測效果越好。當負載電機產生5 000 N·m負載且驅動電機的輸出轉速為400 r/min時,測試樣本預測準確率超過98%. 主要原因在于從較大負載和較高轉速行星輪軸承的訓練樣本中獲取的故障特征更具特點,有助于預測測試樣本中行星輪軸承的剩余壽命。另外,在小樣本情況下每種運行工況的平均準確率均超過96%. 這是因為該方法在行星輪軸承所處階段的指導下,利用生成器G生成大量新樣本,從而解決MLR分類其訓練不充分的問題。因此,該方法能在小樣本情況下準確地預測行星輪軸承的剩余壽命。

表1 3種運行工況下行星輪軸承的剩余壽命預測準確率Tab.1 RUL prediction accuracies of planet bearings underthree operating conditions

3.3 對比分析

因行星輪軸承的剩余壽命預測準確率主要受GRU層神經元數目的影響,神經元數目對預測準確率影響的對比分析如下。改變第1個GRU層神經元數目,且第2個GRU層神經元數目為第1層的一半。第1個GRU層神經元不同數目下的預測結果如圖9所示。從圖9中可以看出,訓練樣本準確率可達100%,測試樣本準確率超過95%. 但隨著第1個GRU層神經元數目的增加,訓練時間逐漸延長。主要原因在于C-DRGAN的計算復雜度逐漸增加,延長了訓練時間。當第1個GRU層神經元數目超過350時,測試樣本準確率保持穩定,而訓練時間明顯增加。綜合考慮預測準確率和訓練時間后,將第1個GRU層神經元數目設定為350.

當第1個GRU層神經元數目設為350時,改變第2個GRU層神經元數目。第2個GRU層神經元不同數目下的預測結果如圖10所示。由圖10可見,測試樣本準確率先逐漸提高,然后保持穩定。當第2個GRU層神經元數目達到200時,測試樣本準確率達到98.43%. 因此可將第2個GRU層神經元數目設定為200.

圖9 第1個GRU層神經元不同數目下的預測結果Fig.9 RUL predicted results with different neuron numbers of the first GRU layer

圖10 第2個GRU層神經元不同數目下的預測結果Fig.10 RUL predicted results with different neuron numbers of the second GRU layer

圖11 行星輪軸承的剩余壽命預測結果Fig.11 RUL predicted results of planet bearing

為了研究本文C-DRGAN方法的收斂性,分別采用Adam優化算法、基于行動者- 評論家(AC)的訓練算法和基于AD的訓練算法訓練C-DRGAN. 在Adam優化算法中,dropout率設為0.1,學習率α設為0.001,兩個矩估計指數衰減率β1和β2分別設為0.9和0.99,數值穩定常數ε設為10-8. C-DRGAN的模型結構和基于AD訓練算法的參數設置如前所述。基于AC訓練算法的參數設置與基于AD訓練算法的相同。預測準確率與迭代次數之間的關系曲線如圖12所示。從圖12中可以看出,當迭代次數超過320時,基于AD訓練算法的預測準確率便趨于穩定,表明該算法能顯著地提高C-DRGAN的收斂速度。主要原因在于該算法避免了動作集的限制,使智能體根據目標導向政策采取行動,以取得最佳長期回報,從而減少了獲取最優策略的迭代次數,降低了訓練時間。

圖12 預測準確率與迭代次數之間的關系曲線Fig.12 Relation between RUL predicted accuracy and number of iterations

為了進一步驗證本文方法對行星輪軸承剩余壽命預測的效果,將該方法與Paris模型、Wiener過程模型和SVM進行對比。利用時間分段算法訓練Paris模型[5];通過極大似然估計算法獲得Wiener過程模型的參數[8];采用遺傳算法選取SVM的核函數和懲罰參數。訓練與測試樣本數之比分別為1∶5,1∶2,1∶1和2∶1,4種方法的預測結果如圖13所示。由圖13可看出,訓練與測試樣本數之比越大,預測準確率越高。這是由于越多的訓練樣本可使模型得到充分訓練。在不同樣本數之比下,該方法均取得最佳的預測效果。原因在于該方法將行星輪軸承所處階段看作額外的條件,指導生成器生成服從真實數據分布的新樣本,從而增加訓練樣本數量,解決訓練樣本不足的問題。因此,該方法能取得較高的行星輪軸承剩余壽命預測準確率。

圖13 4種方法的預測結果Fig.13 RUL predicted results of four methods

4 結論

1)本文提出的C-DRGAN方法利用CGAN,在已知運行工況指導下生成服從真實數據分布的訓練樣本,從而在小樣本情況下取得出色的行星輪軸承剩余壽命預測效果。

2)C-DRGAN方法利用GRUNN的狀態記憶和時變信號的處理能力,從非靜態和非線性信號中提取故障特征,解決了變工況下行星輪軸承的剩余壽命預測問題。

3)C-DRGAN方法采用基于AD的訓練算法訓練C-DRGAN,避免了動作集的限制,使智能體根據目標導向政策采取行動,以取得最佳長期回報,從而減少了獲取最優策略的迭代次數,降低了訓練時間。

猜你喜歡
動作模型
一半模型
下一個動作
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
動作描寫要具體
畫動作
讓動作“活”起來
動作描寫不可少
3D打印中的模型分割與打包
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
主站蜘蛛池模板: 精品欧美日韩国产日漫一区不卡| 亚洲欧美不卡视频| 色综合久久综合网| 高潮毛片无遮挡高清视频播放| 一本综合久久| 亚洲成网777777国产精品| 国产毛片不卡| 国产剧情无码视频在线观看| 久久久久国产一级毛片高清板| 中国黄色一级视频| 色噜噜综合网| 一级不卡毛片| 亚洲欧美另类中文字幕| 国产亚洲精久久久久久无码AV| 亚洲欧美另类视频| 国产精品久久久久久搜索| 网久久综合| 国产亚洲一区二区三区在线| 操国产美女| 国产高清在线精品一区二区三区| 她的性爱视频| 亚洲天天更新| 国产成人禁片在线观看| 亚洲av无码成人专区| 中文字幕在线永久在线视频2020| 自拍欧美亚洲| 性视频一区| 精品少妇人妻无码久久| 久久久久中文字幕精品视频| 青青草国产免费国产| 丝袜高跟美脚国产1区| 不卡午夜视频| 国产丝袜丝视频在线观看| 欧美不卡视频一区发布| 国产在线精品香蕉麻豆| 精品免费在线视频| 中国精品久久| 福利视频一区| 国产女人综合久久精品视| 91激情视频| 一本大道香蕉高清久久| 亚洲二区视频| 久久久久人妻一区精品| 国产成人亚洲精品色欲AV| 日本少妇又色又爽又高潮| 99在线视频精品| 亚洲精品爱草草视频在线| 久久午夜夜伦鲁鲁片无码免费| 中文字幕第4页| 国产精品无码AV片在线观看播放| 欧美国产综合视频| 91无码视频在线观看| 在线日韩一区二区| 思思热精品在线8| 日韩无码视频专区| 精品精品国产高清A毛片| 色综合激情网| 午夜国产小视频| 国产区福利小视频在线观看尤物| 欧美无遮挡国产欧美另类| 久久久精品国产SM调教网站| 亚洲人成在线免费观看| 在线观看国产黄色| 五月婷婷综合网| 国产91视频免费观看| 麻豆精品在线播放| 欧美成人一级| 欧洲欧美人成免费全部视频| 在线观看精品自拍视频| 亚洲v日韩v欧美在线观看| 无码'专区第一页| 国产在线精彩视频二区| 欧美亚洲国产视频| 亚洲首页国产精品丝袜| 国产午夜福利在线小视频| 久久精品人妻中文视频| 亚洲一区二区视频在线观看| 3344在线观看无码| 欧美成人精品一级在线观看| 狠狠色噜噜狠狠狠狠奇米777 | 色婷婷综合在线| 国产麻豆另类AV|