999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

高考英語完形填空縱向認知診斷教學探索

2025-06-06 00:00:00鐘志強高紅
考試研究 2025年3期

[關鍵詞]完形填空;小樣本;縱向認知診斷;神經網絡;潛在轉換分析;增長曲線模型

[中圖分類號]G424.74[文獻標識碼]A

[文章編號] 1673—1654(2025)03—085—009

一、引言

認知診斷模型(Cognitive Diagnostic Model,CDM)當下備受教學改革關注,是推進教學改革的有力工具。借助認知診斷理論,教師可以宏觀把握學校和班級整體認知結構,微觀把握學生個體認知狀態,對學生的認知屬性進行對比分析,據此因材施教,提供個性化教學[1]。

早期的認知診斷應用多以截面數據(Cross-sectionalData)的橫斷研究為主。假定被試知識狀態在一段時間內相對固定,對被試認知屬性在該時段內答題記錄的掌握情況進行評估與分類,并以此進行補救教學2]。一般利用DINA模型(DeterministicInputs,Noise“And”Gate Model,Junker,Sijtsma,2001)、融合模型(Fusion Model,Hartz,2002)、G-DINA模型(theGeneralizedDINA,dela Torre,2011)等實現認知診斷。但這些模型需要估計題目參數(區分度、難度、失誤及猜測度)和被試能力參數,需利用極大后驗估計算法(MaximumAPosteriori,MAP)、期望后驗估計算法(Expected APosteriori,EAP)EM算法(ExpectationMaximization)馬爾科夫蒙特卡洛算法(MarkovChainMonteCarlo,MCMC)等完成參數估計,需要依托校級以上大樣本才能達到可靠的估計結果[3]。

認知診斷和教學補救不能通過一次教學就達到教學目標,通常需要多次教學訓練才能取得理想的教學效果。因而,靜態的橫向認知診斷模型的應用局限性逐漸顯現。為此,學者們提出了縱向認知診斷(Longitudinal CognitiveDiagnostic)方法。該方法通過收集被試的跨時間段的測評數據,即利用面板數據(PanelData)充分考慮時間因素,動態評估學生的認知屬性掌握程度和潛在能力的變化情況,并展現個體間差異。縱向認知診斷方法包括基于認知屬性的潛在轉換分析(Latent Transition Analysis)模型、基于認知掌握模式(認知屬性的組合)的潛在轉換分析模型、基于高階潛在結構(抽象認知屬性)的認知診斷模型等4。這些模型不僅深化了認知診斷研究的理論厚度,還拓寬了認知診斷的實踐范圍,但同樣需要大樣本的參數估計模型。

在實際教學中,許多教改執行者的研究對象僅為一至兩個班級,利用大樣本進行參數估計和復雜計算模型反而限制了認知診斷模型的應用。值得慶幸的是,近來學者對小樣本的縱向非參數估計也有研究。如 LHDD(Longitudinal Hamming DistanceDiscrimination)[5]、LWGNPC(Longitudinal WeightedGeneralizedNon-ParametricClassification)等方法。然而,這些模式仍存在著應用不便。實踐中,不同教學單元的認知屬性和知識結構是變化的,還不能通過屬性粒度(Fine-grained)的調整融入相同的模型中。理論上,該類研究采用正則化(Regularization)統計方法,將前期分類結果作為當前分類約束條件(RestraintCondition),其方法的自洽性有待商權。更重要的是,該類的分類計算采用漢明距離及其變型,通過相同位置上不同對象的數量來計算認知掌握模式的差異,其不如采用交叉熵(CrossEntropy)作為差異的計算方法。此外,這些方法忽視了認知屬性之間的層級關系,忽視了處于底層的認知屬性的權重遠大于頂層認知屬性這一重要理論假定。

鑒于減少參數估計量和滿足縱向教改實際的需求,本次研究在具體的顯性認知屬性上抽象出高級能力,再利用高級能力完成多次認知診斷。吸取前期研究成果,探索非參數估計的神經網絡分類方法在小樣本容量下的認知診斷教學實施途徑,為解決縱向認知診斷問題提供有益嘗試。

二、認知診斷評價基本概念

在認知診斷模型中,認知屬性(Attributes)是指完成測驗所需的知識結構或認知加工技能。認知屬性掌握模式是認知屬性 的邏輯組合,其中k為屬性個數。認知屬性不能任意組合,受屬性之間關系約束,形成理想掌握模式(IdealMasterPattern,IMP),即 ,其中組合數 。試題 矩陣是所有試題 包括認知屬性的列表。理想反應模式(IdealResponsePattern,IRP)是各種認知屬性掌握模式在不猜測也不失誤情況下對試題Q矩陣的正確反應。其計算過程如下:

觀察反應模式(ObservedResponsePattern,ORP)是所有測試(N)作答情況,即 。認知診斷評價(CognitiveDiagnosticAssess)就是根據測試作答情況,將被試劃分到相應認知屬性掌握模式中,即對ORP與IRP進行比較,最終將與ORP最相似的IRP判別給該被試,完成屬性掌握模式分類。IRP與IMP對應機器學習數據訓練集的特征值(X)與目標值(Y),并以此完成規則學習。

三、研究過程

(一)研究對象

在遼寧省沈陽市選取一所教育質量處于中等水平的高中作為測試學校。利用高考復習階段,每周進行兩次英語完形填空認知診斷教學。每次教學后,師生根據認知診斷結果實施教學補救,共執行了10個教學周期,收集了完全參與教學過程的48人測試成績。

(二)研究目標的認知屬性

英語知識可分為語音、詞匯、語法、語篇和語用五個方面知識。其中,語音、詞匯和語法屬于語言結構性知識,語篇和語用屬于語言運用性知識。近年來,高考英語考試大綱相對穩定,閱讀部分有6個方面要求:(1)理解主旨要義;(2)理解文中具體信息;(3)根據上下文推斷單詞和短語的含義;(4)做出判斷和推理;(5)理解文章基本結構;(6)理解作者的意圖、觀點和態度。完形填空作為閱讀要求的一部分,主要在詞匯、語法、語篇層次上進行。它要求學生在正確理解語篇主旨大意的基礎上,重點關注具體語境中不同詞語、句子與整個篇章結構之間的聯系,尤其強調對文章整體結構和關鍵信息的理解[8]。概括來說,完形填空要求被試通過已知信息推斷未知信息,這與格式塔(Gestalt)心理學要求考慮事物的結構化和整體性相一致。由于完形填空失分率較高,一直是教學難點,因而提升完形填空題型的正確率是本次教學改革的重點研究目標。根據高考大綱要求,一線學科教師利用自己多年的解題經驗,先擬定了針對完形填空的認知屬性;再邀請學科專家審核,并結合學生有聲思維實證,最終確定英語完形填空認知屬性(表1)。

表1高考英語完形填空認知屬性

(三)探究涉及數據

認知診斷所需的數據共有4種,包括理想掌握模式(IMP)、試題Q矩陣、理想反應模式(IRP)、觀察反應模式(ORP,即實際作答數據)。考慮到高考的權威性,其試題有較好的難度、區分度和信效度。本次認知診斷教學的完形填空試題選自近5年高考英語全國試卷甲、乙的第三部分第一節20題(41-60),共計10個教學單元。

首先,由學科專家對試題涉及的認知屬性進行分析,確定了三個屬性 及其形成的層級結構,如圖1(a)所示。根據其中指向關系拓撲出6種理想掌握模式或知識狀態(KnowledgeState,KS)見表2(IMP)列。其次,學科教師對10套試題涉及的屬性逐個甄別,并確定試題Q矩陣,以2023年甲卷試題Q矩陣為例,見圖1(b)(深色塊表示試題包含對應屬性)。然后,根據式(1)利用理想掌握模式(IMP)和Q矩陣,計算出理想反應模式見表2(IRP)列。最后,由學生實際的作答形成觀察反應模式(ORP)。觀察反應模式是學生實際答題情況的直接反映,與理想反應模式相對比,可以揭示學生在認知屬性掌握上的差異和問題。由于數據量較大,具體觀察反應模式的數據在此略去。

圖1完形填空屬性層級結構(a)與2023年高考英語全國甲卷完形填空Q矩陣(b)
表2理想屬性模式與期望反應模式

在數學或物理學科中,知識點一般有基本原理和計算公式,認知屬性可相對精準界定,但英語完形填空認知屬性抽象程度較高,且受研究者主觀選擇的影響較大,這會造成試題關聯屬性的適配不一致。這也預示著:要確定學生的屬性掌握程度或模式,需要進行反復多次的教學診斷過程,以提高其科學性和有效性。

(四)認知診斷分類方法的選擇

機器學習方法是不受樣本特征限制的非參數方法。目前,學者們驗證了八種機器學習的認知診斷分類和聚類方法: k- means聚類、KNN(k-NearestNeighbors)、決策樹(DecisionTree,DT)、隨機森林(RandomForest,RF)、支持向量機(SupportVectorMachine,SVM)、樸素貝葉斯分類(NaiveBayesianClassification,NBC)、自組織映射(Self-OrganizingMap,SOM)聚類、人工神經網絡(ArtificialNeuralNetwork,ANN)。

利用機器學習方法進行的小樣本認知診斷只能將個體劃分到屬性組合的理想掌握模式中,簡單判斷掌握與否,不如大樣本認知評價還可以判斷出個體各屬性掌握程度的概率。盡管機器學習的確診率會有所下降,但相關研究已經實證了機器學習算法有利于屬性層級表征方面的優勢,且屬性層級、屬性個數和樣本容量對于診斷結果的影響不大,應用結果基本一致,差別不明顯。然而,這些方法的理論內涵上仍存在差別,需要實踐再檢驗。

通過計算IRP和ORP的距離(歐式或漢明)實現分類,理論上都會存在將一個ORP歸屬多個IMP的問題。即除了決策樹、隨機森林與樸素貝葉斯分類,其余5類算法利用距離或相似進行判別都會面對這一問題。

無監督學習SOM和K-means聚類算法檢驗力通常小于有監督的分類。理論上,這兩個方法都有概率分布和統計數量的要求。SOM盡管可以利用minisom包實現,但需要自定義目標函數和空間結構,實踐中有時不一定會收斂。K-means聚類使用最簡單,但有概率分布和統計數量的要求,需要自編函數實現,且不能進行參數調節。因此,這兩種方法應用上存在不便,不建議使用。

KNN分類添加了使用靈活性,需要自編函數實現,主要利用擴充K倍數據與誤差的調節實現,但K值的人為設定會造成過擬合或欠擬合。余下5種監督學習算法對已有信息的利用更充分,都可直接調用已有庫包實現。決策樹在樣本量小、特征維度高時更具優勢。隨機森林算法作為決策樹的改進算法,對噪聲具有很好的抵抗能力。兩種方法利用信息熵代替K-means和KNN使用距離作為分類判斷,算法上有很大進步,且不需要滿足數據的概率分布要求。但是,二者都是以試題作為節點的樹型分類,對試題樣本敏感,很容易過擬合,即使剪枝也無法避免。兩種方法應用不便,因而不建議使用。

SVM基于統計學習理論和最優化方法,能夠在小樣本獲得全局最優解,但需經過實驗選擇合適的參數以及核函數,才能獲得較好的試驗效果,且容易欠擬合。這不利于一線教學人員實踐運用。

NBC能對小樣本實現準確預測,但理論上要求特征(測試題)之間是獨立的樸素(簡單)假設。這在多數認知診斷實踐中并不滿足。

ANN既可實現有監督學習的分類和回歸,也可實現無監督學習的分類等。雖然其采用貪心學習的策略來搜索假設空間,容易過擬合,一般僅能實現局部最優解。但其理論約束少,使用最為方便,相關研究成果最多,因而本次研究優先采用ANN。

綜上所述,在8種機器學習方法的認知診斷評價應用中,SOM、K-means與KNN有數據概率分布要求,SOM聚類存在解釋力隨機問題。樸素貝葉斯分類有數據獨立要求,決策樹、隨機森林和支持向量機在應用上會有過擬合和欠擬合問題。相比之下,神經網絡能夠盡可能減少樣本特征要求,是小樣本情況下認知診斷評價最佳的應用方法[0]。

盡管神經網絡模型發展快、類型眾多,但本次研究沒有選擇深度學習,只用最簡單的多層感知機(Multi-LayerPerceptron,MLP,Hinton,1986)就可完成相應功能。其核心思想是通過反復迭代“前向傳播、計算損失、反向傳播”,完成參數更新,直到網絡輸出達到預定目標范圍。利用PyTorch定義和訓練神經網絡,其算法的步驟為:

1.模型訓練時,IRP作為輸人,IMP作為輸出。

2.設置網絡參數:隱藏層個數,參考Kolmogorov定理設置隱層結點數 ( 2 m+ 1 ) , m 為輸入層結點數,即IRP的個數。由于實驗數據都為0或1,所以神經元傳遞函數選擇ReLU、tanh或sigmoid函數。考慮本次研究實質是多類別劃分,故采用了交叉熵作為損失函數,選用Adam(AdaptiveMomentEstimationOptimizer)優化器。

3.模型預測時,ORP作為輸入,通過訓練好的模型進行預測。

四、教學診斷過程

(一)認知診斷結果

共進行了10次認知診斷教學,以第一次(2019年甲卷)的學生測試認知診斷結果為例,見圖2。模式“111”(即三個屬性全掌握)分類人數最多,說明學生對該試卷知識掌握較好。模式\"110\"分類人數為15,說明仍有部分學生未能完全掌握第三個屬性 ,加強 屬性講解與練習是課堂補救教學重點。此外,模式\"010\"的3人僅掌握“ ”基礎語法,屬于異常分類結果,是重點關注對象,需要在課外加強英語基礎知識學習。另外,有10名得12分的學生在三個模式中均有分布。

診斷結果體現了認知診斷的意義,即分數相同的學生認知屬性結構不一定相同,認知屬性結構相同的學生分數也有差別。傳統/經典測量理論(ClassicalTestTheory)僅利用分數劃分學生類型存在明顯的局限性。相比之下,認知診斷模型對學生知識結構缺陷的判斷更科學,有利于開展因材施教的個性化教學。

然而,以上僅為一次認知診斷的粗略判斷,更為精準的屬性模式劃分需經后續研究。如模式\"111”中分數分散程度較大,這說明分類準確度存疑。主要是抽象的認知屬性及其組成的掌握模式產生了分類方法缺陷,為此,必須采用多次測量才能彌補實驗設計層面的測量誤差。

圖22019年甲卷完形填空個體認知屬性掌握模式與成績分布

(二)教學補救策略

判斷學生的認知屬性掌握模式僅是教學的第一步,而通過反復教學補救實現成績提高才是教學的目標。試題補救講解中,考試中需要的信息匹配、判斷和推理屬于應用策略,這些能力通過教學訓練可以較快達到掌握要求。但影響英語成績的主要因素依然是日積月累的基礎知識,這就需要教師在聯系教材的基礎上,結合表1的考查內涵和認知診斷結果,時刻關注學生的認知模式,紓困解難,精益求精,錘煉示范以下學習策略。

1.詞匯層次:屬于認知知識范疇,需要時刻利用比較、匯總法豐富詞匯知識結構。例如,通過對比近義詞、反義詞以及詞根詞綴的規律,幫助學生系統化地掌握詞匯。

2.語法層次:屬于知識技能范疇,包括主謂搭配、動賓一致、定語從句、同位語從句、倒裝句、比較句與平行結構。教師應通過例句分析和語法規則歸納,幫助學生理解并掌握這些語法知識點。同時,結合實際語境進行練習,強化學生的語法應用能力。

3.語篇層次:屬于認知策略范疇,要把握句不離段、段不離篇的文章結構,要理解漢語重意和,而英語重形和的差別。要掌握句子連接手段、謀篇的構架方式與長難句的解析。句子連接手段包括詞匯銜接、照應、替代、省略、連接詞五種。語篇銜接包括詞匯的復現和對比。語法銜接包括照應、替代。照應包括人稱照應、指示照應、對比照應。省略包括名詞性省略、動詞性省略、分句性省略。連接詞有并列、遞進、因果、轉折、讓步等。

在教學過程中,要求學生在每次測試后、教師講解前,自己參照試題Q矩陣和參考答案,逐題核實屬性掌握程度,排除猜測和失誤,研究推送學習策略,統計自己掌握的試題屬性,并作為教學反饋材料。例如,表3展示了10次測試中各屬性整體分配情況和學生個體(以18號為例)的屬性掌握情況。

表3試題屬性分配與學生反饋屬性掌握程度

五、教學效果分析

(一)認知屬性掌握模式變化表征

10次成績(答題正確數)分布及整體認知屬性掌握模式(簡稱認知模式)見圖3。除去異常的21年甲(1)卷成績,時間盒狀圖3(a)序列反映了成績平均分提高趨勢。圖3(b)桑基圖中共6種認知模式,下面的低階\"010\"和\"001”模式向上逐漸變換為“001”、“101\"和\"111\"高階模式。流量從分散逐漸到集中也表征了最終高階認知模式的穩定性。但也存在少量的模式逆流向。這說明:多數學生的屬性認知掌握程度和成績都得到了提高,少數學生的屬性掌握程度有波動,即存在個別學生教學效果改善不明顯。此間,不能排除試卷難度變化和補救教學差異等因素產生的影響。

(二)認知模式掌握概率分析

潛在轉換分析(Latent Transition Analysis,LTA),也稱隱馬爾可夫模型。其使用縱向數據估計潛在類之間的轉變,能計算出轉變概率(LatentTransitionProbabilities矩陣,從概率的角度描述不同類別子群體隨時間變化的情況。本次研究計算的是48人的6個認知屬性模式10次隨時間轉換的過程,最終確定48個狀態(人)在6個出現目標(認知模式)的轉換概率。這一方法也是文獻[2]、[4]提及的縱向認知診斷方法。本次研究利用圖3的數據實現認知模式掌握概率的潛在轉換分析,并假定被試的能力不斷增長、不會遺忘。利用python語言hmmlearn包實現相關計算。盡管10次轉換數據偏小,但仍可表征認知模式概率化的意義。從圖4可知每個學生在不同認知模式上的掌握概率,如35號學生的屬性認知模式基本確定為“010”(縱向顏色最淺行,概率 ≈ 1.0);48號學生屬性認知模式不確定(縱向各行概率lt; 0 . 6 ) 。潛在轉換分析補充了單獨進行神經網絡對認知模式分類的不足。

圖3成績盒狀分布序列(a)認知屬性掌握模式桑基圖(b)
圖4潛在轉換分析學生認知模式掌握概率

(三)成績總體發展趨勢與個體間發展差異分析

利用增長曲線模型(GrowthCurveModel)分析縱向數據的基本思想是:通過模型固定效應(截距i和斜率s的均值)來描述平均成績增長趨勢;通過模型隨機效應(截距i和斜率s的方差)描述成績增長趨勢的差異。本次研究先對48名學生三個屬性掌握程度反饋數據(例如表3個體學生掌握情況)進行匯總,然后利用潛類別分析(LatentClassAnalysis,LCA)對其分類。LCA是一種實現潛變量聚類分析的技術,目的是用最少的潛類別數解釋顯變量之間的關聯,并使各潛類別的外顯變量之間滿足局部獨立的要求。本次研究使用R語言poLCA包實現分析過程,當劃分為三類時,信息評價指標(BIC)最小,表明分類結果最優,這與上文認知屬性模式掌握變化結果吻合。最后將分類結果作為協變量納入增長曲線分析。此外,還舍去了平均分異動的初次(19年甲卷)和最高(21年甲卷)兩次測試成績(圖3所示),利用R語言lavaan包實現相關計算如表4。其模型卡方統計量(47.377, d f= 3 7 , P =0 . 1 1 8 )表明模型擬合較好。

表4成績增長曲線模型統計結果

從表4可知,在固定效應中,截距與斜率的均值均統計意義顯著( ,說明成績的變化率和初始測量水平在測量個體間顯著不同。具體包括:平均截距的估計值是2.313;平均斜率的估計值是0.502,說明整體學生成績有微增長趨勢。截距的方差統計不顯著( ),說明閱讀成績的個體間發展起始點沒有區別;斜率的方差統計顯著( 0.05),說明成績增長趨勢的差異顯著。平均截距與平均斜率的協方差統計不顯著( pgt;0 . 0 5 ,說明成績初值與增長速度沒有關系。教學反饋(fk)的認可程度作為協變量,對截距和斜率的統計顯著( 0.05),說明教學補救反饋效果對成績發展的截距與斜率都有影響。

在許多教改實驗中,很難區分是教師因素還是教學方法因素甚至是它們的交互因素對教學效果產生影響。本次研究通過固定教師因素,使用學生對教學補救反饋評價教學改革效果。相對常規教改采用的實驗組與對照組進行t檢驗、F檢驗和卡方檢驗,本研究方法更加準確地反映教學干預的實際效果。

六、總結

前述分析表明,經過連續的認知診斷和教學補救,學生成績提高效果明顯,個體發展水平之間差異增加。教學補救反饋認可程度對成績提高有正向影響,善于實踐補救方法的學生得到更大的進步,而不關注學習過程的學生則未能從教學補救中獲益。

認知診斷有三個操作環節:首先是厘清認知屬性內涵與層級關系,需要的是學科專家的頂層智慧。然后是Q矩陣的建立、理想模式類別劃分和試題作答的整理,需要的是教學研究人員創新科技的賦能。最后是教學補救材料和方案的精準推送,需要的是學科教師的匠心工程。在三個環節中,前兩個環節在應用條件成熟時較易落實,而最后一個環節,涉及學生個體多且差別大,實踐效果往往不盡如人意。英語教學效果的提升困難重重,應試技巧培訓效果僅體現在最初接受階段。根本性提高英語應用能力,需要教育者“馳而不息,久久為功\"的高效教學方法;更需要學習者“歷久彌新,念念不忘\"的刻苦學習。本次研究中,學生成績得到提高是研究者、任課教師和參與同學“同心協力,步步為實\"努力的結果。

參考文獻:

[1]鐘志強.基于縱向認知診斷模型的形成性評價研究——以中學物理歐姆定律教學為例[J].鞍山師范學院學報,2023,(6):26-31.

[2]詹沛達,潘艷方,李菲茗.面向\"為學習而測評\"的縱向認知診斷模型[J].心理科學,2021,(1):214-222.

[3]涂冬波,蔡艷,戴海琦,等.HO-DINA模型的MCMC參數估計及模型性能研究[J].心理科學,2011,(6):1476-1481.

[4]宋麗紅,袁思玉,汪文義.面向學習測評的縱向認知診斷模型的泛化性能比較研究[J].江西師范大學學報(自然科學版),2023,(4):384-392.

[5]劉耀輝,陳琦鵬,徐慧穎,等.縱向漢明距離判別法:對潛在屬性的發展追蹤[J].心理科學,2023,(3):742-751.

[6]鄭天鵬,郭磊,邊玉芳.縱向非參數認知診斷評估[J].應用心理學,2024,30(02):172-183.

[7]中國教育考試網.普通高等學校招生全國統一考試大綱[EB/OL].[2022-4-26].http://gaokao.neea.edu.cn/html1/report/19012/5951-1.htm.

[8]教育部教育考試院.強化關鍵能力考查引導學生全面發展——2023年高考英語全國卷試題評析[J].中國考試,2023,(7):22-26.

[9]蔡艷,涂冬波,丁樹良.五大認知診斷模型的診斷正確率比較及其影響因素:基于分布形態、屬性數及樣本容量的比較[J]心理學報,2013,(11):1295-1304.

[10]趙秀宏,鐘志強.小樣本認知診斷中的機器學習方法[J].福建電腦,2025,41(02):67-71.

Exploration of Longitudinal Cognitive Diagnosis Teaching in English Cloze Test for College Entrance Examination

Zhong Zhiqiang Gao Hong School of Physical,Anshan Normal University,Anshan,Liaoning,114007

Abstract: A small sample teaching exploration was conducted by using longitudinal cognitive diagnostic methods.The research object is the scores of ten College Entrance Examination English cloze tests taken by a class.The research results show that the cognitive atribute mastery mode and grades of most students have been improved,while thecognitive atribute mastery mode and grades of a few students have fluctuated.The average scoreof studentshasincreasedand isnotrelated to their initial grades,with significant differences inindividual development levels.Students who actively practice remedial methods show significant improvement in their grades.The conclusion of the study is that there are measurement errors in theabstractcognitive atribute mastery mode,whichrequires multiple diagnostic teaching.Cognitive diagnosis isa teaching reform method worth exploring continuously.

KeyWords: Cloze Test,Small Sample,Longitudinal Cognitive Diagnosis,Neural Network,Latent Transition Analysis,GrowthCurve Model

(責任編輯:吳茫)

主站蜘蛛池模板: 国产精品香蕉| 在线欧美日韩| 2020精品极品国产色在线观看| 亚洲男人在线天堂| 青青热久麻豆精品视频在线观看| 99re在线视频观看| 永久毛片在线播| 久久semm亚洲国产| 国产在线视频福利资源站| 99热亚洲精品6码| 久久综合伊人77777| 一级毛片基地| 久久这里只有精品国产99| 国产欧美又粗又猛又爽老| 综合色婷婷| 色综合天天综合| 久久精品人妻中文系列| 一级不卡毛片| 国产成人精品男人的天堂| 欧美午夜视频在线| 欧美啪啪一区| 日本在线免费网站| 午夜啪啪网| 天天爽免费视频| 日韩成人高清无码| 日韩天堂视频| 国产91导航| 一本大道香蕉高清久久| 麻豆精品在线| 亚洲欧美综合另类图片小说区| 喷潮白浆直流在线播放| 久久毛片网| 91九色国产porny| 亚洲欧美日韩成人在线| 免费人欧美成又黄又爽的视频| 波多野结衣AV无码久久一区| 国产精品护士| 99视频在线免费观看| 国产在线啪| 色婷婷在线播放| 精品午夜国产福利观看| 亚洲av无码人妻| 国产视频 第一页| 国产成人精品男人的天堂下载| 欧美午夜性视频| аⅴ资源中文在线天堂| 免费在线a视频| 国产情侣一区二区三区| 婷婷色中文| 亚洲欧美另类久久久精品播放的| 99免费视频观看| 一级毛片高清| 亚洲精品国偷自产在线91正片| 久久影院一区二区h| 全免费a级毛片免费看不卡| 精品国产成人高清在线| 久久国产精品夜色| 亚洲人网站| AV在线天堂进入| 亚洲男人的天堂视频| a色毛片免费视频| 亚洲va欧美va国产综合下载| 激情爆乳一区二区| 欧美日本激情| 国产一级做美女做受视频| 亚洲视频在线青青| 国产69囗曝护士吞精在线视频| 四虎永久免费在线| 亚洲免费福利视频| 国产人在线成免费视频| 国产精品偷伦在线观看| 国产欧美在线观看一区| 8090成人午夜精品| 国内精品视频| 992tv国产人成在线观看| 性色在线视频精品| 欧美一级在线| 91国语视频| 欧美国产精品不卡在线观看| 色屁屁一区二区三区视频国产| 国产91蝌蚪窝| 思思热精品在线8|