999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

二語詞匯測試工具研究綜述

2023-01-04 09:11:28過君琰
關鍵詞:單詞詞匯深度

過君琰

(奧克蘭大學文學院,新西蘭 奧克蘭 1010)

引言

詞匯是語言的重要組成部分,它不僅對理解、掌握和表達語言至關重要,同時對促進語言背后思辨能力的發展也起著舉足輕重的作用。了解學習者的詞匯水平是衡量他們語言水平的重要指標。自二十世紀八十年代起,學者們就開始對詞匯測試工具進行了初步探索。隨著語料庫的普及和計算機技術的發展,大量詞匯測試工具不斷涌現。目前國內有關詞匯測試工具的綜述類文章較少,僅有針對測試詞匯知識的單一方面如廣度[1]、深度[2],亦或是對少數測試工具的綜述[3]。本文從詞匯知識的內涵和維度出發,深入剖析主要的詞匯測試工具,并對未來詞匯測試工具的開發進行展望。本研究還結合《中國英語能力等級量表》中詞匯知識運用能力子量表,為開發適用于國內大學生的英語詞匯測試以及如何用詞匯測試促進詞匯教學提供一些建議和思考。

一、詞匯知識的內涵和維度

詞匯知識是一個多維度的、相對開放的領域。關于詞匯知識的內涵,最具綜合性且應用最為廣泛的是Nation 提出的框架,該框架涵蓋詞形(口頭、書面、詞匯部件)、詞意(詞形和意義、概念和指稱、聯想)和使用(語法功能、搭配、語境制約)三大類,共九個小類,展示了一個單詞內部具體且相互聯系的組成部分[4]。Nation 將框架中的每一個小類分為接受性和產出性兩個方面。接受性詞匯知識是指學習者能夠在閱讀和聽力中理解詞匯,而產出性詞匯知識是指學習者能夠在寫作和口語中表達詞匯[5]。除了接受性/ 產出性這種基于技能的區分方式,另一種方式是把詞匯知識分為廣度知識和深度知識。廣度知識指的是學習者所知道的單詞數量,深度知識指的是學習者對這些單詞各方面了解的程度[6]。

對于學習者的詞匯知識有三點值得注意:第一,學習者各個方面詞匯知識的發展并不平衡,比如學習者的產出性詞匯知識水平的發展落后于接受性詞匯知識;第二,這些區分之間有交叉的部分,比如形意關聯普遍被認為屬于詞匯廣度知識層面,它包含詞形識別、詞意識別、詞形召回和詞意召回四個方面,其中詞形詞意識別屬于接受性知識,詞形詞意召回屬于產出性知識。對于詞匯深度知識內涵的界定,學者們看法不一。Henriksen[7]和Schmitt[6]把接受性和產出性知識的區分歸類于詞匯深度知識;第三,對詞匯知識內涵的不同界定模式產生了相應模式下不同的測試方法和工具。但由于詞匯知識的多面性,迄今為止沒有一個詞匯測試工具可以涵蓋詞匯知識的各個方面,或是全面地測量詞匯知識的某一方面。本文將從廣度和深度這兩個涵蓋更為廣泛的維度出發對主要的測試工具進行分析。

二、主要詞匯測試工具及其相關研究

(一)詞匯廣度測試

詞匯廣度測試是目前詞匯測試開發成果最為豐碩的領域,主要是測試書面形式的接受性詞匯知識。按照測試的類型主要分為詞匯量測試和詞匯層級測試兩大類。

1.詞匯量測試

詞匯量測試目標是測試學習者所掌握的詞匯總量。目前主要有兩種測試形式:是否測試和大小測試。

是否測試(YES/NO,YN)是介于自我測評和測試之間的一種形式。它給學習者呈現一份詞匯清單,學習者需要勾選出所有他們知道含義的單詞。它最早用于測試母語學習者的詞匯量。然而,這種自我報告的方法不能準確地反映學習者的詞匯知識,學習者可能會勾選他們不認識的單詞從而夸大自己實際的詞匯量。為了解決這一問題,虛構詞被引入清單,如果學習者勾選出這些虛構詞,他們的分數則會向下調整從而更好地預測他們真實的詞匯量[8]。學者們將這種方法運用于二語詞匯測試并開發了不同版本。

YN 測試中的虛構詞主要有兩種虛構方法:改變真實單詞里的一兩個字母和改變真實單詞的詞綴。根據受試者的回答,共有四種計分類型:命中(hit)即選擇真實詞、錯過(miss)即未選真實詞、錯誤警報(false alarm)即選擇虛構詞和正確拒絕(correct rejection)即未選虛構詞。根據命中和錯誤警報的比例運用一些公式對原始分數進行校正從而計算出受試者真實的詞匯量。這些公式包括命中的個數減去錯誤警報的個數、基于信號探測理論的猜測矯正(correction for guessing,cfg)[8]、兩個指數Δm[9]和ISDT[10]以及回歸公式(regression formula)[11]。經過三十年的更新迭代,YN 測試在內容和計分方式方面也進行了不斷的調整。

YN 測試最顯著的優點是便捷、高效。對受試者答題、測試者編制和評閱測試來說都相對簡單,能夠在較短的時間里測試大量的詞匯。其設計方法也適用于其它語言詞匯測試的開發。此類測試沒有明顯的負面反撥效應[12]。不過,YN 測試也有其不容忽視的缺點:這種測試形式只測試了單詞一個方面的詞匯知識(被動認知)。而且虛構詞存在的必要性也存疑。對虛構詞的構詞原則、詞匯屬性缺乏深入研究,虛構詞的比例缺乏統一標準,對于精準有效的校正公式存在分歧。另外,YN 測試也受到與測試構念無關因素的影響,如測試形式本身、測試環境和答題偏見等[13][14]。

針對YN 測試信度和效度研究主要圍繞以下方面展開。學者們對YN 測試和其他形式的詞匯測試(如匹配、選擇、填空、翻譯、訪談等)以及水平測試的關聯度展開了一系列研究,然而各項研究的結果并不一致:從不相關或弱相關[15][16]、到中等相關[13]、再到高度相關[17][18]。導致研究結果不一致的原因之一是錯誤警報的比例不同。研究者們嘗試探索一些避免猜測、調整錯誤警報比例的方法,從而增強YN 測試的信度和效度,比如:進一步明確測試任務的要求;改變測試形式,如用電腦版本取代紙質版本、基于識別的詞匯測試(Recognition Based Vocabulary Test)[16];研究虛構詞的詞匯屬性[18];探索除虛構詞法以外的其他方法,如反應時間法等[17]。

第二種詞匯量大小測試(Vocabulary Size Test,VST)是以單選題的形式呈現的[19]。它主要有三大目的:衡量學習者是否擁有足夠的詞匯量來完成一些英語學習任務,比如閱讀英文小說、報紙等;橫向和縱向追蹤學習者詞匯量的成長;比較母語學習者和非母語學習者的詞匯量。

跟YN 測試以詞元(lemma)為基礎不同,VST選擇涵蓋面更為廣泛的詞族(word family)來展現,它以Bauer &Nation 編制的詞族層級6 級為標準[20],采用分層隨機抽樣法從最高頻的前14,000個英國國家語料庫(BNC)詞族表中每1,000 個單詞層級選取10 個目標詞,共140 個。VST 通過測試詞匯的形式和含義關系考查學習者書面形式的接受性詞匯知識。題干是考查的目標詞和一個包含該單詞的非限定語境的句子,目的是讓學習者無法通過語境來猜測該單詞的意思,選項包含一個正確答案和三個干擾項。干擾項的含義所指向的單詞和考查單詞基本同頻,且和考查單詞的正確含義通常會有一部分重疊,學習者必須對所考查單詞的含義有一定程度的了解才能夠選出正確的選項。每選對一題得1 分,學習者的詞匯量為總分乘以100。

VST 的不同版本開發及研究主要集中在三個方面:(1)測試的詞匯量。14,000 高頻詞族版本的VST 測試的對象主要是英語非母語學習者以及12 歲以下的英語母語者?;诖?,研究人員開發了面向英語母語者的20,000 高頻詞族版本的VST 以克服天花板效應[21]。(2)測試的語言。雙語版本的開發主要是為了避免單語版本中與構念無關的變量以及與詞匯知識無關因素的影響。雙語版本的形式為題干是英語,選項是學習者的母語。到目前為止,已開發的語言版本包括漢語在內共十個語種。對各個版本的內部效度研究包含用Rasch 模型和經典測試理論對單語和雙語版本的效度研究。研究表明,單語和雙語版本都有較好的信度和效度,明確測試單一因素(書面形式的接受性詞匯知識),且能夠很好地區分不同水平的學習者。雙語版本對于英語非母語學習者而言更直接、省時,且能更精準地預測低水平學習者的詞匯量。但是對于中低水平學習者是否需要用完整版還是只需要縮減版(比如前8,000 詞頻)還有待進一步研究。(3)圍繞VST 變體展開的研究,旨在通過修改VST 減少猜測等考試策略,從而更準確地測量學習者的詞匯量,比如不定選項、通過網頁版設置不同數量的干擾項[22]、在選項中加入“我不知道”(I don’t know,IDK)這個選項等[23]。

2.詞匯層級測試

層級測試(Vocabulary Levels Test,VLT)屬于診斷性測試,主要測試學習者是否掌握某一具體頻度的詞匯。層級測試不僅可以了解學習者所具有的詞匯資源是否能夠完成特定的語言任務[24],而且可以定位學習者具體層級的詞匯缺陷從而更好地幫助他們確立學習目標、調整學習材料和學習策略。

層級測試也是測試學習者的書面接受性詞匯知識。它有較多版本(表1),主要有以下四個特點:(1)表中前兩個VLT 選用的詞匯語料庫較為陳舊,采樣率比較低,但涵蓋的詞匯頻度寬,高、中、低詞頻均有涉及。后三個測試選用的語料庫更新,采樣率更高,但涵蓋的頻度密集,主要集中于高頻和部分中頻詞匯。Nation 認為層級測試的目標不是測試詞匯總量,因此設定最高頻的3,000詞或5,000 詞更為合適[25]。(2)前三個都是匹配形式,UVLT 雖然也是匹配形式但稍有不同,它將詞匯和含義設置成更為清晰的網格形式。后兩個則是和VST 一樣的單選題形式。(3)前四個以詞族方式展現,而最后一個則以修飾過的詞元(modified lemma 或稱為flemma)展現。(4)相關的效度研究較為缺乏。即便是后三個最新的測試,編者們也只進行了初步的效度驗證。

表1 不同版本的層級測試

3.小結

以YN、VST 和VLT 為代表的詞匯廣度測試工具自研發以來得到了廣泛應用,然而圍繞廣度測試依然有三個值得關注的問題。

(1)目標詞匯的選擇。目前的詞匯廣度測試都是以詞頻為選擇標準,采取隨機分層抽樣的方法。這種選擇標準默認同頻度的詞匯難度是一樣的,然而即使是同頻詞匯,單詞的難度不一。因此,面對測試工具中的低采樣率,某頻度少量詞匯的掌握是否意味著對相應頻度所有詞匯的習得,這一點學者們依然存疑。

(2)詞匯的展現方式。廣度測試工具以詞元或是詞族為單位來展現詞匯。詞元包括詞干及其曲折變化,詞族包括詞干及其曲折變化和派生變化。學習者對一個單詞的正確作答則被認為他/ 她掌握了該單詞的詞干以及所有相關變化。Nation認為以詞族方式展現詞匯更適合測試接受性詞匯知識[25]。另外一些學者認為對單詞詞干接受性知識的掌握并不意味著對該詞所有派生變化的習得[41],因此以詞族方式展現的詞匯測試結果實際上夸大了學習者的實際詞匯知識水平,以詞元為單位可能更合理。而Webb 則認為以詞元為單位的詞匯數量比以詞族為單位的多很多,會讓測試可行性受到影響[42]。

(3)測試形式和分數解釋。詞匯廣度測試考查的是書面形式的接受性詞匯知識,也就是閱讀所需要的詞匯,但是以上測試工具所測試的詞匯知識層面(識別)與閱讀所需要的詞匯知識層面(詞意召回)并不對應。識別層面的詞匯知識要求遠比詞意召回層面低,所以即便學習者能夠在這些詞匯測試中選對單詞的含義,在實際閱讀中仍然會存在想不起這些單詞意思的情況。另外在現行的詞匯測試形式(判斷、單選、匹配等)中,學習者能夠通過猜測或其它與構念無關的考試策略來答對,導致這些測試結果顯示的學習者詞匯水平偏高。但是考查召回層面的詞匯知識需要學習者寫出該單詞的含義,這樣的形式費時費力,也會影響測試的可行性。

(二)詞匯深度測試

Yanagisawa &Webb 概括了界定詞匯深度知識內涵的三種模式:發展模式(詞匯知識的發展程度)、網格模式(詞與詞之間的聯結)和成分模式(詞匯知識的方面)[43]。

1.發展模式下的詞匯深度測試

基于發展模式的詞匯知識量表(Vocabulary Knowledge Scale,VKS)[44][45]最初是用來追蹤閱讀材料中新單詞的習得,它的設計理念是學習者每個單詞的知識是遵循一定發展模式的,從對單詞完全不認識到正確地符合語法和語義規范地運用該詞。按照這個理念VKS 把詞匯知識分為5 個層級,學習者根據這5 個級別來呈現他們的詞匯知識水平。

VKS 自研發以來其效度不斷受到質疑[46][47],主要集中在以下三點:(1)填寫和評分費時,只能在有限的學習者中測試有限的單詞。(2)5 個層級涵蓋的詞匯深度知識依然有限,而且層級之間的難度并不均等[5]。VKS 測試的維度并不單一,且測試構念區分不明確。(3)學習者的詞匯知識并不一定是遵循這樣的線性發展模式。

2.網格模式下的詞匯深度測試

網格模式編制理念為詞匯深度知識是單詞與單詞之間能夠在大腦中形成網絡聯結。詞匯聯想測試(Word Associate Format,WAF)[48][49]是使用最為頻繁的詞匯深度測試。第一版WAF 是用于衡量大學層級的學術英語學習者的詞匯學習,兩個平行版本100 個目標詞匯來源于UWL。詞性包括名詞、形容詞和動詞。學習者根據目標詞匯在8 個關聯詞中排除4 個干擾詞,選出4 個正確的關聯詞。關聯詞與目標詞的關系包含以下三種之一:橫聚合(paradigmatic)、縱聚合(syntagmatic)和分析(analytic)。第二版40 個目標詞匯全部為形容詞,主要選自Barnard 2,000 和3,000 詞表[50],并將8 個單詞(4 個正確關聯詞和4 個干擾詞)隨機分成左右兩組,此版本的開發僅用作研究工具。

WAF 的不足在于:(1)它雖然測試了詞匯知識的三個方面(同義詞、搭配和多義詞),但本質上還是以形意關聯為中心的接受性測試,因此它對詞匯深度知識的涵蓋面依然具有局限性[47]。(2)盡管選項中的關聯詞和目標詞展現了不同的關系,但是在計分方面沒有區別,WAF 的分數無法代表某個具體方面的詞匯知識,而且測試結果所反映的學習者的深度知識僅限于被測詞匯,無法將其外推到同頻度的其它詞匯。(3)它的測試形式(選擇)依然會受猜測等因素的影響。

Lex 30 是另外一個網格模式下的深度測試[51],它測試的是學習者的自由詞匯產出能力。Lex 30共有30 個目標詞(均選自最高頻的1,000 個詞族),針對每一個目標詞,學習者寫出自己能想到的與之相關聯的詞(最多4 個)。計分方法是將學習者寫出的所有單詞根據詞頻進行分類,每一個低頻單詞(第一個1,000 詞以上)得1 分,滿分120 分。隨著語料庫的發展,統計詞頻的對照詞表也在與時俱進。最近的研究開始使用詞匯分析工具VocabProfiler 中的BNC/COCA 詞表來統計詞頻[52]。共有兩種計分方式:總分(低頻詞總數)和百分比(低頻詞的總數÷所寫單詞總數)。

Lex 30 在一些研究中其效度得到了一定程度的驗證[53][54]。Fitzpatrick&Clenton 從廣義的產出詞匯知識角度出發編制了詞匯測試能夠涉及的詞匯知識模型[54]。該模型包括學習者產出詞匯知識的四個方面:能夠產出這些單詞詞形;能夠使用這些詞匯來替代合適的指稱和母語詞匯;能夠在語境中使用這些單詞并符合語意規范;能夠在語境中使用這些單詞并符合語意和語法規范。他們認為以上四個方面Lex 30 測試均能涉及。然而產出性詞匯深度知識包含詞形、使用、語域、搭配、詞意等多個方面,Lex 30 只測試了學習者對單詞的詞形召回能力,即使上述研究認為它的測試范圍能包括學習者四個方面的詞匯知識,但它能測試到什么程度依然無法清晰地界定??梢姡绾谓忉孡ex 30 的分數是一個問題。

3.成分模式下的詞匯深度測試

因為詞匯深度知識所涵蓋層面的廣泛性和多樣性,既要能全面衡量學習者的詞匯深度知識又要考慮到實際操作性,僅靠單個詞匯測試工具很難實現,因此學者們嘗試從詞匯知識的不同方面入手,測試學習者對某一詞匯深度知識成分的掌握情況,比如搭配:Collocation test[55]和詞的組成部分Word Part Levels Test[56]等。然而上述測試的應用并不廣泛,而且因為它們的開發是獨立進行的,詞源不一致,所得結果無法直接進行平行比較。學習者對每個單詞各個方面的知識不盡相同。

4.小結

測試學習者的深度知識要比廣度知識復雜和困難許多。學習者對每個單詞各個方面的知識不盡相同。測試學習者的深度知識首先要選擇需要被測的詞匯以及這些詞匯具體需要被測的方面,然后再用成分模式下對應的測試將學習者所掌握的詞匯知識的各個方面進行測試匯總,才能更好地了解學習者對這些詞匯掌握的深度。

三、結論與建議

詞匯測試工具是詞匯測試研究中的重要課題??v觀這些主要的測試工具,我們發現:(1)現有的測試工具普遍缺乏系統且嚴密的效度證據。(2)這些測試工具主要聚焦于學習者的顯性陳述性詞匯知識,即學習者詞匯知識的準確度。(3)詞匯深度測試工具較少。雖然詞匯廣度測試工具較多,但集中于考查接受性詞匯知識(詞意認知),其它方面的廣度知識較少涉及。(4)在現有的詞匯測試工具中,無法用不同的工具來衡量同一詞匯的不同知識層面,因此使用這些工具所得到的結果不能平行比較。也有少數例外,比如Stuart McLean等學者用同一詞源開發了兩種形式的詞匯等級測試:前文所提及的書面形式的NVLT 和聽力形式的Listening Vocabulary Levels Test(LVLT)[57]。而同為書面形式的VLT 和Productive Vocabulary Levels Test(PVLT)[58]則可以比較同一詞匯的詞意認知和詞形召回情況。(5)目前的詞匯測試所關注的詞匯多為通用詞匯,學術詞匯較少涉及。

基于此,對于未來詞匯測試工具的研究,我們可以從以下幾個方面進行嘗試:(1)繼續對現有的測試工具進行進一步的效度論證研究,例如明確測試目的、測試語言和形式、不同的學習者和教育環境、不同分數的解釋等[59]。(2)除了陳述性詞匯知識以外,Godfroid 拓展了Nation 的框架[60],增加了詞匯知識使用的流利度和自動性維度,未來可以加強在這方面測試工具的開發。(3)針對詞匯廣度測試,我們可以研究開發測試產出性詞匯知識的工具(例如考查詞形詞意召回)。雖然這種方法費時費力,但隨著人工智能的發展,未來可以嘗試開發此類測試的自動打分系統。針對詞匯深度測試,我們可以系統地、有針對性地開發測試工具來測試學習者各個方面的詞匯深度知識,如詞綴、多詞單位等。(4)開發詞匯測試組合模塊,用一組測試工具來衡量學習者同一詞頻的詞匯知識或同一詞匯不同層面的知識[43]。(5)嘗試開發單獨的學術英語詞匯測試工具,而不是僅僅將學術詞匯的考查作為通用詞匯考查的一部分。除此以外,詞匯知識的考查還應該與語言技能相結合,加強語言技能詞匯測試工具的開發,包括細分這些技能詞匯知識的層級,如聽力詞匯、口語詞匯等。

因為不同的母語學習者在詞匯習得和測試的表現不盡相同,我們迫切需要在對標教學大綱、教學目標、課程指南和教材基礎上,改編現有英語詞匯測試、開發新的測試以適應不同學段、不同語言水平的母語為漢語的英語學習者,衡量他們的詞匯水平、追蹤他們的詞匯發展。以大學階段的英語教學為例,首先教師可以讓學生用詞匯量測試(如YN、VST 等)進行自測。根據測試結果對標大學英語教學和英語專業教學大綱的接受性詞匯量要求,對于詞匯量偏低的學生,教師應積極鼓勵其擴大詞匯量,例如關注NGSL 和AWL 等詞表,而非僅僅局限于四六級單詞表。其次,教師應重視中高頻詞匯的教學。教師可以用不同形式的詞匯層級測試(如口頭、書面)來診斷學生對于中高頻詞匯的掌握情況。除了形意關聯層面,《中國英語能力等級量表》中詞匯知識運用能力子量表(大學階段5-7 級)的描述語強調了產出性詞匯知識,并涵蓋了概念、聯想、搭配和語境等方面知識。因此,教師可以選定需要測試的目標詞匯,設計符合教學要求和學生需求的詞匯深度組合測試。教師應該根據測試結果,定位學生的詞匯知識缺陷,在教學過程中,加強培養學生的詞匯深度知識。

猜你喜歡
單詞詞匯深度
本刊可直接用縮寫的常用詞匯
深度理解一元一次方程
一些常用詞匯可直接用縮寫
山東醫藥(2020年34期)2020-12-09 01:22:24
單詞連一連
本刊可直接用縮寫的常用詞匯
深度觀察
深度觀察
深度觀察
看圖填單詞
本刊一些常用詞匯可直接用縮寫
主站蜘蛛池模板: 久久久噜噜噜| 三上悠亚精品二区在线观看| 亚洲大尺度在线| 91福利在线观看视频| 午夜久久影院| 国产精品亚洲天堂| 日韩a在线观看免费观看| 国产成人综合亚洲欧洲色就色| 日本不卡在线| 国产幂在线无码精品| 91色在线观看| 中日韩一区二区三区中文免费视频| 亚洲妓女综合网995久久| 国产理论一区| 久久久久亚洲Av片无码观看| 国产综合网站| 亚洲水蜜桃久久综合网站| 久久综合一个色综合网| 亚洲伦理一区二区| 国产欧美日韩精品综合在线| 97久久精品人人做人人爽| 2048国产精品原创综合在线| 国产欧美日韩va另类在线播放 | 中文字幕调教一区二区视频| 亚洲啪啪网| 欧美在线综合视频| 成人国产精品网站在线看| 无遮挡一级毛片呦女视频| 欧美视频免费一区二区三区| 欧美日韩国产精品综合| 精品国产免费人成在线观看| 青青热久麻豆精品视频在线观看| 中文字幕 欧美日韩| 五月天在线网站| 久久国产高潮流白浆免费观看| 亚洲成肉网| 国产成人一区免费观看| 国产91线观看| vvvv98国产成人综合青青| 1级黄色毛片| 无码AV日韩一二三区| 97在线视频免费观看| 亚洲欧美日韩天堂| 精品国产女同疯狂摩擦2| 亚洲精品制服丝袜二区| 在线看免费无码av天堂的| 激情综合婷婷丁香五月尤物 | 超清无码熟妇人妻AV在线绿巨人| 亚洲第一国产综合| 免费毛片视频| 日韩高清欧美| 伊人国产无码高清视频| 亚洲Av激情网五月天| 欧美色99| 国产精品久久自在自线观看| 谁有在线观看日韩亚洲最新视频 | 国产超碰在线观看| 91麻豆国产视频| 五月婷婷综合在线视频| 国产精品久久久久久搜索| 黄色免费在线网址| 色色中文字幕| 日本日韩欧美| 国产丝袜无码精品| 免费观看成人久久网免费观看| 特级毛片8级毛片免费观看| 青草国产在线视频| 女人18毛片水真多国产| 久久黄色视频影| 亚洲第一页在线观看| 国产免费久久精品99re不卡| 国产中文在线亚洲精品官网| 91精品综合| 国产美女主播一级成人毛片| 国产成人亚洲欧美激情| 波多野结衣一区二区三视频| 91色爱欧美精品www| av大片在线无码免费| 永久在线精品免费视频观看| 国产主播一区二区三区| 一级高清毛片免费a级高清毛片| 国产精品网曝门免费视频|