999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

AUC統計特性概述

2021-07-29 14:04:18廣東工業大學王彥光朱鴻斌徐維超
電子世界 2021年13期
關鍵詞:定義

廣東工業大學 王彥光 朱鴻斌 徐維超

接收機工作特性(ROC)曲線下面積(AUC)可從總體上對二類分類器的分類性能進行評估,已被廣泛的應用與各個領域。本文從AUC定義出發,給出了AUC的概率解釋,以及AUC與曼惠特尼統計量的等價性,最后給出了AUC均值和方差的表達式的證明,以及零假設分布下AUC的均值和方差。

接收機工作特性曲線(Receiver Operating Characteristic Curve),簡稱ROC曲線。ROC曲線起源于二戰中的雷達目標檢測領域,當時它主要用來整體評價探測的性能通過描述雷達的檢測概率和虛警概率之間的相互制約關系。在此之后,ROC曲線以及ROC曲線下面積(AUC)在經濟、醫療,科技等各個領域均有不同程度的發展與應用。在此,特別需要提及的是AUC在醫療研究領域的實際應用中得到了持續的發展,例如在醫學影像的診斷結果的評估,新冠病毒等流行病毒的識別,醫療試劑的效果評價等。在上個世紀的九十年代以后,AUC開始逐漸被用在人工智能領域諸如模式識別、機器學習、數據挖掘中的分類器性能評估。此后,隨著人工智能技術的發展,AUC成為一種主流的科學評估分類器算法性能與不同分類器之間性能比較的主要工具。一系列關于AUC的研究結論使得人工智能等科研人員對分類識別等算法的性能有了全面而又深刻的認識。

1 AUC的概率解釋

定義1:對于一個由正例X={X1,X2, ...,Xm}和負例Y={Y1,Y2, ...,Yn}組成的數據集,存在一個閾值,使得,這里FX(x)和FY(x)分別是X和Y的概率分布函數。令。則ROC可以定義為:,ROC曲線下面積AUC定義為:

我們知道AUC是一種很好分類器評價方法,可以用來評估和比較與選擇的準確決策閾值無關的分類模型的總體性能。AUC=1.0表示分類器性能最好,AUC=0.5表示分類器隨機進行分類決策的性能,這個決策與拋硬幣的概率是等效的。分類算法的AUC值越大代表分類器性能越好,這也是AUC最直觀的理解和解釋。其實,AUC還有一個更深刻的理解和解釋,它還可以用概率解釋。

證明:設X代表正例,Y代表負例,FX(●)和FY(●)代表相應的概率分布函數,fX和fY代表相應的概率密度函數。由AUC和ROC的定義,我們得到:

其中,上式中是利用ROC的定義中變量的轉換。再根據正例X和負例Y之間的相互獨立性,我們得到:

從上面的證明過程我們可以看出,從樣例中隨機挑選一對正例和負例組成的樣本對,分類算法根據分類器計算得到的score值將正例排在負例前面的概率就是AUC值。AUC值越大,表明分類算法將正例排在負例前面概率越大,也就是分類效果越好。

從AUC的定義我們可以看出,AUC的取值范圍是[0,1],而不是[0.5,1],這是因為我們并沒在ROC曲線的定義中定義。這樣在度量正例和負例的分布差異時,如果AUC小于0.5,它表示分類器預測的與標注的標簽相反。

從AUC的概率解釋,可以看出AUC能夠度量兩樣本分布的差異,兩樣本分布差異越大,AUC值也越大。

2 AUC與Mann-Whitney U統計量的關系

H.B.Mann和D.R.Whitney提出Mann-Whitney U Statistics(MW)來比較兩個樣本的大小。令與;它們來自兩個連續的樣本,并且滿足獨立的相同分布。FX(x)和FY(y)分別用概率密度函數Fx(x)和Fy(y)任意分布來表示,假設和是相互獨立的。根據Mann Whitney U的統計資料,X和Y之間的關系有如下關系:

在公式(5)中θ有另外的含義,它表示出X>Y的可能性等于在ROC曲線下的面積AUC。

3 AUC的均值和方差

定理2:用θ來表示ROC曲線下的面積AUC,FX(x)和FY(y)是一些未知的參數,θ的均值和方差可以計算為:

其中:

以上,X是X'的獨立恒等分量,Y是Y'的獨立恒等分量。

證明:利用公式(5),我們可以得到:

類似地,從公式(5)中,我們可以得到:

在式(9)中,S2協方差的和表示所有組合除了(i = l,J = k),對于公式(9)中的第一項,標注它為S1:

對于式(9)中的協方差項,注意到協方差S2除非在i = l或j = k的情況下是0。因此可以按照兩種情況把S2分為兩個部分,注解為R1和R2,進而有:

當i = l和j ≠ k時,有m種方式去得到,且有n(n-1)種方式使得j ≠ k,因此有mn(n-1)種式(9)中的協方差項形式,我們知道R1滿足:

當i ≠ l和j = k時有m(m-1)種方式得到i ≠ l且n種方式得到j;因此有mn(m-1)種式(9)中的協方差項形式,我們得到R2滿足:

由上面式(10)~(13),我們得到如下最終結果:

由公式(7)的子項表達式,可以得到:

將Q0,Q1和Q2代入公式(7),我們可以得到:

結論:接收機工作特性曲線分析當前廣泛應用于醫學、經濟、機器學習等科學領域。接收機工作特性曲線下的面積(AUC)對二分類器的性能進行有效評估。對于AUC相關分析,本文使用應用比較廣泛的非參數方法,即利用AUC與Mann-Whitney U統計量的關系對AUC的均值以及方差進行推導證明。除此之外,考慮到某些情況下需要對模型的進行假設檢驗,因此,本文還進一步推導了零假設情況下AUC的均值和方差的計算。

猜你喜歡
定義
以愛之名,定義成長
活用定義巧解統計概率解答題
例談橢圓的定義及其應用
題在書外 根在書中——圓錐曲線第三定義在教材和高考中的滲透
永遠不要用“起點”定義自己
海峽姐妹(2020年9期)2021-01-04 01:35:44
嚴昊:不定義終點 一直在路上
華人時刊(2020年13期)2020-09-25 08:21:32
定義“風格”
成功的定義
山東青年(2016年1期)2016-02-28 14:25:25
有壹手——重新定義快修連鎖
修辭學的重大定義
當代修辭學(2014年3期)2014-01-21 02:30:44
主站蜘蛛池模板: 国产精品性| 亚洲高清无码久久久| 欧美激情视频在线观看一区| 亚洲精品天堂在线观看| 中文一级毛片| 国产在线欧美| 欧美日韩国产成人高清视频| 国产精品七七在线播放| 国产一级做美女做受视频| 波多野结衣一区二区三区88| 波多野结衣中文字幕一区| 国产视频一二三区| 久久久黄色片| 亚瑟天堂久久一区二区影院| 在线观看视频99| 三上悠亚精品二区在线观看| 97精品国产高清久久久久蜜芽 | 成人精品在线观看| 国产福利在线免费观看| 亚洲色图狠狠干| 在线观看国产精美视频| 色婷婷丁香| 国产波多野结衣中文在线播放| 日韩欧美视频第一区在线观看| 欧美一区中文字幕| 波多野结衣一区二区三区四区| 久久成人免费| 激情无码视频在线看| 成人综合网址| 少妇极品熟妇人妻专区视频| 免费在线看黄网址| 欧美精品伊人久久| 免费jizz在线播放| 91小视频在线| 亚洲综合片| www.91中文字幕| 亚洲最猛黑人xxxx黑人猛交 | 亚洲国产天堂久久九九九| 青青青视频91在线 | 亚洲欧美综合在线观看| 美女一级毛片无遮挡内谢| 久久久久人妻一区精品色奶水| 狠狠亚洲五月天| 国产簧片免费在线播放| 国内精品91| 玖玖精品视频在线观看| 亚洲第一页在线观看| 国产电话自拍伊人| 日本伊人色综合网| 欧美精品xx| 久久亚洲精少妇毛片午夜无码| igao国产精品| 国产91特黄特色A级毛片| 99久久这里只精品麻豆| 国产精品吹潮在线观看中文| 免费毛片在线| 国产对白刺激真实精品91| 国产高清精品在线91| 亚洲第一极品精品无码| 日韩精品无码不卡无码| 亚洲无码A视频在线| 国产成人91精品免费网址在线| 中国一级特黄视频| 国产网站一区二区三区| 超碰aⅴ人人做人人爽欧美 | 亚洲精品图区| 国产毛片网站| 国产成人亚洲无码淙合青草| 在线无码九区| 欧美国产日本高清不卡| 2019国产在线| 丝袜亚洲综合| 国产一级毛片网站| 青青青视频91在线 | a级毛片在线免费观看| 亚洲天堂高清| 四虎国产在线观看| 欧美亚洲激情| 久久香蕉国产线看精品| 呦系列视频一区二区三区| 国产美女一级毛片| 亚洲国产成人精品青青草原|