999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于狄克松準則剔除水文數據異常值

2021-09-15 07:38:58陳愛林
陜西水利 2021年8期

李 紅,陳愛林,喬 師

(湖北省荊州市水文水資源勘測局,湖北 荊州 434000)

1 引言

水文數據所包含的水文信息是水文科學發展的源泉和基礎,水文學需要大量獲得新的信息和在這種新的信息基礎上提取新的知識。水文數據由地表水、地下水和河、湖等相關屬性數據組成,觀測項目包含水位、流量、降水、蒸發等數據資料,是防洪調度、水資源調查評價、工程施工設計的基礎,同樣是水資源管理工作的基礎。水文數據時空分布對水資源影響至關重要,指導水資源合理開發、規劃利用具有重要意義。

2 數據異常值

數據是關于自然、社會現象和科學試驗的定量或定性的記錄是科學研究最重要的基礎研究數據,是對數據進行采集、分類、錄入、儲存、統計分析、統計檢驗等一系列活動的統稱,其準確性直接影響以此基礎研究結果的正確性。水文數據主要以實測資料為主,對各種水文要素原始數據進行記載和處理。為獲取水文數據真實值,常常多次采集測量數據樣本,提高數據樣本精度。但測量過程中難免出現非正常因素引起差錯,個別數據出現誤差,如不從測量數據中剔除,將影響采集數據樣本精度[1]。

水文數據異常值產生的原因一般有3個方面:一是水文監測設施設備原因,當水文監測施設備在運行過程中有部件損壞、傳輸故障,常導致監測結果容易出現異常值;二是人為技術水平,根據每個人對水文要素認知水平以及操作掌握熟練程度不同等產生異常值;三是外界條件,水文監測過程中,波浪、風等氣候因素對觀測者產生不利條件,容易出現異常值。

3 判別方法

3.1 狄克松準則

水文觀測數據異常值剔除一般采用統計分析法,對于多次觀測數據采用拉依達準則、格拉布斯準則、肖維勒準則等方法進行異常值的剔除,狄克松準則(Dixon)主要優勢為觀測數據樣本量沒有嚴格要求,但對樣本數據小更有利,計算方便且概率意義明確,操作快捷且簡單。

狄克松準則(Dixon)在1950年提出一種無需估算平均值、方差的剔除方法,它是根據相鄰狄克松準則值差異大小來判斷被懷疑的對象是否為異常數據。它是先將測量數據從小到大進行排列,因異常值容易出現在系列數據中兩端,狄克松準則直接從中抽取最大值和最小值進行分析,使判斷異常值簡單而有效。

將符合正態分布測量數據,按從小到大進行排列并進行統計,即:

x(1)≤x(2)≤x(3)≤…≤x(n)

構造檢驗高端異常值x(n)和低端異常值x(1)的統計量,因樣本容量n不一樣,分為以下幾個情況:

3.2 3σ準則

3σ準則稱拉依達準則,可用于處理正態和近似正態分布的數據,并且要求數據量較大,測量次數多(n≥10)。若測量次數少(n<10),則3σ準則對異常值數據的判別和剔除就不夠準確。

正態分布稱為常態分布,有均值u和方差σ2兩個參數。對于服從正態分布的隨機變量,其均值決定了正態分布的整體位置,當變量距離均值越近,則該變量出現的概率就越大;隨機變量的方差決定了正態分布的幅度。因此,正態分布常被記作N(u,σ2)。此外,對于服從正態分布的隨機變量,其方差值越小,隨機變量的分布就越集中。

3σ準則數據判別過程:先假設一組數據僅存在偶然誤差,然后計算這組數據的標準差,最后,以一定的概率確定一個區間范圍,不在該區間內的誤差稱為粗大誤差,并將其從原數據中剔除。正態分布3σ準則數值分布在(u-σ,u+σ)內的概率為68.3%;數值分布在(u-2σ,u+2σ)內的概率為95.4%;數值分布在(u-3σ,u+3σ)內的概率為99.7%。由于分布在(u-3σ,u+3σ)內的數據占總數據的99.74%,超出這個范圍的可能性僅占不到0.3%。因此,絕大部分數據的分布特征符合正態分布3σ準則。

標準差計算如下如下:

3.3 不確定度

由數理統計方法得知,計算水文觀測數據不確定度,分析獨立的誤差來源和誤差性質。觀測數據屬于隨機不確定度,應以絕對量值來衡量,需服從正態分布,置信水平為95%。隨機不確定度越小,觀測結果質量越高,使用價值高;隨機不確定度越小,觀測結果質量越小,使用價值低。

隨機不確定度取2倍標準差。

4 實例分析

長湖位于湖北省荊門市沙洋縣,荊州市荊州區、沙市區和潛江市的周邊范圍內,地處長江漢江之間的江漢平原腹地,南遙長江,北貫漢江,是湖北省三大湖泊之一。長湖是四湖流域上區的主要調蓄湖泊,湖形狹窄,長31 km,最寬18 km,平均寬4.16 km。多年平均氣溫16.6℃~17℃,多年平均風速2.2 m/s~3.1 m/s,多年平均日照時數1771.7 h~1859 h。長湖站是長湖水位控制站,收集湖泊水體自然變化規律,每日觀測水文要素數據受外界條件影響因素較多,需多次重復觀測,將重復觀測數據進行平均,采用平均值進行記錄。進行本文以湖泊發生一般波浪情況下連續觀測15次水尺讀數進行分析,利用狄克松準則對數據進行分析,結合不確定度把異常數據進行剔除。

通過表1分析計算平均值0.67 m,標準差2.9%,隨機不確定度為5.8%。

表1 原始觀測數據

利用狄克松準則按照從小到大順序進行排列,根據n及懷疑的對象,選擇適當公式計算rij的值;選定信度a,查得臨界值rij(n,a);根據計算值和查得臨界值進行比較分析,結合隨機不確定度值進行判斷是否舍去。

首先判斷最小值x(1),n=15,計算統計量r22:

查得表r22(15,0.05)=0.525,判斷r22>r22(15,0.05),x(1)判斷為異常值,未納入異常值計算標準差2.0%,隨機不確定度為4.0%,比原始數據標準差、隨機不確定度值要低,精度高,應舍去。

同理,根據最小值為異常值x(1),重新將樣本數據從小到大進行排列,n=14,計算統計量r22為0.5,查得表r22(14,0.05)=0.546,r22>r22(14,0.05),判斷x(1)為正常值。

采用狄克松準則進行處理異常值,每次樣本數據按從小到大進行排列,判別最小值x(1)和最大值x(n)數據,當有一個或者兩個數據為異常值,結合隨機不確定值進行分析判斷,是否進行剔除。如果剔除,將異常值后的樣本數據重新進行排列,此時樣本數據逐漸減少,樣本數據最低限度為3個,反復進行檢驗,直到最小值x(1)和最大值x(n)不為異常數據,則停止檢驗,判別過程結束。顯著性水平a可分為0.01,0.02,0.05,0.10四種,分別依次趨向于嚴格水平,最高水平為0.10,最低水平為0.01。本次采用顯著性水平a為0.05,已趨向于嚴格,不易漏掉異常值,符合現有樣本精度水平;采用顯著性水平a為0.01或0.02相對于寬松,在本次樣本數據進行判別反而全部為合格水平,精度偏低,容易漏掉異常值。選擇顯著性水平a應選擇趨向嚴格的。

3σ準則以數據符合正態分布為前提,在樣本數據量不大情況下,處理異常值容易漏掉。不建議采用3σ準則進行數據異常值處理。

5 結論

(1)水文觀測數據具有時間序列,采用人工觀測或自記設施設備收集數據,數據量較大的特征,其準確性關系到水文資料精度,特別是特征值。

(2)狄克松準則不需要計算數據平均值、標準差,且處理過程嚴謹,適用于樣本數量小,計算簡單重復量小,結果精度高。為保障數據精度更高,本文引入隨機不確定度加以判斷,減少人為因素和外界條件因素引起誤差,具有其他傳統異常值探測方法的優越性,其結果更好。

(3)由于多方原因,在采集和收集數據采集過程中,出現異常值屬于隨機事件,因此,進行數據分析之前選擇適當判別準則進行粗差處理,剔除異常值,對監測數據的準確性和可靠性結果尤其重要。

主站蜘蛛池模板: 黄色网址手机国内免费在线观看| 精品久久久久成人码免费动漫| 亚洲日韩精品综合在线一区二区| 国产免费高清无需播放器| 国产SUV精品一区二区6| 亚洲欧美成人网| 精品视频一区二区三区在线播 | 国产91小视频在线观看| 五月婷婷伊人网| 18禁影院亚洲专区| 久久精品无码国产一区二区三区| 免费一级毛片完整版在线看| 91po国产在线精品免费观看| 国产亚洲精品91| 国产91丝袜在线播放动漫 | 国产女人水多毛片18| 18禁黄无遮挡网站| 1769国产精品免费视频| 啊嗯不日本网站| 51国产偷自视频区视频手机观看| 亚洲日韩精品无码专区97| 思思99热精品在线| 国产成人亚洲精品蜜芽影院| 国产精品免费露脸视频| 人人澡人人爽欧美一区| 综合久久久久久久综合网| 九色视频最新网址 | 欧美特黄一级大黄录像| 亚洲一级毛片在线观| 国产无码高清视频不卡| 制服丝袜在线视频香蕉| 不卡无码网| 在线观看视频99| 亚洲 欧美 日韩综合一区| 91视频青青草| 少妇被粗大的猛烈进出免费视频| 91 九色视频丝袜| 2022精品国偷自产免费观看| 国产亚洲精品自在久久不卡 | 亚洲制服丝袜第一页| 亚洲精品国产综合99| 欧美区在线播放| 欧美午夜在线播放| 99热国产这里只有精品无卡顿"| 亚洲精品成人片在线观看| 久久国产黑丝袜视频| 久久久久人妻精品一区三寸蜜桃| a毛片免费观看| 亚洲另类色| 日韩精品无码不卡无码| 五月婷婷综合网| 99久久国产综合精品女同| jizz国产在线| 国产视频你懂得| 亚洲国产精品一区二区第一页免 | 天堂网国产| 色偷偷综合网| 国产精品美女免费视频大全| 青青草综合网| 婷婷99视频精品全部在线观看| 国产18在线| 一本大道在线一本久道| 极品尤物av美乳在线观看| 欧美成人精品在线| 亚洲免费人成影院| 国产成人精品高清在线| 精品少妇人妻av无码久久| 911亚洲精品| 久久黄色免费电影| 手机在线免费毛片| 日本人妻丰满熟妇区| 国产91线观看| 无码一区二区波多野结衣播放搜索| 香蕉国产精品视频| 99精品在线视频观看| 呦视频在线一区二区三区| 久久国产精品嫖妓| 午夜毛片免费看| a网站在线观看| 香蕉国产精品视频| 国产精品视频3p| 成人日韩精品|