999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

交叉驗證在離散數據網格化時的應用

2012-01-11 08:14:50高艷芳
物探化探計算技術 2012年5期
關鍵詞:方法

高艷芳,陳 實,馮 斌

(1.中國地質大學,北京 100083;

2.中國地質科學院 物化探研究所,河北 廊坊 065000)

交叉驗證在離散數據網格化時的應用

高艷芳1,2,陳 實2,馮 斌2

(1.中國地質大學,北京 100083;

2.中國地質科學院 物化探研究所,河北 廊坊 065000)

根據數據的特點,選擇不同的算法和參數對離散數據進行網格化,所得網格化數據對原始數據的反映程度不同。因此,在網格化時,可以利用交叉驗證(Cross Validation)對不同的網格化方法進行定量的評估和比較,以選擇最能尊重原始數據的網格化算法和參數。

離散數據;網格化;交叉驗證;地球化學數據

0 前言

利用離散分布的觀測數據制作等值線圖、框線圖、陰影圖和柵格圖等,用來表達客觀現實的空間分布狀況,需要通過內插或外插方式填充空值點,將不規則的數據轉換為規則分布的矩形陣列,這個過程就叫做離散數據網格化。目前,可以用來制作等值線的軟件很多,各軟件也提供了多種不同或相同的網格化方法。比如:國外著名的ArcGIS[1]、Golden Sufer10[2]、國內著名的軟件 Mapgisk9[3],分別提供了六種、十二種、四種以上的網格化的數學算法,其中都包含Kring方法。諸多的數學算法是為了滿足各行業各領域對具有不同特點(空間分布、數據量)的數據網格化的需要。在網格化的過程中不僅要選擇算法,同時還有許多其它的參數需要根據數據本身的特點進行選擇,例如:網格間距、網格化搜索域的形狀(矩形、圓、橢圓)、搜索半徑和向異性等等。諸多的方法、眾多的參數,給用戶帶來了寬泛的選擇,也讓用戶在使用過程中產生迷惑。盡管有些軟件本身的智能可以根據數據的特點設置默認的網格化方法和參數,用戶使用這些默認的設置就能產生滿意的結果。比如,對于一般的數據,Sufer會將Kring作為首選的算法向用戶推薦,將X、Y中的較大方向的網格數設定為100。Sufer軟件的用戶說明里也說到:當你創建一個網格文件時,通常可以使用其默認的方法和設置,基本上能產生可以接受的圖形[2]。但是實際應用中并非這么簡單。數據量也許過大或過小,數據分布也許過于集中或散亂,應用Kring方法并不是最佳選擇,默認的搜索方式并不能使用戶獲得最佳的結果。這些原因迫使用戶要在眾多方法和參數之間進行選擇來獲得滿意的,能對原始數據進行良好反映的網格化數據。在這樣的前提下,Sufer自版本8開始,引用了一種統計學上的方法,來對離散數據網格化方法及參數的選擇結果進行定量評估,這個方法就是交叉驗證。

1 交叉驗證

交叉驗證(Cross Validation),又稱為循環估計[4](Rotation Estimation),是通過將觀測數據分成不同的子集,來評估和比較算法優劣的一種統計學上的實用方法。交叉驗證的科學基礎是為了滿足對算法的評估需求,一是評估一種算法的普遍性,二是比較兩個或多種算法的特征,以找出最優的算法。交叉驗證目前應用于算法特征評估、模型選擇和調整模型參數三個方面。

2 網格化時交叉驗證的基本思想

自Golden Sufer.8開始,引入了交叉驗證來進行網格化算法的評估。實現的基本思想:已知有N個點的觀測數據,交叉驗證通過計算和分析網格化后每個觀測點上數據的殘差,來對數據網格化的質量進行相對的評估。

數據的殘差=網格化后的評估值-觀測值[5]。

計算每個觀測點殘差的過程是:先把該點的觀察值從數據集中拿出,利用剩下的數據和確定的網格化方法,來計算該點插值后的評估值,利用這個值和觀測值就能得到該點上的殘差[2]。通過對N個觀測點逐個的計算,將得到含有M個(M為用戶用來進行交叉驗證的數據點數)殘差值的數據文件(見圖1),然后利用多種統計處理手段對殘差數據進行分析,來定量評價網格化方法,指導網格化數學算法和參數的選擇。

在Sufer8中,交叉驗證得到的數據文件是一個ASCII的數據文件,共有M行。M是進行交叉驗證的點數,可以是全部的觀測點N,是部份隨機的觀測點。每一行共有七列,前三列是數據點的原始信息:X、Y方向的坐標及Z值,后面的依次是點號、該點的評估值、該點的殘差和參與該點插值評估的數據點的個數。

3 交叉驗證的應用

將野外采樣獲得的樣本數據進行網格化來制作地球化學圖,是地球化學數據處理的主要手段之一。地球化學普查或詳查、區域化探,涉及的工作范圍為數十平方公里、數百平方公里,數據量數千甚至上萬個。因此地球化學數據的特點是分布范圍較廣,數據量大。

作者在本實例中,采用的數據是地球化學詳查工作的成果。點線距為:40*100,樣點數為2 706個,呈不規則多邊形分布在5.2km2*3.2km2的礦區范圍上,如圖2所示。

Sufer8中提供了十二種的網格化方法,對于地球化學數據來說,并不是全部適用:

(1)自然臨近點、三角網線性插值因為網格化方法不能向外擴邊,而滿足不了地球化學方法技術的要求。

(2)多項式回歸因為不是真正進行網格化插值,只是定義一種趨勢或模式。

(3)最近點也不是進行真正的插值,只適用于數據分布均勻而空值點少的數據。

所以在制作地球化學圖時,也只有距離倒數、克里格、徑向基本函數、改進謝別德、最小曲率、移動平均這些方法可以選擇。

采用距離倒數、克里格、徑向基本函數、改進謝別德、最小曲率、移動平均分別對本數據進行網格化處理,網格間距設定為40*40,圓域搜索,搜索半徑為300。在網格化時使用交叉驗證獲得的結果見下頁表1。

分析以上的結果,從數據的范圍、獲得殘差的平均值和標準離差等統計數據可以看出,克里格和距離倒數,以及徑向基本函數、改進謝別德,是化探數據進行網格化可選的數學算法。克里格和徑向基本函數產生的結果特別相似,網格化后的Z值會超出原始數據的范圍;而距離倒數和改進謝別德方法相似,皆以距離倒數為權重。由于克里格和距離倒數這兩種方法在插值點與取樣點重合時,插值點的值就是樣本點的值,所以克里格和距離倒數這兩種方法成為地球化學數據常用的方法,加之由于使用克里格方法產生的網格數據在制作等值線時,可以避免出現更多的牛眼點[8],因此克里格成為了地球化學數據網格化時首選的方法。大量的實際經驗表明,地球化學數據進行網格化處理可以利用的方法有距離倒數、克里格、徑向基本函數[7],交叉驗證的結果給予了證明。

表1 交叉驗證結果對比表Tab.1 The comparison of the results from cross validation

4 結論

不規則分布的原始數據經過網格化后獲得網格數據,由網格數據來產生等值線圖,用來分析某種客觀現象連續的分布態勢,是科學研究中通常采用的方法。但是網格化后的數據不一定完全尊重原始數據,而等值線形態和趨勢僅是由網格化后的數據點所決定,這使得原始數據點和等值線圖會產生一定的偏離。因此尋找最優的網格化的方法和參數,對原始數據進行最接近的表達,是網格化時最需要考慮的地方。這個選擇可以利用已獲得的經驗值,比如對地球化學數據進行網格化一般選用克里格方法,網格間距通常為采樣間距的一半,搜索半徑為2倍~5倍,同樣可以利用交叉驗證來給予理論上的支持。同時,交叉驗證使得網格化過程變得透明,從交叉驗證的結果可以得到參與某一點網格化的數據點數,可以對原數據點網格化前、后的數據值進行比較,這使得網格化不再僅僅是一個快速完成的過程,而是讓用戶真正參與其中,去通過定量分析選擇自己需要的算法和參數。

[1] 秦濤,付宗堂.ArcGIS中幾種空間內插方法的比較[J].物探化探計算技術2007,29(1):72.

[2] GOLDEN SOFTWARE,INC.User’s Guide of Surfer 8[M].Golden Software,Inc.2002.

[3] 中地數碼.MAPGIS K9空間分析使用手冊[M].北京:中地數碼,2009.

[4] PAYAM REFAEILZADEH,LEI TANG,HUAN LIU .Cross-Validation http://www.public.asu.edu/~ltang9/papers/ency-cross-validation.pdf.

[5] 徐新強,張志剛.高程異常模型的已知點框架約束[J].海洋測繪,2006,26(6):59.

[6] 郭思,郭科,謝箭.基于ArcGIS儲量估算系統的開發與實踐[J].物探化探計算技術,2010,32(5):560.

[7] 高艷芳.離散數據網格化參數的確定和數學模型的選擇[J].地質與勘探,2002,38(增刊):139.

[8] 徐愛萍,胡力,舒紅.空間克里金插值的時空擴展與實現[J].計算機應用,2011,31(1):273.

O 241.5

A

10.3969/j.issn.1001-1749.2012.05.21

1001—1749(2012)05—0619—03

2012-05-10 改回日期:2012-06-07

高艷芳(1965-),女,碩士,高級工程師,在中國地質科學院物化探研究所信息中心從事GIS技術的應用開發工作。

猜你喜歡
方法
中醫特有的急救方法
中老年保健(2021年9期)2021-08-24 03:52:04
高中數學教學改革的方法
河北畫報(2021年2期)2021-05-25 02:07:46
化學反應多變幻 “虛擬”方法幫大忙
變快的方法
兒童繪本(2020年5期)2020-04-07 17:46:30
學習方法
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
最有效的簡單方法
山東青年(2016年1期)2016-02-28 14:25:23
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
賺錢方法
捕魚
主站蜘蛛池模板: 国产午夜精品鲁丝片| 激情综合网激情综合| 亚洲视频二| 亚洲伦理一区二区| 国产一级二级在线观看| 91蜜芽尤物福利在线观看| 国产成人AV综合久久| 欧美一区二区自偷自拍视频| 亚洲国产日韩欧美在线| 香蕉久久永久视频| 国产特一级毛片| 欧美另类视频一区二区三区| 亚洲一区二区视频在线观看| 国产成年无码AⅤ片在线| 久久精品午夜视频| 久久国产亚洲偷自| 中文字幕不卡免费高清视频| 91福利免费| 国产亚洲欧美另类一区二区| 亚洲一级毛片| 日本黄色不卡视频| 亚洲中文字幕久久无码精品A| 亚洲va视频| 99热这里只有精品免费国产| 91区国产福利在线观看午夜 | 99久久99这里只有免费的精品| 风韵丰满熟妇啪啪区老熟熟女| 亚洲成在线观看| 免费在线不卡视频| 人妻精品久久无码区| 亚洲综合极品香蕉久久网| 一本大道AV人久久综合| 最新午夜男女福利片视频| 午夜啪啪福利| 1024国产在线| 欧美国产精品拍自| 在线免费不卡视频| 亚洲成aⅴ人在线观看| 视频一区视频二区中文精品| 欧美日韩久久综合| 亚洲h视频在线| 天天色天天综合| 国产亚洲现在一区二区中文| 亚洲成人免费看| 国产亚洲欧美日韩在线一区| 伊人久久福利中文字幕| www.av男人.com| 国产精品毛片一区| 亚洲一区无码在线| 国产欧美日韩资源在线观看 | 免费人成视频在线观看网站| 22sihu国产精品视频影视资讯| 制服丝袜 91视频| 亚洲国产中文在线二区三区免| 呦女亚洲一区精品| 在线观看国产网址你懂的| 国产高清毛片| 亚洲综合网在线观看| 亚洲免费毛片| 久久精品国产精品一区二区| 91热爆在线| 欧美无专区| 亚洲成人网在线观看| 婷婷色中文网| 最新日韩AV网址在线观看| 免费在线播放毛片| 欧美全免费aaaaaa特黄在线| 日韩无码黄色网站| 538国产视频| 欧美日韩成人在线观看| 丁香六月综合网| 青青草欧美| 国产日韩精品欧美一区喷| 欧美国产在线看| 亚洲午夜国产片在线观看| 亚洲第一香蕉视频| 亚洲av成人无码网站在线观看| 制服丝袜无码每日更新| 亚洲一区黄色| 免费A级毛片无码免费视频| 亚洲天堂视频在线免费观看| 欧美在线视频a|