999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

地形特征與山地氣候變化空間關聯規則數據挖掘研究

2010-12-28 03:19:20何政偉
地理與地理信息科學 2010年1期
關鍵詞:數據挖掘關聯規則

陳 剛,何政偉,楊 斌

(1.成都理工大學地球科學學院,四川成都 610059;2.中石化西南油氣分公司勘探開發研究院信息中心,四川成都 610081;

3.西南科技大學環境與資源學院,四川綿陽 621010)

地形特征與山地氣候變化空間關聯規則數據挖掘研究

陳 剛1,2,何政偉1*,楊 斌3

(1.成都理工大學地球科學學院,四川成都 610059;2.中石化西南油氣分公司勘探開發研究院信息中心,四川成都 610081;

3.西南科技大學環境與資源學院,四川綿陽 621010)

以四川省的地形、氣候為研究對象,針對山地地形特征與氣候變化研究中,傳統的統計分析、非線性擬合等方法缺乏分析處理海量數據和提取隱含信息能力的問題,提出將關聯規則數據挖掘與柵格圖像處理、地形分析相結合的研究方法。該方法利用柵格圖像處理和地形分析技術,對地形和氣候柵格圖像進行坐標轉換、裁剪、分類、因子提取、離散化等預處理,再用Ap rio ri算法對提取的地形特征因子和氣候因子進行分析,得到反映兩者之間相關性的強關聯規則。通過對60余萬組數據的分析,得到22條滿足最小支持度和置信度的關聯規則,并由此綜合分析得到6條復合關聯規則。實驗證明,這些反映地形特征與氣候變化幅度之間關聯性的關聯規則可信度較高。

地形;山地;氣候;關聯規則;數據挖掘

在山地研究中,地形特征是一個包括海拔、坡向、坡度和粗糙度等因子的多維變量,由于地形特征決定了太陽輻射、降水、氣溫的空間分布,從而決定了氣候帶的分布[1,2],除緯度與海陸位置外,地形特征是影響區域氣候的主要因素。尤其是在內陸地區,地形特征對氣候的主導作用尤為明顯。研究表明[3],地形與區域氣候變化具有一定的聯系,因此,研究地形與山地區域氣候的關系,減小氣候變化對社會經濟和生態環境的影響,具有重大的現實意義。

多年的山地研究積累了遙感、地質、生態環境、社會等方面的大量數據,而對這些數據的分析仍主要采取統計分析、非線性擬合等傳統方法[4-6],在多元、多維、海量數據分析處理方面存在明顯不足,導致大量信息(如特征描述、趨勢、類別等)淹沒于背景數據中,難以被發現。數據挖掘是從20世紀90年代發展起來的新興數據分析處理技術,它能從大量、不完全、有噪聲、模糊、隨機的數據中提取隱含、潛在有用的信息和知識,并且近年來隨著信息技術的發展,數據挖掘得到了有力支撐,發展迅速。因此,數據挖掘的應用可解決山地科學研究中數據分析處理這一瓶頸問題。本文以四川省為研究區域,通過柵格圖像處理、地形分析與關聯規則數據挖掘技術,研究山地地形特征與氣候之間的相關性。

1 研究區域概況與數據處理

四川省位于東經97°21′~108°31′,北緯26°03′~34°19′,東西長1 075 km,南北寬921 km,面積48.41萬km2。地形復雜多樣,包含四川盆地、青藏高原、橫斷山脈、云貴高原、秦嶺-大巴山山地等地貌單元,地勢西高東低,由西北向東南傾斜,山地、高原和丘陵約占全省土地面積的97.46%。四川位于亞熱帶范圍內,由于受復雜地形和不同季風環流的交替影響,東西部氣候差異明顯,東部盆地屬亞熱帶濕潤氣候,西部高原以垂直氣候帶為主,寒冷、冬季長、日照充足、降水集中、干濕季分明,從南部山地到北部高原,由亞熱帶演變到亞寒帶,氣候垂直變化大,垂直方向上有亞熱帶到永凍帶的各種氣候類型。四川復雜的地形和多樣的氣候,為研究山地地形特征與氣候的相關性提供了典型樣本。

地形數據采用SRTM V 4.1數據,精度3 rad/s,水平分辨率約9 m,高程基準是 EGM-96的大地水準面,平面基準是 WGS_1984。通過插值方法對SRTM V 4.1原圖中的空洞進行填補。覆蓋四川省的SRTM圖幅文件共6個,通過圖像處理軟件進行無縫拼接后,與四川省省界矢量圖形進行裁剪,得到四川省的SRTM地形圖,再用此圖分別提取高程、坡度、坡向柵格圖像[7,8]。文中所有的柵格圖像均采用WGS_1984地理坐標系,以便在統一的坐標系統進行疊加和計算分析。

本文選用中國自然資源數據庫中提供的1961-1998年氣候數據作為實驗數據,數據為經過柵格化處理的每年7月平均氣溫和降水數據。為量化反映氣溫和降水的變化波動程度,實驗中用標準差對數據進行處理,計算公式為:S=SQRT[Σni=1(xi-ˉx)2/n],得到跨度為38 a的氣溫(降水)標準差柵格圖。其中,SQRT表示開平方根,xi為第i年7月平均氣溫(降水)柵格數據,ˉx為1961-1998年7月平均氣溫(降水)柵格數據的平均值,S為標準差(S越大說明數據相對平均數上下波動越大,即變動幅度越大)。

2 關聯規則數據挖掘算法描述

關聯數據挖掘是數據挖掘的一個重要研究方向,它通過找出事物之間在特定條件下存在的某種強度聯系的關聯規則,發現事務之間的規律。關聯規則模式屬于描述型模式,基本算法有Ap riori和FP-Tree兩種,其中Ap riori算法是研究和使用最多的算法,它是一種使用頻繁項集性質的先驗知識,生成關聯規則的算法屬于無監督學習,其核心是掃描數據,用逐層搜索的迭代方法求得所有頻繁集,能有效地發現大量數據中的關聯規則[9,11]。

關聯規則的相關數學描述如下:設 I={i1,i2,…,im}是項集合,其中的元素稱為項(item)。D是一個事務集合,在 D中每個事務 T是項的集合,且 T?I,對應每個事務有唯一的標識 TID。設 X是一個I中項的集合,如果 X?T,那么稱事務 T包含X。本文將項定義為二進制數,值為0或1,每個事務中的唯一標識為每個取樣點的編號 PO IN TID,關聯規則挖掘的過程主要包括以下步驟。

2.1 確定關聯規則算法的分析因子

將地形特征和氣候作為關聯規則數據挖掘的研究對象,分析因子由高程、坡度、坡向、降水、氣溫5項組成。由于算法性能對粒度的限制,在用關聯規則算法進行分析前,需要對指標進行分類,5項柵格數據分別按照以下標準進行分類:根據《中國地貌區劃》[12]記載的絕對高程分類方法,將高程分為5類:極高山(>5 000 m)、高山(3 500~5 000 m)、中山(1 000~3 500 m)、低山(500~1 000 m)、非山地(丘陵與平原)(<500 m)。根據國際地理學會地貌調查與制圖委員會制定的坡度分級方法,將坡度分為7級:平原至微傾斜坡(<2°)、緩傾斜坡(2°~5°)、斜坡(5°~15°)、陡坡(15°~25°)、急坡(25°~35°)、急陡坡(35°~55°)、垂直坡(>55°)。坡向以正北方向為起始方向,按順時針方向計算,范圍為0°~360°,以45°為間隔劃分為8類。將氣溫和降水柵格數值的標準差,按照標準偏差分類法(standard deviation)劃分為6類,數值越大表示變化幅度越大(地形和氣候因子的分類結果如圖1、圖2所示)。

2.2 設定最小支持度和最小置信度閾值

支持度表示事務集合D中包含 X和 Y的事務數與總的事務數的比值(式(1)),說明了規則在所有事務中代表性程度,支持度越大,關聯規則越重要,最小支持度Supmin用以表示這種規則發生的最小概率。置信度表示D中同時包含 X和 Y的事務數與只包含X的事務數的比值,是對關聯規則準確度的衡量(式(2)),最小置信度 Confmin用來濾掉可能性過小的規則。支持度和置信度的閾值對能否找到滿意的關聯規則非常重要,如果生成的規則過多或過少,則需要對支持度閾值和置信度閾值進行調整,并重新生成強關聯規則。

2.3 迭代找出所有支持度大于等于 Supmin的頻繁項集

頻繁項集是出現的頻率大于或等于最小支持數,即滿足最小支持度閾值的項集。關聯規則挖掘的實質就是在給定的交易或事務數據庫D中,發現所有的頻繁關聯規則[13,14]。找出頻繁項集的基本過程如下[15]:設Ck表示候選k-項集,Lk表示Ck中出現概率大于或等于最小支持度閾值與事務總數的乘積的k-項集,即k-頻繁項集或者是k-大項集。1)計算所有的C1;2)掃描數據庫,刪除其中的非頻繁子集,生成L1(1-頻繁項集);3)將L1與自己連接生成C2(候選2-項集);4)掃描數據庫,刪除C2中的非頻繁子集,生成L2(2-頻繁項集);5)依次推算,通過Lk-1(k-1-頻繁項集)與子集連接生成Ck(候選k-項集),然后掃描數據庫,生成Lk(頻繁k-項集),直到不再有頻繁項集產生為止。

2.4 根據頻繁項集生成所有置信度大于等于置信度閾值的強規則

強規則就是滿足最小支持度Supmin和最小置信度Confmin的關聯規則。給定一個事務集D,挖掘關聯規則問題就是產生支持度和置信度分別大于用戶給定的最小支持度和最小置信度的關聯規則,即產生強規則的問題。對于每個頻繁項集L,產生L的所有非空子集;對于L的每個非空子集S,如果Support(Y)/Support(X)≥Confmin,則輸出規則X?(Y-X),Confmin是最小置信度的閾值。由于規則由頻繁項集產生,每個規則都滿足最小支持度。

3 空間關聯規則數據挖掘實驗及分析

3.1 分析因子的表示

為便于在數據庫中表示,在計算前需要將分析因子的分類值二值化。在四川行政區域內,從氣溫柵格分類圖上提取與柵格對應的點,以這些點的坐標為采樣點,提取相同經緯度坐標的地形特征因子和氣候因子的分類數值,共625 689組;然后對得到的每組分類數字進行二值化處理,組成由5段32個項組成的事務。項是二進制數,每段代表一個分析因子,段中不同位置的項對應不同的分類,每個段中項只能有一個位置為1,其他的均為0,整個事務集合由625 689個事務組成。

3.2 實驗結果

從四川省的高程、坡度、坡向、降水、氣溫柵格數據中,共提取625 689組數據作為分析樣本,經坐標轉換、裁剪、分類、提取、離散化處理后,每組數據得到32個屬性。采用Ap rio ri算法對數據進行分析,設定最小支持度閾值Supmin=5%和最小置信度閾值Confmin=60%,得到22條關聯規則(表1),其中,一維規則4條,二維規則18條,這些規則按支持度降序排列,均具有較高的置信度。如表1所示,每條規則代表了一個關聯關系,例如:規則 ①:F2=>H3,說明降水的標準差在0~20.1393(F2)和高程1 000~3 500 m(H3)存在關聯,兩者同時出現的概率為7.255%,而在此降水標準差變化范圍內,高程1 000~3 500 m(H3)的概率為98.783%,F2、H3具有較高支持度。其他規則的解釋同上。

表1 地形特征和氣候因子的關聯規則Table 1 Association rules of terrain feature and climate factors

3.3 實驗分析

根據以上關聯規則,通過交并運算,可以概括出6條復合關聯規則:①高程為178~500 m(H1),氣溫標準差為5.2768~6.5576(T2),則降水標準差為22.9193~25.6993(F4);②氣溫標準差為5.2768~6.5576(T2),降水標準差為0~22.9193(F1/F2),坡度在 15°~35°(SL4/SL5)間的地形,則高程為1 000~3 500 m(H3);③氣溫標準差為6.5576~9.119(T3/T4),降水標準差為22.9193~28.4792 (F3/F4),坡度在5°~35°(SL3/SL4/SL5)間的地形,則高程為3 500~5 000 m(H4);④高程為178~500 m(H1),降水標準差為 22.9193~25.6993 (F3),或高程為1 000~3 500 m(H3),降水標準差為0~20.1393(F1),則氣溫標準差為 5.2768~6.5576;⑤高程為178~500 m(H1),降水標準差為25.6993~28.4792(F4),或高程為3 500~5 000 m (H4),降水標準差為20.1393~22.9193(F2),則氣溫標準差為6.5576~7.8383(T3);⑥高程為3 500~5 000 m(H 4),降水標準差為25.6993~28.4792 (F4/F5),則氣溫標準差為7.8383~9.119(T4)。

用布爾表達式分布表示為:

從以上結果可以看出,地形特征與氣候變化幅度之間存在明顯的復雜關聯性。為證明以上結果的正確性,用空間分析與統計分析結合的方法進行驗證。先將關聯規則R的前項按照表達式中的邏輯關系,對涉及的要素圖像進行柵格運算,得到滿足前項條件的研究區域A;再按照區域A的范圍,從關聯規則 R后項對應的要素柵格圖像中,提取后項表示結論區域B;對區域B中柵格單元用前述采樣點提取數值,然后,分別統計區域B中采樣點總數 PB(區域點數)和數值滿足關聯規則 R后項的采樣點數 PR(有效點數),對比得到兩組數據。從圖3可以看出,滿足關聯規則結果的有效點在區域內占有較高比例,說明上述關聯規則具有較高的可信度。

圖3 區域B中點數與有效點數對比Fig.3 The comparison of area pointsand effective points in area B

4 結論

本文以四川省為研究區域,在用柵格圖像和地形分析技術對地形、氣候圖像進行預處理的基礎上,采用Ap rio ri關聯數據挖掘算法,研究了地形因子與氣候變化間的關聯規則,在無假設模式的前提下,無監督的從大量信息中挖掘地形與氣候變化間有價值的隱含知識、關系、規則。實驗共得到22條基本關聯規則,并通過綜合分析提取了6條復合關聯規則。經過證明,這些規則可信度較高,表明地形特征與氣候變化幅度之間存在明顯的復雜關聯性。因此,關聯規則挖掘算法作為山地環境研究的一種新方法具有實用性。

[1] 邵遠坤,沈桐立,游泳,等.四川盆地近40年來的降水特征分析[J].西南農業大學學報,2005,27(6):749-752.

[2] 程路.秦嶺山地輻射和氣溫空間分布研究[D].南京氣象學院,2003.

[3] 倪永明,歐陽志云.基于地形因素的新疆荒漠植被-氣候模型應用研究[J].西北植物學報,2006,26(6):1236-1243.

[4] 何思源,劉鴻雁,任佶,等.內蒙古高原東南部森林-草原交錯帶的地形-氣候-植被格局和植被恢復對策[J].地理科學, 2008,28(2):253-258.

[5] 吉廷艷.貴州省低緯山地氣候變化趨勢[J].山地學報,2003,21 (4):422-427.

[6] 舒守娟,王元,熊安元.中國區域地理、地形因子對降水分布影響的估算和分析[J].地球物理學報,2007,50(6):1703-1711.

[7] 朱紅春,劉海英,張繼賢,等.基于DEM地形因子提取與量化關系研究——以陜北黃土高原的實驗為例[J].測繪科學,2007, 23(2):138-140.

[8] 張照錄,崔繼紅.基于柵格 GIS土壤侵蝕地形因子的提取算法[J].計算機工程,2006,32(5):226-228.

[9] AGRAWAL R,IM IEL INKSI T,SWAM IA.Mining association rules between setsof items in large database[A].Proceedingsof the 1993 ACM SIGMOD International Conference on M anagement of Data[C].1993.207-216.

[10] AGRAWAL R,SRIKANT R.Fast algorithm for mining association rules[A].Proceedings of the 20th VLDB Conference [C].1994.487-499.

[11] 周劍雄,王明哲.基于關聯規則的數據挖掘技術的快速算法[J].計算機工程,2003,29(12):48-50.

[12] 中國科學院自然區劃工作委員會.中國地貌區劃[M].北京:科學出版社,1959.83-88.

[13] 李清峰,楊路明.數據挖掘中關聯規則的一種高效Ap rio ri算法[J].計算機應用與軟件,2004,21(12):84-86.

[14] 李新良,陳湘濤.數據挖掘中關聯規則算法的研究[J].計算機工程與科學,2007,29(12):111-116.

[15] 李德仁,王樹良,李德毅.空間數據挖掘的理論與應用[M].北京:科學出版社,2006.390-392.

Spatial Association Rules Data M ining Research on Terrain Feature and Mountain Climate Change

CHEN Gang1,2,HE Zheng-wei1,YANGBin3
(1.College of Earth Sciences,Chengdu University of Technology,Chengdu 610059;
2.Information Center,Exp loration&Production Research Institute,SW PB SINOPEC,Chengdu 610081;
3.College of Environment and Resource,Southw est University of Science and Technology,M ianyang 621010,China)

In this paper,aimed at p roblem s w hich commonly research means,such as statistical analysis,nonlinear fitting and so on,lack the ability of extraction hidden information and p rocessing mass data inmountain terrain feature and climate change research,the terrain and climateof Sichuan is taken as research object,and a researchmethod w hich combines association rules data mining,raster image p rocessing and terrain feature facto rs extraction is put fo rward.In this method,raster image p rocessing and terrain analysis technique are adop t to p re-treat terrain and climate raster image by coordinate transformation,clipping,classification,facto rs extraction,discretization and so on,and Ap rio ri algo rithm is used to analysis terrain features and climate factors extracted by above p retreatmentmethods for obtaining strong association rules w hich rep resent relativity law between terrain and climate change.By means of analysis on mo re than 600 000 group data,to tally 22 item s association rulesw hich satisfy minimum support and confidence are obtained,and 6 compound association rules are generalized by comp rehensive analysis as well. Experiment show s that those results have higher credibility in reflecting associated law s between terrain feature and climate change.

terrain;mountain;climate;association rules;data mining

P208

A

1672-0504(2010)01-0037-04

2009-07-09;

2009-10-30

國家自然科學基金(40972225);國家科技支撐“十一五”計劃(2008BAK49B02);國家863重點項目(2007AA 120306);四川省杰出青年學科帶頭人培養計劃項目(06ZQ026-014);四川省教育廳自然科學重點項目(2006A 116)

陳剛(1976-),男,博士研究生,研究方向為 GIS、空間數據庫、數據挖掘。*通訊作者E-mail:hzw@cdut.edu.cn

猜你喜歡
數據挖掘關聯規則
撐竿跳規則的制定
“苦”的關聯
當代陜西(2021年17期)2021-11-06 03:21:36
數獨的規則和演變
探討人工智能與數據挖掘發展趨勢
奇趣搭配
讓規則不規則
Coco薇(2017年11期)2018-01-03 20:59:57
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
智趣
讀者(2017年5期)2017-02-15 18:04:18
TPP反腐敗規則對我國的啟示
一種基于Hadoop的大數據挖掘云服務及應用
主站蜘蛛池模板: 夜夜操天天摸| 91麻豆国产在线| 无码中文字幕精品推荐| 99精品热视频这里只有精品7| 国产麻豆精品在线观看| 亚洲一级毛片| 精品伊人久久久大香线蕉欧美| 国产人成午夜免费看| 久久无码av一区二区三区| 国产精品无码AV片在线观看播放| 亚亚洲乱码一二三四区| 99手机在线视频| A级全黄试看30分钟小视频| 国产97视频在线| 2022国产无码在线| 亚洲系列中文字幕一区二区| 免费国产不卡午夜福在线观看| 蜜桃视频一区二区| 精品久久久久久成人AV| 美女视频黄又黄又免费高清| 蜜芽一区二区国产精品| 亚洲高清资源| 三级视频中文字幕| 欧美午夜在线视频| 久久国产精品无码hdav| 伊人精品成人久久综合| 人妻丰满熟妇啪啪| 国产剧情国内精品原创| 国产啪在线91| 日本国产在线| 国产永久在线观看| 色播五月婷婷| 亚洲啪啪网| 69视频国产| 91在线国内在线播放老师| 国产成人免费观看在线视频| 正在播放久久| 国产爽妇精品| 亚洲无线视频| 亚洲精品综合一二三区在线| 最新无码专区超级碰碰碰| 日韩福利在线视频| 综合天天色| 国产亚洲精品自在久久不卡| 啪啪免费视频一区二区| 亚洲欧美自拍中文| 91欧美亚洲国产五月天| 亚洲成AV人手机在线观看网站| 无码乱人伦一区二区亚洲一| 久久大香伊蕉在人线观看热2| 99久久人妻精品免费二区| av一区二区人妻无码| 日韩不卡高清视频| 亚洲第一色网站| 国产经典在线观看一区| 日本精品视频| 国产精品30p| 四虎永久免费地址在线网站 | 在线亚洲精品福利网址导航| 亚洲免费三区| 在线免费亚洲无码视频| 婷婷五月在线| 亚洲AV无码久久精品色欲| 五月激情综合网| 日韩美一区二区| 国产成人亚洲精品色欲AV | 久久狠狠色噜噜狠狠狠狠97视色| 亚洲精品爱草草视频在线| 久久狠狠色噜噜狠狠狠狠97视色 | 亚洲精品成人片在线播放| 免费高清毛片| 在线观看热码亚洲av每日更新| 999精品在线视频| 一本久道热中字伊人| 国产精品亚洲精品爽爽| 素人激情视频福利| 国产产在线精品亚洲aavv| 亚洲a级毛片| 亚洲欧美另类久久久精品播放的| 免费又爽又刺激高潮网址| 免费无码又爽又刺激高| AV在线麻免费观看网站|