999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

多尺度空間格網數據的索引編碼研究

2014-06-27 05:47:13張小虎鐘耳順王少華
測繪通報 2014年7期
關鍵詞:效率

張小虎,鐘耳順,王少華,張 珣

(1.中國科學院地理科學與資源研究所,北京 100101;2.中國科學院大學,北京 100049)

多尺度空間格網數據的索引編碼研究

張小虎1,2,鐘耳順1,王少華1,2,張 珣1,2

(1.中國科學院地理科學與資源研究所,北京 100101;2.中國科學院大學,北京 100049)

針對多尺度格網數據訪問效率問題,設計了一種基于格網空間索引的多尺度格網數據索引編碼體系。該索引編碼有著較高的編碼和訪問效率,能較好地滿足多尺度格網數據分析時的效率需求。

多尺度;格網數據;索引編碼

一、引 言

隨著地理信息系統應用的日益深入,不同的應用越來越需要不同尺度的格網數據[1-2]。研究表明,規則格網數據能夠較好地滿足多尺度地理數據空間表達的需求,并一定程度上解決可塑面積單元問題(MAUP)對原始數據的影響[3]。在實際應用中,格網數據會根據具體的尺度規則,生成多個不同尺度數據集合L={l1,l2,…,ln},并將L存儲在空間文件或空間數據庫中。然而,不管以柵格數據格式還是矢量數據格式,L中各個子層{l1,l2,…,ln}概念上存在空間聯系,而存儲及索引上彼此獨立。這種傳統的“一庫多版本技術”并未將多尺度格網數據的空間拓撲關系、尺度關系表現出來[4],不但降低了多尺度格網數據集的邏輯一致性,而且對后續的多尺度分析帶來巨大的時間消耗。多尺度格網數據之間的運算操作涉及大規模的地理查詢操作,直接依靠已有的空間查詢和拓撲操作,且每次查詢將直接影響數據運算效率。因此,必須建立一套有效的數據索引體系,減少格網數據的查詢和拓撲操作,使得多尺度格網數據的多尺度分析得以實現。本文的研究目的就是為多尺度格網數據集L建立一種有效的索引方式,使得各子層之間的空間關系得以明確,并采用合理的編碼將這種關系固定存儲起來,使得多尺度格網的空間運算高效實施,各個尺度的格網數據可以高效訪問其他尺度的相關格網數據。

二、格網索引及多尺度格網統計數據特征

空間數據索引技術并不是一個新興的研究問題,其在空間數據庫技術中得到了廣泛的研究,并形成3類空間索引方法,即基于點區域劃分的索引、基于面區域劃分的索引和基于體區域劃分的索引[5-6]。空間索引是采用一定的順序在不同的空間劃分區域內搜索查找地理實體,從而加快空間查詢[7]。面區域劃分的索引方法主要有3種,即格網索引、區域四叉樹索引和R樹索引。根據多尺度格網數據的空間特征,傳統的格網索引比較合適用多尺度格網數據建立索引。

格網索引是一種基于空間填充曲線(space-filling curve)的索引方式[8]。其基本方法是將二維正方形平面劃分成m×n的格網,并利用一種空間填充曲線建立起這些格網的一維索引(如圖1所示)。典型的空間填充曲線有Z-curve和Hilbert-curve,其對應的一維索引編碼為 Morton碼和 Hilbert碼[9]。其中Hibert編碼可以使得原二維的平面形狀不必限制為正方形,以拓展格網索引的使用范圍[10]。

圖1 基于Z-curve的二級格網索引

格網索引的性能依賴于格網和對象的大小,以及對象密度之間的關系[11]。對于空間密度變化大的數據,通常需要建立多層的索引格網,以保證性能

需要指出的是任何索引對查詢、訪問的操作時間的優化都是相對的,不合適的索引不但不能加快查詢速度,反而會使操作更為復雜耗時。因此,建立索引必須針對數據本身特征。本文將根據多尺度格網統計數據自身特征,建立符合多尺度格網數據特征的索引編碼體系,滿足多尺度格網數據訪問的效率需求。

2.多尺度格網數據的兩種形式及索引編碼需求

多尺度格網數據是一種在統一的數據管理系統下存儲的不同尺度的空間數據,該數據索引有其特殊的需求,即所構建的索引能使格網數據實現不同尺度層數據的快速切換及各尺度對應格網單元快速互訪問。這種索引不需要滿足優化空間查詢等基本地圖操作需求,因為這些格網數據錄入到空間數據庫時,已有的空間數據庫索引技術已經滿足了這些基本要求。然而,多尺度格網數據多尺度分析時需要反復查詢目標格網對應的其他尺度下的相應格網及其鄰近格網。利用已有的空間索引技術需要反復采用空間查詢及空間拓撲操作,極大地降低了空間分析的效率,尤其當格網數據的尺度規模和空間規模都非常大時,這種影響將更為明顯。因此,需要一種建立一種專門的索引及其編碼,滿足多尺度格網數據多尺度分析的效率需求。

根據不同的應用需求,多尺度格網統計數據各層格網主要有兩種不同的拓撲關系,根據這兩種關系,多尺度格網統計數據主要表現成兩種形式(如圖2所示)。第1種形式為不同尺度的格網的尺度縮放因子成整數倍數關系,大尺度格網完整包含小尺度格網,不同層的數據完整覆蓋,不交叉;第2種形式為不同尺度格網的尺度縮放因子不成整數倍數關系,大尺度的格網不能完整包含小尺度格網,不同層的數據存在交叉。在后續的多尺度空間分析時,這兩種形式的數據相互訪問時存在明顯差異,主要表現在:

1)第1種格網小尺度格網僅僅對應一個大尺度格網數據,各尺度間數據可以按照樹結構進行相互訪問,并可根據樹形結構推測其鄰接格網單元。

黑米酒、小米酒等兩款不同風味的米酒中的黃酮及多糖類化合物,主要來源于釀酒發酵原料及其在液體發酵過程中的浸出。絕大多數植物內都含有黃酮及多糖類化合物,其在植物的生長、抗菌防病等方面起著重要的作用。由圖4可知,兩組樣品酒液中的黃酮含量差距不大,范圍都在45~50 mg/L之間。黑米酒、小米酒等兩款不同風味的米酒中都含有黃酮,但含量都較少。黑米酒中的總多糖含量高于小米酒,表明發酵過程中可能黑米原料中的多糖化合物更容易浸出。黃酮及多糖類化合物均具有抗氧化、清除自由基等生物功效,風味米酒中含有適量的黃酮及多糖類化合物,有利于提高酒體的營養價值,具有潛在的營養保健功效。

2)第2種格網小尺度對應多個大尺度格網數據,各尺度間數據不能按照簡單的空間關系建立樹形關系,各尺度直接的相互訪問比較復雜。

圖2 多尺度格網數據的兩種表現形式

在實際應用中,根據不同的需求,格網尺度可能是人為指定的,但是往往是規則的(常用 1 km、500 m、250 m、100 m、50 m)。格網數據往往表現為上述第1種形式;或者是第2種形式中大部分數據呈現第1種數據形式,只有少數層縮放因子不符合整倍數關系(如1 km、500 m、250 m、100 m、50 m中只有100 m不符合第1種數據形式要求的整倍數關系)。

因此,多尺度格網索引及其編碼的基本策略是在建立第1種形式格網數據索引編碼的基礎上,解決第2種形式數據的特殊問題。

三、多尺度格網數據的索引編碼

1.多尺度格網統計數據的多尺度編碼

本文提出一種基于樹形結構和格網空間索引的多尺度格網索引編碼體系,解決了多尺度格網統計數據多尺度分析時的效率問題。這種索引編碼較好地實現了多尺度數據多尺度特征,其基本方法為(如圖3所示)。

圖3 多尺度格網統計數據的索引編碼示例

1)編碼規則:格網編碼分為3個部分,即尺度代碼,尺度因子代碼,格網位置代碼。如“99”“02”“00”“00”,其中第1個數值是上級格網尺度代碼,“99”表示無上一層尺度的格網;第2個數值表示與上個尺度的縮放因子,“02”表示該尺度格網是上個尺度格網1∶2劃分而來;第3個數值是上個尺度對應格網的順序編碼;第4個數值為該格網順序編碼。

2)按順序從大尺度分別建立下級格網編碼,編碼以十進制行列順序編碼。如level 1,根據其行列值對其采用二維十進制編碼,如第1行第1列賦值為“001001”,并記錄該格網的上級格網及其尺度因子、對應格網編碼,最終表示為“0002”“00”“001001”。

3)如果尺度數據為第2種形式數據(如圖2數據中有level x),先建立其他尺度格網的索引編碼。對level x數據,根據其尺度因子選擇最臨近的滿足整倍數關系的上尺度(大尺度)格網(level 0),根據該數據建立其格網編碼。

4)當加入新的尺度格網數據時,如果該尺度數據與原有數據的尺度縮放因子滿足整倍數關系,需要根據步驟1)—2)重新建立索引編碼;當不滿足需求時,根據步驟3)加入編碼。

5)當需要刪除某個尺度的格網數據時,如果該尺度數據與原有數據的尺度縮放因子滿足整倍數關系,刪除該數據同時需要按步驟1)—3)重建索引編碼;當不滿足關系時,直接刪除該數據。

6)按照上述編碼,根據大尺度格網索引小尺度格網、編碼從小到大的順序寫入索引文件,便于后續使用。

上述編碼規則適用于任何情況下的多尺度格網數據。然而實際應用中,多尺度格網尺度規則的制定是有彈性的,可以根據需求建立等級尺度縮放的多尺度格網,這不但不影響實際多尺度分析的效果,而且索引編碼的效率將大為增加。如采用等級為2的縮放因子,使得各尺度間滿足四叉樹的索引模式,進而提高后續分析的效率。

2.多尺度格網數據索引編碼應用效率分析

本文中多尺度格網數據索引體系的設計實際上是利用大尺度格網作為小尺度格網建立空間索引的格網參考,從而使得多尺度格網數據不同尺度間相互聯系,并加快各尺度數據層之間的相互訪問。沒有這種索引機制的多尺度格網數據進行多尺度分析時需要額外的空間查詢操作。本文通過對比多尺度格網數據建立索引前后的多尺度分析操作的時間及多尺度格網索引編碼建立時間來分析多尺度格網統計數據索引編碼的應用效率。

檢驗索引編碼的編碼效率的計算機環境為:CPU:Intel(R)Core(TM)2 Quad CPUQ9550@2.83 GHz;內存:4.00 GB(1067 HZ)/3.37 GB可用;操作系統:Microsoft Windows 7專業版 (32位);編程語言:python2.6;地理數據操作基本庫:arcpy;數據格式:Esri shapefile文件型空間數據格式。

試驗為4個不同研究范圍建立了4個不同尺度的格網。不同規模的格網統計數據索引編碼時間如表1、圖4所示。

表1 不同規模多尺度格網數據索引編碼時間 s

圖4 不同規模多尺度格網數據索引編碼時間

對于大規模的格網編碼索引編碼效率能夠滿足需求,格網統計數據的索引編碼效率與尺度、規模關系密切,同一規模下索引編碼時間與尺度因子成對數關系。

同時,為了評價本文提出的多尺度格網索引對多尺度格網統計數據分析效率的改善效果,設計了統一的多尺度數據互訪問操作,即通過相鄰尺度兩層格網的相互訪問,計算所有尺度格網某個屬性的總和。試驗分別對表1中10 km2的原始格網、具有一般格網索引的格網(Esri ArcGIS shapefile的空間索引)和具有本文設計的多尺度格網索引的格網進行了上述操作,其耗時見表2。原始格網的多尺度運算操作十分耗時,效率低下;具有一般格網空間索引有效地提高了多尺度數據互訪問的效率;本文所設計的多尺度格網索引也較好地提高了多尺度數據不同尺度間互訪問的效率,并且比一般格網空間索引好,效率提高了30%。

表2 多尺度格網數據實驗耗時 s

四、結論與討論

本文針對多尺度格網設計了一種基于格網索引的索引編碼體系。該方法有著較高的編碼效率和訪問效率,較好地解決了多尺度格網數據尺度間訪問的效率問題。同時需要指出的是:①任何索引對查詢、訪問的操作時間的優化都是相對的,不合適的索引不但不能加快查詢速度,反而會使得操作更為復雜耗時。因此,建立索引必須針對數據本身特征,這也是本文設計的索引比一般格網索引效率更優的根本原因和基礎。②索引對原始數據訪問的優化,并不一定降低空間查詢、訪問及運算的時間。根據索引選擇合適的數據查詢方法、制定優化的訪問策略、設計高效的運算算法對多尺度格網數據的分析效率都是至關重要的。

[1] 狄琳.建立新國家地理格網服務地理國情監測初探[J].測繪通報,2011(11):1-2.

[2] 左偉,張桂蘭,萬必文,等.中尺度生態評價研究中格網空間尺度的選擇與確定[J].測繪學報,2003,32 (3):267-271.

[3] GEHLKE C K,BIEHL K.Certain Effects of Grouping upon the Size of the Correlation Coefficient in Census Tract Material[J].Journal of the American Statistical Association,1934(29):169-170.

[4] 王艷慧,李小娟,宮輝力.地理要素多尺度表達的基本問題[J].中國科學E輯:技術科學,2006(36):38-44.

[5] 閻超德,趙學勝.GIS空間索引方法述評[J].地理與地理信息科學,2004(4):23-28,39.

[6] 鄭坤,朱良峰,吳信才,等.3D GIS空間索引技術研究[J].地理與地理信息科學,2006(4):35-39.

[7] 吳敏君.GIS空間索引技術的研究[D].鎮江:江蘇大學,2006.

[8] PEANO G.Sur Une Courbe,Qui Remplit Toute Une Aire Plane[J].Mathematische Annalen,1890(36):157-160.

[9] HILBERT D.Ueber Die Stetige Abbildung Einer Line Auf Ein Fl?chenstück[J].Mathematische Annalen,1891 (38):459-460.

[10] HAMILTON C H,RAU-CHAPLIN A.Compact Hilbert Indices:Space-filling Curves for Domains with Unequal Side Lengths[J].Information Processing Letters,2008 (105):155-163.

[11] LONGLEY P.Geographic Information Systems and Science(2nd ed)[M].West Sussex:John Wiley&Sons Inc,2005:229-234.

[12] 楊族橋,郭慶勝,牛冀平,等.DEM多尺度表達與地形結構線提取研究[J].測繪學報,2005,34(2):134-137.

Research on Index and Code for Multi-scale Grid Data

ZHANG Xiaohu,ZHONG Ershun,WANG Shaohua,ZHANG Xun

P208

B

0494-0911(2014)07-0035-04

2013-03-12

國家科技支撐計劃(2011BAH06B03)

張小虎(1986—),男,江蘇寶應人,博士生,研究方向為格網空間數據多尺度分析。最優。在格網索引中,當用戶進行空間查詢時,首先計算被查對象所在的空間格網,使用格網快速定位到所選的空間對象。格網索引方法是對空間對象最為直觀簡單的索引方法,其對應的算法也比較簡單,可以實現對象的快速目標查詢,并且這是一種典型的以空間換時間的索引方法,數據冗余大,但并不影響格網索引的高效而帶來的廣泛應用。

張小虎,鐘耳順,王少華,等.多尺度空間格網數據的索引編碼研究[J].測繪通報,2014(7):35-38.

10.13474/j.cnki.11-2246. 2014.0220

猜你喜歡
效率
你在咖啡館學習會更有創意和效率嗎?
提升朗讀教學效率的幾點思考
甘肅教育(2020年14期)2020-09-11 07:57:42
注意實驗拓展,提高復習效率
效率的價值
商周刊(2017年9期)2017-08-22 02:57:49
引入“倒逼機制”提高治霾效率
遼寧經濟(2017年6期)2017-07-12 09:27:16
質量與效率的爭論
中國衛生(2016年9期)2016-11-12 13:27:54
跟蹤導練(一)2
提高食品行業清潔操作的效率
OptiMOSTM 300V提高硬開關應用的效率,支持新型設計
“錢”、“事”脫節效率低
中國衛生(2014年11期)2014-11-12 13:11:32
主站蜘蛛池模板: 久久精品视频一| 国产麻豆91网在线看| 久久午夜夜伦鲁鲁片无码免费| 亚洲免费人成影院| 色屁屁一区二区三区视频国产| 欧美日韩导航| 久久精品国产亚洲麻豆| 四虎影视8848永久精品| 色综合成人| 国产真实乱人视频| 亚洲第一天堂无码专区| 国产又粗又爽视频| 精品久久高清| 亚洲成人77777| 一级香蕉视频在线观看| 在线免费观看AV| 99re热精品视频中文字幕不卡| 国产在线拍偷自揄拍精品| 亚洲av无码久久无遮挡| 国产成人精品一区二区| 凹凸国产分类在线观看| 欧美精品亚洲精品日韩专区| 亚洲欧州色色免费AV| 日本一本正道综合久久dvd| 久久人与动人物A级毛片| 五月婷婷丁香色| 色婷婷成人| 色噜噜久久| 免费在线国产一区二区三区精品| 欧美一区二区三区不卡免费| 97se亚洲综合在线天天| 色婷婷色丁香| 亚洲精品天堂自在久久77| 国产乱子伦无码精品小说| 日韩av资源在线| 高清欧美性猛交XXXX黑人猛交| 国产精品自在拍首页视频8| 欧美日韩精品一区二区视频| 乱码国产乱码精品精在线播放| 久久综合一个色综合网| 99国产精品国产高清一区二区| 视频一区视频二区中文精品| 久久久久久久97| 国产菊爆视频在线观看| 日韩资源站| 伊人久久婷婷五月综合97色| 欧美区日韩区| 国产成人精品三级| 欧美精品啪啪一区二区三区| 欧美a网站| www.youjizz.com久久| 朝桐光一区二区| 亚瑟天堂久久一区二区影院| 亚洲第一香蕉视频| 91精品国产综合久久香蕉922| 草草线在成年免费视频2| 亚洲黄色成人| 3D动漫精品啪啪一区二区下载| 欧美成在线视频| 无码区日韩专区免费系列| 日韩高清在线观看不卡一区二区| 91青青草视频| 爆乳熟妇一区二区三区| 人妻21p大胆| 日韩在线播放欧美字幕| 欧美一级高清片欧美国产欧美| 98精品全国免费观看视频| 久久综合一个色综合网| 91成人在线观看| 91麻豆精品国产高清在线| AV无码国产在线看岛国岛| 日本三级黄在线观看| 三上悠亚在线精品二区| 亚洲综合色婷婷中文字幕| 色哟哟精品无码网站在线播放视频| 狠狠色香婷婷久久亚洲精品| 久久中文字幕2021精品| 欧美色图第一页| 狠狠操夜夜爽| 日韩精品毛片人妻AV不卡| 在线观看视频99| 五月婷婷综合色|