999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于聚類算法的GIS深度數(shù)據(jù)挖掘模型研究

2021-11-07 10:32:17熊燕
科技信息·學(xué)術(shù)版 2021年22期
關(guān)鍵詞:時(shí)間

摘要:本文基于項(xiàng)目研究,結(jié)合GIS數(shù)據(jù)的特點(diǎn)及業(yè)務(wù)領(lǐng)域特征,基于聚類算法進(jìn)一步研究了深度數(shù)據(jù)挖掘方案,得到新的算法模型。本文闡述了多維建模過程及模式,對(duì)樣本數(shù)據(jù)進(jìn)行分類的方法,聚類規(guī)則等,并在來源項(xiàng)目中得到驗(yàn)證。

關(guān)鍵詞:聚類,GIS,時(shí)間,位置,文件

前言

GIS 數(shù)據(jù)不僅具有空間特征,又具有屬性特征,并隨時(shí)間變化。因此,數(shù)據(jù)量大且結(jié)構(gòu)復(fù)雜。如今,社會(huì)上許多行業(yè)和部門都在使用 GIS。面向不同應(yīng)用領(lǐng)域的GIS數(shù)據(jù),還會(huì)同時(shí)產(chǎn)生更多維度的數(shù)據(jù),如人文信息。如果沒有合適的數(shù)據(jù)分析和挖掘方案,GIS就不可能發(fā)揮其最大的效能,許多數(shù)據(jù)間的關(guān)聯(lián)及潛在“知識(shí)”不會(huì)被發(fā)現(xiàn)。

1. GIS數(shù)據(jù)的特性

1.1 時(shí)空特性

地理數(shù)據(jù)是與空間相關(guān)的。它可以被分配坐標(biāo)或任何空間引用。數(shù)據(jù)在地球表面,包括位置和組織。地理數(shù)據(jù)的規(guī)模可以從一般到具體,從簡(jiǎn)單到復(fù)雜。地理數(shù)據(jù)是動(dòng)態(tài)的,包括空間動(dòng)態(tài)(空間變化)和時(shí)間動(dòng)態(tài)(時(shí)間變化)。地理數(shù)據(jù)既具有空間特征,又具有屬性特征,并隨時(shí)間變化。因此,數(shù)據(jù)量非常大。

1.2 業(yè)務(wù)特性

當(dāng)今,許多行業(yè)已經(jīng)將GIS納入了自己的業(yè)務(wù)系統(tǒng)。在這些業(yè)務(wù)系統(tǒng)中,GIS中的數(shù)據(jù)與用戶的其他在線活動(dòng)相關(guān)聯(lián)。GIS數(shù)據(jù)來源包括地圖、遙感圖像、文本數(shù)據(jù)、統(tǒng)計(jì)數(shù)據(jù)、實(shí)測(cè)數(shù)據(jù)、多媒體數(shù)據(jù)、現(xiàn)有系統(tǒng)數(shù)據(jù)等。由于標(biāo)準(zhǔn)化,不同系統(tǒng)之間的數(shù)據(jù)共享和互換性正變得越來越強(qiáng)。這擴(kuò)大了數(shù)據(jù)的可用性,增加了數(shù)據(jù)的潛在價(jià)值。因此,在挖掘 GIS中的信息時(shí),首先要明確業(yè)務(wù)需求,確定數(shù)據(jù)源。本文主要研究了用戶在網(wǎng)絡(luò)和數(shù)字地圖上的活動(dòng)數(shù)據(jù)。事實(shí)上,有很多數(shù)據(jù)庫(kù)系統(tǒng)是關(guān)系數(shù)據(jù)庫(kù)。

2. 聚類算法及挖掘架構(gòu)

2.1 聚類算法

聚類(Cluster)分析是由若干模式(Pattern)組成的,通常,模式是一個(gè)度量(Measurement)的向量,或者是多維空間中的一個(gè)點(diǎn)。聚類分析以相似性為基礎(chǔ),在一個(gè)聚類中的模式之間比不在同一聚類中的模式之間具有更多的相似性。聚類分析的算法可以分為劃分法(Partitioning Methods)、層次法(Hierarchical Methods)、基于密度的方法(Density-based Methods)、基于網(wǎng)格的方法(Grid-based Methods)、基于模型的方法(Model-Based Methods)。

基于某種業(yè)務(wù),很難說具體應(yīng)用了哪種聚類算法,因?yàn)檫@些類別可能重疊,從而使得一種方法具有幾類的特征。因此在聚類基本劃分方法的基礎(chǔ)上,如何針對(duì)業(yè)務(wù)領(lǐng)域設(shè)計(jì)出相應(yīng)的新算法是有一定挑戰(zhàn)的。

2.2 挖掘架構(gòu)

在來源項(xiàng)目的研究中發(fā)現(xiàn),數(shù)據(jù)資源可以通過訪問公眾、收集地理信息等方式獲得。我們可以把所有的數(shù)據(jù)分成幾種類型。一般的挖掘過程包括:挖掘?qū)ο蟠_定、數(shù)據(jù)準(zhǔn)備、模式提取、模式評(píng)價(jià)。

基于項(xiàng)目研究領(lǐng)域的特點(diǎn),新挖掘算法模型的產(chǎn)生基于這樣的架構(gòu):數(shù)據(jù)維的劃分、切片、聚類、識(shí)別。該模型關(guān)注的是地理數(shù)據(jù)的維度,這些數(shù)據(jù)被信息需求分割。然后高密度區(qū)域被劃分為集群。在對(duì)數(shù)字地圖進(jìn)行聚類之后,用戶可以進(jìn)一步識(shí)別地圖上的深度信息。

3. 多維數(shù)據(jù)模型的建立

3.1 維度確定

數(shù)據(jù)在轉(zhuǎn)換后被加載到一個(gè)關(guān)系數(shù)據(jù)庫(kù)中。選擇多維數(shù)據(jù)允許我們從數(shù)據(jù)庫(kù)的各個(gè)方面觀察數(shù)據(jù)。多維數(shù)據(jù)矩陣由模式表示:

C (A1,A2,...,Am,count)

矢量 Ai (i = 1,2,...,m)表示其中一個(gè)維度。參數(shù)count是一個(gè)變量。

在數(shù)據(jù)矩陣中,根據(jù)實(shí)驗(yàn)要求選擇多個(gè)維度:時(shí)間維度、空間維度、 url 維度、用戶維度、文件維度。建立數(shù)據(jù)矩陣后,可用于分析來自多個(gè)方向的數(shù)據(jù)。

3.2 模式設(shè)計(jì)

創(chuàng)建多維數(shù)據(jù)模式在關(guān)系數(shù)據(jù)庫(kù)中,數(shù)據(jù)模型由實(shí)體及其關(guān)聯(lián)的集合組成。該數(shù)據(jù)模型適用于在線事務(wù)處理。然后,我們構(gòu)造了一個(gè)星型模式來表示數(shù)據(jù)倉(cāng)庫(kù)中的多維數(shù)據(jù)結(jié)構(gòu)。這個(gè)模式包含一些部分,如圖1所示。

星型模式由兩部分組成:

(1)中心表也是事實(shí)表。這個(gè)表包含了大量的數(shù)據(jù),這些數(shù)據(jù)并不是冗余的。

(2)還附加了一組維度表,每個(gè)維度對(duì)應(yīng)一個(gè)維度表。

4.多維視圖的聚類分析算法

在以前構(gòu)建的數(shù)據(jù)倉(cāng)庫(kù)中采用聚類分析算法,從數(shù)據(jù)庫(kù)引擎中提取數(shù)據(jù)的三個(gè)維度:日期、文件、位置。在數(shù)字地圖中,位置維度按街道劃分。日期尺寸除以年份。文件尺寸按文件類型劃分。

根據(jù)原始數(shù)據(jù)經(jīng)過清理和轉(zhuǎn)換后的數(shù)據(jù)矩陣,用戶對(duì)數(shù)據(jù)的訪問用2D 表示。我們?cè)谶@個(gè)二維表示中使用日期維度和文件維度。日期維度是按年組織的,例如:y1,y2,y3,y4。文件維度按訪問的文件類型進(jìn)行組織,例如:file1,file2,file3。事實(shí)或度量是屬性 visit _ count。屬性 visit _ count 的值表示每次訪問一個(gè)文件的次數(shù)。

DBSCAN (Density-Based Spatial Clustering of Application with Noise)是一種針對(duì)高密度連接區(qū)域的密度聚類算法。該算法將具有足夠密度的區(qū)域劃分為若干個(gè)簇。任何形狀的聚類都可以在帶有“噪聲”的空間數(shù)據(jù)庫(kù)中找到。集群被定義為與密度相關(guān)的最大點(diǎn)集。基于密度的聚類包含了一些新的定義,例如:

(1)neighborhood是給定物體的區(qū)域,該區(qū)域的半徑為r。

(2)如果一個(gè)對(duì)象的鄰域至少包含一個(gè)最小數(shù)量的對(duì)象,該對(duì)象被稱為核心對(duì)象。

(3)給定一個(gè)對(duì)象集 d,如果對(duì)象 p 在對(duì)象 q 的鄰域內(nèi),q 是核心對(duì)象,我們說對(duì)象 p 是直接從對(duì)象 q 密度可達(dá)的。

結(jié)語:

該算法模型在來源項(xiàng)目中進(jìn)行了實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果驗(yàn)證了該聚類分析算法及模型的有效性。數(shù)據(jù)被劃分為多個(gè)維度,并通過星型模式存儲(chǔ)在數(shù)據(jù)倉(cāng)庫(kù)中。新的聚類算法給出了一些定義和規(guī)則。根據(jù)這些算法規(guī)則,對(duì)多維數(shù)據(jù)進(jìn)行計(jì)算和分析,最終可獲得更深層次信息。

參考文獻(xiàn):

[1]呂奕. 基于改進(jìn)密度峰值聚類算法的軌跡行為分析[J]. 計(jì)算機(jī)工程與應(yīng)用. 2021,4

[2]Nagpal Mayank. Keyword Selection Strategies in Search Engine Optimization:How Relevant is Relevance [J]. Journal of Retailing. 2020,12

[3]Hamid Saadatfar. A New K-Nearest Neighbors Classifier for Big Data Based on Efficient Data Pruning [J]. Mathematics Volume 8,Issue 2. 2020

項(xiàng)目來源:面向復(fù)雜來源的大數(shù)據(jù)分析架構(gòu)及算法模型研究,湖北省教育廳2019年度科研計(jì)劃項(xiàng)目,項(xiàng)目編號(hào)B2019285

作者簡(jiǎn)介:熊燕,女,副教授,湖北省武漢市武昌理工學(xué)院,人工智能學(xué)院。

猜你喜歡
時(shí)間
Spatial—Temporal Metaphor of“qian/hou”in Chinese and English
時(shí)間與空間:新聞采訪中無聲的語言
新聞愛好者(2016年9期)2016-11-15 19:32:34
時(shí)間消滅空間?
新聞界(2016年12期)2016-11-08 21:36:56
“時(shí)間”面前人人平等
湯姆?提克威影片的審美特征
主站蜘蛛池模板: 亚洲91在线精品| 四虎永久免费地址| 亚洲精品桃花岛av在线| 国产成人久久综合777777麻豆| 精品无码一区二区三区电影| 一级一级一片免费| 亚洲无码高清视频在线观看| 全部免费毛片免费播放| 国产精品成人免费综合| 亚洲国产天堂久久综合226114| 日韩天堂在线观看| 国产乱子伦一区二区=| 国产精品内射视频| 成人一级黄色毛片| 国产成人高清精品免费| 91精品专区国产盗摄| 国产精品专区第1页| 国产真实乱了在线播放| 久久人人97超碰人人澡爱香蕉| 免费观看精品视频999| 天天躁夜夜躁狠狠躁图片| 国产亚洲精品yxsp| 一级成人欧美一区在线观看 | 国产无码精品在线播放| 亚洲人成网站日本片| 亚洲国产AV无码综合原创| 欧美黄网站免费观看| 久久人人爽人人爽人人片aV东京热 | 国产日韩欧美在线播放| 色网在线视频| 国产女人在线视频| 无码福利视频| 欧美色伊人| 成人午夜视频网站| 免费在线看黄网址| 丰满的熟女一区二区三区l| 久久精品人妻中文系列| 欧美高清三区| a在线亚洲男人的天堂试看| 黄色三级网站免费| 精品伊人久久久香线蕉| 四虎永久免费在线| 91福利免费| 狠狠色丁婷婷综合久久| 亚洲中文字幕日产无码2021| 极品国产在线| 亚洲最黄视频| 亚洲浓毛av| 粉嫩国产白浆在线观看| 久久人人97超碰人人澡爱香蕉 | 国产香蕉在线视频| 91精品情国产情侣高潮对白蜜| 五月激激激综合网色播免费| 成人综合在线观看| 日韩a级毛片| 国产美女精品在线| 精品国产电影久久九九| 日韩 欧美 国产 精品 综合| 久久久久中文字幕精品视频| 国产精品亚洲αv天堂无码| 国产高清色视频免费看的网址| 精品人妻一区无码视频| 波多野结衣一区二区三区四区| 亚洲视频无码| 19国产精品麻豆免费观看| 91亚洲视频下载| 精品亚洲欧美中文字幕在线看| 久久久久国产一级毛片高清板| 国产a网站| 久久综合婷婷| 日韩黄色精品| 亚洲男人天堂久久| 97在线公开视频| 99在线观看精品视频| 欧美高清视频一区二区三区| 三级欧美在线| 香蕉久久永久视频| 天堂在线www网亚洲| 国产欧美视频综合二区| 亚洲天堂免费观看| 毛片基地美国正在播放亚洲| 四虎永久在线|