999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

撫州市行業高熱區塊空間分布特征聚類

2020-11-09 07:27:45郭名靜熊鑫戴雅婷
合作經濟與科技 2020年21期
關鍵詞:數據挖掘

郭名靜 熊鑫 戴雅婷

[提要] 針對城市行業空間布局研究中對重點區塊探知問題,以江西省撫州市城區行業經營點為研究對象,利用新浪微博的網絡簽到位置數據,基于數據挖掘中的聚類分析方法,通過優化基于密度聚類算法,對城市的餐飲、娛樂和購物三個主要服務行業的高熱重點區塊實現直接聚類提取,解決從多維空間數據中挖掘城市行業空間分布特征的問題。具體的優化算法是利用多維簽到位置數據中的非位置屬性計算權重系數,修正判定數據點分類的相似度函數,構建加權密度聚類算法抽取城市行業的高熱區塊。綜合三個服務行業的聚類提取結果,歸納出城市行業分布特征。仿真結果表明:多維空間數據的加權密度聚類算法可以較好地實現對城市行業空間特征的直接提取,抽取得到的重點區塊具有明顯的高熱特性。基于聚類提取結果的行業重點區塊特征分析能更合理地反映城市行業發展狀況,也可以為城市管理者研究行業布局提供科學決策的重要參考依據。

關鍵詞:城市空間特征;數據挖掘;空間數據;聚類分析;行業布局

基金項目:撫州市2019年社會科學規劃項目(19SK02);國家自然科學基金項目(41576105,41604010)

中圖分類號:F292 文獻標識碼:A

收錄日期:2020年7月28日

一、引言

服務業是現代城市眾多行業的重要組成,是在物資生產和商品交換的發展過程中,伴隨著商業的產生而出現,以餐飲、娛樂、購物等行業為具體表現。隨著城市地域范圍的擴大、城市經濟社會生活的日漸繁榮和城市居民數量的日益增多,現代城市的經濟活動與服務業之間的聯系日趨緊密,并表現出與城市居民生活質量息息相關的態勢。因此,通過對一個城市服務業空間分布格局的研究,不僅可以服務于商家和配套設施的合理選址,還可以輔助城市規劃和管理決策,甚至對于城市重大公共安全事件的科學預測都具有重要的參考價值。

服務業活動一般都具有廣泛性、綜合性、分散性和地域性的特點。具體來說,服務業因為提供的產品和商品種類繁多,表現出經營范圍廣泛。伴隨著消費者群體的分散存在和遷移,服務業一般都是分散經營。由于同一個地區的多個服務企業之間大多存在相互聯系,從而形成群體效應以發揮綜合服務能力。而且城市特有的地理條件和社會環境的差異又會影響服務業,使得不同城市的服務業又會具有濃郁的地方特色,即在共性中又具有較強的城市地域特征。基于上述基本特點,國內學術界對行業空間特征的相關研究以發現某具體行業在城市中的空間分布格局為主,研究方法大多是基于官方統計數據和問卷調研數據的統計分析和定性分析。這類方法對小數據是有用的,但隨著數據量不斷增大,這類方法反映數據全貌,可能出現解釋力不足和特征提取方法的普適性較差等問題。行業空間特征是土地、社會群體和經濟活動等多個城市要素相互作用的結果,因此迫切需要一種表征城市多源要素特征的多維大體量數據源,以數據驅動空間特征知識發現。

空間數據由屬性元素與地理位置相關聯,通常是時間和一些描述性屬性或實體屬性的數據與位置屬性共同構成,可以通過各種測量傳感器網絡、定位設施和以因特網為平臺的社交網絡獲取。近20年來,空間數據作為一種重要戰略基礎數據資源被越來越多地用于建立數學模型,以聚類、關聯分析算法和預測模型為代表的數據挖掘技術來探查大規模數據,自動發現數據中的信息和模式,識別對象的空間分布、位置關系并支持決策。對城市行業空間分布特征的研究屬于空間分布模式中的點群模式,一般是通過提取相似且相近的密集聚集點,常用的技術方法有均勻格網法和等值線法。但單元網格的大小和現狀常常影響邊界識別結果,密度估計帶寬選擇也比較困難。基于密度聚類方法(DBSCAN)是一類利用數據點群的空間聚類直接提取聚集模式的方法,在處理非規則空間數據時表現出了較好的適用性。但是,DBSCAN算法只利用數據點的位置屬性來計算數據點分類的相似度,沒有考慮其他描述性屬性,導致識別出的區塊的合理性較差,得到的行業布局特征與實際情況的吻合度較低。因此,本文通過構建加權聚類算法,利用非位置屬性變換得到權重系數,優化相似度函數公式,以實現結合數據點的位置屬性和非位置屬性提取行業中某些重要區塊的空間分布特征,從而增加對城市空間特征提取結果的科學性和可信度。

二、研究對象與方法

(一)空間數據集。撫州市位于江西省東部,全市人口418萬,地理位置為東經115°35′~117°18′,北緯26°29′~28°30′之間,轄1區10縣和1個高新技術產業園區,是長江中游城市群的重要成員之一。撫州市總面積1.88萬km2,南北長約222km,東西寬約169km。本文選用截至2014年11月份撫州市的新浪微博簽到數據共計1,948條,從中篩選出餐飲類商戶簽到記錄324條,娛樂休閑類商戶簽到記錄277條,商業購物類商戶221條,總共822條空間數據作為撫州市服務行業高熱區塊研究對象。表1列舉10條記錄示例數據集中包含的主要屬性。(表1)

在表1的“類別”屬性中,“food”標識餐飲業,“entertain”標識娛樂休閑業,“shop”標識購物商業。“簽到次數”屬性中的數值標識了該商家被消費者在新浪微博中網絡簽到打卡的次數,數值越高表明該商家受歡迎熱度越高,數值越低表明該商家受歡迎熱度越低。為了探知行業中受消費者關注熱度較高的商家的空間分布特征,因此界定行業高熱區塊需要滿足兩個條件:一是高熱區塊中數據點在地理位置上要相對聚集,即高熱區塊內數據點分布的密度較高;二是高熱區塊中數據點簽到次數屬性值要相對較大,即高熱區塊內的數據點表現出明顯的高熱特征。

(二)密度聚類算法。基于密度的DBSCAN算法可以發現稀疏數據點區域中的密集數據點,該算法利用相似度函數判定數據點的歸屬類,再根據密度相連原理提取數據點的最大集合,也叫做聚類簇。算法中判定數據點歸屬的相似度函數是基于歐幾里得距離(公式1),其中,位置數據集中數據點的位置坐標為(xi,yi),其中i=1,…,n,提取的聚類簇只能是滿足地理位置的高聚集分布,而沒有考慮數據點的簽到次數屬性。因此,對簽到次數屬性值做變換得到一個按照公式(2)計算權重系數的wj,其中j=1,…,n,實現對DBSCAN算法處理多維位置數據的優化目的。

顯而易見,wj取值范圍是(0,+1),且wj取值越接近+1說明數據點(xj,yj)的簽到次數越高,即該點簽到熱度越高,在與簇中心點(xi,yi)距離相等的條件下,則越可能被劃入簇中。由此變換算法相似度函數的距離計算公式如式(3)所示。其中,參數ω的取值根據權重系數wj的取值范圍而定。

三、聚類提取與驗證

(一)高熱區塊提取。從表1的空間數據集中按照餐飲、購物和娛樂休閑篩選出3個類的空間數據子集作為初始數據集。由公式(2)和(3)對每個數據子集計算權重系數wj,再加權密度聚類提取高熱區塊。利用Python3.7編輯程序做散點圖如圖1所示,圖示的坐標單位均為“°”。其中,設置參數ω的取值為1,密度聚類的區域半徑r取值為0.015,最小值MinP取值為10。(圖1)

在圖1中,3個行業各分布有1個高熱區塊,分別用符號“x”、“+”和“o”標識。區塊內數據點的詳細信息統計在表2中,每個高熱區塊中簽到次數最多的前幾個高熱點列表在表3中。(表2、表3)

(二)高熱特征檢驗。對高熱簽到點統計如表4所示,餐飲業的17個高熱簽到點是最多,而購物商業的377個簽到點是全部簽到點中最多。娛樂休閑業簽到點的全部簽到點和高熱區塊簽到點的簽到次數在3個行業里面都是最高,分別有9,145次和2,584次。從提取的區塊看,3個行業總共提取了47個高熱簽到點組成了3個高熱區塊,雖然在簽到點數目上高熱區塊的簽到點數據僅占全行業全部922個簽到點的5.1%。但產生了總計7,019次簽到,占全部簽到次數總和23,231次的30.21%。(表4、圖2)

根據帕累托定律,一個系統中最重要的只占其中小部分約20%,其余80%盡管是多數,卻是次要。雖然3個類別的高熱簽到點總數分別只占各類別全部簽到點總數的比率都只有5%左右,但這些簽到點的簽到次數卻占到各類別簽到點的簽到次數總和的30%以上,特別是購物商業類高熱區塊內簽到點的簽到次數的占比甚至高達36.94%,而該類的高熱區塊內簽到點數目在全行業占比僅為3.71%。因此,可以證明這47個高熱簽到點構成的3個簽到區塊確實是各行業類別的高熱區域,是值得重點關注的關鍵區域。

四、特征分析及建議

基于上述統計分析,可以歸納出該城市這3個行業空間分布特征如下:

(一)居民消費行業主體地位明顯。撫州市雖然只是一個地級城市,但因為其較為優越的地理位置和歷史沿革,主要城區中行業種類較為齊全。因為餐飲、商業購物和娛樂休閑業這3個行業在全部行業中簽到點總數1,948個中占比近50%,反映出該市居民消費類行業在整體上具有良好發展態勢。

(二)零售業是引領全市市場銷售平穩較快增長的主力軍。從聚類分析結果來看,撫州市的購物商業類簽到數據點是3個行業中最多的,購物業的高熱區塊的高熱簽到點的簽到次數在行業平均簽到次數和在全行業中的占比也都是3個行業中最高的,體現出了撫州市居民對于商業購物類消費的熱衷。特別是以馬家山文化商貿廣場和洪客隆百貨為代表的高熱簽到點的高簽到次數,也足以驗證零售業是社會消費品零售市場穩步增長的主導力量。但是,全市購物商業的高熱簽到點過于密集分布在唯一的高熱區塊中可能不利于全市居民銷費水平的進一步提高。拓展新的購物商圈的部署和建設,應該是城市相關部門管理者需要思考的問題。

(三)文化體育生活豐富。由表4數據,娛樂休閑類的簽到點不管是在全行業中,還是在高熱區塊中,所產生的簽到次數總和都是3個行業中最高的。雖然該類別簽到網點數目是3個行業中全行業簽到數據點數最少的,但這些簽到網點的平均簽到次數在全行業簽到點的數據統計中是最高的,在高熱區塊中的平均簽到次數也只是略低于排名第一的購物業,卻遠高于排名第三的餐飲業。特別是撫州市體育館以644次排名全市娛樂休閑業網點第一高的網絡簽到次數,主要得益于市政府在2014年的全民健身日、全民健身周和全民健身日,以及元旦、“三八”等節點組織開展的9,000余場次各種大中小型群眾體育活動,還有先后承辦的多場各級比賽,極大地促進了該市全民健身運動的廣泛開展。繼續增加城市中文化體育類場所網點應該是撫州市相關管理部門下一步建設目標。

(四)老城區的城市中心地位明顯。從高熱區塊地理位置屬性來看,3個行業基本都是重疊在撫州市的老城區,特別是沿撫州市的主干道贛東大道沿線,這主要是因為不同服務行業之間存在連帶配套的需求致使行業扎堆城市中心老城區布點。但是,從城市長遠發展來看,這種態勢有必要引起城市管理者的關注。例如,作為撫州市重要的文化網點的湯顯祖大劇院,雖然擁有344次的高簽到次數,卻沒有被提取到高熱區塊中。這一方面因為加權密度算法的參數設置的數據點歸屬判定條件的限制;另一方面也反映了在湯顯祖大劇院周圍缺乏配套的文體類娛樂網點的建設,無法實現文化圈的集群效應。

五、結語

行業空間分布特征分析對推動城市合理化布局具有重要研究意義。空間位置數據是一種典型的大數據,具有體積大、采集速度快、模態多樣和價值巨大等特征,是一種非常寶貴的新的戰略資源。通過對撫州市餐飲、購物和娛樂休閑這3個服務行業的空間數據的加權密度聚類,得到了行業高熱區塊分布位置和高熱點集,獲取了該市3個行業的主要空間分布特征,也發現了空間布局存在的問題,解決了傳統聚類算法單一利用位置屬性判定數據點分類的弊病,提高了聚類提取行業高熱區塊的合理性。研究結果表明,綜合多維空間數據的非位置屬性,可以更真實地反映城市行業布局特征,幫助管理者在城市規劃中科學決策,促進城市商業圈更好地發揮集群效應。

主要參考文獻:

[1]李芬,賴玉珮,劉悅.低碳生態城市的建設成效認知評價——基于城市管理者問卷調查[J].北京規劃建設,2013(6).

[2]張文忠,李業錦.北京市商業布局的新特征和趨勢[J].商業研究,2005(8).

[3]仵宗卿,柴彥威.論城市商業活動空間結構研究的幾個問題[J].經濟地理,2000(1).

[4]鄧羽,蔡建明,楊振山,等.北京城區交通時間可達性測度及其空間特征分析[J].地理學報,2012.67(2).

[5]段煉,黨蘭學,李銘,等.位置數據稀疏約束下的疑犯時空位置預測[J].鄭州大學學報(工學版),2018.39(5).

[6]龔希,陳占龍,謝忠.出租車軌跡數據的地域間移動模式分析[J].武漢大學學報(信息科學版),2018.43(10).

[7]谷巖巖,焦利民,董婷,等.基于多源數據的城市功能區識別及相互作用分析[J].武漢大學學報(信息科學版),2018.43(7).

[8]田晶,熊富全,程雪萍,等.道路密度分區及其在道路選取質量評價中的應用[J].武漢大學學報(信息科學版),2016.41(9).

[9]許澤寧,高曉路.基于電子地圖興趣點的城市建成區邊界識別方法[J].地理學報,2016.71(6).

[10]吳康敏,張虹鷗,王洋,等.廣州市多類型商業中心識別與空間模式[J].地理科學進展,2016.35(8).

猜你喜歡
數據挖掘
基于數據挖掘的船舶通信網絡流量異常識別方法
探討人工智能與數據挖掘發展趨勢
數據挖掘技術在打擊倒賣OBU逃費中的應用淺析
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
數據挖掘技術在中醫診療數據分析中的應用
一種基于Hadoop的大數據挖掘云服務及應用
數據挖掘在高校圖書館中的應用
數據挖掘的分析與探索
河南科技(2014年23期)2014-02-27 14:18:43
基于GPGPU的離散數據挖掘研究
利用數據挖掘技術實現LIS數據共享的開發實踐
主站蜘蛛池模板: 国产精品xxx| 欧美天天干| 欧美精品另类| 亚洲天堂啪啪| 国产高清又黄又嫩的免费视频网站| 亚洲精品国产精品乱码不卞| 99视频在线看| 丰满人妻久久中文字幕| 中文字幕无线码一区| 国产福利观看| 亚洲精品国产精品乱码不卞 | 色135综合网| 亚洲一区二区精品无码久久久| 日韩精品高清自在线| 日韩专区欧美| 在线观看免费黄色网址| 久久国产精品麻豆系列| 免费看美女自慰的网站| 青草午夜精品视频在线观看| 国产精品无码久久久久AV| 久热这里只有精品6| 99视频有精品视频免费观看| 激情影院内射美女| 色综合色国产热无码一| 亚洲视频在线观看免费视频| 免费一看一级毛片| 波多野结衣一区二区三区四区 | 久久综合亚洲鲁鲁九月天| 午夜a视频| 精品综合久久久久久97超人| 蜜桃视频一区| 蝴蝶伊人久久中文娱乐网| 久久综合AV免费观看| 毛片一级在线| 538国产视频| 亚洲人成网站在线播放2019| 午夜不卡视频| 好紧太爽了视频免费无码| 精品久久久久成人码免费动漫 | 无码内射在线| 亚洲男人在线| 亚洲大尺码专区影院| 国产香蕉一区二区在线网站| 欧美精品高清| 久久婷婷五月综合色一区二区| 国产小视频a在线观看| 浮力影院国产第一页| 国产成人免费视频精品一区二区 | 亚洲综合天堂网| 91亚洲视频下载| 国产日产欧美精品| 538国产视频| 精品国产成人a在线观看| 欧美日韩理论| 国产00高中生在线播放| 成人在线视频一区| 71pao成人国产永久免费视频 | 国产高清在线丝袜精品一区| 亚洲系列中文字幕一区二区| 婷婷色一二三区波多野衣| 国产亚洲精品va在线| 久久国产精品无码hdav| 不卡午夜视频| 韩日无码在线不卡| 国产日韩久久久久无码精品| 国产一级精品毛片基地| 小蝌蚪亚洲精品国产| 99热最新网址| 国内精自线i品一区202| 国产传媒一区二区三区四区五区| 亚洲综合天堂网| 欧美乱妇高清无乱码免费| 2021国产精品自产拍在线| 国产成人免费观看在线视频| 成人福利在线看| 久久99久久无码毛片一区二区| 精品伊人久久久久7777人| 国产在线一区二区视频| 精品国产91爱| 亚洲区欧美区| 玖玖精品在线| 精品乱码久久久久久久|