999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

應(yīng)用數(shù)據(jù)挖掘技術(shù)優(yōu)化東陽公共自行車系統(tǒng)研究

2017-03-22 14:36:50謝小蘭彭亞發(fā)
商情 2017年1期
關(guān)鍵詞:數(shù)據(jù)挖掘

謝小蘭+彭亞發(fā)

【摘要】根據(jù)東陽市公共自行車各站點(diǎn)間的自流動(dòng)性的特點(diǎn),借助于成熟的回歸分析方法,提出了迭代回歸模型。通過挖掘城市公共自行車系統(tǒng)中的原始數(shù)據(jù),依據(jù)公共自行車需求與用地類型,居住人口和建筑面積等相關(guān)變量,利用多元回歸分析法確定統(tǒng)計(jì)數(shù)據(jù)與自行車投放預(yù)測量間近似的函數(shù)關(guān)系,再通過若干次迭代提高預(yù)測精度,以達(dá)到更準(zhǔn)確的預(yù)測站點(diǎn)投放自行車的數(shù)量。迭代回歸模型不僅能夠有效預(yù)測并改善目前公共自行車站點(diǎn)的投放數(shù)量需求,同時(shí)能夠?qū)Τ醮卧O(shè)置公共自行車站點(diǎn)的城市提供投放依據(jù),在滿足城市居民低碳出行需求的同時(shí)節(jié)約資源,具有一定的實(shí)用價(jià)值與現(xiàn)實(shí)意義。

【關(guān)鍵詞】數(shù)據(jù)挖掘;公共自行車;回歸模型

1引言

當(dāng)前,城市大氣污染和交通擁堵問題日益嚴(yán)峻,汽車排放的尾氣已經(jīng)成為影響城市空氣質(zhì)量的最主要因素。而城市公共自行車能夠在很大程度上緩解這一問題,城市公共自行車系統(tǒng)作為大眾運(yùn)輸?shù)闹匾M成部分,在短程接駁、站間換乘以及休閑旅游中發(fā)揮著巨大的作用,因?yàn)樵诔鞘卸叹嚯x的空間,騎自行車出行很顯然是一種低碳環(huán)保的方式。東陽市公共自行車系統(tǒng)服務(wù)項(xiàng)目自2014年11月第一期運(yùn)營以來,受到市民的廣泛關(guān)注,據(jù)了解,東陽從一期公共自行車投入運(yùn)營以來到目前,已辦理公共自行車租賃功能的公交IC卡1.2萬余張,自行車租用量累計(jì)40余萬人次。二期投入運(yùn)營后,東陽市公共自行車租賃點(diǎn)累計(jì)達(dá)到135個(gè),公共自行車投放累計(jì)達(dá)3000輛。但是,隨著市民對公共自行車的需求量不斷的增大,東陽市公共自行車系統(tǒng)在運(yùn)行過程中逐漸出現(xiàn)站點(diǎn)規(guī)模等級化程度不高。站點(diǎn)的分布規(guī)模不成層次系統(tǒng),出現(xiàn)有的站點(diǎn)利用率不高,閑置太多車輛,造成資源浪費(fèi),而有的站點(diǎn)租車換車緊張的現(xiàn)象;各站點(diǎn)內(nèi)鎖樁數(shù)量的設(shè)置趨于經(jīng)驗(yàn)化,各站點(diǎn)投放公共自行車數(shù)量經(jīng)驗(yàn)化主要體現(xiàn)在投放模式比較單一粗放,沒有充分的考慮站點(diǎn)之間的不同所造成的不同需求。公共自行車投放數(shù)量的不科學(xué)造成部分站點(diǎn)內(nèi)的自行車供不應(yīng)求,而也有不少站點(diǎn)的自行車供大于求,達(dá)不到資源優(yōu)化配置的效果,不能為城市人群提供更好的服務(wù),因此,如何合理高效的優(yōu)化城市公共自行車服務(wù)系統(tǒng)已成為當(dāng)下亟待解決的問題。

因此,利用迭代回歸模型對東陽市公共自行車系統(tǒng)進(jìn)行優(yōu)化,可以依托于租賃點(diǎn)日常自行車借出情況的詳細(xì)統(tǒng)計(jì)數(shù)據(jù),租賃點(diǎn)所在地區(qū)的土地利用情況,居民人口數(shù)量和建筑面積的數(shù)據(jù),建立迭代多元回歸模型來求解租賃點(diǎn)自行車投放數(shù)量,通過迭代循環(huán)近似求解出租賃點(diǎn)公共自行車的投放量。迭代回歸模型在公共自行車系統(tǒng)優(yōu)化中的應(yīng)用研究,可以預(yù)測數(shù)據(jù)來源于東陽市公共自行車系統(tǒng)對站點(diǎn)每日不同時(shí)段的自行車租借人次與周轉(zhuǎn)率的準(zhǔn)確統(tǒng)計(jì),數(shù)據(jù)準(zhǔn)確可靠,預(yù)測采用回歸分析法與迭代法相結(jié)合方法,逐步逼近實(shí)際需求,回歸分析法基于觀測數(shù)據(jù)與影響范圍內(nèi)的土地利用建立適當(dāng)?shù)淖兞恳蕾囮P(guān)系,以分析數(shù)據(jù)內(nèi)的關(guān)系,迭代法則保證了預(yù)測數(shù)據(jù)與實(shí)際需求的盡可能的接近,兩種方法的結(jié)合保障了預(yù)測方法的科學(xué)與精確,從而確保了模型較高的可靠性。

2東陽公共自行車數(shù)據(jù)再處理分析

數(shù)據(jù)挖掘需要處理大量的數(shù)據(jù),這些數(shù)據(jù)都會(huì)存儲(chǔ)在公共自行車服務(wù)系統(tǒng)數(shù)據(jù)庫中,但這些原始的數(shù)據(jù)沒有經(jīng)過預(yù)處理分析統(tǒng)計(jì)是不適合直接挖掘,需要對原始數(shù)據(jù)進(jìn)行有針對性的篩選、轉(zhuǎn)換和消除一些冗余數(shù)據(jù)等,因?yàn)閿?shù)據(jù)預(yù)處理工作是否到位直接影響著挖掘算法是否高效。

以東陽市公共自行車服務(wù)系統(tǒng)中提供的原始數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析。首先應(yīng)將數(shù)據(jù)表進(jìn)行分別統(tǒng)計(jì)分析,統(tǒng)計(jì)公共自行車服務(wù)系統(tǒng)中每天所有站點(diǎn)的借車頻次和還車頻次,對有異常的數(shù)據(jù),利用統(tǒng)計(jì)判別法給予剔除,并按累計(jì)的借車頻次和還車頻次分別給出排序,同時(shí),統(tǒng)計(jì)分析出每次用車時(shí)長的分布情況。通過數(shù)據(jù)分析,結(jié)合繪制的圖形進(jìn)行描述統(tǒng)計(jì)。統(tǒng)計(jì)借車頻次最高和還車頻次最高的站點(diǎn),需根據(jù)相關(guān)數(shù)據(jù)進(jìn)行逐一統(tǒng)計(jì),并綜合統(tǒng)計(jì)數(shù)據(jù)統(tǒng)計(jì)每張借車卡累計(jì)借車次數(shù),同時(shí)根據(jù)統(tǒng)計(jì)數(shù)據(jù)分析分布情況。另外,需要定義兩個(gè)站點(diǎn)之間的距離為從某一站點(diǎn)借車到另一站點(diǎn)還車所用的最短時(shí)長,由此,從數(shù)據(jù)中可以得到一些基本站點(diǎn)之間的距離,對于不能從數(shù)據(jù)中讀取的兩個(gè)站點(diǎn)間的距離可以應(yīng)用算法進(jìn)行求解。

公共自行車的原始數(shù)據(jù)都是數(shù)據(jù)挖掘技術(shù)的必要準(zhǔn)備數(shù)據(jù),數(shù)據(jù)的準(zhǔn)確度將直接影響公共自行車服務(wù)系統(tǒng)優(yōu)化模型的構(gòu)建。對于公共自行車站點(diǎn)與鎖樁數(shù)量設(shè)置效果的評定,數(shù)據(jù)處理分析的準(zhǔn)確度將對優(yōu)化模型的構(gòu)建產(chǎn)生直接的影響,因此對于關(guān)鍵數(shù)據(jù)要進(jìn)行再處理和精確分析。假如某個(gè)站點(diǎn)的自行車?yán)寐矢撸柢嚭瓦€車的頻次相協(xié)調(diào),那么這個(gè)站點(diǎn)設(shè)置的很成功,就要對這類數(shù)據(jù)進(jìn)行分析保存。對一些站點(diǎn)自行車?yán)寐什桓撸瑪?shù)據(jù)沒有明顯變化,那么可以取平均值為衡量標(biāo)準(zhǔn),利用相關(guān)原始數(shù)據(jù)統(tǒng)計(jì)分析歸納最終可得到68個(gè)樣本,截取部分?jǐn)?shù)據(jù)如表1所示。

表1公共自行車站點(diǎn)布置情況統(tǒng)計(jì)表(部分)

站點(diǎn)

ID主要

對象

性質(zhì)區(qū)域?qū)ο蟮?/p>

經(jīng)濟(jì)水平站點(diǎn)區(qū)

域類別住宅

距離商場區(qū)

距離附近

站點(diǎn)人流量站點(diǎn)

鎖樁

密度站點(diǎn)

設(shè)置

效果

等級Z001外地人低商場區(qū)近近少大不GOODZ003本地人高高級宅區(qū)較近近無大不MID3迭代模型的建立與回歸方法的求解

回歸分析法從被測變量和與它有關(guān)的解釋變量間的因果關(guān)系出發(fā),通過建立回歸分析模型,預(yù)測對象未來發(fā)展的一種定量方法。通常處在一個(gè)系統(tǒng)中的各種變量可以有兩種關(guān)系即函數(shù)關(guān)系和相關(guān)關(guān)系。當(dāng)事物之間具有確定關(guān)系時(shí),則變量之間表現(xiàn)為某種函數(shù)關(guān)系。另外有些事物,比如租賃點(diǎn)投放自行車數(shù)量與土地利用類型,周邊一定范圍居住人口數(shù)量和有效建筑面積之間,雖然有著密切的聯(lián)系,但并不能準(zhǔn)確的用某一函數(shù)關(guān)系式確定投放數(shù)量與三者間的關(guān)系,稱這類事物之間具有相關(guān)關(guān)系。

通過比較現(xiàn)有預(yù)測模型的缺陷,從而提出迭代回歸模型的有效性和可靠性。回歸分析法從被測變量和與它有關(guān)的解釋變量間的因果關(guān)系出發(fā),通過建立回歸分析模型,預(yù)測對象未來發(fā)展的一種定量方法。通常處在一個(gè)系統(tǒng)中的各種變量可以有兩種關(guān)系即函數(shù)關(guān)系和相關(guān)關(guān)系。當(dāng)事物之間具有確定關(guān)系時(shí),則變量之間表現(xiàn)為某種函數(shù)關(guān)系。另外有些事物,比如站點(diǎn)投放自行車數(shù)量與土地利用類型,周邊一定范圍居住人口數(shù)量和有效建筑面積之間,雖然有著密切的聯(lián)系,但并不能準(zhǔn)確的用某一函數(shù)關(guān)系式確定投放數(shù)量與三者間的關(guān)系,稱這類事物之間具有相關(guān)關(guān)系。迭代回歸模型的建模要立足金華市范圍內(nèi)設(shè)置的所有自行車站點(diǎn),每個(gè)站點(diǎn)的投放數(shù)量上必然存在供不應(yīng)求與供大于求的情況,也必然存在一部分運(yùn)作良好,供需平衡的站點(diǎn)。這些供需平衡的站點(diǎn)的自行車投放數(shù)量必然與周邊包括土地利用類型,居住人口數(shù)量和建筑面積等等條件相適應(yīng),即投放數(shù)量與周邊條件之間具有的這種確定的關(guān)系,投放數(shù)量是多種相關(guān)因素的函數(shù),滿足一定的近似函數(shù)關(guān)系式。具體算法分析如下。

首先以屬性P進(jìn)行假設(shè),假設(shè)正例集的個(gè)數(shù)為x個(gè),反例集的個(gè)數(shù)為y個(gè),那P的信息量為Ix,y=-xx+ylog2xx+y-yx+ylog2yx+y,E(P)為EP=∑ki=1mi+nix+yEPi

其中EPi=-mimi+nilog2mimi+ni-nimi+nilog2nimi+ni。設(shè)r=mi-nimi+ni;則EPi=1+r2log21+r2+1-r2log21-r2=1+r2ln2ln(1+r)+1-r2ln2ln(1-r)-1。把ln(1+x)和ln(1-x)展開,則EPi=1+r2ln2∑∞n=1(-1)n-1rnn-1-r2ln2∑∞n=1rnn-1=…=1ln2∑∞n=1r2n2n(2n-1)-1

根據(jù)公式推出EPi=1ln2(r22+r412+r630+r856+…)-1代入上式計(jì)算出誤差在0.1以內(nèi)并推出EP≈∑ki=1mi+nix+y[1-0.72*r2]。為了克服算法以非最優(yōu)屬性作為新節(jié)點(diǎn)的缺點(diǎn),在算法中設(shè)置一個(gè)權(quán)值J,設(shè)屬性P有a種值,則J=1/a。將屬性P的信息增益公式G(P)=I(x,y)-EP改為G′(P)=[I(x,y)-∑ki=1mi+nix+y(1-0.72*r2)]1a。

4總結(jié)

立足東陽市公共自行車各站點(diǎn)間的自流動(dòng)性的特點(diǎn),借助于數(shù)據(jù)挖掘技術(shù)中成熟的回歸分析方法,提出了迭代回歸模型。通過挖掘公共自行車系統(tǒng)中的原始數(shù)據(jù),依據(jù)公共自行車需求與用地類型,居住人口和建筑面積等相關(guān)變量,利用多元回歸分析法確定統(tǒng)計(jì)數(shù)據(jù)與自行車投放預(yù)測量間近似的函數(shù)關(guān)系,再通過若干次迭代提高預(yù)測精度,以達(dá)到更準(zhǔn)確的預(yù)測站點(diǎn)投放自行車的數(shù)量。迭代回歸模型不僅能夠有效預(yù)測并改善目前公共自行車站點(diǎn)的投放數(shù)量需求,同時(shí)能夠?qū)Τ醮卧O(shè)置公共自行車站點(diǎn)或增加站點(diǎn)的城市提供投放依據(jù),在滿足金華市居民低碳出行需求的同時(shí)節(jié)約資源。

基金項(xiàng)目:

本文為2016浙江廣廈建設(shè)職業(yè)技術(shù)學(xué)院“應(yīng)用數(shù)據(jù)挖掘技術(shù)優(yōu)化東陽公共自行車系統(tǒng)研究”的研究成果,課題編號:16ZR011。

猜你喜歡
數(shù)據(jù)挖掘
基于數(shù)據(jù)挖掘的船舶通信網(wǎng)絡(luò)流量異常識別方法
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
數(shù)據(jù)挖掘技術(shù)在打擊倒賣OBU逃費(fèi)中的應(yīng)用淺析
基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
電力與能源(2017年6期)2017-05-14 06:19:37
數(shù)據(jù)挖掘技術(shù)在中醫(yī)診療數(shù)據(jù)分析中的應(yīng)用
一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
數(shù)據(jù)挖掘在高校圖書館中的應(yīng)用
數(shù)據(jù)挖掘的分析與探索
河南科技(2014年23期)2014-02-27 14:18:43
基于GPGPU的離散數(shù)據(jù)挖掘研究
利用數(shù)據(jù)挖掘技術(shù)實(shí)現(xiàn)LIS數(shù)據(jù)共享的開發(fā)實(shí)踐
主站蜘蛛池模板: 国产一区二区人大臿蕉香蕉| 日韩精品久久久久久久电影蜜臀| 久久99精品国产麻豆宅宅| 国产无码高清视频不卡| 国产精品林美惠子在线观看| 91外围女在线观看| 国产丝袜啪啪| 国产美女一级毛片| 亚洲AV免费一区二区三区| 香蕉伊思人视频| 情侣午夜国产在线一区无码| 精品视频一区二区三区在线播| 风韵丰满熟妇啪啪区老熟熟女| 日本不卡视频在线| 国产乱人伦偷精品视频AAA| 国产综合日韩另类一区二区| 高h视频在线| 国产精品观看视频免费完整版| 999福利激情视频| 2021国产v亚洲v天堂无码| 国产91久久久久久| 亚洲天堂777| 免费国产小视频在线观看| 日韩天堂在线观看| 亚洲av日韩综合一区尤物| 91色老久久精品偷偷蜜臀| 久爱午夜精品免费视频| 波多野结衣久久高清免费| 3p叠罗汉国产精品久久| 国产va在线观看| 福利在线不卡一区| 国产本道久久一区二区三区| 成人伊人色一区二区三区| 亚洲天堂高清| 中文字幕在线欧美| 久久免费精品琪琪| 国产视频a| 凹凸精品免费精品视频| 在线观看国产精美视频| 天堂岛国av无码免费无禁网站 | 国产一二视频| AV熟女乱| 欧美日韩第二页| 91福利一区二区三区| 欧美有码在线| 成人午夜天| 日韩精品无码不卡无码| 国产精品片在线观看手机版| 亚洲欧美日韩成人高清在线一区| 青青操国产视频| 污污网站在线观看| 中国黄色一级视频| 污污网站在线观看| 亚洲第一在线播放| 欧美性色综合网| 亚洲精品无码AV电影在线播放| 97人妻精品专区久久久久| 一本一道波多野结衣一区二区 | 精品视频一区二区观看| 欧美在线精品怡红院| 国产jizz| 日韩美毛片| 在线播放国产99re| 高清无码不卡视频| A级毛片高清免费视频就| 亚洲精品高清视频| P尤物久久99国产综合精品| 小说区 亚洲 自拍 另类| 老司机精品久久| 99精品伊人久久久大香线蕉 | 国产美女视频黄a视频全免费网站| 欧美日韩va| 国产系列在线| 亚洲国产天堂久久综合| 亚洲天堂在线免费| 精品视频在线一区| 免费国产小视频在线观看| 中文字幕有乳无码| 亚洲成人动漫在线观看| 国产女人在线视频| 日本一区二区三区精品国产| 欧美一级一级做性视频|