999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于主成分分析模型評價和諧宜居城市建設(shè)

2020-07-18 16:18:42趙藝然

趙藝然

摘 要:《國家新型城鎮(zhèn)化規(guī)劃(2014—2020)》、中央城市工作會議、十三五規(guī)劃綱要等均明確指出要提高城市發(fā)展宜居性,并把建設(shè)和諧宜居城市作為城市發(fā)展的主要目標(biāo)。本文從社交網(wǎng)絡(luò)上收集到的北京市2015年到2018年與和諧宜居相關(guān)的評論為基礎(chǔ),構(gòu)建情感分析模型和主成分分析模型,得出影響居民對“和諧宜居”主觀感受的主要因素,進(jìn)一步了解北京市在建設(shè)中需要加以改進(jìn)或修正的方面。

關(guān)鍵詞:情感分析;主成分分析;和諧宜居城市建設(shè)

一、引言

十八大以來,我國政府高層決策相繼把建設(shè)和諧宜居城市提升到前所未有的戰(zhàn)略高度,《國家新型城鎮(zhèn)化規(guī)劃(2014—2020)》、中央城市工作會議、十三五規(guī)劃綱要等均對建設(shè)和諧宜居城市作出專門論述,明確指出要提高城市發(fā)展宜居性,并把建設(shè)和諧宜居城市作為城市發(fā)展的主要目標(biāo)。

本文確定了與和諧宜居城市建設(shè)有關(guān)的44類關(guān)鍵詞,再從社交網(wǎng)絡(luò)上收集北京市2015年到2018年帶有這些關(guān)鍵詞的評論,構(gòu)建情感分析模型和主成分分析模型,分析影響居民對“和諧宜居”主觀感受的主要因素,進(jìn)一步了解在建設(shè)中需要加以改進(jìn)或修正的方面。

二、基于情感分析模型的居民評價模型構(gòu)建

(一)數(shù)據(jù)清洗預(yù)處理

中文分詞是中文類型的自然語言處理的第一個階段,也是必不可少的階段。中文的句意是由詞語組成的,分詞的意義在于將中文詞語分成一個個有效的,符合句意的詞語,本文采用pkuseg模塊進(jìn)行分詞。由于居民評論中經(jīng)常含有一些助詞、語氣詞、表情符號或者“回復(fù)”等詞,這些詞語沒有具體的含義,也沒有明確的感情傾向,所以將這些詞作為停用詞。如果分詞結(jié)果中含有停用詞,則刪除該停用詞。同時為了衡量評論內(nèi)容與評論目標(biāo)之間的關(guān)聯(lián)程度,去除無意義的評論,本文計(jì)算了評論內(nèi)容與關(guān)鍵詞之間的余弦相似度,去除相似度為0的評論。

(二)評論文本情感分析建模

通過預(yù)訓(xùn)練TextCNN情感分類模型,對清洗完畢的數(shù)據(jù)進(jìn)行情感分類,同時為了能夠表達(dá)評論語句的強(qiáng)烈程度,使用情感詞典對文本的情感極度進(jìn)行標(biāo)記。本文通過對微博情感200萬條數(shù)據(jù)集進(jìn)行情感分類訓(xùn)練模型,使用該模型對數(shù)據(jù)預(yù)處理后的評論文本進(jìn)行分類,其數(shù)據(jù)輸入為評論文本,輸出為積極/消極的概率以及情感極度。選擇CBOW模型作為詞向量模型,采用FastText工具對該詞向量進(jìn)行復(fù)現(xiàn)。CBOW模型是一個兩層結(jié)構(gòu), CBOW模型沒有隱含層, 通過上下文來預(yù)測中心詞, 并且拋棄了詞序信息。

輸入層: n個節(jié)點(diǎn),上下文共2m個詞的詞向量的平均值;

輸入層到輸出層的連接邊:輸出詞矩陣;

輸出層: 個節(jié)點(diǎn)。第i個節(jié)點(diǎn)代表中心詞是詞的概率

首先, 將中心詞wt的上下文ct:wt-m, ..., wt-1, wt+1, ...wt+m轉(zhuǎn)成輸入詞向量xt+j:

進(jìn)而將上下文的輸入詞向量wt-m, ..., wt-1, wt+1, ...wt+m求平均值, 作為模型輸入:

(1)

輸出層采用softmax作為激活函數(shù), 用logloss作為損失函數(shù), 利用梯度下降帶入訓(xùn)練數(shù)據(jù)訓(xùn)練詞向量, 文本中所有詞向量存在于矩陣中。其訓(xùn)練網(wǎng)絡(luò)圖如下:

TextCNN 是利用卷積神經(jīng)網(wǎng)絡(luò)對文本進(jìn)行分類的算法,2014年由 Yoon Kim在 《Convolutional Neural Networks for Sentence Classification》一文中提出。TextCNN的核心點(diǎn)在于可以捕獲信息的局部相關(guān)性,具體到文本分類任務(wù)中可以利用CNN來提取句子中類似N-Gram的關(guān)鍵信息,使用不同尺寸的kernel_size來模擬語言模型中的N-Gram,提取句子中的信息。

三、基于主成分分析模型確定影響居民主觀感受的主要因素

主成分分析法(PCA)是模式識別中的一個線性監(jiān)督分析法,主要是基于變量協(xié)方差矩陣對原始信息進(jìn)行壓縮和提取處理。PCA 是將多元的信息線性變換(降維、簡化、重排)為少數(shù)的幾個綜合信息(主成分),不僅保留了原始數(shù)據(jù)中的主要信息,而且可以將降維轉(zhuǎn)換后的特征向量線性分類。

首先,將上文確定出的44類關(guān)鍵詞作為指標(biāo),由于這44類指標(biāo)都具有三個屬性,分別為表現(xiàn)為積極情感的概率,表現(xiàn)為消極情感的概率,情感的極性,為了處理成單屬性格式,本文通過下面公式進(jìn)行數(shù)據(jù)聚合,將三列屬性合并為單特征,公式如下:

(2)

其中和表示準(zhǔn)確率,表示關(guān)鍵詞聚合特征,表示評論為消極的概率,表示評論為積極的概率,表示情感極性。

接著使用SPSS進(jìn)行主成分分析。

求出的 KMO 值為0.915,說明可以采用主成分因子分析法。同時Bartlett 的球形度檢驗(yàn)的顯著性值為 0,說明數(shù)據(jù)的統(tǒng)計(jì)顯著性非常強(qiáng)。

將44個特征輸入,得到主成分分析的解釋總方差,

根據(jù)圖3以及表2主成分提取分析表,特征值在第10個主成分開始收斂,而在第10個主成分的累計(jì)貢獻(xiàn)率定為 85%,因此選取10個主成分作為特征模型。

初始因子載荷矩陣中的數(shù)據(jù)除以主成分相對應(yīng)的特征值開平方根便得到每個主成分中每個指標(biāo)所對應(yīng)的系數(shù),即特征向量。以每個主成分所對應(yīng)的特征值占所提取主成分總的特征值之和的比例作為權(quán)重,可得到主成分綜合模型,根據(jù)主成分綜合模型系數(shù)排序最終可以得到因子重要性排序如表3所示:

根據(jù)表3可以發(fā)現(xiàn),在居民的主觀感受中,空氣質(zhì)量、收入水平與高精尖這三個成為重要性最為突出,是最為影響居民對“和諧宜居”主觀感受的關(guān)鍵因素,在因子重要性排名前20的指標(biāo)可以看出,居民的主觀感受更多是切實(shí)關(guān)系到衣食住行一些指標(biāo),例如水質(zhì),房價等指標(biāo)。因此,影響居民對“和諧宜居”主觀感受的關(guān)鍵因素更多是切實(shí)關(guān)系到居民的生活的因素。

要將北京建設(shè)成為和諧宜居之都需要結(jié)合民眾切實(shí)的主觀感受。為有效提高民眾對和諧宜居的主觀感受,合理規(guī)劃北京市城市建設(shè),需要做到以下幾個方面:第一,注重城市的生態(tài)環(huán)境建設(shè),使城市生態(tài)環(huán)境均衡、和諧發(fā)展,實(shí)現(xiàn)低耗能、低污染;第二,在居民意識方面,糾正居民的發(fā)展觀念,充分宣傳宏觀指標(biāo)的重要性,在照顧到民眾的切實(shí)利益方面也要考慮到展示城市軟實(shí)力的一些指標(biāo)。

參考文獻(xiàn)

[1] Xu Sun,Houfeng Wang,Wenjie Li.Fast Online Trainingwith Frequency-Adaptive Learning Rates for Chinese WordSegmentation and New Word Detection. Proceedings ofACL.253-262. 2012.

[2] 微博情感200萬條公開數(shù)據(jù)集https://download.csdn.net/download/turkan/9181661

[3] Li J,Jing L, Fu X, et al.Learning distributed wordrepresentation with multi-contextual mixed embedding[J].Knowledge-Based Systems,2016(106):220-230.

[4] 劉春磊,武佳琪,檀亞寧.基于TextCNN的用戶評論情感極性判別[J].電子世界,2019(3):48,50.

[5] 米碩,孫瑞彬,李欣,明曉.基于循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)和卷積神經(jīng)網(wǎng)絡(luò)(CNN)對電子郵件的作者識別[J].科技創(chuàng)新與應(yīng)用,2018(10):24-25.

[6] Kim Y.Convolutional Neural Networks for SentenceClassification[J]. Eprint Arxiv,2014.

[7] 孟令爽,唐德善,史毅超.基于主成分分析法的城市人水和諧度評價[J].水資源與水工程學(xué)報,2018,29(1):93-98.

[8] 孟令爽,唐德善,史毅超.基于主成分分析法的用水效率評價[J].人民長江,2018,49(5):36-40.

[9] 周洋,侯淑婧,宗科.基于主成分分析方法的生態(tài)經(jīng)濟(jì)效益評價[J].統(tǒng)計(jì)與決策,2018,34(1):66-69.

主站蜘蛛池模板: 91成人在线观看| 超碰aⅴ人人做人人爽欧美| 欧美成人看片一区二区三区 | 久久美女精品| 午夜啪啪网| 丁香五月激情图片| 国产在线视频自拍| 婷婷六月激情综合一区| 乱系列中文字幕在线视频| 久久窝窝国产精品午夜看片| 久久久久久高潮白浆| 四虎成人精品| 国产精品 欧美激情 在线播放| 呦视频在线一区二区三区| 99草精品视频| 国产精品三级专区| 欧美色视频日本| 国产欧美在线| 精品无码一区二区三区电影| 亚洲国产综合精品一区| 免费在线成人网| 亚洲国产成熟视频在线多多| 免费毛片在线| 亚洲国产清纯| 国产成人精品视频一区视频二区| 亚洲美女操| 超薄丝袜足j国产在线视频| a亚洲视频| 精品免费在线视频| 在线欧美一区| 最新国产网站| 日韩精品免费在线视频| 国产精品99久久久| 在线观看视频一区二区| 久久特级毛片| 色网站在线免费观看| 国产精品极品美女自在线| 日本免费a视频| 国产手机在线观看| 97国内精品久久久久不卡| 日韩成人午夜| 欧美日韩亚洲综合在线观看| 欧美视频在线第一页| 国产成人精品优优av| 操美女免费网站| 亚洲成人手机在线| 毛片三级在线观看| 免费无码网站| 国产区免费| 国产毛片久久国产| 国产xx在线观看| 午夜视频www| 亚洲区视频在线观看| 欧美啪啪精品| 亚洲二三区| 亚洲天堂久久久| 国产日韩欧美一区二区三区在线| 国产亚洲精| 91福利一区二区三区| 人妻精品久久无码区| 中文字幕资源站| 久99久热只有精品国产15| 伊人久久青草青青综合| 91色在线观看| 国产精品开放后亚洲| 一级一级一片免费| 亚洲视频色图| 99精品福利视频| 全部免费毛片免费播放| 欧美一区二区三区国产精品| 国产办公室秘书无码精品| 国产黄网永久免费| 久久香蕉国产线| 伊人久久大香线蕉aⅴ色| 高清免费毛片| 亚洲伦理一区二区| 国产jizzjizz视频| 亚洲视频影院| av尤物免费在线观看| 国产福利小视频高清在线观看| 国内精品久久人妻无码大片高| 亚洲码一区二区三区|