999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

“大數據時代,朋友近在咫尺”

2018-01-24 18:17:07曹瑛典
中國科技教育 2017年8期
關鍵詞:用戶

曹瑛典

研究背景

在大數據時代,面臨數據海量、多樣性和價值稀疏性等特點,能不能用某種方法快速找到與自己興趣愛好相投的新朋友呢?能不能利用大數據分析解決潛在好友推薦的問題呢?

移動定位社交服務的出現為人們提供了一種全新的交友方式。這類應用通過將用戶的位置數據在地圖上可視化,讓用戶相互分享生活經歷,結交新的朋友。潛在好友和位置推薦作為移動定位社交服務中最重要的一個功能,已經被應用到很多交友軟件當中。但是,現有的一些交友軟件的推薦功能仍然存在不足,推薦的潛在好友很多在現實生活中沒有交集,與自己真正想要找到的朋友相差甚遠;微信通過“附近的人”這一功能向用戶推薦潛在好友,但該方法只是根據用戶之間的距離遠近進行推薦,找到的所謂“好友”與用戶往往沒有相同的興趣愛好。

現有推薦方案的問題

現有的一些潛在好友及位置推薦系統主要局限于用戶的網絡行為。這些研究的注意力主要集中在用戶的網絡行為上,卻忽略了用戶在現實世界中的位置等信息。與網絡行為相比,用戶的現實行為更能體現出用戶的喜好和社會屬性。通過對比現有社交應用軟件的潛在好友及位置推薦方案,單一的使用位置數據或用戶網絡行為進行推薦已經無法提高推薦成功率。因此,本文根據用戶歷史位置數據結合詞頻逆文本頻率(Term Frequency Inverse Document Frequency,TF-IDF)算法思想計算用戶的相似性,進而發現用戶的興趣位置,挖掘用戶的愛好特點,最后實現潛在好友及位置推薦,提高推薦準確性。

本文的主要研究內容包括:挖掘用戶停留位置;計算相似用戶;通過計算對停留位置的訪問頻率提取用戶感興趣的位置,為用戶位置推薦提供數據源;從前三步得到的相似用戶列表和用戶興趣位置列表選取符合條件的結果為用戶推薦潛在好友和位置。

算法思想與設計

整體架構

算法的整體架構和實現流程如圖1所示。首先從用戶的原始位置數據中挖掘其停留區域,并從停留區域中挖掘用戶的停留位置;然后采用TF-IDF算法計算出用戶之間的相似性,并通過計算用戶對于不同停留位置的訪問頻率,得出用戶感興趣的位置;最后從得到的相似用戶列表和用戶興趣位置列表選取符合條件的結果,為用戶推薦潛在好友和位置。

用戶停留位置挖掘和相似性算法

原始的GPS位置數據對于用戶而言意義并不大。因為一般人外出購物或者旅游時都會表述自己“要去”某一具體地點,而不會指出該地點的經緯度。同時,原始的GPS位置數據由于數據量大從而加大了算法處理難度。為了彌補這些缺陷,本文從原始的GPS位置數據中挖掘用戶的停留區域。

由于挖掘出的用戶停留區域范圍太大,無法將其直接應用于用戶的相似計算中,因此進一步從停留區域中挖掘停留位置,縮小原始位置數據的范圍。停留位置是指用戶活動的實際地點,即某用戶在某區域內停留的時間超過某一特定閾值時,即為該用戶的停留位置。

停留位置可以分為3種情況:情況一,某用戶會經常從不同方向經過某一地點;情況二,某用戶進入某一建筑一段時間后再從該建筑出來;情況三,某用戶在某地段以很慢的速度行走。

用戶的停留位置包括其中心點及相鄰的鄰居點,這些鄰居點數據中隱藏著用戶的停留位置,據此設計了停留位置挖掘算法。

上述算法中處理停留位置的中心點是通過計算用戶周邊所有鄰居點的平均值得出,這樣將會導致同一個停留位置而位置數據卻不一樣。為了提高用戶相似計算的有效性,本文將停留位置的中心進行了標準化處理。

計算結果有時會給出2種停留位置不一致,但實際上是同一個位置的情況。在圖2(a)中,用戶A和B都在同一道路上移動,而A與B由于速度不一樣或者軌跡序列之間的距離間隙導致A與B的停留位置中心不一致;在圖2(b)中,A與B都是圍繞同一建筑移動,但是由于A與B移動的方向不同或者移動距離不一致導致停留位置中心不一致。

為了避免圖2中的情況影響用戶相似計算的有效性,將鄰近的停留位置合并,取合并后的中心作為新的停留位置。假設每個停留位置都有一個范圍r,以鄰居點的平均值為圓心,半徑r畫圓,當鄰近的2個停留位置所畫的圓相交時,將這2個圓代表的停留位置中心合并成1個新的中心,并且用這個新的中心作為用戶的停留位置。

進行用戶相似計算時,本文借鑒了TF-IDF算法的思想。

本文中將每個停留位置中心對應成文本中的一個詞,不同的停留位置中心對用戶的重要性不同,因此利用TF-IDF算法計算停留位置中心對用戶的重要性。由此得到每個用戶的相似用戶列表。

用戶興趣位置提取

根據地理學第一定律,地理位置和用戶的行為具有重要關聯關系。為了提取用戶興趣位置,需要對沒有語義的原始GPS數據進行處理。通過百度地圖API將由經緯度構成的GPS原始數據映射為現實中具有語義的地理位置名稱,如某學校、某餐廳等。

接著通過計算用戶停留位置的興趣度獲取用戶的興趣位置列表。用戶對某一停留位置訪問越頻繁,代表用戶對這個位置興趣度越髙。

潛在好友與位置推薦策略

令潛在好友推薦。經過用戶相似計算后,獲得指定用戶的相似用戶列表,在此基礎上使用相似矩陣表示用戶之間的相似度。經過該處理后用戶之間相似值的取值范圍為[〇,1]。當需要查詢某個用戶的相似用戶時,只需要查詢該用戶的行向量即可找到相似用戶列表,根據該列表中的相似值大小給指定用戶推薦潛在好友。

位置推薦。位置推薦主要是為用戶提供符合其愛好的場所,并且這些場所是該用戶從未訪問過的。由于相似用戶的社會屬性相近,即相似的人會表現出相近的行為特點、愛好等,因此反過來通過用戶相似計算,可以發現用戶潛在的感興趣位置。

實驗及結果分析

挖掘停留位置實驗

本文的實驗數據來自微軟亞洲研究院(Microsoft Research Asia)的GeoLife項目,該項目從2007年4月到2012年8月的5年時間里,采集了182名志愿者的GPS位置數據。采集器每隔1?5秒或者5?10米記錄一次用戶的GPS坐標點,共有2400多萬條記錄。endprint

GPS位置數據在采集過程中受用戶的活動規律、活動范圍等因素的影響,每個用戶采集的數據集大小不一致。本文從MSData中選取記錄條數在9萬?50萬的3個用戶(0號、5號、112號用戶),他們分別采集了173870、109046、90565個GPS點,將GPS位置數據在地圖上進行了可視化,如圖3所示。從該圖中可以看出3個用戶的數據分布大致相同,但是數據密度完全不同。

本文針對0號、5號、112號用戶的原始數據集做了多次實驗,完成對算法參數的設定,從而計算出這3個用戶的停留區域。

用戶相似計算實驗

用戶相似計算第一步將所有用戶的停留位置中心進行標準化處理。在合并之前,由于采集的數據過于密集,導致很多停留位置會重疊。通過將停留位置合并后,減少了重疊的停留位置,不同的停留位置能更精確地代表其特定的區域范圍,有利于用這些標準化處理后的停留位置計算用戶之間的相似值。

為了驗證用戶相似計算算法的理論,本文選取與指定用戶相似值最大和最小的用戶停留位置在地圖上顯示,對比其停留位置的重合率。通過實驗分析可以得出每一個用戶的相似用戶列表,該用戶經過的地點與其他用戶越相似,用戶之間的相似值越大,他們的相似性越高。

結論與創新點

本文采用大數據分析技術,針對原始數據集進行數據清洗,引入TF-IDF算法思想,改進用戶相似計算方法,提髙檢測用戶興趣位置的準確性,提出全新的潛在好友與位置推薦策略,最終在建立用戶相似矩陣的基礎上,實現了潛在好友和位置的精準推薦。

本文通過一系列實驗對提出的算法和策略思想進行了驗證,通過實驗分析

證明了潛在好友和位置推薦框架的精準和有效。

本文的主要創新點是:采用TF-IDF算法實現在位置大數據中相似用戶的挖掘;首次提出將停留位置中心進行標準化,采用余弦定理計算用戶相似度。該方法具有耗時短、占用資源少、高效的特點;用此方法可探索出基于用戶相似計算的潛在好友及位置推薦策略。

該項目獲得第31屆全國青少年科技創新大賽創新成果競賽項目中學組計算機科學一等獎。

專家評語

該項目選題具有先進性和新穎性。作者依據“喜歡在同一地點停留的人具有某種相同的興趣或行為習慣”的假設,通過對用戶的地理位置信息進行挖掘,找出興趣或習慣相近的人進行推薦。這是一種比較新穎并有效的方法,值得嘗試,值得注意的是,該方法要在大多數人愿意共享位置信息時才有效。整個工作比較完整,答辯表述清楚,回答問題切題。endprint

猜你喜歡
用戶
雅閣國內用戶交付突破300萬輛
車主之友(2022年4期)2022-08-27 00:58:26
您撥打的用戶已戀愛,請稍后再哭
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
關注用戶
商用汽車(2016年5期)2016-11-28 09:55:15
兩新黨建新媒體用戶與全網新媒體用戶之間有何差別
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
挖掘用戶需求尖端科技應用
Camera360:拍出5億用戶
創業家(2015年10期)2015-02-27 07:55:08
100萬用戶
創業家(2015年10期)2015-02-27 07:54:39
主站蜘蛛池模板: 精品自窥自偷在线看| 亚洲男人天堂久久| 91日本在线观看亚洲精品| 中国国产A一级毛片| 四虎永久在线| 亚洲成年网站在线观看| jizz亚洲高清在线观看| 中文字幕亚洲专区第19页| 91年精品国产福利线观看久久 | 国产无码精品在线播放| 国产一级α片| 国产精品思思热在线| 夜夜操狠狠操| 色国产视频| 国产精品第一区| 国产精品任我爽爆在线播放6080| 欧美一区精品| 日韩欧美中文在线| 日本黄色a视频| 激情国产精品一区| 日日拍夜夜操| 色婷婷亚洲综合五月| 波多野结衣亚洲一区| 狠狠躁天天躁夜夜躁婷婷| 99国产精品免费观看视频| 日韩大片免费观看视频播放| 亚洲天堂啪啪| 国产成人凹凸视频在线| 欧美精品在线观看视频| 五月婷婷综合网| 亚洲国产精品国自产拍A| 国产丝袜第一页| 日本精品影院| 黄色成年视频| 国产亚洲视频免费播放| 亚洲欧美日韩色图| 亚洲欧美综合另类图片小说区| 国产精品99一区不卡| 国产精品高清国产三级囯产AV| 免费人成网站在线观看欧美| 亚洲天堂网在线播放| 人妻精品全国免费视频| 伊人久久大香线蕉成人综合网| 手机在线国产精品| 九色综合伊人久久富二代| 四虎AV麻豆| 天天色天天综合网| 成人韩免费网站| 欧美精品高清| 国产精品密蕾丝视频| 亚洲熟女偷拍| 东京热av无码电影一区二区| 97国产一区二区精品久久呦| 日韩成人免费网站| 91视频区| 亚洲熟女中文字幕男人总站| a级毛片免费看| 91po国产在线精品免费观看| 国产成人狂喷潮在线观看2345| 亚洲无码高清免费视频亚洲 | 久久精品女人天堂aaa| 国产在线精品99一区不卡| 狠狠久久综合伊人不卡| 在线免费a视频| 国产丰满大乳无码免费播放| 狠狠五月天中文字幕| 日韩在线永久免费播放| 999在线免费视频| 看你懂的巨臀中文字幕一区二区| 久久国产香蕉| 99久久精彩视频| 尤物在线观看乱码| 色久综合在线| 免费看a级毛片| 99精品国产高清一区二区| 国产成人无码Av在线播放无广告| 极品性荡少妇一区二区色欲| 日本道综合一本久久久88| 18禁黄无遮挡免费动漫网站| 精品欧美一区二区三区在线| 天天综合色网| 欧美日韩午夜视频在线观看|