999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于KNN算法的約會網站配對模型的應用研究

2019-01-08 08:37:44劉淑英鄒燕飛李依橋趙瑤瑤王偉
數字技術與應用 2019年10期
關鍵詞:機器學習

劉淑英 鄒燕飛 李依橋 趙瑤瑤 王偉

摘要:約會網站數據量非常大,如何從眾多數據對象中,選擇適合自己的人群,成為數據分析中的一個研究問題。本文主要闡述了該模型的具體實現過程,主要包括數據采集、數據歸一化處理、構造算法模型、評估算法模型。通過采用實例數據集進行模型的訓練和測試,實驗結果表明:該模型能較準確的進行約會對象的匹配,測試誤差較小。

關鍵詞:機器學習;KNN算法;Python

中圖分類號:TP391 文獻標識碼:A 文章編號:1007-9416(2019)10-0128-02

0 引言

如今網站的快速發展,人們的生活和工作都離不開網絡。人們的生活節奏也在逐漸加快,工作越來越忙了。約會網站吸納了眾多的單身青年參與,積累了大量的用戶資源。而且我國廣大的上班族群體為約會網站提供了良好的用戶基礎[1]。一個好的約會網站可以帶動婚戀等多種產業的發展,但是目前的約會網站對約會對象的數據處理有時候不夠準確,約會配對成功率不夠高。通過對網站數據進行分析,采用KNN算法較好的完成約會配對,為網站用戶提供較好的服務。

1 KNN算法

KNN,也稱K-最近鄰居,是機器學習算法最簡單的一種[2-3]。它既可以用來分類,也可以是回歸方法。它把實例的特征向量作為輸入,再計算訓練集與新數據特征值之間的距離,之后選出距離k個最近的分類。如果k=1,最近鄰類就是待測數據。KNN算法主要涉及三個問題:距離度量,k值選擇和分類決策規則。我們最主要討論分類決策規則。分類決策規則就是指多數投票,或基于距離的加權投票。由輸入實例的k個鄰近訓練實例中的多數類別決定輸入實例的類別[4-5]。

2 模型實現

本模型使用的樣本數據一共有1000行,該模型采用80%的數據作為訓練集,20%的數據作為測試集來進行模型訓練,數據預處理使用的方法是歸一化。模型具體實現分為六個步驟,分別是采樣數據、樣本數據可視化、預處理、獲取模型、模型訓練、預測。我們的測試數據主要包括婚戀人員的特征,分別是年飛行??屠锍虜?、玩視頻耗時百分比、周消耗冰激凌公升數,我們首先標記此部分數據,1代表一點也不喜歡,2代表有一點喜歡,3代表非常喜歡。為了更直觀的的理解樣本數據,數據采用Matplotlib庫進行繪圖分析,如圖1所示。

2.1 預處理

根據前面所述可知,三個特征值之間的差距有點大,所以在模型訓練之前,必須把數據放到同一量級,即數據預處理。本模型采用歸一化方法,目的是把不一樣的特征數據縮放到相同的一個相似區間中。

2.2 獲取模型

該部分功能是獲取模型,也就是構造KNN分類器。核心思想就是,如果一個樣本在特征空間中的k個最相似的樣本中的大多數屬于某一個類別,則該樣本也屬于這個類別。

該過程通過計算各個訓練數據與測試數據之間的距離,按照距離遞增關系排序,選取距離最小的k個點,確定k個點所在類別的出現頻率,返回前k個點中出現頻率最高的類別作為測試數據的預測分類。這樣就構造出了KNN分類器。

2.3 模型訓練

我們講1000個樣本數據劃分為訓練集和測試集,該部分的核心代碼如下所示。

for i in range(num_test_vecs):

classifier_result = classify0(norm_mat[i, :], norm_mat[num_test_vecs:m, :],

dating_labels[num_test_vecs:m], 4)

if classifier_result != dating_labels[i]:

error_count += 1.0

right_ratio = 1 - error_count / float(num_test_vecs)

2.4 樣例預測

該部分功能是對新數據進行預測分類,用戶輸入待約會對象的數據,預測出這條數據的分類,可以判斷喜歡程度。核心代碼如下。

def classify_main():

result_list = ['一點也不喜歡', '有點喜歡', '非常喜歡']

ff_miles = float(input("每年獲得的飛行??屠锍虜担?))

percent_tats = float(input("玩視頻游戲所消耗時間百分比:"))

ice_cream = float(input("每周消費的冰淇淋公升數:"))

dating_data_mat,dating_labels = init_data()

norm_mat,diff_dt,min_value = feature_scaling(dating_data_mat)

in_arr = array([ff_miles, percent_tats, ice_cream])

classifier_result = classify0((in_arr - min_value)/diff_dt, norm_mat, dating_labels, 3)

print("你對這個人的喜歡程度:",result_list[classifier_result-1])

3 結語

本文通過采用KNN算法對婚戀數據數據進行分析,采用Python數據可視化庫中的函數和Matplotlib庫完成對數據的分類。通過測試結果,可知,模型學習的準確率達到了92%,基本能夠滿足我們的要求。

參考文獻

[1] 黃鶴.關于我國婚戀網站網絡交友的研究[D].武漢:華中師范大學,2011.

[2] 石曉宇.基于Google App Engine的移動信息服務的研究[D].大連:大連理工大學,2011.

[3] 黎爽.基于Python科學計算包的金融應用實現[D].南昌:江西財經大學,2017.

[4] 胡元,石冰.基于區域劃分的KNN文本快速分類算法研究[J].計算機科學,2012,39(10):182-186.

[5] 康春花,張淑君,李元白,等.KNN認知診斷法及其應用[J].江西師范大學學報(自然科學版),2019,43(02):135-141+159.

猜你喜歡
機器學習
基于詞典與機器學習的中文微博情感分析
基于網絡搜索數據的平遙旅游客流量預測分析
時代金融(2016年27期)2016-11-25 17:51:36
前綴字母為特征在維吾爾語文本情感分類中的研究
科教導刊(2016年26期)2016-11-15 20:19:33
基于支持向量機的金融數據分析研究
機器學習理論在高中自主學習中的應用
主站蜘蛛池模板: 午夜不卡福利| 亚洲精品在线影院| 欧美精品二区| 亚洲乱码在线视频| 国产在线97| 亚洲侵犯无码网址在线观看| 亚洲精品久综合蜜| 五月婷婷激情四射| 国产在线观看成人91| 国产精品美人久久久久久AV| 99久久精品国产麻豆婷婷| 亚洲综合色吧| 成人午夜免费观看| A级全黄试看30分钟小视频| 国产在线无码一区二区三区| 色婷婷综合在线| 视频二区亚洲精品| 中文字幕啪啪| 十八禁美女裸体网站| 国产精品无码影视久久久久久久| 免费在线色| 免费观看欧美性一级| 97久久免费视频| 精品福利视频导航| 国产成人做受免费视频| 综合亚洲色图| 国内精品久久久久鸭| 国产成人亚洲精品无码电影| 国产浮力第一页永久地址| 超清无码熟妇人妻AV在线绿巨人| 亚洲黄网在线| 亚洲天堂成人在线观看| 高清不卡毛片| 亚洲成aⅴ人在线观看| 无码在线激情片| av尤物免费在线观看| 日韩精品毛片人妻AV不卡| 国产欧美日韩精品第二区| 亚洲天堂网站在线| 国产美女免费网站| 国产精品久久久久婷婷五月| 四虎永久在线| 日本午夜视频在线观看| 国产精品入口麻豆| 99在线视频精品| 精品一区二区三区视频免费观看| 香港一级毛片免费看| 精品综合久久久久久97| 亚洲国产综合精品中文第一| 国产91视频免费| 91成人免费观看在线观看| 欧美精品v| 国产精品永久在线| 欧美成人手机在线视频| 香蕉蕉亚亚洲aav综合| 四虎国产永久在线观看| 91小视频版在线观看www| 亚洲精品无码高潮喷水A| 欧美国产综合色视频| 久久久久青草线综合超碰| 嫩草影院在线观看精品视频| 夜夜爽免费视频| 久久久久久久蜜桃| 国产成人精品日本亚洲| 亚洲成a人片| 亚洲美女操| 六月婷婷综合| 国产理论一区| 婷婷中文在线| 亚洲成人精品在线| 国产一区二区三区免费| 色综合久久久久8天国| 亚洲欧洲自拍拍偷午夜色| 亚洲一本大道在线| 一级毛片在线免费视频| 欧美精品二区| 国产97视频在线观看| 福利在线一区| av尤物免费在线观看| 99热在线只有精品| 成人精品亚洲| jizz国产视频|