999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于金融大數據的個性化推薦技術研究

2018-08-30 09:09:10唐向紅彭超陸見光
價值工程 2018年20期

唐向紅 彭超 陸見光

摘要: 隨著金融大數據的出現和發展,各種理財產品和貸款項目的種類和數量都爆炸式的增長。如何有效地針對客戶推薦提高推薦成功率成了關鍵問題。針對這一問題,文章提取代表客戶興趣、相應組群和相關項目的特征,然后利用神經網絡進行預測,從而達到了個性化推薦的目的。實驗結果表明:所建模型能有效地進行個性化推薦。

Abstract: With the advent and development of financial big data, the types and quantities of all types of wealth management products and loan projects have exploded. How to effectively recommend for customers to improve the success rate of the recommendation has become a key issue. To solve the problem,we extract features which represent customers interests, corresponding groups and related items,and ultilize the neural net to predict to achieve the goal of personalized recommendation. The experiment result shows that the model can effectively acomplish the personalized recommendation.

關鍵詞: 金融大數據;個性化推薦;數據

Key words: financial big data;personalized recommendation;data

中圖分類號:TP391 文獻標識碼:A 文章編號:1006-4311(2018)20-0203-03

0 引言

隨著大數據時代的到來,各行各業的運營模式發生了巨大的變化。在大數據時代,金融業也隨著時代產生了一些根本性的變化,人們可以更好、更多地利用數據對信息進行管理,對管理方式進行創新。金融平臺正進行著一場數據服務的變革,其中最凸顯的一項技術服務就是個性化推薦技術。針對不同的消費者的不同屬性,提供相對應的個性化服務[1]。這解決了客戶對于琳瑯滿目的商品難以選擇的問題,增加了用戶對金融平臺產品的興趣度,使金融平臺有了更多的機會提高產品的成交量,吸引了更多的用戶群體,也減少了平臺的運營成本[2]。

根據個性化推薦模型的特點來說,個性化推薦方法通常分為基于規則的推薦、基于內容的推薦、基于協同過濾的推薦三種基本的方法[3]。 基于規則的推薦以關聯規則挖掘方法為核心,通過從大量的客戶購買商到客戶的購買模式,結合客戶的歷史購買行為,產生對目標客戶的推薦列表。基于內容的推薦通過分析客戶已購買產品或已評價對象的特征獲取相應客戶的興趣描述,通過比較客戶與產品或對象之間的相似性實現推薦。基于協同過濾推薦是尋找與目標客戶相似的客戶集的購買產品或評分情況來預測目標客戶對產品的購買興趣或評分,以此來進行推薦。基于規則的、基于內容的以及基于協同過濾的推薦算法由于自身算法的特點,在實際應用中都存在相應的缺陷,所以對于如今的個性化推薦系統一般都是由這三種推薦方法混合而成的推薦模型。

通過了解,大多數個性化推薦系統中所用到的數據都是通過個性化信息服務應用的相關技術來提取得到的[4],其中提取的方法和推薦模型的建立都是比較復雜耗時的。針對這點文章提出了一種更為可靠高效的推薦模型。其中對數據和特征的選擇和提取更為方便。我們使用MySQL數據庫進行數據的篩選,得到我們想要的數據;再從新的數據鏈表中提取我們所需要的特征;最后通過調試神經網絡的參數,訓練并建立好預測模型。通過實驗數據的表明,新生產的個性化推薦模型的推薦質量有更好的表現。

1 個性化推薦模型的建立

1.1 個性化推薦模型特征的提取

相對于大多數基于大數據的個性化服務應用的主要技術,如數據挖掘技術、協同過濾技術等都需從客戶對項目的瀏覽情況、對項目的評分或其他可代表客戶對項目興趣的數據用來分析[5],作為特征建模。這些數據的收集、處理一般都是比較復雜和耗時的。針對這個問題本次實驗選用的特征是比較方便收集和表示的。

1.1.1 用戶類型特征的選取

平臺對于所有用戶一般有一個分類的管理。分類的方法一般是平臺按某種算法對用戶進行分類,或者是用戶自己選擇自己適合的類型。這些類型數據經過分析可以反應出用戶的某種購買特征,對于個性化推薦是十分重要的。

1.1.2 用戶購買特征的選取

參考用戶以往的購買記錄也是對個性化推薦系統十分有價值的。用戶以往的購買記錄往往包含著用戶一直以來的購買習慣和興趣項目,所以對用戶購買項目的數據進行提取和分析,將得到很多重要的信息。通過對比其他個性化推薦方法,也涉及用到這類數據進行特征的提取。

1.2 預測模型的選擇

鑒于本次實驗所需預測的關系比較直觀,該個性化推薦方案使用BP神經網絡來進行興趣項目的預測。

BP神經網絡模型[6]:

BP神經網絡是當前功能強大、理論體系完善的一種機器學習算法,也是人工神經網絡中使用最廣泛的神經網絡模型。

BP神經網絡一般層數較少、網絡結構較為簡單。其中每個(除輸出層的神經元)神經元可以連接多個神經元,每個連接通道都對應著連接權系數wij和偏置參數bij。通過對神經網絡的訓練,也即是對wij和bij的調整來使神經網絡的輸出能達到預期的目標值[7]。

2 實驗方法和過程

本次實驗使用Prosper貸款平臺數據進行研究分析,找出用戶感興趣的項目類型,以此作為依據給用戶推薦。其中涉及數據的選擇與提取、特征的提取、訓練和預測及實驗等環節。

2.1 數據的選擇與提取

我們拿到的Prosper貸款平臺的數據①是xml格式的大文件,不方便讀取和操作;所以我們使用MySQL數據庫對原始數據進行讀取和數據的拆分。原始數據的讀取得到的信息非常雜亂,而對于本次個性化推薦方案,我們只需從數據中選擇能代表用戶興趣的原始數據來做分析。最后提取了5個數據鏈表用于后續實驗。

5個數據鏈表如表1。

2.2 特征的提取

對已提取的數據進行特征的提取,為后面預測模型的輸入做準備。

其中篩選出具有200個項目以上(更具代表性)的用戶作為樣本,樣本特征的提取主要是從5個已提取的數據鏈表中提取,得到3個特征。其中的3個特征分別是:

2.2.1 用戶所在組的類別特征

客戶一般會在平臺新建用戶的時候,選擇自己感興趣的組(一個組一般有一個或者多個感興趣的類別),所以組的信息中有代表用戶興趣的特征。

該特征的表現形式是(9,1)的向量,因為組里包含的類別信息最多9個。

2.2.2 用戶參與項目的類別特征

這一特征的信息包含的是用戶以往參與平臺各個類型項目的數據統計。

項目類別總共有20個,所以以(20,1)的向量表示該特征。

2.2.3 用戶感興趣項目類別;(選擇了用戶參加項目數量前三名的類別作為用戶感興趣的的項目類別,其余的為不感興趣的類別)。

預測模型主要針對這一特征進行判斷,判斷用戶是否對該項目有興趣。

該特征表示的是20個項目類別的其中一個,采用(1,1)的向量表示。

2.3 實驗結果與分析

本次實驗的目的是使用購買項目多的用戶數據進行訓練,來預測項目少的用戶的興趣類型。

通過MySQL數據庫對數據的整理,得到的可訓練樣共3000個,抽取2400個作為訓練樣本,600個作為測試樣本,實驗每次100個樣本輸入模型,預計訓練2000次(查準率趨于穩定,自動結束本次訓練)。使用交叉驗證的方式進行實驗。

根據個性化推薦方案模型預測的結果,分析該推薦系統的推薦質量。

選用的分析指標有:

2.3.1 查準率[8]

該指標表明預測模型對客戶的個性化推薦與客戶興趣的相關性。

2.3.2 迭代時間

該指標表明模型訓練所耗時間。(主要針對客戶數據更新時,模型的重新建立所需消耗資源的體現)

本文主要以查準率和迭代時間表示個性化推薦系統的推薦質量,并使用了交叉驗證保證其可靠性。

通過圖3、圖4,我們可以計算出:

5次模型訓練的查準率 =[0.96173042,0.96333331,

0.96333331,0.96333331,0.96327209]

5次模型訓練的(達到最高查準率的)迭代時間= [2.7099998,8.81200004,

9.95000005,3.18400002,6.27800012]

5次模型訓練的平均查準率=0.96300,平均訓練時間=6.186800,平均迭代次數=149.600。

其中考慮到神經網絡訓練中加入了dropout函數,其函數的隨機性對訓練影響,我們選用了多次模型訓練中耗時最長的一次實驗作為參考,根據數據分析,可以看到個性化推薦模型的推薦質量較為理想,其查準率高達96.3%,訓練時間最長也不超過10s。較短的訓練時長對于個性化推薦系統以后的模型更新也是非常方便的。

本次實驗由于選擇了更具代表性的特征進行訓練,通過不斷調參的神經網絡,訓練出的預測模型在查準率和迭代時間兩個指標上更為良好。

3 結語

隨著大數據時代的到臨,各行各業信息過載將越來越凸顯。如何根據用戶個人習慣來找出用戶的興趣特征進行個性化推薦是一個重要的研究領域。本文是針對Prosper貸款平臺數據的個性化推薦方案,解決購買項目少、興趣特征不明顯的用戶的個性化推薦問題;并且還具有模型訓練快速,推薦質量高的特點。

還需要說明的是,該方案僅是依據實驗中所提的3個特征,對于用戶而言還有其他數據中隱含著代表用戶興趣特征的數據可供使用。利用更多類型的數據有可能會提高個性化推薦質量,這可以在日后工作中進行鉆研和完善。

注釋:

①原始數據參考網址:https://www.prosper.com/Downloads/Services/Documentation/ProsperDataExport_Details.html。

參考文獻:

[1]喬嵐.基于大數據技術的個性化推薦系統的設計與實現[J].信息與電腦(理論版),2017(21):70-72.

[2]胡一.基于大數據的電子商務個性化信息推薦服務模式研究[D].吉林大學,2015.

[3]葉紅云.面向金融營銷問題的個性化推薦方法研究[D].合肥工業大學,2011.

[4]韓莉.大數據時代的個性化推薦技術分析[J].晉中學院學報,2016,33(03):74-77.

[5]馬相春,鐘紹春,徐妲.大數據視角下個性化自適應學習系統支撐模型及實現機制研究[J].中國電化教育,2017(04):97-102.

[6]周志華.機器學習[M].北京:清華大學出版社,2016:97.

[7]戚德虎,康繼昌.BP神經網絡的設計[J].計算機工程與設計,1998(02):47-49.

[8]余力,劉魯.電子商務個性化推薦研究[J].計算機集成制造系統,2004(10):1306-1313.

主站蜘蛛池模板: 东京热一区二区三区无码视频| 97超碰精品成人国产| 国产精品午夜福利麻豆| 免费在线国产一区二区三区精品| 毛片免费在线视频| 尤物国产在线| 一区二区三区在线不卡免费| 99re在线视频观看| 专干老肥熟女视频网站| 九色91在线视频| 国产日韩欧美中文| 精品国产电影久久九九| 亚洲第一国产综合| 中文字幕亚洲乱码熟女1区2区| 日本欧美中文字幕精品亚洲| 欧美无专区| 男人天堂伊人网| 伊人久久大香线蕉影院| 亚洲视频四区| 国产高清国内精品福利| 美女亚洲一区| 欧美日韩理论| 欧美a在线看| 日韩A∨精品日韩精品无码| 免费人成视网站在线不卡| 国产精品妖精视频| 老汉色老汉首页a亚洲| www.av男人.com| 久久久91人妻无码精品蜜桃HD| 婷婷久久综合九色综合88| 国产精品手机在线播放| 国产嫩草在线观看| 在线观看亚洲精品福利片| 五月天婷婷网亚洲综合在线| 91精品国产自产在线老师啪l| 午夜福利视频一区| 日韩小视频网站hq| 亚洲中文字幕av无码区| 久操线在视频在线观看| 国产精品熟女亚洲AV麻豆| www.亚洲一区| 国产精品久久久精品三级| 99热最新网址| 亚洲啪啪网| 狠狠五月天中文字幕| 色偷偷男人的天堂亚洲av| 免费一级毛片在线观看| 毛片一级在线| 国产综合在线观看视频| 国产精品一线天| 久久精品人人做人人爽电影蜜月| 一级毛片免费播放视频| 亚洲国产精品美女| 亚洲欧洲日韩综合色天使| 亚洲成人一区在线| 国产精品尹人在线观看| 亚洲国产av无码综合原创国产| 欧美一区二区三区国产精品| 色网在线视频| 国产日本欧美在线观看| 免费国产小视频在线观看| 干中文字幕| 久青草免费视频| 中文成人无码国产亚洲| 婷婷午夜影院| 国产99视频精品免费观看9e| 国产在线视频导航| 亚洲精品中文字幕午夜| 午夜日b视频| 欧美翘臀一区二区三区| 亚洲综合专区| 亚洲一区无码在线| 九九久久99精品| 亚洲一区无码在线| 香蕉网久久| 欧美日本在线| 日本福利视频网站| 日日拍夜夜嗷嗷叫国产| 四虎国产永久在线观看| 久久熟女AV| 欧美性猛交xxxx乱大交极品| 国产理论一区|