999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

電子音樂興趣類別及市場數據分析

2021-06-09 11:54:43田恒銳
學習與科普 2021年4期
關鍵詞:音樂用戶

田恒銳

1緒論

1.1研究背景及意義

在互聯網信息技術高速發展的時代,隨著人們的物質基礎的不斷提高,愈多的人開始追求更多的精神需求。音樂,就是一種人類所需要滿足的一種精神需求。音樂的曲風分為很多類型,有流行音樂、古典音樂、民歌、金屬樂等,現代的音樂市場一直被流行音樂、古典音樂與其他音樂類型給瓜分,且其中流行音樂的占比尤為重要,極難撼動。

但20世紀中后期因電子合成器技術的興起,歐洲人將電子機械技術與音樂結合起來形成了新興的電子音樂產業。電子音樂因其獨特的音樂性與其文化融合的多重性迅速受到人們推崇。至此,在之后的幾十年里電子音樂迅速發展,逐漸在歐洲,美洲興起,其音樂類別逐漸占領了音樂行業的主要市場,并形成成熟的產業鏈。在21世紀初,電子音樂流入中國,為這歷史悠久的國度增添了新的音樂色彩。因此面對現狀,需對國內當前流行的電子音樂類別進行分析,并利用多種算法將流行的電子音樂類別推薦給聽眾,推廣電子音樂。

1.2 研究現狀

研究電子音樂不單單只是一個音樂類型,而是研究一個地域、國家、宗教、種族的文化。電子音樂許多是由純音樂構成,通過音樂的純粹透露出來的文化的魅力更讓人記住與回味。

電子音樂跟傳統音樂不同,電子音樂的作品主要由電子音樂制作人和電子演出者(DJ)或人聲演唱(vocal)組成。研究其市場時,需要對制作人和DJ進行區別分析。在這里,本次研究內容主要針對制作人的作品類別進行分析,作品類別在一定程度上能夠代表電子音樂文化的發展趨勢。

現如今,電子音樂風格種類繁多,雖沒有專業機構對此進行分類,但其音樂風格大體可歸為EDM(電子舞曲音樂)、Electro(電子合成器音樂)、IDM(只能舞曲音樂)、Glitch(電子脈沖音樂)、Jungle(叢林音樂)、Drum&Bass(鼓打貝斯音樂)、Bass Music(貝斯音樂)、Breakbeat(破碎節拍音樂)、Trap(陷阱音樂)、Experimental Music(實驗電子音樂)十個音樂風格,十種音樂風格下面還有300多種不同曲風的電子音樂類別,這些風格各異的音樂類別組成了當今多樣化的電子音樂市場。

雖然國外電子音樂發早在20世紀末就已經十分成熟,但中國電子音樂在上世紀80年代末才逐漸傳入中國。但盡管如此,盧旸[1][1]認為中國電子音樂起步于20世紀80年代后期,但經過三十多年發展,如今已呈現出一派生機盎然的蓬勃之勢。據中國首份電音市場研究報告《2019中國電音市場洞察報告》[2]中闡述,全球電子音樂產業年產值預計2021年將達到89億美元,年復合增長率為3.8%,中國電子音樂用戶規模預計2021年將達到5.3億人,年復合增長率為21.5%,中國電子音樂節數量預計2021年將達到300+場,年復合增長率為59.5%,中國電子音樂線上播放量預計2021年將達到4.2千億次,年復合增長率為21.3%。由此可知,電子音樂市場在音樂市場的份額正在飛速地逐年增長。在海量的電子音樂中,受眾很難精確定位自己喜愛的樂曲,因此有必要對用戶進行畫像,根據用戶特征,利用個性化推薦算法,為受眾進行個性化推薦,為受眾提供更為精準和周到的服務。大眾對熱門電子音樂的決策偏好和喜愛度,作為此電子音樂類別為未來電子音樂發展的流行趨勢。

1.3 研究內容及優勢

本文研究的主要內容是對在音樂網站上熱門電子音樂排行榜與熱門電子音樂的類別數據集進行爬蟲。用selenium webdriver web應用程序工具對帶有URL參數的網頁進行爬蟲,用excel和mysql儲存數據,把爬蟲后的獲取地雜亂數據進行數據預處理,對需要預處理地數據進行數據篩選及特征值的選擇,并將處理后的數據分成兩類數據,一部分為電子音樂排行榜數據,另一部分為電子音樂類別榜單及歌曲數據。將排行榜數據用compile()等函數將歌曲評論數進行建模分析,并用python的matplotlib包來作圖,對字段進行進一步數據分析得出結果。同時將音樂類別榜單數據進行建模分析,用個性化推薦算法先利用歌曲評論中的用戶id,生成20多萬個用戶,先獲得初始化數據,通過用戶名獲得音樂列表,再計算兩個用戶之間的皮爾遜相關系數,證明其相關性,再計算公共的音樂評分,利用算法計算用戶的距離,獲得最臨近的用戶。通過遍歷整個數據集,計算兩個用戶的相似度,并將最相似的N個用戶進行降序排序輸出。進行基于用戶的協同過濾后,通過recommend()算法將最相近的N個用戶推薦的用戶音樂列表添加至推薦列表中,并對推薦的結果根據音樂評分進行降序排序,并最終輸出結果體現K個相似用戶的推薦音樂類別與歌曲。

本文優勢主要體現在:利用selenium webdriver對URL地址進行參數爬蟲;對歌曲評論數進行字段數據分析,統計出最受歡迎的歌曲及制作人;對榜單數據中的用戶id隨機生成,并證明N個用戶的相似度,選取最相似的N個用戶輸出;利用基于用戶的協同過濾,將最多最相近的N個用戶個性化推薦給其他K個用戶的推薦算法;利用了音樂數據其字段數少的特點,用最為合理有效的推薦算法來證明其分析的可信度,來達到預測的結果。通過對推薦結果的分析,進行適合的市場營銷手段,通過此手段更好的利用推薦算法和營銷將更好的體驗推薦給用戶以及電子音樂制作人們。

1.4 論文整體結構

本文共分為七個部分:

第一部分為緒論,論述電子音樂興起的背景,闡述電子音樂興起的原因及其行業現狀,進一步提出本文研究的問題及意義。

第二部分為數據爬取,通過selenium webdriver工具對QQ音樂排行榜數據爬取并爬取作品名,作品播放時間,制作人或歌手,作品評論數,作品風格字段,在對網易云音樂歌單進行數據爬取并爬取作品專輯編號,作品專輯名,作品專輯網頁URL地址,制作人或歌手,作品編號,作品名,作品網頁URL地址,作品評論數,電子音樂類別,電子音樂風格類別,作品標簽等字段名從而獲得未處理的數據。

第三部分為數據預處理,對爬取后的數據進行描述,清洗,篩選,呈現和變換。

第四部分為電子音樂排行榜數據分析,通過對每周排行榜數據的評論數進行建模分析,從而得出近一年用戶最喜愛的音樂類型及其歌手。

第五部分為基于用戶的協同過濾推薦方法進行個性化推薦模型的構建,通過對電子音樂類別榜單的用戶數據進行過濾及分類,選擇基于用戶對電子音樂歌單類別相似性,用皮爾遜相關系數對相關性驗證,并構建用戶相似度推薦模型,從而研究用戶之間的相關性,來為接下來對用戶的推薦模型做準備,建模后,將推薦后的結果通過評分降序排序后,通過對得分的結果進行模型分析,利用ROC曲線等指標來驗證模型的準確性,通過其對未來的行業市場及受眾預測進行分析。

第七部分為市場化營銷,通過對建模分析后的結果,對此結果結合電子音樂市場,對于未來的行業的市場化營銷發展進行可行性研究及有效的營銷手段。

2數據爬取

音樂數據對于其他行業數據集來說,獲取途徑少,獲取難度高,因為許多國外網站例如VFine MUSIC與Beatport等,其為了保護知識產權,進行了反爬蟲手段、復雜的JavaScript渲染及境外IP封鎖等原因,使得無法順利獲取數據。因此本次數據選取了國內兩大音樂網站:網易云音樂與QQ音樂爬蟲。

2.1 分析網頁結構

在從網站中獲取數據之前,需要分析網頁結構。分析網頁結構主要目的為了查看網頁組成元素,HTML源代碼,查看服務器之間的交互內容,服務器返回內容為后來的數據獲取做好準備,通過分析網頁結構,將獲取數據所需要的信息進行匯總,為接下來的爬蟲進行分析的論證基礎。

通過Firefox瀏覽器進入QQ音樂電音排行榜頁面,進入審查網頁元素模式。如圖2-1所示。

由圖中顯示可看出此網頁為動態網頁,并可以看到此網站的URL地址,同時點擊網絡中的任意方法可知道此網絡請求方法為get方法。如圖2-2所示。

根據圖中所示,網站請求方法為get方法,通過此方法可很好地將網站中的網站源碼給成功獲取下來。

同理,打開網易云音樂,并使用與上述同樣的方法將網站的基本結構進行分析并對網站請求方法進行獲取,并得到URL地址。

根據圖中所示,網易云音樂中電子音樂歌單網頁的網站請求方法也為post方法,因此爬蟲方法與QQ音樂數據爬蟲方法不同。

因此,查詢網易云音樂網頁的XHR,通過瀏覽器與服務器之間相互發送請求來進一步分析網頁結構,調用例如request等諸多類來進行網頁爬蟲的工作。

2.2 數據爬取

打開QQ音樂電子音樂排行榜數據榜單通過調用selenium webdriver來驅動瀏覽器中的程序來進行刪除cookie。同時查詢網頁的XHR,把網頁的真實URL與歌曲的地址源代碼獲取。隨后將每個一年內所有排行榜的信息利用list給全部存儲下來,通過range函數遍歷近兩年電音排行榜的所有榜單,并用selenium獲取數據,并定位歌曲名,歌手,歌曲編號等元素,并利用循環算法將range函數中近兩年排行榜中的所有歌曲的定位元素全部獲取,最后將這些獲取到的數據存儲到Excel中形成表格。將獲取到的QQ音樂電子音樂排行榜數據榜單如圖2-4所示

同樣打開網易云音樂電子音樂歌單網頁,初始化網頁地址。同時設置代理,防止本地IP地址被封。但與獲取QQ音樂數據不同的是,獲取網易云音樂數據需要request 表頭http地址,這個地址可以通過在ntesdoor日志中找到,復制過來后即可使用。之后通過使用http.cookiejar.CookieJar()方法創建CookieJar對象實現cookie的獲取與存儲,并使用HTTPCookieProcessor創建cookie處理器,并以其為參數構建opener對象。在獲取數據之前先創建代理IP對象,定制一個opener對象,并將opener安裝為全局,設置多個參數。設置這些參數可以有效把opener變成url代理opener,并且可以有效地使用cookie。這時網頁內部會有些加密協議看不到,所以之后要獲取encText,也就是params用來分析網頁的AES加密。然后通過獲取encSeckey,并用json方法post,self, url, params, encSecKey四個參數。最后對post編碼進行轉換,試發出請求并得到相應,即可將相應后中的內容用read讀取出來獲得網頁代碼,設置網頁編碼為UTF-8,防止亂碼,返回獲得的網頁內容。

接下來將所有熱門的榜單信息利用list全部存儲下來,用selenium獲取數據,并獲取榜單類別,榜單號,歌曲url地址等字段,并利用循環算法將所有不同榜單的數據都獲取到。鏈接好MySQL數據庫,并獲取游標,執行sql語句命令并最后關閉游標。將所有數據存儲在MySQL數據庫下,同時將此數據存儲到Excel里方便查看及保存。獲取到的網易云音樂電子音樂歌單數據如圖2-5、圖2-6所示。

3.數據預處理

在數據預處理階段,對爬取的數據,統計每個字段數據的缺失數量,對數據類型轉換,查看異常值等操作,從而選擇最后合適的變量參與分析及建模

3.1 數據說明

首先對獲取到的兩年QQ音樂電子音樂排行榜數據進行說明。此數據集的數據共有1080條,且可以分為5個字段,分別為作品名,作品播放時間,制作人或歌手,作品評論數,作品風格。電子音樂排行榜數據信息表如表3-1所示。

其次,對獲取到的網易云音樂電子音樂歌單數據進行說明。此數據集的數據一共由10576條,且可以分為11個字段,分別為作品專輯編號,作品專輯名,作品專輯網頁URL地址,制作人或歌手,作品編號,作品名,作品網頁URL地址,作品評論數,電子音樂類別,電子音樂風格類別,作品標簽。電子音樂歌單數據信息表如表3-2所示。

3.2 數據缺失值

通過對數據進行篩選處理,從兩個數據集中選取數據缺失值并進行處理,檢查數據缺失的部分,并用sapply函數計算缺失值個數,最后統計出來的缺失值個數為0

從結果中得出,該兩個數據集中的每一列數據都沒有缺失值,因此不需要進行確實填補。

3.3 數據清理及數據冗余

兩個數據集中所有字段數據中,有些數據存在重復的現象出現,因本次研究內容的特殊性,重復出現的數據也應即為有效數據,并且作為篩選后的數據,在接下來的數據分析進一步處理。

當爬取數據完畢時,此時數據文件中存在15個冗余數據,此數據的數據格式與所需格式不符且出現亂碼,作為其冗余數據進行清理。此后對其他11641條數據進行篩選,均未獲得其他冗余數據和缺失數據,獲取的較為工整且整潔的數據,清洗后的數據情況如下表3-3所示。

4.電子音樂排行榜數據分析

經過網頁數據爬取和數據清理后,需要對爬取到的電子音樂排行榜歌曲進行數據分析。通過對每個歌曲的所有字段進行分析,發現評論數可一定程度代表電音作品的熱門程度。因為數據中近兩年內電子音樂排行榜中有許多重復的作品,且QQ音樂的排行榜只能獲取到排行榜中的前20數據,因此排行榜中的排名不能代表大部分作品對于電音市場的影響。綜上所述,能夠清晰的體現排行榜作品的影響力,其作品的評論數可作為其評判的標準之一。

因此,本次研究將排行榜數據進行以評論數為建模的數據分析,通過將數據以圖形的形式直觀地體現作品之間的關系,可以更好地反應出作品在市場占比率。同時對于評論數地數量,可以縱向地把整個排行榜作品類別,利用評論數給表達出來。

在用評論數進行建模分析之前,首先對于排行榜作品中的字段,應進行特征挖掘,然后將所有數據以制作人,制作時間作為字段,進行數據分析,再以評論數進行建模分析。

于是我們根據制作人、制作時間的的兩個字段,制作合理的圖表,表現制作人與作品評論間、熱門評論和制作時間的關系。

4.1 數據分析

依據篩選出的樣本數據,利用python的matplotlib繪圖功能,對排行榜中所有制作人信息,利用排序算法和統計算法將制作人出現的次數,即制作人最受歡迎圖統計出來,如下圖4-1所示

如圖所示,圖中橫坐標代表電子音樂制作人在所有榜單作品中出現的次數,縱坐標代表制作人的姓名,如圖所示進入排名的制作人有很多,根據柱狀圖表分析可得出最受歡迎的電子音樂制作人為Martin Garrix,并且人氣高的電子音樂制作人在所有制作人中的占比很高,同時作為電子音樂制作人的數量也可見一斑,可以側面顯示出了近兩年電子音樂的蓬勃發展。同時Martin Garrix作為2016-2018年度百大DJ第一,2019-2020年度百大DJ前三名,Martin Garrix不僅在國外有著高的人氣,在國內電子音樂的地位旁人也難以撼動。

根據制作人作品的發布時間,音樂作品的發布時間,如下圖4-2所示。

如圖所示,餅圖中的1,2,3,4代表一年當中的月份,圖中的百分比代表著其月份中作品發布占所有月份中作品發布的百分比,通過其百分比可以代表音樂制作人在發布作品間的規律。

由上圖分析得出,根據matplotlib數學模型,建立一個以每個月發布時間占比占所有作品發布月份的餅狀圖,通過餅狀圖中顯示出制作作品的發布時間大概集中在2-3月份。有科學數據顯示,在被稱為電子音樂發展元年2018的2-3月,全國在2-3月份的演出有400多場,其大小音樂節有進200場。春節檔,人們利用電音節熱鬧激情的氛圍而烘托其過節洋溢的節日氣息。在年前年末的電子音樂節,許多的音樂制作人選擇將1-2月作為一個黃金的作曲時間,從而迎來2月份的盛大音樂節。因此,在2、3、4月份的時間就是制作人發布作品的時期,年初的作品在經過2月的音樂節過后,熱門作品就會隨著其暢銷曲目,在接下來的幾個月時間內將其作品以各大音樂現場展現。

跟據上述對人氣制作人以及作品發布時間的分析,經過構筑matplotlib數學模型,將所有電子音樂排行榜中的作品,以出現次數為x軸,以作品風格為y軸建立其直方圖如圖4-3所示。

通過對上圖的分析可得出每周排行榜前20名作品的風格炯異,不同的電子音樂風格竟然高達63種,其中Midtempo為制作人,被大眾喜歡的電子音樂風格, progressive House(EDM)和Jungle音樂也比較受大眾及電子音樂制作人的青睞。而在排行榜中最受歡迎的Midtempo也屬于EDM風格的電子音樂類別作品。而根據圖中所示在一些偏實驗電子音樂風格的如Acid House,Tech House,比較不受中國電子音樂聽眾喜愛,而在作為電子音樂文化的古董藝術Dub音樂,在中國聽眾的認可度為最低。

根據調查得出,中國電子音樂的發展相對西方國家比較緩慢2010年開始在國內發展,在2016年以后電子音樂才逐漸被中國主流音樂所接受,并在中國舉行比較大型的如叢林電音節,三亞國際音樂節,VAC電音節,并且國外許多知名電音節,例如EDC等國際電音節也逐漸的發現了國內巨大的商業市場,于2018年在中國上海、珠海等地舉辦EDC CHINA,并取得不俗成績。但自從2018年以來,國外電子音樂作品大多以House、Trance這些EDM電子音樂類別為主,這些音樂的市場份額占總市場的七成以上。傳到國內后,這些電子音樂類別與風格就比較容易讓新的聽眾接受與包容,因此在排行榜數據中,此類電子音樂類型的類別就比較受歡迎。

4.2 建模分析

通過上述的數據分析可得出,電子音樂排行榜數據通過圖表給我們帶來的直觀信息,傳遞出電子音樂和音樂制作人相關信息。可從上述分析中,數據并不能給我們帶來一些對于聽眾對作品的反饋,更多地是對市場對電子音樂制作人進行的分析。為了更好的研究用戶對于電子音樂排行榜作品的理解與看法,本次研究將以用戶評論數作為基礎,對評論數進行建模分析,通過建立評論數與音樂制作人之間關系的數學模型對用戶在不同作品下評論的數量進行分析,通過數量可在一定程度上分析出此作品的熱度及話題度。通過比較,可將所有排行榜中的作品評論數進行降序排列,通過排列得出最有熱度的作品,其作品某種程度上可代表用戶對于電音市場作品的期待值與關注度,從而分析聽眾對于電音市場的受眾情況。

首先,通過設置參數解決下Windows系統下容易出現的亂碼問題,其次,通過調取每個用戶在一個或多個作品的評論數來觀察其變化。通過循環語句將每個語句中的每個作品中的評論數進行循環,這樣可以提高其運算效率。構造其二維圖中,作品與評論數的相關關系。通過正則表達式將兩者之間的關系以對數函數的模型給顯示出來最后得到其模型圖,如圖4-4所示。

由圖中的信息可看到橫坐標的對數表示評論數,縱坐標代表所有作品中評論數出現的次數以及數量。通過評論數進行建模分析可得出最后最受歡迎制作人為K-391。K-391,中文名為肯尼斯,是來自挪威的音樂制作人,其音樂作品的音樂風格為House風格,在Youtube上已有30多萬的粉絲,通過與上述數據的對比分析可得出,最受歡迎的音樂制作人第二的Alan Walker與此音樂制作人有多次合作,而Alan Walker在2018年參加國內首檔電子音樂節目《即刻電音》后成為國內電子音樂聽眾比較喜歡的制作人,從而也慢慢認識了K-391這名富有才華的音樂制作人。并在2019-2020年中其音樂作品受到國內電子音樂聽眾愛聽House曲風風格的影響,慢慢在國內聽眾中占據了主要位置。

5.基于用戶的協同過濾進行個性化推薦的模型構建及分析

通過對QQ音樂電子音樂排行榜數據分析,得出了大眾對于電子音樂的曲風和在對電子音樂受眾中不活躍的人對于電子音樂的興趣類別,以及聽眾最喜愛的電子音樂制作人等方面。可是跟據研究數據與國外音樂平臺數據對比可知,國外電子音樂聽眾與國內聽眾的興趣類別有著極大不同如圖5-1所示。

如上圖所示為國際電子音樂峰會上beatport對電子音樂興趣類別分析圖的統計數據。上圖為國外最大的電子音樂網站beatport在2015年-2019年對每一季度電子音樂用戶群體進行的用戶數據分析,由上圖所示,Techno與Tech House為最受電子音樂聽眾歡迎的曲風與類別,與QQ音樂電子音樂排行榜得出的興趣結果差異明顯。上述對QQ音樂電子音樂排行榜用戶的調查顯示出Techno與Tech House音樂類別,其占據市場的受歡迎份額僅占4%左右,與國外市場差異明顯,同時國外聽眾對于音樂的類別中的House風格也比QQ音樂電子音樂聽眾人數占比要多。

于是本次研究將有著多年濃厚電子音樂受眾基礎群體的網易云音樂作為對照組,對聽眾群體進行細化,對網易云音樂里的電子音樂用戶群體進行類別細化,從而研究在網易云音樂中電子音樂用戶群體對于整個市場的變化。

因此在接下來的研究中,對用戶的聽眾群體,應當有更為細致的研究,并對用戶愛聽的歌單進行統計并尋找用戶歌單與用戶群體間的關系,將用戶的興趣類別進行梳理,利用基于用戶的協同過濾從進行個性化推薦的模型構建來分析國內電子音樂聽眾的興趣導向,從而和國外聽眾進行對比,預測未來電子音樂市場的發展。

5.1 基于用戶的協同過濾

首先明確建模步驟,先通過將獲取到的電子音樂歌單數據的熱門歌單,進行初始化處理。并建立以獲取到的歌單中聽眾用戶和歌曲的.json文件,并把歌曲id和信息以及用戶id給記錄下來;其次隨即生成幾十萬個隨機目標用戶對作品進行評分;然后將獲取用戶找到和目標用戶興趣相似即評分相似的用戶集合,并用皮爾遜的相關系數證明其兩兩用戶間的相關性;再用歐式距離找到與當前用戶最臨近的用戶,最終通過評分的相似,找到集合中的用戶喜歡的電子音樂,且目標用戶沒有聽說過的電子音樂類別推薦給用戶。將推薦作品類別中取最終推薦的電子音樂作品推薦給用戶。

于是根據步驟梳理網易云音樂的歌單,從中篩選出電子音樂歌單中的熱門歌單,進行爬蟲。獲取初始化數據后,隨機生成用戶數據。通過每個歌單中用戶評論中獲得每個用戶名,經過用戶名獲得其用戶列表。并用用戶信息和詳細歌單作品id生成在.json文件中。在json文件中存儲的數據相比其他數據交換格式更能方便于在服務器之間交換數據,且格式非常簡單,調用數據也比較容易。隨機生成幾十萬個目標用戶并將用戶id也儲存在.json文件中方便調用。之后隨機用getitems()算法獲取歌單用戶以及目標用戶并進行調試處理。

調試完成后,通過兩個用戶的評分行為來計算用戶行為的相似度。首先利用下圖5-2公式來計算皮爾遜相關系數。

將歌單用戶和目標用戶數據格式的初始值設為{音樂,評分}的格式同時將

皮爾遜相關系數相關量系數值設置為:sumXY=0.0,n=0,sumX=0.0 sumY=0.0,

sumX2=0.0,sumY2=0.0,設置完變量后,計算其公共音樂的評分如圖5-3所示。

上述循環語句可將兩個用戶之間的評分相關性將兩個用戶間的相關性給證明出來。通過皮爾遜相關系數可以很好的證明兩個用戶的線性相關性,其取值區間為[-1,1],大于0為正相關,小于0為負相關。將皮爾遜相關系數值為r,若|r|越大,線性相關性越強,|r|越小,線性相關性越小。利用r值的數值可以很好表述兩兩用戶間的相關性強弱。

但通過皮爾遜相關系數只能表現兩兩用戶的相關性,即便加了評分要素,也不能完全體現其相似性多少。

于是接下來的研究主要采用歐式距離算法來獲取歌單用戶臨近用戶的距離,獲得最臨近的用戶。創建nearstUser()方法,并創建distances={}算法計算用戶的相似度,并用neighbors=[]協同過濾用戶并取最鄰近的用戶,并用此算法遍歷整個數據集。其中用if neighbor != username and neighbor not in neighbors語句來保證每次過濾用戶即為最臨近的用戶,并保持算法的嚴謹性。用distance語句將歌單用戶與最為臨近的隨機用戶計算兩個用戶的相似度,并將此語句循環進行。最后將最相似的N個用戶進行排序處理,并得到最終的N個用戶如圖5-4所示

圖中在得到排序好的N個用戶后,可以為接下來得個性化推薦模型做準備,同時利用皮爾遜算法證明其相關性后使用此算法相比于直接余弦相似度算法而言好處在于,先對向量進行了中心化后在進行余弦相似度的計算,更好地能夠處理用戶的評分數據,對于稠密的用戶數據其算法更能顯示出其優越性。

5.2 構建個性化推薦模型

得到最終的N個用戶后可構造recommend()方法,其方法里是即將被推薦的音樂。接著用待推薦的音樂推薦最相近的N個用戶,把推薦的用戶的音樂列表給創建出來。同時設立key()算法證明當前用戶名是事先保密的。用創建好的推薦列表,將帶推薦的音樂添加到推薦列表中,最終,將對推薦的結果按照音樂評分進行排序并輸出最終推薦的音樂作品。

經過基于用戶的協同過濾后,研究將歌單用戶及目標用戶通過皮爾遜相關系數,歐式距離算法,最后通過個性化推薦將歌單用戶把N個用戶的數據推薦給目標用戶形成用戶推薦列表,并用評分機制,將推薦列表中的作品經過降序處理將最終推薦列表推薦給目標用戶。

5.3推薦模型分析

本次研究,通過將網易云音樂電子音樂歌單數據進行了基于用戶的協同過濾進行個性化推薦的目標用戶推薦作品列表分析,每次進行一次推薦算法目標用戶就有三個與此相似度較高的用戶推薦作品,每個高相似度用戶對目標用戶推薦18首電子音樂作品并評分,最終選取4.0分以上的作品推薦給目標用戶。在三個用戶中每個推薦用戶的作品評分都有一定的闕值,用ROC曲線可以將3個推薦用戶進行比較,選取ROC曲線越靠近左上角的推薦作品,模型的準確率就越高從而不僅做到驗證此模型對于目標用戶的推薦作品是否精準,還能夠在3個推薦用戶的作品中選取更適合目標用戶的電子音樂作品,隨著研究隨機出現許多的作品列表,于是將結果中的隨機兩個目標用戶進行部分表分析如下(令兩個目標用戶擬為甲,乙)

根據表5-2中三個推薦用戶的最終推薦給目標用戶甲的結果中可以得出評分在4.5與5.0的電子音樂作品中主要以House曲風和Trap曲風為主。而在4.0分的曲子則為trance風格的電子音樂作品,其余的推薦作品均在4.0分以下。

為了驗證3個推薦用戶中其中哪個用戶最適宜目標用戶甲的興趣作品,且驗證其模型的準確率的高低,本次研究通過SPSS分析工具來做出ROC曲線來證明其相關性。將不同的推薦用戶即其推薦作品評分為一列,將分類列數據以橫向作品評分尤其大于4的為1(有效個案數),反之為0(無效個案數).將輸入后的數據如圖5-5所示。

如上圖所示,分類列中有效個案數與無效個案數相等,表名正實際狀態的值不明。于是為了實驗精確,將分類列數據為狀態變量,三個推薦用戶作品評分數據為檢驗變量,以特異性為橫軸,敏感度為縱軸生成ROC曲線做出ROC曲線圖,如圖5-6所示。

通過ROC圖原理可知,ROC曲線越靠近左上角,即相同條件下,特異性越低,敏感度越高的的模型,其模型的準確性就越高,比較三個推薦用戶可知相比參考線User34772推薦用戶曲線的點更接近與左上角,是分類錯誤最少的最好取值,其假正例與假反例總數最少,其評分中的作品最適合給目標用戶甲推薦。

通過上表所示,可知目標最終推薦用戶的音樂作品中其所有4.0分以上作品均為House與Trance音樂風格。

為了驗證3個推薦用戶中其中哪個用戶最適宜目標用戶乙的興趣作品,且驗證其模型的準確率的高低并與甲進行對照,本次研究通過SPSS分析工具來做出ROC曲線并計算其AUC來證明其相關性。將不同的推薦用戶即其推薦作品評分為一列,將分類列數據以橫向作品評分尤其大于4的為1(有效個案數),反之為0(無效個案數).將輸入后的數據如圖5-7所示。

由上圖可知,目標用戶乙的分類列數據中可得出其真正類率的大小為圖5-8所示。

由上圖可知,目標用戶乙的真正類率為1/3,代表分類器預測的正類中實際占所有正實例的1/3,由此可做出ROC曲線如圖5-9所示。

比較三個推薦用戶可知相比參考線Use27506與User52075推薦用戶曲線的點接近與左上角,是分類錯誤最少的最好取值,其假正例與假反例總數較少,為進一步確定誰是目標用戶乙的最好推薦用戶則需要計算AUC指標。其各曲線下的面積圖如圖5-10所示.

AUC指標代表正樣本排在負樣本前面的概率,即ROC曲線下面的面積即為AUC的值。如圖所示User27506的區域面積大,即AUC指標大,即其假正例與假反例總數最少,其評分中的作品最適合給目標用戶甲推薦。

(1)綜合上面分析,可知此推薦模型得訓練結果表明,通過推薦列表給目標用戶推薦的電子音樂在一定程度上有一定的隨機性。

(2)使用皮爾遜相關系數的好處可將不同的電子音樂的相似度在用戶之間聯系起來,可以將歌單用戶與目標用戶做一個很好的銜接作用。

(3)因為使用此推薦算法得出,在所有對目標用戶推薦的電子音樂列表中House曲風和Trance曲風占比約為40%,與國外電子用戶音樂人群得興趣對比可知,網易云音樂用戶喜愛的電子音樂類別與國際電子音樂用戶得興趣類別有一定的相似性,在某種程度上表達出網易云音樂電子音樂用戶比QQ音樂電子音樂用戶的子音樂文化與國際的流行曲風更為契合。

(4)通過此次研究,體現出在不同音樂群體中,用戶對于電子音樂的興趣類別與種類有很大不同,與音樂人群的音樂基礎和音樂習慣有著不小的關系。

(5)通過此次研究,此次個性化推薦模型的準確率和推薦效率來說卓有成效。

5.4推薦模型的預測

通過本次研究,結合國外電子音樂網站可預測未來的電子用戶市場的大概發展可知,電子音樂在幾年后的發展占比占流行音樂的比重越來越大,統計如下圖5-11所示。

如上圖所示為國際電子音樂峰會上國外媒體對電子音樂站流行程度排行榜的統計數據,如圖所示電子音樂在國際上的流行度僅次于pop音樂和rock音樂,并且電子音樂在中國將逐漸形成一個成熟穩定的音樂市場,同時通過推薦結果以及QQ電子音樂聽眾用戶排行榜的結果來看,中國電子音樂用戶群體的聽眾水平參差不齊,不同的群體對于電子音樂曲風與類別,甚至對于電子音樂的文化看法區別差異很大,因此對于未來國內電子音樂群體的發展將是一個漫長而艱巨的考驗。

6.市場化營銷

6.1營銷背景

對于拓寬電子音樂市場,各行業的相關人士就必須考慮音樂市場的營銷手段,好的市場營銷手段可以在一定程度上影響其音樂種類在流行音樂市場中的地位。好的營銷模式可以擴大其電子音樂文化在國際上的影響力,同時也能影響國內電子音樂文化的發展。

6.2傳統數字營銷

傳統營銷手法首先對于上述的研究結果可以在各音樂平臺利用數字音樂的理念將個性化推薦結果中選取幾個優秀的電子音樂類別進行UI交互設計,將電子音樂中的熱門類別置頂到頁面,供更多音樂用戶了解并接觸電子音樂。其次可以通過利用各類音樂平臺的優勢用數據分析將平臺內的音樂資源推送給用戶,統計平臺內電子音樂愛好者的興趣,定時地推送音樂節與電子音樂活動給他們,平臺收取舉辦方和制作人一定的提成。

此營銷方法對于進行基本數字音樂的宣傳,確實能使電子音樂在短期內對行業會有幫助,但長期來看對電子音樂的發展并沒有特別突出的貢獻。同時根據此營銷手段聽眾進入此音樂類別需要其深厚的音樂基礎和音樂習慣。同時傳統數字營銷手段,電子音樂制作人的收益很低,據統計,電子音樂制作人占作品總收入為13.5%,甚至在某些平臺,制作人的收入占比僅為5%。

6.3傳統數字營銷

而根據現代科技的發展,現如今對現代數字音樂有著新的詮釋,通過這幾年區塊鏈技術的發展,可以通過加密技術將數字音樂制作成NFT產品。所謂NFT即是非同質化通證,是一種數字資產,通過區塊鏈技術與密碼學技術形成的代幣通證,與比特幣不同NFT產品具有不可分割的特點,同時區塊鏈的技術能夠讓NFT產品具有保密性、唯一識別性等特點,此產品使區塊鏈技術能夠在金融領域以外的其他領域能夠影響整個區塊鏈生態系統乃至整個傳統經濟體系。

6.4現代數字營銷

NFT,可以將電子音樂作品的音頻或視頻文件,甚至是專輯封面等圖像文件,通過剪輯將其嵌入NFT中形成數字卡片。將其NFT卡片上傳至區塊鏈瀏覽器平臺例如Flow平臺中利用每個區塊之間的鏈進行作品間的轉遞和售賣。當電子音樂用戶進行交易時,可生成一個裝滿NFT的數字錢包,通過哈希算法生成的錢包的隨機公鑰和私鑰可保證用戶賬戶的絕對安全,當用戶進行交易時,需填寫對方交易的公鑰地址及其標簽,將其NFT通過其平臺間的跨鏈或同平臺的公鏈,在本區塊內進行交易,同時付給平臺燃料費,經過多個節點等待,最終成功交易。

NFT的制作者具有NFT作品的版權和著作權,每一次的交易與流通記錄都能夠被追溯,且生成NFT作品有其NFT編號,可以通過其編號證明其唯一識別性。NFT可支持線上交易并且支持法幣交易,使其音樂作品能夠方便快捷的進行支付。現如今,有許多的行業內的巨頭挺進NFT市場,如行業龍頭索尼音樂將與Flow合作開發音樂NFT平臺,beatport開放數字交易并在未來開放NFT交易市場。同時,創作者每個NFT藝術品或者數字專輯得到的利潤通常能夠占到總利潤的70%-80%左右,并且大大的減少了中間中介平臺的手續費和制作成本。

福建江夏學院 350100

猜你喜歡
音樂用戶
奇妙的“自然音樂”
音樂從哪里來?
藝術啟蒙(2018年7期)2018-08-23 09:14:16
圣誕音樂路
兒童繪本(2017年24期)2018-01-07 15:51:37
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
音樂
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
Camera360:拍出5億用戶
創業家(2015年10期)2015-02-27 07:55:08
100萬用戶
創業家(2015年10期)2015-02-27 07:54:39
如何獲取一億海外用戶
創業家(2015年5期)2015-02-27 07:53:25
主站蜘蛛池模板: 人妻丰满熟妇AV无码区| 亚洲人成网站观看在线观看| 久久精品国产91久久综合麻豆自制| 国产激情在线视频| 午夜三级在线| 欧美午夜一区| 亚洲成a人片7777| 日韩精品久久久久久久电影蜜臀| 国产精品久久久久无码网站| 国产精品偷伦在线观看| 国产成人高精品免费视频| 亚洲一区无码在线| 久久99热66这里只有精品一| 国产一区二区三区免费观看| 午夜在线不卡| 日韩午夜伦| 高清无码不卡视频| 2021国产乱人伦在线播放| 丁香亚洲综合五月天婷婷| 久夜色精品国产噜噜| 亚洲国产成人麻豆精品| 国产屁屁影院| 五月婷婷亚洲综合| a国产精品| 免费啪啪网址| 亚洲午夜综合网| 香蕉蕉亚亚洲aav综合| 91美女在线| 午夜啪啪福利| 国产男女XX00免费观看| 免费国产小视频在线观看| 亚洲日韩图片专区第1页| 欧美精品三级在线| 中文字幕无码中文字幕有码在线 | 99精品在线看| 伊人色综合久久天天| 午夜高清国产拍精品| 色网站免费在线观看| 亚洲人精品亚洲人成在线| 国产性生大片免费观看性欧美| 亚洲综合色吧| 日韩A∨精品日韩精品无码| 国产二级毛片| 大陆国产精品视频| 国产簧片免费在线播放| 伊人久久久久久久| 91福利在线看| 国产杨幂丝袜av在线播放| 国产成人综合网| 久久国语对白| 久久熟女AV| 99热最新在线| 亚洲欧美自拍中文| 国产视频 第一页| 1级黄色毛片| a级毛片一区二区免费视频| 香蕉久久国产精品免| 国内精品视频在线| 色综合天天综合中文网| 青青操视频免费观看| 久久永久精品免费视频| 国产精品jizz在线观看软件| 999国产精品| 九色国产在线| 国产精品9| 成人另类稀缺在线观看| 午夜a级毛片| 欧美精品在线看| 亚洲不卡无码av中文字幕| 狂欢视频在线观看不卡| 91探花在线观看国产最新| 色综合狠狠操| 一本大道香蕉高清久久| jizz在线免费播放| 国产 在线视频无码| 国产成人免费手机在线观看视频 | 在线中文字幕日韩| 玖玖精品视频在线观看| 国产成人精品视频一区二区电影| 免费看a毛片| 一级毛片在线播放免费| 成年免费在线观看|