999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

面向新一代調(diào)控系統(tǒng)的應(yīng)用個(gè)性化推薦技術(shù)*

2023-06-04 06:24:14吳冠宇
關(guān)鍵詞:特征用戶系統(tǒng)

鄒 慶 吳冠宇 黃 昆,4 余 璟 高 原,4

(1.南瑞集團(tuán)有限公司(國網(wǎng)電力科學(xué)研究院有限公司) 南京 211106)(2.國電南瑞科技股份有限公司 南京 211106)(3.國網(wǎng)江蘇省電力公司 南京 210024)(4.智能電網(wǎng)保護(hù)和運(yùn)行控制國家重點(diǎn)實(shí)驗(yàn)室 南京 211106)

1 引言

為適應(yīng)新一代電力系統(tǒng)發(fā)展的需要,國家電網(wǎng)公司提出建成具有“共享、智能、開放、安全”特征的新一代調(diào)控系統(tǒng)[1]。建立適用電網(wǎng)調(diào)控業(yè)務(wù)的應(yīng)用商店,是打造新一代調(diào)控系統(tǒng)開放生態(tài)的重要手段。新一代調(diào)控系統(tǒng)應(yīng)用商店為國網(wǎng)公司各調(diào)控業(yè)務(wù)用戶,提供監(jiān)視控制、分析預(yù)警、計(jì)劃決策、仿真模擬、綜合評估及自動(dòng)化業(yè)務(wù)等六大類場景數(shù)千個(gè)應(yīng)用。如何幫助電網(wǎng)調(diào)控用戶,從應(yīng)用商店中快速、高效的獲取到需要的應(yīng)用功能,是新一代調(diào)控系統(tǒng)應(yīng)用商店需要解決的一個(gè)重要問題。

目前,互聯(lián)網(wǎng)各類應(yīng)用商店常用的應(yīng)用推薦方式:專家推薦[2]、基于用戶社交關(guān)系的推薦、基于數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)技術(shù)的推薦。蘋果公司App-Store 各類應(yīng)用榜單是專家推薦的典型代表,蘋果公司為此組建了專職的編輯團(tuán)隊(duì),為用戶進(jìn)行篩選推薦。這類方法需要較大的人員投入,并且推薦結(jié)果單一,難以反映用戶的個(gè)性化需求。基于用戶社交關(guān)系的推薦[3~4],利用系統(tǒng)內(nèi)用戶之間的社交關(guān)系數(shù)據(jù),為用戶推薦“朋友們正在使用的應(yīng)用”。在企業(yè)應(yīng)用場景中,用戶缺少社交屬性,難以直接應(yīng)用該推薦技術(shù)。基于數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)技術(shù)的推薦,又可以分為:基于項(xiàng)目的協(xié)同過濾推薦技術(shù)[5]、基于人員的協(xié)同過濾推薦技術(shù)[6]、基于內(nèi)容的推薦技術(shù)[7]等。這類推薦技術(shù),基本原理都是基于用戶行為歷史數(shù)據(jù),分析用戶興趣特征和項(xiàng)目特征,建立用戶和項(xiàng)目偏好關(guān)系,為用戶進(jìn)行個(gè)性化推薦。項(xiàng)目的特征有多種構(gòu)建方式[8],包括物品的屬性集合[9]、隱語義向量[10]、標(biāo)簽等。標(biāo)簽是能夠準(zhǔn)確的表達(dá)物品內(nèi)容特征的關(guān)鍵詞[11],按生成方式一般有兩種:一種是專家標(biāo)簽(Professionally-generated Content,PGC)[12],由項(xiàng)目創(chuàng)建者或者審核編輯,根據(jù)項(xiàng)目特點(diǎn)給物品定義的特性關(guān)鍵詞;另一種是用戶自定義標(biāo)簽(User-generated Content,UGC)[13],由使用者根據(jù)個(gè)人感受為物品定義的個(gè)性關(guān)鍵詞標(biāo)簽。基于標(biāo)簽的推薦算法[14~15]大多是基于UGC 標(biāo)簽進(jìn)行特征分析和推薦,基于PGC 標(biāo)簽進(jìn)行推薦的研究較少。

新一代調(diào)控系統(tǒng)應(yīng)用商店作為一個(gè)企業(yè)內(nèi)部系統(tǒng),用戶社交頻率不高,難以獲得足夠的UGC 標(biāo)簽;另一方面,應(yīng)用開發(fā)商提交應(yīng)用時(shí),提供了應(yīng)用的關(guān)鍵詞和應(yīng)用分關(guān)鍵類信息,并經(jīng)過管理員的審核,信息比較準(zhǔn)確,可以作為PGC的來源。因此,本文提出一種基于專家標(biāo)簽的推薦技術(shù),通過用戶留存應(yīng)用包含的專家標(biāo)簽,分析用戶對專家標(biāo)簽的興趣特征,建立基于標(biāo)簽的用戶應(yīng)用的興趣度計(jì)算公式,并利用相同專業(yè)的用戶興趣,補(bǔ)充目標(biāo)用戶對其他應(yīng)用的興趣度,實(shí)現(xiàn)面向新一代調(diào)控系統(tǒng)應(yīng)用的個(gè)性化推薦。最后,基于實(shí)驗(yàn)數(shù)據(jù)集進(jìn)行了多輪測試,實(shí)驗(yàn)結(jié)果驗(yàn)證了本文提出的算法對應(yīng)用個(gè)性化推薦的效果。

2 基于專家標(biāo)簽多維特征的內(nèi)容推薦和同類用戶協(xié)同推薦技術(shù)

2.1 構(gòu)建應(yīng)用的多維特征向量

新一代調(diào)控系統(tǒng)應(yīng)用商店中的應(yīng)用集合A 和用戶集合U可分別表示為

式中:N為應(yīng)用總數(shù),M為系統(tǒng)用戶數(shù)。

我們把用戶已下載安裝且未卸載的應(yīng)用,稱為用戶留存應(yīng)用,用戶um留存應(yīng)用集合可以定義為

式中:N'為用戶um留存應(yīng)用個(gè)數(shù)。

其中,Ti表示應(yīng)用ai的特征向量,ki,1、ki,2、ki,3分別表示應(yīng)用ai上的3 個(gè)關(guān)鍵詞,ci表示應(yīng)用ai屬于的分類,由于1個(gè)應(yīng)用可以同時(shí)屬于1個(gè)或多個(gè)分類,應(yīng)用ai特征可進(jìn)一步表示為

式中:J為應(yīng)用ai的應(yīng)用分類個(gè)數(shù)。

2.2 構(gòu)建用戶對標(biāo)簽的偏好特征

用戶um留存應(yīng)用,包含的標(biāo)簽集合表示為

式中:P 為用戶um留存的應(yīng)用包含的PGC 標(biāo)簽個(gè)數(shù)。基于TF-IDF 算法[16],用戶um對Rm中某個(gè)標(biāo)簽tm,p的偏好可表示為

式中:Num(rm,p)為用戶um留存的應(yīng)用中包含標(biāo)簽tm,p的應(yīng)用個(gè)數(shù),Num(Rm)為用戶um留存的應(yīng)用包含的標(biāo)簽數(shù),Num(tA,m,p)為所有應(yīng)用中包含標(biāo)簽tm,p的應(yīng)用個(gè)數(shù)。用戶留存應(yīng)用中,包含某個(gè)標(biāo)簽的應(yīng)用越多,說明該標(biāo)簽對用戶的選擇偏好影響越大;同時(shí),在所有應(yīng)用中,越多的應(yīng)用包含某個(gè)標(biāo)簽,該標(biāo)簽?zāi)軌蚍从秤脩襞d趣的區(qū)分度越低。

2.3 預(yù)測用戶對應(yīng)用的興趣度

基于式(7),用戶um對應(yīng)用ai的偏好,可以通過用戶um對應(yīng)用ai上的多維標(biāo)簽的偏好,按照權(quán)重疊加計(jì)算,表示為

式中:Pm,k表示用戶um對應(yīng)用ai的關(guān)鍵詞ki標(biāo)簽的興趣度,Pm,c表示用戶um對應(yīng)用ai的分類標(biāo)簽ci的興趣度,l為應(yīng)用分類特征相對于關(guān)鍵詞特征的權(quán)重。

基于式(8),為目標(biāo)用戶um計(jì)算所有待預(yù)測應(yīng)用的興趣度并進(jìn)行排名,選擇興趣度Top-N應(yīng)用集合,作為推薦候選集RAm,N。

2.4 同類用戶協(xié)同推薦

式(8)是建立在基于目標(biāo)用戶um歷史行為,分析用戶留存應(yīng)用標(biāo)簽基礎(chǔ)上計(jì)算用戶對應(yīng)用的興趣度。對于那些不包含目標(biāo)用戶um喜好標(biāo)簽的應(yīng)用,可以參考與目標(biāo)用戶um興趣度相似的用戶進(jìn)行推薦。傳統(tǒng)基于用戶的協(xié)同過濾,主要通過統(tǒng)計(jì)用戶的歷史行為,挖掘出行為特征類似的用戶,確定為同類用戶,進(jìn)行協(xié)同推薦[17]。整個(gè)過程計(jì)算復(fù)雜,花費(fèi)時(shí)間長。在新一代調(diào)控系統(tǒng)場景中,企業(yè)用戶有顯著的專業(yè)特性,同一專業(yè)崗位的用戶,工作職責(zé)和工作范圍都比較相似,其選擇的應(yīng)用具有很大的參考性,所以本文利用這一特點(diǎn),基于式(8)計(jì)算同一專業(yè)崗位的用戶的平均興趣度,選擇興趣度Top-N應(yīng)用集合,作為用戶um推薦候選集RA'm,N。

2.5 為用戶進(jìn)行推薦

合并推薦候選集RAm,N與RA'm,N,按照興趣度選擇Top-N作為用戶um最終的推薦結(jié)果Wm,N。

3 算法設(shè)計(jì)

本文提出的推薦算法,利用應(yīng)用包含的多維特征專家標(biāo)簽,建立用戶和應(yīng)用之間的關(guān)聯(lián)關(guān)系,通過用戶對應(yīng)用標(biāo)簽的偏好分析,預(yù)測用戶對其他未知應(yīng)用的興趣度,結(jié)合目標(biāo)用戶以及目標(biāo)用戶相似用戶的偏好,生成Top-N推薦。具體算法如下:

算法1

輸入:訓(xùn)練集,測試集,l值,N值

輸出:目標(biāo)用戶um的Top-N推薦集Wm,N

步驟1:根據(jù)訓(xùn)練集中用戶留存應(yīng)用信息A',廠商標(biāo)注的應(yīng)用標(biāo)簽(關(guān)鍵詞和應(yīng)用分類)信息T,計(jì)算出用戶um留存的應(yīng)用標(biāo)簽集合Rm

步驟2:根據(jù)式(3)計(jì)算用戶um對標(biāo)簽的偏好矩陣Pm

步驟3:根據(jù)式(4)計(jì)算用戶um對應(yīng)用的偏好矩陣Im

步驟4:按照目標(biāo)用戶um對應(yīng)用的偏好值排序,選擇Top-N應(yīng)用候選推薦集RAm,N

步驟5:根據(jù)用戶崗位屬性,選擇同一崗位的用戶,根據(jù)同類用戶對應(yīng)用的偏好值排序,選擇Top-N應(yīng)用,構(gòu)建應(yīng)用候選推薦集RA'm,N

步驟6:合并候選推薦集RAm,N和RA'm,N按照偏好值排序,從中選擇Top-N推薦應(yīng)用集Wm,N。

4 實(shí)驗(yàn)結(jié)果分析

4.1 實(shí)驗(yàn)數(shù)據(jù)來源

新一代調(diào)控系統(tǒng)目前正處于試點(diǎn)建設(shè)階段,應(yīng)用商店還缺少足夠的應(yīng)用信息和用戶行為數(shù)據(jù)。為了驗(yàn)證本文提出的推薦算法,我們從互聯(lián)網(wǎng)公開數(shù)據(jù)集中選擇了GroupLens 實(shí)驗(yàn)室2000 年發(fā)布的MovieLens 1M 電影評級數(shù)據(jù)集[18],該數(shù)據(jù)集包含的用戶和電影數(shù)量,與新一代調(diào)控系統(tǒng)的用戶和應(yīng)用規(guī)模比較接近。由于MovieLens 1M[19]數(shù)據(jù)集并沒有包含電影標(biāo)簽數(shù)據(jù),我們從MovieLens 10M[20]數(shù)據(jù)集中篩選出了MovieLens 1M 數(shù)據(jù)集中所有電影所對應(yīng)的標(biāo)簽數(shù)據(jù),加入到實(shí)驗(yàn)數(shù)據(jù)。實(shí)驗(yàn)數(shù)據(jù)包括:

電影數(shù)據(jù)([“movies”]):包括電影標(biāo)記、電影名稱及電影類別(可多選)。

用戶數(shù)據(jù)([“users”]):用戶標(biāo)記、用戶職業(yè)。

電影評分?jǐn)?shù)據(jù)([“ratings”]):用戶標(biāo)記、電影標(biāo)記、用戶對電影評分(1-5分)。

電影標(biāo)簽數(shù)據(jù)([“tags”]):用戶標(biāo)記、電影標(biāo)記、用戶對電影所打標(biāo)簽。

4.2 實(shí)驗(yàn)數(shù)據(jù)預(yù)處理

GroupLens 發(fā)布的電影數(shù)據(jù)集,其場景與本文的新一代調(diào)控系統(tǒng)應(yīng)用商店的場景有所差異,無法直接應(yīng)用于算法1,需要進(jìn)行必要的數(shù)據(jù)預(yù)處理。GroupLens 數(shù)據(jù)集中電影標(biāo)簽屬于UGC 標(biāo)簽,來源于用戶對電影的個(gè)性化標(biāo)簽操作,同一部電影不同用戶根據(jù)個(gè)人感受可能會(huì)打出多個(gè)不同的標(biāo)簽,這與新一代調(diào)控系統(tǒng)應(yīng)用商店中,由開發(fā)廠商提交關(guān)鍵詞、應(yīng)用分類等應(yīng)用專家標(biāo)簽不同,為此我們對GroupLens中電影標(biāo)簽數(shù)據(jù)([“tags”])進(jìn)行了處理:從每部電影的用戶個(gè)性化標(biāo)簽數(shù)據(jù)中,篩選出使用頻率最高的三個(gè)標(biāo)簽,作為該電影的“關(guān)鍵詞”標(biāo)簽,電影數(shù)據(jù)([“movies”])中的分類信息作為分類標(biāo)簽,共同構(gòu)成電影的“專家”標(biāo)簽。同時(shí),對應(yīng)新一代調(diào)控系統(tǒng)中應(yīng)用是/否留存的狀態(tài),基于電影的評分?jǐn)?shù)據(jù)([“ratings”]),先統(tǒng)計(jì)出平均值M,作為電影平均質(zhì)量的評判標(biāo)準(zhǔn),用戶對電影的評分大于等于M時(shí),定義為用戶“留存”電影A'。

4.3 實(shí)驗(yàn)方法

將實(shí)驗(yàn)數(shù)據(jù)集中電影評分?jǐn)?shù)據(jù)([“ratings”]),按照80/20 比例隨機(jī)分成兩部分:訓(xùn)練數(shù)據(jù)集T1包含評分?jǐn)?shù)據(jù)其中的80%,測試數(shù)據(jù)集V1包含剩余的20%。為了保證實(shí)驗(yàn)結(jié)果的客觀性,分為5 輪進(jìn)行重復(fù)測試,每輪保持80/20 比例重新隨機(jī)劃分訓(xùn)練數(shù)據(jù)集Ti和測試數(shù)據(jù)集Vi,1 ≤i≤5。

根據(jù)算法1,通過訓(xùn)練數(shù)據(jù)Ti為用戶um生成的推薦集合Ri。通過測試數(shù)據(jù)驗(yàn)證,計(jì)算推薦集合Ri中應(yīng)用的正負(fù)反饋比,在測試數(shù)據(jù)Vi中評分大于應(yīng)用商店平均分M 的應(yīng)用判定為正反饋,評分低于M的判定為負(fù)反饋。正負(fù)反饋比越高,證明應(yīng)用留存的概率越大,即應(yīng)用推薦的質(zhì)量越高。

4.4 實(shí)驗(yàn)結(jié)果

根據(jù)算法1,在每輪試驗(yàn)中,λ值依次為1、2、0.5、0.2,N 值依次為10、20、30、40、50。5 輪試驗(yàn)結(jié)果對比如圖1所示。

圖1 不同l值、N值對應(yīng)的推薦列表正負(fù)反饋比較

由圖1可以看出,5輪試驗(yàn),隨著訓(xùn)練數(shù)據(jù)集和測試數(shù)據(jù)集的隨機(jī)劃分,推薦結(jié)果雖有一定波動(dòng),但推薦結(jié)果表現(xiàn)出類似的變化趨勢。在同一l 值時(shí),Top-N推薦N值取10時(shí),取得最好的推薦效果,推薦的準(zhǔn)確性最高;隨著N 值范圍越大,推薦的準(zhǔn)確性越低,推薦結(jié)果中出現(xiàn)負(fù)反饋的比例越大。

此外,不同λ值對于推薦結(jié)果的表現(xiàn)為,λ值為1時(shí)表現(xiàn)相對更好,λ值為0時(shí),有一定程度降低,其余λ值表現(xiàn)變化不大。所以再考慮應(yīng)用的標(biāo)簽數(shù)據(jù)時(shí),應(yīng)用的關(guān)鍵詞標(biāo)簽、分類標(biāo)簽不同維度的標(biāo)簽,都應(yīng)該納入推薦依據(jù),根據(jù)試驗(yàn)結(jié)果,兩個(gè)維度權(quán)重相等時(shí),取得最好的推薦結(jié)果。

本文在基于專家標(biāo)簽多維特征的內(nèi)容推薦上,采用同類用戶協(xié)同推薦,對推薦結(jié)果進(jìn)行優(yōu)化。下表對本文方法和基于標(biāo)簽的內(nèi)容推薦方法進(jìn)行了推薦質(zhì)量采用每輪實(shí)驗(yàn)正負(fù)反饋比平均值進(jìn)行對比。

由表1 可以看出,本文方法相對于基于標(biāo)簽的推薦算法有了明顯的改進(jìn),在多維標(biāo)簽特征對推薦結(jié)果的基礎(chǔ)上,結(jié)合用戶的工作屬性,根據(jù)同類用戶喜好進(jìn)行協(xié)同過濾,對推薦結(jié)果的準(zhǔn)確度有進(jìn)一步提升。

表1 2種算法的推薦質(zhì)量比較

5 結(jié)語

實(shí)驗(yàn)結(jié)果顯示,本文提出的面向新一代調(diào)控系統(tǒng)的應(yīng)用個(gè)性化推薦技術(shù),在傳統(tǒng)基于用戶標(biāo)簽的推薦技術(shù)基礎(chǔ)上,充分利用新一代調(diào)控系統(tǒng)的場景特性,基于專家標(biāo)簽建立多維特征用戶興趣度模型,利用相同專業(yè)用戶興趣偏好進(jìn)行協(xié)同推薦,為用戶實(shí)現(xiàn)了應(yīng)用個(gè)性化推薦,提高了用戶應(yīng)用選擇效率。后續(xù)將在新一代調(diào)控系統(tǒng)上線運(yùn)行過程中,通過采集用戶操作數(shù)據(jù),進(jìn)一步完善推薦算法,實(shí)現(xiàn)更高質(zhì)量的推薦結(jié)果。

猜你喜歡
特征用戶系統(tǒng)
Smartflower POP 一體式光伏系統(tǒng)
WJ-700無人機(jī)系統(tǒng)
ZC系列無人機(jī)遙感系統(tǒng)
北京測繪(2020年12期)2020-12-29 01:33:58
如何表達(dá)“特征”
不忠誠的四個(gè)特征
抓住特征巧觀察
連通與提升系統(tǒng)的最后一塊拼圖 Audiolab 傲立 M-DAC mini
關(guān)注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
關(guān)注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關(guān)注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
主站蜘蛛池模板: 国产精品毛片一区| 996免费视频国产在线播放| 国产成人亚洲毛片| 亚洲第一中文字幕| 久久婷婷六月| 国产精品视频久| 欧美不卡视频在线| 宅男噜噜噜66国产在线观看| 中美日韩在线网免费毛片视频| 99免费在线观看视频| 国产女人在线| 97国产在线播放| 婷婷成人综合| 午夜老司机永久免费看片 | 久久国产毛片| 午夜天堂视频| 日韩av电影一区二区三区四区| 国产成年女人特黄特色毛片免| 亚洲妓女综合网995久久 | 91久久大香线蕉| 欧美在线天堂| 久久婷婷综合色一区二区| 超级碰免费视频91| 一区二区欧美日韩高清免费| 国产激情无码一区二区APP| 国产亚洲精品无码专| 欧美丝袜高跟鞋一区二区| 视频国产精品丝袜第一页| 免费一看一级毛片| 久久久久国产一级毛片高清板| 久久精品人人做人人综合试看| 直接黄91麻豆网站| 婷婷亚洲视频| 久久久久久久97| 高清不卡毛片| 婷婷丁香色| 国产精品欧美激情| 97在线免费| 亚洲高清中文字幕在线看不卡| 欧美中日韩在线| 毛片免费在线| 亚洲成人精品久久| 亚洲天堂免费在线视频| 亚洲天堂高清| 高清无码手机在线观看| 中文毛片无遮挡播放免费| 亚洲国产精品VA在线看黑人| 91久久夜色精品国产网站| 天天色综网| 精品乱码久久久久久久| 久久综合丝袜长腿丝袜| 精品视频免费在线| 亚洲中文字幕av无码区| 日韩乱码免费一区二区三区| 欧美一级高清片欧美国产欧美| 久久精品无码国产一区二区三区| 伊人久久婷婷| AV网站中文| 欧美人在线一区二区三区| 亚洲—日韩aV在线| 少妇极品熟妇人妻专区视频| 99视频精品在线观看| 麻豆AV网站免费进入| 国产91久久久久久| 欧美日韩专区| 国产www网站| 精品久久久久久中文字幕女| 国产精品视频导航| 中文字幕欧美日韩高清| 免费精品一区二区h| 亚洲日韩国产精品综合在线观看| 久久狠狠色噜噜狠狠狠狠97视色| 国产精品亚洲一区二区三区z| 国产在线97| 欧美一级高清视频在线播放| 色精品视频| 99re免费视频| 五月婷婷综合色| 久久窝窝国产精品午夜看片| 女人av社区男人的天堂| 中文字幕佐山爱一区二区免费| 久久精品中文字幕免费|