999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

一種基于標簽推薦的服務聚類方法

2017-06-26 12:49:31黃媛
計算機與數字工程 2017年6期
關鍵詞:文本用戶服務

黃媛

(長江工程職業技術學院信息工程系武漢430070)

一種基于標簽推薦的服務聚類方法

黃媛

(長江工程職業技術學院信息工程系武漢430070)

標注技術廣泛應用于標注Web2.0應用的對象中。標簽能支持Web服務更好地被理解分類和發現,這在面向對象的軟件系統中是很重要的。論文提出一種新穎的方法,描述文本和標簽都用來幫助API服務聚類。此外還提出一種標簽推薦策略,為了驗證論文方法的有效性,在API服務數據集上進行了實驗,實驗結果表明進行了標簽推薦后的服務更好改進了聚類的性能。

標注;推薦;Web服務;聚類

Class NumberTP391

1 引言

隨著Web2.0技術的飛速發展,Mashup和API服務在Web開發者社區中已經廣為流行[1],并且應用在許多開放的Web網站中。但由于企業Web應用中Mashup非常不同于其他的應用,常常不能重復使用或者是沒有Web API,這就意味著我們不得不為這些應用去創建大量Web API,大量的API服務每天都在涌現,所以我們需要一個平臺來瀏覽這些API服務。一些在線的平臺,例如雅虎,ProgrammableWeb.com等都允許用戶發布各種API服務。即使一些非專業人士也能通過組合Web API服務或其他的Web資源創建一些新的Web頁面[2],ProgrammableWeb是一個現在很流行的社區,它吸引了大批研究者對社區用戶行為進行研究。目前為止,網站已經有超過16534個開放的API服務。開發者不用經過測試就能將API服務結合起來[3~4]。和傳統的Web開發相比,Mashup越來越簡單和流行,因為開發者不用測試和移植內部的Web應用就能使用這些數據,非技術人員也能通過在線社區以這種Mashup服務的方式快速集成已有的應用。

2 相關工作

最近,Web服務聚類是一種新穎的服務發現方法。Liu等從web服務的WSDL文檔中提取特征,如內容,服務名,主機名進行Web服務聚類[5],把聚類過程看作是發現的預處理階段,希望幫助建立一個搜索引擎來爬取和聚類非語義的Web服務。一種個性化的,交互式的標簽推薦算法在文獻[6]中提出,提供了一種依賴標簽共現的特殊的標注數據的方式。標簽可以用圖的方式來呈現,其中每個節點是標簽,而節點之間的邊反映的是同一個文檔的共現情況。Wei等[7]提出一種用戶和其查詢的Web頁之間主題相似性的排序方法。一些文章也討論過Web服務的標注。Harald Meyer等使用標簽語義的方式來注釋Web服務[8],使用結構化協同標簽匹配Web服務。Gawinecki等[9]從WSDL文檔中提取參數名,并將它們以概念來聚類,聚類結果能用來改進web服務搜索結果的質量。

3 API服務聚類

3.1 API服務相似性

1)描述相似性

經過文檔預處理之后的API服務可以用詞語向量來表示,兩個文本的相似性也就是向量之間的相似性。可以用向量之間的夾角的余弦值來表示,也叫作余弦相似性,這是目前在信息檢索和聚類方法中。度量文本相似性的最常用的方法。給定兩個文檔和,它們的余弦相似性計算公式如下

2)標簽相似性

API服務的標注數據能描述API服務或是提供文本或語義信息。文中提出一種利用標注數據改進API服務聚類性能的方法。給定一個包含三個標簽t2,t3的API服務,si的標簽集Ti={t2,t3}。通過Jaccard系數方法計算標簽之間的相似性。

其中|Ti∩Tj|是同時標注和的標簽數目,|Ti∪Tj|是Ti和Tj的并集,

根據以上公式,API服務si和sj的相似性sim(si,sj)計算如下:

其中β,1-β是描述文本和標簽的權值,β是描述層相似性的權值,simdes() si,sj是描述層的相似性,β的取值范圍是[0,1],如果兩個服務的描述和標簽相同那么是1,如果兩個服務的描述和標簽完全不同則是0。

3.2 API服務的標簽推薦

ProgrammableWeb是一個很流行的圍繞用戶產生的Mashup的在線社區,在這里用戶可以發布、標注、評價Web API和Mashup,圖1是API的一個實例,包含這個API服務的細節信息,如所屬類別、標簽、協議等。這些方面吸引了大量研究者的注意,推動了很多關于在線用戶行為,Mashup創建的趨勢相關的很多研究。本文利用ProgrammableWeb的知識庫發現API和相應標注之間的關系,為了使Web服務發現結果更精確,根據這些關系改進了Web服務聚類的性能。通過在從ProgrammableWeb上爬取下來的真實數據集上做實驗,評價了本方法的有效性。

圖1 API服務實例

圖2 API服務和標簽之間的關系

通過分析從網絡上爬取下來的標簽數據,可以發現標簽的分布不一致,一些API服務有6個標簽而有的只有1到2個標簽。圖2展示的是API服務和標簽之間的關系,從圖中看到標簽的峰值是2,在ProgrammableWeb上每個API的標簽數目最大值是6,而標簽頻率峰值是2。我們通過匹配兩個API服務的標簽計算標簽層的相似性,具有較少標簽的API服務則降低了標簽層相似性的價值。本文提出一種給擁有較少標簽的API服務推薦相關標簽的方法解決此類問題。

圖3展示了一個名為AtlasCT的API服務標簽推薦的實例,整個標簽推薦過程如下:首先搜集所有標注的標簽,然后計算用戶標注的標簽和其他標簽的共現系數,接下來收集每個用戶標注的前k個標簽作為候選標簽集,在本例中k值設為4,geocoding的前4個共現標簽分別為address,location, route,places,文中采用Jaccard系數方法[10]來計算共現,公式如下

圖3 標簽推薦的過程

本文采用投票求和策略對候選標簽集進行排序,選擇前k個標簽作為推薦的標簽。在投票策略中,對每個候選標簽c∈C投票計算一個分數,給定一個候選標簽c,首先使用式(5)計算標簽和用戶(u∈U)之間的值vote(u,c)

在獲得每個用戶的標簽投票結果之后,使用式(6)將最后的投票結果進行求和。

4 實驗

4.1 評價指標

這里選擇精度(precision)為度量指標,在信息檢索中廣泛使用精度作為評價聚類性能的一個主要指標。

式中succ(ci)是正確聚類到類ci中正確的服務的數目mispl(ci)是劃分到聚類ci中錯誤的服務的數目。

本實驗中邀請三位有多年web服務開發經驗的志愿者給推薦的結果打分,分數分為三個等級:非常相關,相關和不相關。實驗使用top-k Discounted Cumulative Gain(DCG)作為標簽推薦的評價指標。

式中,reli是API服務與其第i個標簽的相關等級。

4.2 實驗過程及結果分析

為了評價標簽推薦的性能,從數據集中選取了200個具有3個標簽的API服務。表1所示為當k值在1~5之間變化的時候標簽推薦的平均DCG的值,從表中可以看到當k值為3的時候平均DCG的值最大。

表1 標簽推薦的平均DCG

本文比較了兩種API相似性的計算方法:

1)DAT(description and tag):通過計算API服務的描述文本的相似性和相應原有標簽之間的相似性,組合計算API服務的相似性(利用式(3))。

2)DATR(description and tag recommendation):通過計算API服務的描述文本的相似性和推薦的標簽之間的相似性,組合計算API服務的相似性。

本文采用基于API相似性的計算方法,利用K-means算法對API服務進行聚類,聚類數如圖4所示,200個API服務被分為三類,第一類是關于教育,第二類關于藝術,第三類是關于科技的API服務。采用DAT和DATR兩種方法得到的聚類數都是三類,但是得到的每個類中服務的數目不一樣。

從圖5中可以看到利用DAT方法的聚類平均精度為55%,而利用DATR方法的聚類平均精度為78%,高于DAT方法的聚類平均精度,結果表明對于標簽數較少的API服務添加了相關標簽后聚類效果比未經過標簽擴充的API服務聚類效果好。

圖4 API服務聚類結果

圖5 API服務聚類精度比較

5 結語

文中提出一種利用標注數據改進服務聚類的性能的方法。在DAT方法中,計算了API服務間描述層和標簽層相似性,然后利用描述層和標簽層的組合相似性,使用K-means聚類算法對API服務進行聚類,文中還提出一種標簽擴充的方法DATR更好地擴充了標簽數較少的API服務的標簽。為了評價API服務的聚類性能,我們從ProgrammableWeb網站上爬取了200個真實的API服務進行試驗,結果表明標簽擴充的方法改進了DAT的聚類性能。

[1]曹步清,劉建勛,王光榮.Mashup服務網絡及其拓撲結構分析[J].湖南科技大學學報(自然科學版),2012(2):72-76.

CAO Buqing,LIU Jianxun,WANG Guangrong.Mashup services network and its topology analysis[J].Journal of Hunan University of Science&Technology(Natural Science Edition),2012(2):72-76.

[2]Zheng Z B,Zhou T C,Michael R L,et al.Component ranking for fault-tolerant cloud applications[J].IEEE Transactions on Service Computing,2011,22(7):61-79.

[3]M.Roy,Towards end-user enabled web service consumption for Mashups[C]//IEEE ICSE'10,2010:413-416.

[4]Koschmider A.et al.Elucidating the Mashup Hype:Definition,Challenges,Methodical Guide and Tools for Mashups[C]//Proceeding of“2nd Workshop on Mashups,Enterprise Mashups and Lightweight Composition on the Web(MEM 2009)”,2009.

[5]Fangfang Liu,Lei Wang,Jie Yu.Context-aware similarity search of web service[C]//Proceedings of 2012 IEEE International Conference on Information Science and Technology,2012:596-602.

[6]Shengliang Xu,Shenghua Bao,Ben Fei,Zhong Su,Yong Yu.Exploring folksonomy for personalized search[C]//Proceeding of 31st Annual International ACM SIGIR Conference on research and development in information retrieval,2008:155-162.

[7]Wei Wei,Zhili Wang,Wenjing Li.ApplyingMashup for Composing Network Management Services[J].IJACT,2012,4(4):131-140.

[8]Harald Meyer,Mathias Weske.Light-Weight Semantic Service Annotations through Tagging[C]//Proceeding of 4thinternational conference on service-oriented computing-ICSOC 2006,2006:465-470.

[9]Gawinecki,Maciej,Cabri,Giacomo,Paprzycki,Marcin,Maria,Ganzha.WSColab:Structured Collaborative Tagging for Web Service Matchmaking[C]//Proceedings of the 6th International Conference on Web Information Systems and Technology,2010:70-77.

[10]潘偉豐,李兵,邵波,等.基于軟件網絡的服務自動分類和推薦方法研究[J].計算機學報,2011,34(12):2355-2369.

PAN Weifeng,LI Bing,SHAO Bo,et al.Service classification and recommendation based on software networks[J].Chinese Journal of Computers,2011,34(12):2355-2369.

A Service Clustering Method Based on Tag Recommendation

HUANG Yuan
(Department of Information Engineering,Changjiang Institute of Technology,Wuhan430070)

Tagging technique is widely used to annotate objects in Web 2.0 applications.Tags can support web service understanding,categorizing and discovering,which are important tasks in a service-oriented software system.In this paper,a novel approach is proposed that both description and tags are utilized for API service clustering in this approach.In addition,a tag recommendation strategy is presented.In order to verify the validity of this method,experiments are carried out on the API service data sets.The experimental results show that the service after the tag recommendation better improve the clustering performance.

tagging,recommendation,web service,clustering

TP391

10.3969/j.issn.1672-9722.2017.06.027

2016年12月7日,

2017年1月17日

國家自然科學基金項目“云環境下的服務信任評估及組合優化研究”(編號:61402168)資助。

黃媛,女,博士,講師,研究方向:數據挖掘、服務計算。

猜你喜歡
文本用戶服務
在808DA上文本顯示的改善
服務在身邊 健康每一天
今日農業(2019年12期)2019-08-15 00:56:32
服務在身邊 健康每一天
今日農業(2019年10期)2019-01-04 04:28:15
服務在身邊 健康每一天
今日農業(2019年16期)2019-01-03 11:39:20
基于doc2vec和TF-IDF的相似文本識別
電子制作(2018年18期)2018-11-14 01:48:06
招行30年:從“滿意服務”到“感動服務”
商周刊(2017年9期)2017-08-22 02:57:56
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學隱喻
主站蜘蛛池模板: 免费在线色| 欧美亚洲第一页| 亚洲天堂日韩av电影| 国产一区二区三区日韩精品| 日韩中文欧美| 91福利片| 国产一区二区三区精品欧美日韩| 国产女人水多毛片18| 免费可以看的无遮挡av无码| 免费国产一级 片内射老| 亚洲天堂网视频| 日韩成人高清无码| 免费AV在线播放观看18禁强制| 99在线观看国产| 国产精品无码AⅤ在线观看播放| 欧美成人精品在线| 最新国产精品鲁鲁免费视频| 亚洲浓毛av| 亚洲VA中文字幕| 九九线精品视频在线观看| 在线观看视频99| 国产精品女在线观看| 色悠久久综合| 18禁色诱爆乳网站| 超清无码一区二区三区| 日韩在线中文| 精品亚洲国产成人AV| 久热这里只有精品6| 无码精品国产VA在线观看DVD| 国产成人h在线观看网站站| 国产欧美日韩在线一区| 亚洲欧美综合精品久久成人网| yy6080理论大片一级久久| 亚洲AV无码不卡无码| 精品国产乱码久久久久久一区二区| 久久一色本道亚洲| a色毛片免费视频| 日本亚洲最大的色成网站www| 欧美 亚洲 日韩 国产| 99人妻碰碰碰久久久久禁片| 国产黄网永久免费| 国产99视频精品免费视频7| 97视频免费在线观看| 久久特级毛片| 日韩一区二区在线电影| 福利在线一区| 成人午夜精品一级毛片| 国产美女免费| 一本一道波多野结衣一区二区 | 久久久91人妻无码精品蜜桃HD| 亚洲国产成人自拍| 中文字幕在线欧美| 国产在线高清一级毛片| 在线欧美a| 欧美视频在线播放观看免费福利资源| 最新精品国偷自产在线| 欧美日韩精品在线播放| 国产在线高清一级毛片| 欧美在线黄| 黄色网页在线播放| 国产亚洲视频播放9000| 国产一区二区精品福利| 日韩毛片在线视频| 亚洲国内精品自在自线官| 久久久久免费看成人影片 | 久久国产精品嫖妓| 亚洲一区第一页| 日本高清有码人妻| 亚洲精品黄| 99r在线精品视频在线播放| www.国产福利| 在线亚洲精品福利网址导航| 午夜a视频| 国产门事件在线| 久久免费看片| 永久免费av网站可以直接看的| 国产内射在线观看| 91欧美在线| h视频在线播放| 国产在线精品网址你懂的| 国产成人精品一区二区| 国产精品短篇二区|