摘 要:移動(dòng)邊緣計(jì)算(mobile edge computing,MEC)環(huán)境下,海量的領(lǐng)域服務(wù)分布在邊緣服務(wù)器上,如何對(duì)大規(guī)模的邊緣服務(wù)進(jìn)行精確的聚類是亟需解決的重要問題之一。為此提出了一種MEC環(huán)境下多維屬性感知的邊緣服務(wù)二次聚類方法。該方法首先分析并建立了MEC環(huán)境下邊緣服務(wù)二次聚類指標(biāo)模型。之后,提出了一種基于密度的最小生成樹啟發(fā)式分段聚類算法(heuristic segmented for MST clustering based on service density,DMSC),基于DMSC算法依據(jù)一級(jí)指標(biāo)對(duì)邊緣服務(wù)進(jìn)行一次聚類。最后,將密度峰值算法中γ值引入到層次聚類中,構(gòu)建了基于密度峰值的層次聚類算法(hierarchical clustering based on density peak,HCDP),基于HCDP算法依據(jù)二級(jí)聚類指標(biāo),在一次聚類的基礎(chǔ)上對(duì)邊緣服務(wù)進(jìn)行二次聚類。在人工數(shù)據(jù)集和UCI數(shù)據(jù)集上開展了大量驗(yàn)證實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果表明,DMSC算法與HCDP算法提高了聚類的準(zhǔn)確率,減少了算法的平均迭代次數(shù),增強(qiáng)了算法的穩(wěn)定性。
關(guān)鍵詞:移動(dòng)邊緣計(jì)算;邊緣服務(wù);二次聚類;服務(wù)聚類
中圖分類號(hào):TP393 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1001-3695(2022)11-009-3263-07
doi: 10.19734/j.issn.1001-3695.2022.04.0148
Secondary clustering method for edge services based on
multi-dimensional attribute perception in MEC environment
Zheng Hedana, Ma Feifeib, Li Linxiaa, Liu Zhizhonga
(a. School of Computer amp; Control Engineering, b. The Center for Network Security amp; Information, Yantai University, Yantai Shandong 264005, China)
Abstract:In MEC environment, many services distribute on edge servers. Accurate clustering of a large number of edge ser-vices in MEC environment is important. Therefore, this paper proposed a multi-dimensional attribute-aware edge service se-condary clustering method in MEC environment. Firstly, it analyzed and established the secondary clustering index model of edge service in MEC environment. After that, it proposed a heuristic segmented for MST clustering based on service density (DMSC) algorithm, and clustered edge services based on first-level index. Finally, it introduced the γ in the density peak clustering algorithm into the hierarchical clustering, and proposed a hierarchical clustering based on density peak (HCDP) algorithm. Experiments show that the DMSC algorithm and the HCDP algorithm improve the accuracy of clustering, reduce the average number of iterations of the algorithm.
Key words:mobile edge computing; edge service; secondary clustering; service clustering
基金項(xiàng)目:國家自然科學(xué)基金資助項(xiàng)目(61872126);山東省自然科學(xué)基金重點(diǎn)資助項(xiàng)目(ZR2020KF019)
作者簡介:鄭禾丹(1997-),男,河南南陽人,碩士研究生,主要研究方向?yàn)榉?wù)計(jì)算;馬菲菲(1983-),女(蒙古族)(通信作者),河南葉縣人,工程師,學(xué)士,主要研究方向?yàn)橹悄芑逃夹g(shù)(mfflzz@126.com);李林霞(1996-),女,山東棲霞人,碩士研究生,主要研究方向?yàn)橹悄芑扑]技術(shù);劉志中(1981-),男,河南商水人,副教授,碩導(dǎo),博士,主要研究方向?yàn)榉?wù)計(jì)算與人工智能.
0 引言
隨著移動(dòng)邊緣計(jì)算技術(shù)的快速發(fā)展與成熟,網(wǎng)絡(luò)上出現(xiàn)了種類繁多、位置各異、服務(wù)質(zhì)量(quality of service,QoS)不同的海量邊緣服務(wù)。邊緣服務(wù)聚類成為MEC環(huán)境下服務(wù)發(fā)現(xiàn)、服務(wù)替換、服務(wù)選擇、服務(wù)管理等業(yè)務(wù)的重要支撐技術(shù)。然而,在MEC環(huán)境下,邊緣服務(wù)具有地理位置、邊緣服務(wù)器質(zhì)量、QoS、信譽(yù)度等多維屬性,大規(guī)模雜亂的邊緣服務(wù)信息嚴(yán)重影響了服務(wù)發(fā)現(xiàn)、服務(wù)選擇與服務(wù)優(yōu)化組合的效率。如何對(duì)具有多維屬性的邊緣服務(wù)進(jìn)行快速高效的聚類,成為移動(dòng)邊緣計(jì)算、服務(wù)計(jì)算與服務(wù)應(yīng)用領(lǐng)域亟待解決的重要問題之一。
近年來,國內(nèi)外學(xué)者針對(duì)服務(wù)聚類問題開展了深入的研究,并取得了豐富的研究成果。在云計(jì)算環(huán)境下,一些研究人員基于語義、特征詞等開展了Web服務(wù)聚類工作。文獻(xiàn)[1,2]根據(jù)描述性文本對(duì)Web 服務(wù)的功能屬性進(jìn)行提取,并提出多種基于語義的Web服務(wù)聚類方法,用于Web服務(wù)語義發(fā)現(xiàn)等場(chǎng)景。然而,這些研究工作未考慮語義稀疏等數(shù)據(jù)信息不足的情況,導(dǎo)致聚類效果有待提高。為了解決這一問題,文獻(xiàn)[3,4]針對(duì)語義矩陣稀疏問題展開了研究工作,利用Web服務(wù)主題模型對(duì)語義、特征詞進(jìn)行了擴(kuò)充,豐富了用于服務(wù)聚類的數(shù)據(jù)信息,提高了Web服務(wù)聚類的效果。文獻(xiàn)[5~8]在上述研究的基礎(chǔ)上,通過LDA等主題模型對(duì)文檔進(jìn)行語義分析,對(duì)潛在語義進(jìn)行挖掘,豐富了聚類時(shí)所需的數(shù)據(jù)信息,并通過模糊C均值(FCM)等聚類方法對(duì)Web服務(wù)進(jìn)行聚類。這些研究工作在數(shù)據(jù)信息的獲取與服務(wù)聚類方法方面進(jìn)行了改進(jìn),進(jìn)一步提高了Web服務(wù)聚類的效果。
文獻(xiàn)[9~12]在語義聚類的基礎(chǔ)上引入了神經(jīng)網(wǎng)絡(luò)等技術(shù),通過神經(jīng)網(wǎng)絡(luò)模型(word2vec模型等)對(duì)Web服務(wù)語義關(guān)系進(jìn)行訓(xùn)練以重新構(gòu)建詞文本,從而實(shí)現(xiàn)降維與擴(kuò)充,在一定程度上提高了服務(wù)文檔的聚類效果。針對(duì)Web服務(wù)聚類研究專注于Web服務(wù)描述(WSDL)文檔未考慮服務(wù)其他屬性的問題,文獻(xiàn)[13~16]提出將標(biāo)簽、社交屬性或服務(wù)間協(xié)作關(guān)系等其他多種聚類指標(biāo)應(yīng)用于Web服務(wù)聚類,提高了服務(wù)聚類的準(zhǔn)確性。
此外,不同于Web服務(wù)聚類的研究,其他領(lǐng)域內(nèi)的服務(wù)資源聚類研究更傾向于融合本領(lǐng)域內(nèi)服務(wù)資源的特性,根據(jù)這些特性相對(duì)應(yīng)地提出聚類方法。文獻(xiàn)[17~21]針對(duì)其他領(lǐng)域內(nèi)服務(wù)資源,根據(jù)其領(lǐng)域內(nèi)服務(wù)資源的特性,提取并建立了領(lǐng)域下服務(wù)聚類指標(biāo)模型,并針對(duì)性地提出了符合該領(lǐng)域特性的聚類方法來對(duì)服務(wù)資源進(jìn)行聚類。
上述研究工作分別針對(duì)Web領(lǐng)域及其他領(lǐng)域內(nèi)的服務(wù)資源,提出了多種優(yōu)秀的服務(wù)聚類方法,這對(duì)本文研究MEC環(huán)境下邊緣服務(wù)聚類具有積極意義。然而,在MEC環(huán)境下,由于服務(wù)部署在不同的邊緣服務(wù)器中,使得邊緣服務(wù)除了具有服務(wù)一般屬性之外,還具有服務(wù)所在位置以及服務(wù)所在服務(wù)器配置等特性。文獻(xiàn)[22]指出邊緣服務(wù)所具有的特性對(duì)邊緣服務(wù)的性能具有較強(qiáng)的影響,而已有的服務(wù)聚類方法沒有充分考慮MEC環(huán)境下邊緣服務(wù)的特性,因此無法直接應(yīng)用于MEC環(huán)境下邊緣服務(wù)的聚類。
目前,MEC環(huán)境下關(guān)于服務(wù)聚類的研究較少。文獻(xiàn)[23]在MEC環(huán)境下通過服務(wù)聚類實(shí)現(xiàn)了對(duì)QoS的預(yù)測(cè),但在聚類指標(biāo)定義上沒有考慮服務(wù)所在服務(wù)器的配置以及地理位置屬性對(duì)聚類結(jié)果的影響,使得聚類效果有待提高。因此,開展MEC環(huán)境下邊緣服務(wù)聚類方法研究具有重要的研究意義。
針對(duì)上述問題,本文深入考慮了MEC環(huán)境下邊緣服務(wù)具有的特性,提出了一種MEC環(huán)境下多維屬性感知的邊緣服務(wù)二次聚類方法。該方法首先提取并建立了MEC環(huán)境下邊緣服務(wù)聚類指標(biāo)模型,將邊緣服務(wù)所在服務(wù)器的地理位置與配置作為一級(jí)聚類指標(biāo);將服務(wù)質(zhì)量(QoS)、信譽(yù)度等其他重要非功能屬性作為二級(jí)聚類指標(biāo),建立二級(jí)聚類指標(biāo)模型;然后,提出了一種基于密度的最小生成樹啟發(fā)式分段聚類算法,基于DMSC算法依據(jù)一級(jí)指標(biāo)對(duì)邊緣服務(wù)進(jìn)行一次聚類,得到地理位置相近、服務(wù)器配置相似的邊緣服務(wù)類簇;最后,將密度峰值算法與層次聚類算法相結(jié)合,構(gòu)建了基于密度峰值的層次聚類算法,基于HCDP算法依據(jù)邊緣服務(wù)的二級(jí)聚類指標(biāo),在一次聚類的基礎(chǔ)上對(duì)邊緣服務(wù)進(jìn)行二次聚類,最終形成相似度更強(qiáng)的邊緣服務(wù)類簇。本文的主要貢獻(xiàn)如下:
a)為了進(jìn)一步體現(xiàn)服務(wù)地理位置與服務(wù)器配置對(duì)邊緣服務(wù)性能的重要性,提出并建立了MEC環(huán)境下邊緣服務(wù)二次聚類指標(biāo)模型。將邊緣服務(wù)所在服務(wù)器的地理位置與服務(wù)器配置作為一級(jí)聚類指標(biāo);將邊緣服務(wù)的服務(wù)質(zhì)量(QoS)與信譽(yù)度作為二級(jí)聚類指標(biāo)。
b)為了提高M(jìn)EC環(huán)境下邊緣服務(wù)聚類的效率,提出了一種基于密度的最小生成樹啟發(fā)式分段聚類算法。將局部密度作為初始類簇中心選取的依據(jù),加速了算法的收斂速率。同時(shí),根據(jù)最小生成樹(MST)所具有的稀疏性,選用MST來存儲(chǔ)初始聚類結(jié)果并依據(jù)簇間相似度進(jìn)行分段操作,產(chǎn)生新的聚類結(jié)果,可以有效地降低算法的時(shí)間復(fù)雜度。
c)為了進(jìn)一步增強(qiáng)邊緣服務(wù)聚類的精度,將密度峰值算法與層次聚類算法相結(jié)合,在邊緣服務(wù)一次聚類的基礎(chǔ)上,依據(jù)邊緣服務(wù)的γ值有序地對(duì)邊緣服務(wù)進(jìn)行二次聚類,有效地提高了邊緣服務(wù)的聚類效果。
1 MEC環(huán)境下邊緣服務(wù)二次聚類指標(biāo)模型
在MEC環(huán)境下,海量的邊緣服務(wù)部署在眾多具有不同位置和配置的邊緣服務(wù)器上。同時(shí),邊緣服務(wù)自身具有服務(wù)質(zhì)量、信譽(yù)度等其他非功能屬性。MEC環(huán)境下的邊緣服務(wù)聚類問題,本質(zhì)上是將大規(guī)模功能相同或相似的邊緣服務(wù),依據(jù)邊緣服務(wù)的多種非功能性屬性將其劃分為不同的服務(wù)類簇,每一個(gè)服務(wù)類簇中的服務(wù)具有相似的非功能性屬性。在MEC環(huán)境下,邊緣服務(wù)器的地理位置與其配置對(duì)于邊緣服務(wù)的性能具有重要的影響[24]。此外,在進(jìn)行邊緣服務(wù)的選擇時(shí),首先需要考慮邊緣服務(wù)的位置與其所在服務(wù)器的性能。因此,在對(duì)邊緣服務(wù)進(jìn)行聚類時(shí),應(yīng)首先依據(jù)邊緣服務(wù)器的地理位置與其配置信息對(duì)邊緣服務(wù)進(jìn)行聚類;之后,再依據(jù)邊緣服務(wù)的其他非功能屬性進(jìn)行二次聚類。這種聚類方式能夠很好地滿足MEC環(huán)境下服務(wù)發(fā)現(xiàn)與服務(wù)選擇的需要。
本文根據(jù)MEC環(huán)境下邊緣服務(wù)所具備的特性及其具備的一般服務(wù)非功能屬性度量指標(biāo),提出了兩級(jí)服務(wù)聚類指標(biāo)模型,作為邊緣服務(wù)二次服務(wù)聚類的依據(jù)。一次聚類指標(biāo)主要包括邊緣服務(wù)器的地理位置與配置(CPU性能、內(nèi)存、硬盤、數(shù)據(jù)傳輸速率);其次,將邊緣服務(wù)的QoS(成本、響應(yīng)時(shí)間、可用性、可靠性)和信譽(yù)度作為邊緣服務(wù)的二次聚類指標(biāo)。依據(jù)兩級(jí)指標(biāo)對(duì)邊緣服務(wù)進(jìn)行二次聚類,能夠充分體現(xiàn)MEC環(huán)境下邊緣服務(wù)的特性,同時(shí)也能提高服務(wù)聚類的精度。
設(shè)邊緣服務(wù)的非功能性屬性集為SNF={RL,RS,RQ,RC},其中,RL表示邊緣服務(wù)所在服務(wù)器的位置,RS表示服務(wù)所在邊緣服務(wù)器的配置,RQ表示服務(wù)的QoS,RC表示服務(wù)的信譽(yù)度。在一級(jí)指標(biāo)模型中,定義邊緣服務(wù)的地理位置為Ri,L=(xi,yi), xi,yi∈Euclid ExtraaBp,其中xi表示邊緣服務(wù)si的經(jīng)度,yi表示邊緣服務(wù)si的緯度。邊緣服務(wù)器的配置RS主要的指標(biāo)包括服務(wù)器的CPU、內(nèi)存以及數(shù)據(jù)傳輸率。邊緣服務(wù)聚類一級(jí)指標(biāo)模型可定義為Ri,1={Ri,L,Ri,S}。
在MEC環(huán)境下,服務(wù)質(zhì)量是直觀體現(xiàn)服務(wù)非功能性的評(píng)價(jià)指標(biāo),本文將服務(wù)費(fèi)用、反應(yīng)時(shí)間、可用性以及可靠性作為QoS的度量因素,定義服務(wù)的QoS模型為RQoS={rC,rRT,rA,rRb},其中,rC為服務(wù)費(fèi)用,表示用戶使用服務(wù)i時(shí)所需要支付的費(fèi)用;rRT為服務(wù)執(zhí)行時(shí)間,表示從用戶發(fā)出服務(wù)請(qǐng)求到服務(wù)結(jié)束所用的時(shí)間;rA為服務(wù)可用性,表示服務(wù)正常運(yùn)行時(shí)間占總時(shí)間的百分比;rRb為服務(wù)可靠性,表示在用戶輸入錯(cuò)誤、網(wǎng)絡(luò)過載或被有意攻擊情況下,服務(wù)正常運(yùn)行的能力。此外,考慮到服務(wù)的信譽(yù)度對(duì)用戶服務(wù)使用體驗(yàn)具有重要的影響,本文將QoS與信譽(yù)度相結(jié)合,作為服務(wù)的二次聚類指標(biāo),很好地平衡了服務(wù)質(zhì)量在主觀與客觀上的評(píng)價(jià)。服務(wù)信譽(yù)度是用戶對(duì)服務(wù)的主觀評(píng)價(jià),可描述為Cr(si)∈[1,10]。MEC環(huán)境下服務(wù)聚類指標(biāo)模型如表1、2所示。
2 邊緣服務(wù)聚類指標(biāo)數(shù)據(jù)預(yù)處理及相似度計(jì)算公式
由于邊緣服務(wù)具有多種非功能屬性聚類指標(biāo),這些聚類指標(biāo)的取值類型和取值范圍不同,若直接使用原始指標(biāo)值,則會(huì)降低聚類的準(zhǔn)確性。所以,本文對(duì)原始指標(biāo)數(shù)據(jù)進(jìn)行歸一化處理,使得各指標(biāo)的取值類型和范圍具有可比性。
2.1 指標(biāo)取值歸一化處理
邊緣服務(wù)各聚類指標(biāo)的取值類型通常為實(shí)數(shù)型與區(qū)間型,下面分別給出實(shí)數(shù)型數(shù)據(jù)和區(qū)間型數(shù)據(jù)的歸一化處理方式。
2.1.1 實(shí)數(shù)型數(shù)據(jù)的歸一化處理
目前,最常用的數(shù)據(jù)歸一化處理方法是min-max標(biāo)準(zhǔn)化法,它通過對(duì)原始數(shù)據(jù)進(jìn)行線性變換將數(shù)據(jù)統(tǒng)一映射到[0,1]。對(duì)于正向?qū)崝?shù)型指標(biāo),其歸一化轉(zhuǎn)換函數(shù)如式(1)所示。
對(duì)于逆向?qū)崝?shù)型指標(biāo),其歸一化公式如式(2)所示。
其中:xi,k表示邊緣服務(wù)si的第k個(gè)指標(biāo)值;x′i,k表示xi,k歸一化后的值;xkmin和xkmax分別表示第k個(gè)指標(biāo)的最小和最大值。
2.1.2 區(qū)間型數(shù)據(jù)的歸一化處理
服務(wù)聚類指標(biāo)中,有一些指標(biāo)的數(shù)據(jù)類型為區(qū)間型。對(duì)于這種數(shù)據(jù)類型,本文首先采用三角模糊數(shù)對(duì)該類屬性進(jìn)行描述,如式(3)所示。
2.2 聚類指標(biāo)相似度計(jì)算公式
在進(jìn)行邊緣服務(wù)聚類時(shí),通過計(jì)算聚類指標(biāo)間的相似度,從而可全面有效地刻畫服務(wù)間的差異,提高聚類的精準(zhǔn)度。在本文提出的服務(wù)聚類多級(jí)指標(biāo)模型中,主要包括實(shí)數(shù)型數(shù)據(jù)以及區(qū)間型數(shù)據(jù),下面分別給出這兩種數(shù)據(jù)類型的相似度計(jì)算公式。
2.2.1 實(shí)數(shù)型數(shù)據(jù)的相似度計(jì)算公式
3 MEC環(huán)境下邊緣服務(wù)二次聚類方法
在MEC環(huán)境下,對(duì)服務(wù)池中功能相同或相似的邊緣服務(wù)進(jìn)行聚類,可準(zhǔn)確地得到非功能屬性相似的服務(wù)類簇。鑒于MEC環(huán)境下,邊緣服務(wù)具有多種不同的非功能性屬性,不同的屬性對(duì)于邊緣服務(wù)聚類的影響不同。為了提高邊緣服務(wù)聚類的效率與效果,本文提出一種MEC環(huán)境下多維屬性感知的邊緣服務(wù)二次聚類方法。該方法首先根據(jù)邊緣服務(wù)所在服務(wù)器的地理位置與配置屬性進(jìn)行一次聚類;在一次聚類基礎(chǔ)上,根據(jù)服務(wù)的QoS與信譽(yù)度再進(jìn)行二次聚類。
3.1 基于DMSC算法的邊緣服務(wù)一次聚類
K-means算法具有簡單、快速以及適合處理大規(guī)模數(shù)據(jù)等優(yōu)點(diǎn),近年來在服務(wù)聚類方面得到了廣泛的應(yīng)用[18,19,25]。此外,結(jié)合最大最小距離和加權(quán)密度的K-means算法(KWDM)[26]為一種改進(jìn)的K-means聚類算法,其基本思想是利用各樣本點(diǎn)局部密度值排除離群點(diǎn),從而選出聚類中心點(diǎn)集;通過最大最小距離準(zhǔn)則選取聚類中心;最后,利用簇內(nèi)樣本距離與簇間樣本距離的比值來確定聚類中心K的值。雖然KWDM 算法克服了K-means算法對(duì)聚類中心選擇的隨機(jī)性,避免了聚類結(jié)果陷入局部最優(yōu)的問題,但該算法仍存在一些局限性:
a)KWDM算法規(guī)定聚類中心個(gè)數(shù)K只能在[1,n]取值,不能很好地應(yīng)對(duì)服務(wù)分布較為離散、簇類過多的情況;
b)在局部密度定義上,未考慮數(shù)量相同但緊密程度不同的情況,導(dǎo)致初始聚類中心選取精度不足,對(duì)聚類結(jié)果的準(zhǔn)確性產(chǎn)生不好的影響。
針對(duì)上述不足,本文對(duì)KWDM算法進(jìn)行了以下改進(jìn)工作:
a)針對(duì)KWDM算法在聚類對(duì)象分布較為離散時(shí)聚類結(jié)果不準(zhǔn)確這一不足,本文將前n+|log2n|個(gè)局部密度較大的點(diǎn)作為初始類簇中心,將所含聚類對(duì)象較少的類簇判定為離群點(diǎn),以此提高聚類的精度。
b)針對(duì)同一半徑內(nèi)聚類對(duì)象數(shù)量相同、緊密程度不同的情況,設(shè)計(jì)了新的局部密度函數(shù),將服務(wù)間相似度sim(sp,sq)作為計(jì)算服務(wù)局部密度的一部分,提高了局部密度的精度,便于初始類簇中心的選取。局部密度函數(shù)如式(14)所示,其中|si|表示半徑內(nèi)服務(wù)的個(gè)數(shù),|Osi|2表示圓Osi內(nèi)服務(wù)對(duì)的個(gè)數(shù)。
本文以最小生成樹(minimum spanning tree,MST)的形式來存儲(chǔ)初始聚類結(jié)果并處理類簇間的聚合問題,既可以保留初始聚類的結(jié)果,又能夠降低服務(wù)聚類的復(fù)雜度。基于上述的改進(jìn)工作,本文提出了基于密度的最小生成樹啟發(fā)式分段聚類算法(heuristic segmented for MST clustering based on service density, DMSC),并應(yīng)用DMSC對(duì)邊緣服務(wù)進(jìn)行一次聚類,基于DMSC的邊緣服務(wù)一次聚類過程如算法1所示。
算法1 基于密度的最小生成樹啟發(fā)式分段聚類算法
輸入:服務(wù)集合S;服務(wù)個(gè)數(shù)N。
輸出:聚類結(jié)果π={C1,C2,C3,…,Cm}。
a)計(jì)算服務(wù)間相似度。
b)依據(jù)服務(wù)間相似度計(jì)算服務(wù)集合S的平均相似度, 設(shè)為局部密度閾值。
c)計(jì)算每個(gè)服務(wù)的局部密度。
d)選擇前n+log2n」個(gè)局部密度較大的服務(wù)作為初始類簇中心。
e)依據(jù)最大最小距離準(zhǔn)則對(duì)剩余服務(wù)進(jìn)行分類, 得到初始聚類結(jié)果。
f)計(jì)算初始聚類結(jié)果中簇間相似度與簇內(nèi)相似度。
g)以初始聚類結(jié)果中類簇為節(jié)點(diǎn), 簇間相似度為邊的權(quán)重,采用kruskal算法,依次選擇權(quán)重最大的邊生成最小生成樹。
h)依據(jù)權(quán)重最小的邊對(duì)最小生成樹進(jìn)行切割,得到新的聚類結(jié)果。
i)依據(jù)簇間相似度與簇內(nèi)相似度的比值選擇最優(yōu)聚類結(jié)果。
j)采用K-means思想對(duì)聚類結(jié)果進(jìn)行微調(diào)。
在步驟a)~c)中,首先將服務(wù)平均相似度作為截?cái)嗑嚯x,利用式(13)來計(jì)算每個(gè)服務(wù)的局部密度;步驟d)~e)中,將前n+log2n」個(gè)局部密度值較大的服務(wù)作為初始聚類中心,并根據(jù)最大最小距離準(zhǔn)則將剩余服務(wù)進(jìn)行分配;步驟f)g)中,計(jì)算各類簇的簇內(nèi)相似度ICS與簇間相似度ECS,并利用kruskal算法選取權(quán)值最大的邊生成最小生成樹,并將其作為類簇?cái)?shù)為1的聚類結(jié)果,其中節(jié)點(diǎn)N由各類簇表示,簇間相似度ECS表示邊上的權(quán)值W;步驟h)對(duì)MST中權(quán)值最小的邊進(jìn)行分段操作(即對(duì)簇間相似度ECS最小的邊進(jìn)行分段操作),得到兩個(gè)新的類簇,將所含服務(wù)較少的類簇判定為離群簇并按最大最小距離準(zhǔn)則對(duì)其類簇內(nèi)服務(wù)進(jìn)行分配,將結(jié)果作為新的聚類結(jié)果,循環(huán)執(zhí)行該步驟,直至所有的邊都被切割完畢時(shí)停止分段操作;最后,通過比較簇間相似度與簇內(nèi)相似度的比值,將比值最小的聚類結(jié)果依據(jù)K-means算法思想進(jìn)行微調(diào),作為一次服務(wù)聚類的結(jié)果π={C1,C2,C3,…,Cm}。
3.2 基于HCDP算法的邊緣服務(wù)二次聚類
由于邊緣服務(wù)具有多種非功能屬性,通過二次聚類可以進(jìn)一步提高聚類結(jié)果的準(zhǔn)確性,進(jìn)而提高邊緣服務(wù)的發(fā)現(xiàn)效率。層次聚類算法在處理小規(guī)模數(shù)據(jù)集時(shí)具有簡單、快速等優(yōu)勢(shì),所以,本文采用層次聚類算法對(duì)邊緣服務(wù)進(jìn)行二次聚類。密度峰值算法(density peak clustering,DPC)以能夠快速發(fā)現(xiàn)具有成為聚類中心潛力的樣本點(diǎn)而聞名[27]。為了提高層次聚類算法的收斂速度,本文將密度峰值算法中γ值引入到層次聚類算法中,依據(jù)各邊緣服務(wù)的γ值有序地對(duì)邊緣服務(wù)進(jìn)行層次聚類。邊緣服務(wù)的γ值越大表示該服務(wù)成為聚類中心的潛力越大。設(shè)數(shù)據(jù)點(diǎn)xi的局部密度為ρi,數(shù)據(jù)點(diǎn)xi到局部密度比它大且距離最近的數(shù)據(jù)點(diǎn)xj的距離為δi,ρi與δi的計(jì)算公式為
其中:dij為xi和xj之間的距離;dc為截?cái)嗑嚯x;χ(·)為邏輯判斷函數(shù),若(·)lt;0,則χ(·)=1,否則χ(·)=0。
對(duì)于局部密度最大的數(shù)據(jù)點(diǎn)xi,δi=max(dij)。數(shù)據(jù)點(diǎn)xi的γ值為該點(diǎn)局部密度與δi的乘積,γi=ρi×δi。
通過依次選取γ值最大的服務(wù)進(jìn)行層次聚類,在一定程度上解決了層次聚類不可逆所導(dǎo)致的聚類效果不理想的問題,同時(shí)也加速了聚類收斂的速率。本文基于密度峰值的層次聚類算法對(duì)邊緣服務(wù)進(jìn)行二次聚類,其聚類過程如算法2所示。
算法2 基于密度峰值的層次聚類算法
輸入: 服務(wù)集合S;服務(wù)個(gè)數(shù)N。
輸出: 聚類結(jié)果π={C1,C2,C3,…,Cm}。
a)計(jì)算每個(gè)服務(wù)的局部密度、δ值、γ值。
b)將所有服務(wù)歸為一個(gè)類簇。
c)計(jì)算每個(gè)類簇的簇內(nèi)相似度。
d)從所有類簇中挑選出簇內(nèi)相似度最小的類簇C。
e)將類簇C中γ值最大的點(diǎn)放入NewGroup中,剩余的放在OldGroup中。
f)在OldGroup中找出到最近的NewGroup中的點(diǎn)的距離不大于到OldGroup中最近點(diǎn)的距離的點(diǎn),并將該點(diǎn)加入NewGroup中。
g)依據(jù)簇間相似度與簇內(nèi)相似度的比值選擇最優(yōu)聚類結(jié)果π。
h)采用K-means思想對(duì)聚類結(jié)果進(jìn)行微調(diào)。
算法2將密度峰值聚類算法中初始聚類中心選取的方法加入層次聚類算法中,依據(jù)每個(gè)邊緣服務(wù)的γ值進(jìn)行分簇操作,有效地克服了層次聚類難以收斂的問題。步驟a)將一次聚類結(jié)果中任一類簇作為輸入的服務(wù)集合S,計(jì)算各服務(wù)的局部密度、δ值以及γ值;步驟b)~f)依次選取類簇C中γ值最大的服務(wù)進(jìn)行分簇操作,直到OldGroup中沒有新的服務(wù)可分配給NewGroup;最后,通過比較簇間相似度與簇內(nèi)相似度的比值,將比值最小的聚類結(jié)果依據(jù)K-means算法思想進(jìn)行微調(diào),作為一次服務(wù)聚類的結(jié)果π={C1,C2,C3,…,Cm}。
4 實(shí)驗(yàn)與結(jié)果分析
由于MEC環(huán)境的特殊性以及服務(wù)屬性的多元性,當(dāng)前還不存在公用的邊緣服務(wù)聚類數(shù)據(jù)集。為此,本文采用隨機(jī)生成的數(shù)值型人工數(shù)據(jù)集來驗(yàn)證本文所提算法的正確性。同時(shí),采用UCI(University of California, Irvine)數(shù)據(jù)集與K-means等算法進(jìn)行性能對(duì)比,驗(yàn)證本文算法的優(yōu)越性。實(shí)驗(yàn)環(huán)境為個(gè)人電腦, 具體配置為:操作系統(tǒng)為Windows 10系統(tǒng),CPU Intel CoreTM i5-6300HQ 2.30 GHz,內(nèi)存為8.00 GB;算法使用編程語言C++11實(shí)現(xiàn)。
4.1 實(shí)驗(yàn)數(shù)據(jù)的生成
在移動(dòng)邊緣計(jì)算環(huán)境下,大城市周邊邊緣服務(wù)器分布較多,小城市周邊邊緣服務(wù)器分布較少。為了有效地驗(yàn)證聚類的效果,以下述四條準(zhǔn)則為基礎(chǔ),隨機(jī)生成1 000個(gè)功能相同的邊緣服務(wù)作為數(shù)據(jù)集分布在解空間中,其中每條數(shù)據(jù)包含地理位置、服務(wù)器質(zhì)量、QoS與信譽(yù)度屬性。
a)參考公共數(shù)據(jù)集five_cluster,以五座城市為中心,以中心向周圍擴(kuò)散的形式生成地理位置屬性。
b)同一城市可能有多種配置不同的邊緣服務(wù)器,邊緣服務(wù)器質(zhì)量數(shù)據(jù)生成參考亞馬遜(Amazon)云服務(wù)器質(zhì)量屬性。
c)具有相同功能的邊緣服務(wù)QoS值(費(fèi)用、反應(yīng)時(shí)間、可用性、可靠性等),在一定范圍內(nèi)隨機(jī)生成。其中,服務(wù)費(fèi)用與反應(yīng)時(shí)間為實(shí)數(shù)型數(shù)據(jù),服務(wù)可用性與可靠性為區(qū)間型數(shù)據(jù),用三角模糊數(shù)表示。
d) 信譽(yù)度為區(qū)間型數(shù)據(jù),用三角模糊數(shù)來表示,取值在[1,10]隨機(jī)生成。其中,值越大表示該邊緣服務(wù)信譽(yù)度越高,越受用戶喜歡。
表3給出了隨機(jī)生成的人工數(shù)據(jù)集中部分?jǐn)?shù)據(jù)信息,這些信息表示在不同座城市中具有相同功能屬性的邊緣服務(wù),這些邊緣服務(wù)分布在質(zhì)量不同的邊緣服務(wù)器中。
4.2 聚類有效性驗(yàn)證
依據(jù)MEC環(huán)境下邊緣服務(wù)聚類指標(biāo)模型,將所生成的人工數(shù)據(jù)集分為兩組。其中一組包含邊緣服務(wù)器地理位置屬性與邊緣服務(wù)器質(zhì)量屬性,用于驗(yàn)證一次聚類算法(DMSC)的有效性;另一組包含邊緣服務(wù)QoS屬性與用戶評(píng)價(jià)屬性,用于驗(yàn)證二次聚類算法(HCDP)的有效性。基于兩組人工數(shù)據(jù),分別采用DMSC、HCDP與KWDM算法進(jìn)行實(shí)驗(yàn),對(duì)實(shí)驗(yàn)結(jié)果進(jìn)行統(tǒng)計(jì)記錄。以簇間相似度與簇內(nèi)相似度的比值(ECS/ICS)作為判定聚類結(jié)果優(yōu)劣的依據(jù),繪制不同迭代次數(shù)下比值變化的折線圖。實(shí)驗(yàn)結(jié)果如圖1、2所示。
圖1、2分別展示了DMSC、HCDP與KWDM算法的迭代次數(shù)與ECS/ICS比值之間的關(guān)系。從圖1、2中可以看出,相較于KWDM算法,DMSC與HCDP通過較少次數(shù)的迭代便可得到最優(yōu)的聚類結(jié)果。這是由于DMSC算法采用最小生成樹來存儲(chǔ)初始聚類結(jié)果,降低了算法后續(xù)操作的復(fù)雜性,加速了算法的收斂速率;同時(shí),在HCDP算法中引入密度峰值思想,依據(jù)γ值選取了較優(yōu)的初始聚類中心,提高了算法的收斂速率。
4.3 聚類算法性能比較分析
為了測(cè)試聚類算法的準(zhǔn)確性,該實(shí)驗(yàn)選用UCI數(shù)據(jù)庫中的iris、wine和seeds三組數(shù)據(jù)集進(jìn)行實(shí)驗(yàn),同時(shí)對(duì)本文所提出的二次聚類算法中的相似度計(jì)算公式進(jìn)行調(diào)整以適應(yīng)實(shí)驗(yàn)要求。其中iris數(shù)據(jù)集樣本數(shù)據(jù)總數(shù)為150,數(shù)據(jù)屬性為4,類數(shù)為3;wine數(shù)據(jù)集樣本個(gè)數(shù)為178,數(shù)據(jù)屬性個(gè)數(shù)為13,類數(shù)為3;seeds 數(shù)據(jù)集樣本個(gè)數(shù)為210,數(shù)據(jù)屬性個(gè)數(shù)為7,類數(shù)為3。三個(gè)數(shù)據(jù)集的統(tǒng)計(jì)信息如表4所示。
為驗(yàn)證本文所提出算法的有效性,該實(shí)驗(yàn)采用K-means算法、文獻(xiàn)[28]的算法(改進(jìn)的K-means算法)、KWDM算法、文獻(xiàn)[29]的算法(DDK-means算法)、文獻(xiàn)[30]的算法(SSE-means算法)以及本文提出的DMSC服務(wù)聚類算法與HCDP服務(wù)聚類算法分別在三組UCI數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn)。七種聚類算法的準(zhǔn)確率實(shí)驗(yàn)結(jié)果如表5所示。
從表5中可以看出,DMSC聚類方法得到的平均準(zhǔn)確率相比于K-means算法、改進(jìn)的K-means算法、KWDM算法、DDK-means算法以及SSE-means算法分別提高了15.3%、10.6%、1.9%、5.1%和5.9%;HCDP聚類方法得到的平均準(zhǔn)確率相比于K-means算法、改進(jìn)的K-means算法、KWDM算法、DDK-means算法以及SSE-means算法分別提高了17.7%、13%、4.3%、7.5%和8.3%。由此可以看出,本文提出的DMSC算法與HCDP算法在三種UCI數(shù)據(jù)集上的平均準(zhǔn)確率明顯優(yōu)于其他五種算法。這是因?yàn)楸疚乃岢龅腄MSC聚類算法在對(duì)初始聚類中心進(jìn)行選取時(shí),重新定義了局部密度函數(shù)公式,提高了初始聚類中心選取的精度,增加了聚類結(jié)果的準(zhǔn)確率。同時(shí),HCDP聚類算法依次選取γ值最大的服務(wù)進(jìn)行層次聚類,在一定程度上解決了層次聚類不可逆所導(dǎo)致的聚類效果不理想的問題,提高了算法的準(zhǔn)確率。
表6統(tǒng)計(jì)了七種算法在得到最優(yōu)聚類結(jié)果時(shí)算法的迭代次數(shù)。可以看出,KWDM與DDK-means算法的迭代次數(shù)均小于K-means、改進(jìn)的K-means與SSE-means算法。這是由于KWDM與DDK-means在選取初始聚類中心的過程中采取基于密度的選取策略,提高了算法的穩(wěn)定性。而DMSC與HCDP的迭代次數(shù)又均小于KDWM與DDK-means。這是因?yàn)楸疚膶?duì)初始聚類中心的選取進(jìn)行了優(yōu)化,同時(shí)依據(jù)初始聚類中心進(jìn)行預(yù)聚類,并依據(jù)初始聚類結(jié)果生成最小生成樹,降低了算法后續(xù)操作的復(fù)雜度,加速了算法的收斂,減少了算法的迭代次數(shù)。
圖3~5分別統(tǒng)計(jì)了七種聚類算法在三組數(shù)據(jù)集上的準(zhǔn)確率和迭代次數(shù)關(guān)系。這充分說明DMSC與HCDP的準(zhǔn)確率不隨算法迭代次數(shù)的增加而發(fā)生劇烈變化,算法具有較好的穩(wěn)定性,只需進(jìn)行少量迭代便可得到較優(yōu)的聚類結(jié)果。
4.4 聚類算法時(shí)間復(fù)雜度比較分析
K-means算法的時(shí)間復(fù)雜度為O(nkT),其中n為聚類樣本個(gè)數(shù),k為聚類簇?cái)?shù),T為K-means的迭代次數(shù)。KWDM算法的聚類過程主要分為兩部分,其中選取初始聚類中心的時(shí)間復(fù)雜度為O(n2),確定K值的時(shí)間復(fù)雜度為O(nT3/2),因此KWDM算法整體時(shí)間復(fù)雜度為O(n2)+O(nT3/2),其中T為KWDM算法的迭代次數(shù)。本文的二次服務(wù)聚類算法的過程主要分為五部分,其中選取初始聚類中心的時(shí)間復(fù)雜度為O(n2),生成MST的時(shí)間復(fù)雜度為O(ElogE),對(duì)MST進(jìn)行切割操作的時(shí)間復(fù)雜度為O(1),對(duì)離群點(diǎn)進(jìn)行重新分組的時(shí)間復(fù)雜度為O(n),基于密度峰值的層次聚類算法時(shí)間復(fù)雜度為O(n2)+O(tn),因此二次服務(wù)聚類算法的時(shí)間復(fù)雜度為O(n2)+O(ElogE)+O(tn),其中E為MST邊的個(gè)數(shù),t為微調(diào)時(shí)的迭代次數(shù)。算法的時(shí)間復(fù)雜度如表7所示。
從表7中可以看出,本文的算法相較于KWDM算法在時(shí)間復(fù)雜度上略微高,這是由于該算法進(jìn)行了兩次聚類, 而且在一次聚類過程中增加了生成MST的步驟,但通過增加生成MST的步驟降低了后續(xù)操作的復(fù)雜性。通過兩次聚類的方法,以時(shí)間換取聚類的精度,增加了聚類結(jié)果的準(zhǔn)確性,在MEC環(huán)境下,該算法能更好地體現(xiàn)地理位置與服務(wù)器質(zhì)量屬性的重要性。
5 結(jié)束語
當(dāng)前,在MEC環(huán)境下,邊緣服務(wù)的數(shù)量日益劇增,精確的邊緣服務(wù)聚類能夠?yàn)榭焖俚倪吘壏?wù)發(fā)現(xiàn)與選擇提供重要的基礎(chǔ)。針對(duì)這一問題,本文在充分挖掘邊緣服務(wù)特性的基礎(chǔ)上,提出了一種MEC環(huán)境下多維屬性感知的邊緣服務(wù)二次聚類方法。該方法首先提取并設(shè)計(jì)了邊緣服務(wù)多維屬性模型;之后,為了提高聚類的效率,將局部密度與最小生成樹引入K-means中,提出一種基于密度的最小生成樹啟發(fā)式分段聚類算法,并依據(jù)邊緣服務(wù)所在服務(wù)器的位置與邊緣服務(wù)器配置為指標(biāo),對(duì)大規(guī)模的邊緣服務(wù)進(jìn)行一次聚類;然后,為了進(jìn)一步增強(qiáng)服務(wù)聚類的精度,將密度峰值算法同層次聚類算法相結(jié)合,提出了基于密度峰值的層次聚類算法,依據(jù)邊緣服務(wù)的QoS指標(biāo)與信譽(yù)度,在一次聚類的基礎(chǔ)上對(duì)邊緣服務(wù)進(jìn)行二次聚類。實(shí)驗(yàn)結(jié)果表明,本文所提出的服務(wù)聚類方法不僅在聚類的準(zhǔn)確率上有所提高,而且減少了算法的迭代次數(shù),提高了算法的穩(wěn)定性。但是在時(shí)間復(fù)雜度上還有待提高,這也是今后需要努力研究的方向。
參考文獻(xiàn):
[1]孫萍,蔣昌俊. 利用服務(wù)聚類優(yōu)化面向過程模型的語義Web服務(wù)發(fā)現(xiàn) [J]. 計(jì)算機(jī)學(xué)報(bào),2008,31(8): 1340-1353. (Sun Ping,Jiang Changjun. Optimizing semantic Web service discovery for process-oriented models with service clustering [J]. Journal of Computer Science,2008,31(8): 1340-1353.)
[2]劉一松,楊玉成. 基于文本聚類和概念相似度的語義Web服務(wù)發(fā)現(xiàn) [J]. 計(jì)算機(jī)科學(xué),2013,40(11): 211-214. (Liu Yisong,Yang Yucheng. Semantic Web service discovery based on text clustering and conceptual similarity [J]. Computer Science,2013,40(11): 211-214.)
[3]田剛,何克清,高瑩,等. 遷移知識(shí)輔助的語義稀疏服務(wù)聚類方法 [J]. 四川大學(xué)學(xué)報(bào): 工程科學(xué)版,2015,47(5): 116-122. (Tian Gang,He Keqing,Gao Ying,et al. Migrating knowledge-assisted semantic sparse service clustering method [J]. Journal of Sichuan University: Engineering Science Edition,2015,47(5): 116-122.)
[4]陳婷,劉建勛,曹步清,等. 基于BTM主題模型的Web服務(wù)聚類方法研究 [J]. 計(jì)算機(jī)工程與科學(xué),2018,40(10): 1737-1745. (Chen Ting,Liu Jianxun,Cao Buqing,et al. Research on Web service clustering method based on BTM theme model [J]. Computer Engineering and Science,2018,40(10): 1737-1745.)
[5]劉振鹿,王大玲,馮時(shí),等. 一種基于LDA的潛在語義區(qū)劃分及Web文檔聚類算法 [J]. 中文信息學(xué)報(bào),2011,25(1): 60-65,70. (Liu Zhenlu,Wang Daling,F(xiàn)eng Shi,et al. A LDA-based algorithm for latent semantic zoning and clustering of Web documents [J]. Chinese Journal of Information,2011,25(1): 60-65,70.)
[6]張祥平,劉建勛,肖巧翔,等. 基于LDA和模糊C均值的Web服務(wù)多功能聚類 [J]. 中南大學(xué)學(xué)報(bào): 自然科學(xué)版,2018,49(12): 2986-2992. (Zhang Xiangping,Liu Jianxun,Xiao Qiaoxiang,et al. Multifunctional clustering for Web services based on LDA and fuzzy C mean [J]. Journal of Central South University: Natural Science Edition,2018,49(12): 2986-2992.)
[7]石敏,劉建勛,周棟,等. 基于多重關(guān)系主題模型的Web服務(wù)聚類方法 [J]. 計(jì)算機(jī)學(xué)報(bào),2019,42(4): 820-836. (Shi Min,Liu Jianxun,Zhou Dong,et al. Web service clustering method based on multiple relational theme model [J]. Journal of Computer Science,2019,42(4): 820-836.)
[8]胡強(qiáng),沈嘉吉,荊廣輝,等. 基于描述語境特征詞與改進(jìn) GSDMM 模型的服務(wù)聚類方法 [J]. 通信學(xué)報(bào),2021,42(8): 176-187. (Hu Qiang,Shen Jiaji,Jing Guanghui,et al. Service clustering method based on descriptive context feature words and improved GSDMM model [J]. Journal of Communications,2021,42(8): 176-187.)
[9]肖巧翔,曹步清,張祥平,等. 基于word2vec和LDA主題模型的Web服務(wù)聚類方法 [J]. 中南大學(xué)學(xué)報(bào): 自然科學(xué)版,2018,49(12): 2979-2985. (Xiao Qiaoxiang,Cao Buqing,Zhang Xiangping,et al. Web services clustering method based on word2vec and LDA theme model [J]. Journal of Central South University: Natural Science Edition,2018,49(12): 2979-2985.)
[10]趙一,李昭,陳鵬,等. 一種面向領(lǐng)域的Web服務(wù)語義聚類方法 [J]. 小型微型計(jì)算機(jī)系統(tǒng),2019,40(1): 81-88. (Zhao Yi,Li Zhao,Chen Peng,et al. A domain-oriented semantic clustering method for Web services [J]. Minicomputer System,2019,40(1): 81-88.)
[11]景華,陳世平. 融合SOM和多目標(biāo)尋優(yōu)的Web服務(wù)組合優(yōu)化方法 [J]. 小型微型計(jì)算機(jī)系統(tǒng),2021,42(9): 1810-1817. (Jing Hua,Chen Shiping. Web service composition optimization method combining SOM and multi-objective optimization [J]. Minicomputer System,2021,42(9): 1810-1817.)
[12]張祥平,劉建勛,肖巧翔,等. 融合多維信息的Web服務(wù)表征方法 [J]. 計(jì)算機(jī)科學(xué)與探索,2022,16(7):1561-1569. (Zhang Xiangping,Liu Jianxun,Xiao Qiaoxiang,et al. Web service representation method with multidimensional information [J]. Computer Science and Exploration,2022,16(7):1561-1569.)
[13]田剛,何克清,王健,等. 面向領(lǐng)域標(biāo)簽輔助的服務(wù)聚類方法 [J]. 電子學(xué)報(bào),2015,43(7): 1266-1274. (Tian Gang,He Keqing,Wang Jian,et al. Domain label assisted service clustering method [J]. Journal of Electronics,2015,43(7): 1266-1274.)
[14]陸佳煒,馬俊,張?jiān)Q,等. 面向全局社交服務(wù)網(wǎng)的Web服務(wù)聚類方法 [J]. 計(jì)算機(jī)科學(xué),2018,45(3): 206-214. (Lu Jiawei,Ma Jun,Zhang Yuanming,et al. Web services clustering method for glo-bal social services network [J]. Computer Science,2018,45(3): 206-214.)
[15]王琨,胡強(qiáng),王華東,等. 融合功能語義與服務(wù)協(xié)作關(guān)系的Web服務(wù)聚類方法 [J/OL]. 計(jì)算機(jī)集成制造系統(tǒng). [2022-05-16]. http://kns. cnki. net/kcms/detail/11. 5946. TP. 20220314. 1033. 002. html. (Wang Kun,Hu Qiang,Wang Huadong,et al. Web servi-ce clustering method combining functional semantics with service collaboration relationships [J/OL]. Computer Integrated Manufacturing System. [2022-05-16]. http://kns. cnki. net/kcms/detail/11. 5946. TP. 20220314. 1033. 002. html.)
[16]田雨晴,彭菲,王華東,等. 一種融合服務(wù)聚類與協(xié)作相似度的服務(wù)替換方法 [J/OL]. 計(jì)算機(jī)應(yīng)用研究: 1-6 [2022-05-16]. https://kns. cnki. net/kcms/detail/51. 1196. tp. 20220415. 1052. 003. html. (Tian Yuqing,Peng Fei,Wang Huadong,et al. Service substitution method combining service clustering and collaboration similarity [J/OL]. Application Research of Computer: 1-6 [2022-05-16]. https://kns. cnki. net/kcms/detail/51. 1196. tp. 20220415. 1052. 003. html.)
[17]王蕾,夏緒輝,熊穎清,等. 再制造服務(wù)資源模塊化方法及應(yīng)用 [J]. 計(jì)算機(jī)集成制造系統(tǒng),2016,22(9): 2204-2216. (Wang Lei,Xia Xuhui,Xiong Yingqing,et al. Modular method and application of remanufacturing service resources [J]. Computer Integrated Manufacturing System,2016,22(9): 2204-2216.)
[18]何宜超,孫鵬,焦志強(qiáng),等. 語義驅(qū)動(dòng)的作戰(zhàn)資源服務(wù)聚類方法 [J]. 空軍工程大學(xué)學(xué)報(bào): 自然科學(xué)版,2020,21(4): 101-107. (He Yichao,Sun Peng,Jiao Zhiqiang,et al. Semantic-driven clustering method for operational resource services [J]. Journal of Air Force Engineering University: Natural Science Edition,2020,21(4): 101-107.)
[19]郭宗祥. 基于屬性相似度與聚類的知識(shí)服務(wù)匹配研究 [J]. 組合機(jī)床與自動(dòng)化加工技術(shù),2020(9): 171-174. (Guo Zongxiang. Research on knowledge service matching based on attribute similarity and clustering [J]. Combination Machine Tools and Automated Processing Technology,2020(9): 171-174.)
[20]林之岸,羅欣,魏驍雄,等. 基于雙層聚類和模糊等級(jí)評(píng)定的客戶側(cè)供電服務(wù)評(píng)價(jià) [J]. 電力系統(tǒng)保護(hù)與控制,2021,49(23): 62-71. (Lin Zhi’an,Luo Xin,Wei Xiaoxiong,et al. Customer-side power supply service evaluation based on double-layer clustering and fuzzy hierarchy evaluation [J]. Power System Protection and Control,2021,49(23): 62-71.)
[21]陸佳煒,吳涵,張?jiān)Q,等. 融合功能語義關(guān)聯(lián)計(jì)算與密度峰值檢測(cè)的Mashup服務(wù)聚類方法 [J]. 計(jì)算機(jī)學(xué)報(bào),2021,44(7): 1501-1516. (Lu Jiawei,Wu Han,Zhang Yuanming,et al. Mashup service clustering method for fusing functional semantic association calculation with peak density detection [J]. Journal of Computer Science,2021,44(7): 1501-1516.)
[22]Hu Yunchao,Patel M,Sabella D,et al. Mobile edge computing—a key technology towards 5G [J]. European Telecommunications Standards Institute White Paper,2015,11(11): 1-16.
[23]任麗芳,王文劍. 一種移動(dòng)邊緣計(jì)算環(huán)境中服務(wù)QoS的預(yù)測(cè)方法 [J]. 小型微型計(jì)算機(jī)系統(tǒng),2020,41(6): 58-63. (Ren Lifang,Wang Wenjian. A prediction method for service QoS in mobile edge computing environment [J]. Minicomputer System,2020,41(6): 58-63.)
[24]張雅玲,張鵬程,金惠穎. 一種移動(dòng)邊緣計(jì)算下基于高斯隱藏貝葉斯的服務(wù)質(zhì)量監(jiān)控方法 [J]. 小型微型計(jì)算機(jī)系統(tǒng),2020,41(8): 1684-1689. (Zhang Yaling,Zhang Pengcheng,Jin Huiying. QoS monitoring approach based on Gauss hidden Bayes in mobile edge computing [J]. Journal of Chinese Computer Systems,2020,41(8): 118-123.)
[25]黃興,劉小青,曹步清,等. 融合K-means與Agnes的Mashup服務(wù)聚類方法 [J]. 小型微型計(jì)算機(jī)系統(tǒng),2015,36(11): 2492-2497. (Huang Xing,Liu Xiaoqing,Cao Buqing,et al. Mashup service clustering method combining K-means with Agnes [J]. Minicomputer System,2015,36(11): 2492-2497.)
[26]馬克勤,楊延?jì)桑丶t武,等. 結(jié)合最大最小距離和加權(quán)密度的K-means聚類算法 [J]. 計(jì)算機(jī)工程與應(yīng)用,2020,56(16): 50-54. (Ma Keqin,Yang Yanjiao,Qin Hongwu,et al. K-means clustering algorithm combining maximum-minimum distance and weighted density [J]. Computer Engineering and Applications,2020,56(16): 50-54.)
[27]Rodriguez A,Laio A. Clustering by fast search and find of density peaks [J]. Science,2014,344(6191): 1492-1496.
[28]王建仁,馬鑫,段剛龍. 改進(jìn)的K-means聚類k值選擇算法 [J]. 計(jì)算機(jī)工程與應(yīng)用,2019,55(8): 27-33. (Wang Jianren,Ma Xin,Duan Ganglong. Improved K-means clustering k-value selection algorithm [J]. Computer Engineering and Applications,2019,55(8): 27-33.)
[29]郭永坤,章新友,劉莉萍,等. 優(yōu)化初始聚類中心的 K-means 聚類算法 [J]. 計(jì)算機(jī)工程與應(yīng)用,2020,56(15): 172-178. (Guo Yongkun,Zhang Xinyou,Liu Liping,et al. K-means clustering algorithm for optimizing initial cluster centers [J]. Computer Enginee-ring and Applications,2020,56(15): 172-178.)
[30]曹端喜. 聚類算法的改進(jìn)和聚類有效性指標(biāo)的研究 [D]. 南京: 南京郵電大學(xué),2021. (Cao Duanxi. Improvement of clustering algorithm and study on cluster validity indicators [D]. Nanjing: Nanjing University of Posts and Telecommunications,2021.)