摘要:Skyline查詢技術(shù)能夠從海量數(shù)據(jù)集中高效提取優(yōu)秀對象,廣泛應(yīng)用于多標(biāo)準(zhǔn)決策、用戶偏好查詢和數(shù)據(jù)挖掘等領(lǐng) 域。文章綜述了Skyline計算的基本概念和研究現(xiàn)狀,分析了主流算法的特性,并展望了未來研究方向,為該技術(shù)的深入 研究提供參考。
關(guān)鍵詞:Skyline查詢;數(shù)據(jù)挖掘;多標(biāo)準(zhǔn)決策
中圖分類號:G642
文獻(xiàn)標(biāo)識碼:A
文章編號:1009-3044(2025)13-0004-04
0 引言
隨著大數(shù)據(jù)和云計算的普及,數(shù)據(jù)挖掘成為一項 重要任務(wù)[1] 。Skyline查詢技術(shù)作為一種多目標(biāo)優(yōu)化方 法,應(yīng)運而生,在多標(biāo)準(zhǔn)決策、用戶偏好查詢、無線傳 感網(wǎng)、數(shù)據(jù)挖掘等[2] 方面有著突出的表現(xiàn),既能根據(jù)用 戶的不同偏好對數(shù)據(jù)集進(jìn)行查詢,也能以多種方式對 數(shù)據(jù)集進(jìn)行多標(biāo)準(zhǔn)查詢。
為了提高查詢效率,Skyline查詢技術(shù)通過各種優(yōu) 化算法,使用戶能更快地獲取感興趣的數(shù)據(jù),并為用 戶提供多維度的決策支持。同時,Skyline查詢技術(shù)除 了用于數(shù)據(jù)庫領(lǐng)域,還應(yīng)用到了數(shù)據(jù)挖掘、個性化推 薦、數(shù)據(jù)庫可視化等多個領(lǐng)域,與之相應(yīng)地出現(xiàn)了面 向多種應(yīng)用場景的Skyline查詢算法。
本文對"Skyline 查詢技術(shù)的主要算法、應(yīng)用領(lǐng)域 和未來研究方向進(jìn)行分析和總結(jié),旨在為該技術(shù)的深 入研究提供參考。
1 針對靜態(tài)數(shù)據(jù)集的Skyline算法
Borzsonyi 等人在參考文獻(xiàn)[2]中給出了計算 Sky? line 的 兩 種 方 法 :BNL(Block-Nested-Loops) 算 法 、 Divide-and-Conquer(Damp;C) 算法。BNL算法比較直觀, 根據(jù)Skyline的定義,將每個數(shù)據(jù)對象與其他所有數(shù)據(jù) 對象進(jìn)行對比,從而得到最終的Skyline,很顯然這種 算法效率很低。Damp;C算法采用由部分到整體的方式 求解,先將整個數(shù)據(jù)集分為若干子集,然后分別求解 子集的Skyline,最后進(jìn)行匯總獲得整個數(shù)據(jù)集對應(yīng)的 Skyline,這種算法在一定程度上實現(xiàn)了并行計算,提 升了計算速率,但是數(shù)據(jù)點的比較運算量依然很大。
為了提高比較效率,SFS(Sort-First-Skyline) [3] 算法的 提出利用排序過濾的方法依次處理候選值,能及時對 新插入列表中的數(shù)據(jù)點身份進(jìn)行判斷。TAN[4] 等人隨 后提出了基于位圖的Skyline查詢,將每個數(shù)據(jù)點按規(guī) 則轉(zhuǎn)化為二進(jìn)制位圖碼進(jìn)行判斷,但該算法運算量 大,且運算速度不理想,尤其對于高維度的數(shù)據(jù)集運 算代價很大。這些算法需要大容量內(nèi)存,而且當(dāng)要處 理的數(shù)據(jù)量很大時,算法的效率更低。
為了克服上述缺陷,許多Skyline算法引入了索引 來提高運算效率。Index 索引算法[4] 首先將各維屬性 按照優(yōu)劣進(jìn)行排序,然后利用B+樹構(gòu)建索引,再通過 掃描數(shù)據(jù)得到Skyline結(jié)果。文獻(xiàn)[5]提出了最近鄰輪 廓查詢算法(Nearest Neighbor, NN) 采用 R 樹建立索 引,先將數(shù)據(jù)空間進(jìn)行分割,接下來采用遞歸的方式 查找子空間區(qū)域內(nèi)的最近鄰點,逐步求出整個 Sky? line,該算法在處理低維數(shù)據(jù)集時具有很高的效率,但 對于高維數(shù)據(jù)集,則存在空間重合問題,算法的效率 受到了制約。BBS(Branch-and-Bound) 算法[6] 也采用 R 樹構(gòu)造索引,利用建立最小邊界矩形的方式,對整 個數(shù)據(jù)集進(jìn)行從上到下的掃描方法求解Skyline。該 算法既需要大容量內(nèi)存,同時對高維數(shù)據(jù)集處理的計 算代價高。
隨著研究的深入,更多適應(yīng)不同應(yīng)用環(huán)境的Sky? line算法被提出來。為了能更好地表示用戶對某些屬 性的關(guān)注,研究者提出子空間Skyline查詢算法[7] ,即對 整個數(shù)據(jù)集的某些屬性進(jìn)行Skyline查詢,其結(jié)果集比 全空間Skyline結(jié)果集要小得多,能在很多情況下給用 戶更實際的參考信息。為了能方便用戶得到相應(yīng)數(shù) 量的查詢結(jié)果,研究者提出了top-k Skyline查詢[8-9] ,用 以返回數(shù)據(jù)集中在某方面排在前 k 個的最優(yōu)對象集 合,既能得到用戶感興趣的信息又保證了信息量的可 控。隨著數(shù)據(jù)維度的增大,Skyline點的數(shù)量也會急劇 增加,使得Skyline價值的實用性降低,因此,研究者提 出了 k-支配 Skyline[10-11] 的概念,查詢那些在 k 個維度 上不被其他數(shù)據(jù)點所支配的數(shù)據(jù)點,提高了支配概念 的靈活性,降低了查詢結(jié)果中的數(shù)據(jù)流,可以挖掘出傳統(tǒng)Skyline無法查詢的有價值信息,但是這類算法得 到的結(jié)果包含不確定的信息,無法直接對用戶產(chǎn)生決 策支持。
隨著分布式數(shù)據(jù)庫、P2P網(wǎng)絡(luò)的發(fā)展,研究者提出 了分布式Skyline計算[12-13] ,用采用并行的方式來計算 Skyline,首先對各子節(jié)點求解 Skyline,然后把所有節(jié) 點的Skyline查詢結(jié)果合并起來,從而實現(xiàn)了對分散存 儲數(shù)據(jù)的查詢,提高了數(shù)據(jù)的利用率。
在所有可能世界模型的基礎(chǔ)上,提出的不確定數(shù) 據(jù)的概率Skyline查詢[14] ,將Skyline算法擴(kuò)展到不確定 數(shù)據(jù)領(lǐng)域,首先新定義了不確定數(shù)據(jù)的支配概念和 Skyline概念,然后設(shè)置一個閾值p,查詢結(jié)果由Skyline 概率大于p的所有點組成,深入挖掘了有價值信息,但 是文中在閾值的選取上沒有給出明確的規(guī)定,且對概 率支配和概率Skyline的定義和計算比較復(fù)雜,計算量 比較大,剪枝效率也不高。為了能實現(xiàn)并行計算,文 獻(xiàn)[15]引入了MapReduce技術(shù)通過并行運算提升了查 詢速度,但該方法的計算流程比較多,而且 MapRe? duce的使用導(dǎo)致查詢結(jié)果的漸進(jìn)性比較差。文獻(xiàn)[16] 針對閾值不易選取的問題,采用區(qū)域劃分及權(quán)重支配 的知識,提出了離散型不確定數(shù)據(jù)的概率Skyline求解 方案,在閾值選取、權(quán)重支配和過濾剪枝方面有比較 好的提升。
除此之外,還有動態(tài)Skyline查詢[17-19] ,它能依照不 同的參考點,動態(tài)設(shè)置屬性的取值,隨著參考點的改 變,查詢結(jié)果也隨之發(fā)生改變,但是處理的數(shù)據(jù)依然 是靜態(tài)不變的。動態(tài)Skyline查詢可以根據(jù)用戶自定 義偏好,查詢出讓用戶更感興趣的數(shù)據(jù)信息,使其具 有很好的靈活性,因此,這種查詢應(yīng)用范圍更大,例如 環(huán)境監(jiān)測、金融分析、圖片查詢等。由動態(tài)Skyline演 變出來的反Skyline查詢[20] ,可以從用戶的視角進(jìn)行查 詢,在返回的查詢結(jié)果中,每個對象的動態(tài)Skyline都 會將之前設(shè)置的查詢點包括在內(nèi),在金融投資和市場 決策方面有很高的使用價值。這類算法比較側(cè)重查 詢結(jié)果的漸進(jìn)性和實時性,因此對算法的運行速度和 結(jié)果的返回有較高的要求,現(xiàn)在算法在這些方面還有 較大的提升空間。
上面介紹的都是靜態(tài)Skyline查詢,主要通過設(shè)計 不同的索引存儲結(jié)構(gòu)和剪枝過濾策略來獲取用戶感 興趣的對象,這類查詢處理的是給定的數(shù)據(jù)集,數(shù)據(jù) 是不變的,因此查詢結(jié)果也是固定的,在技術(shù)的應(yīng)用 靈活性方面存在缺陷,因為即使數(shù)據(jù)集中有很小的一 部分?jǐn)?shù)據(jù)發(fā)生改變,也需要重新執(zhí)行查詢操作,給用 戶帶來不便。
2 針對數(shù)據(jù)流的Skyline算法
數(shù)據(jù)流是一組以事先規(guī)定好的順序讀取一次的 數(shù)據(jù)序列,與靜態(tài)數(shù)據(jù)集相比,數(shù)據(jù)流中的數(shù)據(jù)對象 會以很快的速度到達(dá)和退出,且隨著時間的推移在不 斷發(fā)生變化。因此,靜態(tài)數(shù)據(jù)集下的 Skyline 是固定 的,這些數(shù)據(jù)在查詢前已經(jīng)存在,并且可以在查詢過 程中多次訪問。因此,靜態(tài)Skyline查詢更注重算法的 準(zhǔn)確性和完整性,對時間復(fù)雜度的要求相對較低。而 數(shù)據(jù)流的Skyline處理的是連續(xù)、實時、有序的數(shù)據(jù)項 序列。這些數(shù)據(jù)的特點是實時到達(dá)、規(guī)模宏大、次序 獨立,且往往只能一次讀取,而且對數(shù)據(jù)流中的每一 個對象進(jìn)行高效的Skyline查詢處理,并要求算法具有 較低的時間復(fù)雜度,更強調(diào)實時更新。所以,數(shù)據(jù)流 的Skyline運算主要處理兩種情況:一是新數(shù)據(jù)對象到 達(dá)對現(xiàn)有對象的影響問題,二是數(shù)據(jù)對象過期對現(xiàn)有 對象的影響問題。文獻(xiàn)[22]首次提出了數(shù)據(jù)流環(huán)境下 基于窗口模型的Skyline查詢算法,以R樹結(jié)構(gòu)來存儲 窗口內(nèi)的對象,針對數(shù)據(jù)對象的到達(dá)和退出對Skyline 產(chǎn)生的不同影響,采用一種稱為間隔樹的結(jié)構(gòu)來實現(xiàn) 剪枝,從而實時維護(hù)Skyline集合。但是由于該算法采 用了復(fù)雜的剪枝技術(shù)、編碼方案和更新技術(shù),因此其 實現(xiàn)可能相對復(fù)雜,而且雖然算法在理論上具有較低 的時間復(fù)雜度,但在實際應(yīng)用中,可能需要占用較多 的內(nèi)存和計算資源來存儲和處理數(shù)據(jù)流中的元素。
文獻(xiàn)[23]研究了數(shù)據(jù)流環(huán)境下動態(tài)Skyline求解算法, 在一種新的融合索引結(jié)構(gòu)基礎(chǔ)上,提出了BDS算法和 IDS算法來計算在各維度上最接近給定對象的對象集 合。盡管BDS算法在大多數(shù)情況下能夠快速地計算 出動態(tài)輪廓集合,但在處理個別更新時,可能會存在 較大的時間延遲,數(shù)據(jù)流中的數(shù)據(jù)點數(shù)量非常大時, 算法的計算復(fù)雜度可能會顯著增加,這可能會限制算 法在處理大規(guī)模數(shù)據(jù)集時的應(yīng)用效果。
隨著移動計算、傳感網(wǎng)等技術(shù)的發(fā)展,不確定性 數(shù)據(jù)得到了人們的重視,進(jìn)而也就出現(xiàn)了不確定性數(shù) 據(jù)流。針對不確定數(shù)據(jù)流的數(shù)據(jù)挖掘與分析方興未 艾,因此,不確定數(shù)據(jù)流環(huán)境下的Skyline查詢成為學(xué) 者們的研究方向之一。文獻(xiàn)[24]首次針對基于滑動窗 口模型數(shù)據(jù)流提出了相應(yīng)的概率Skyline求解算法,該 算法采用R樹索引存儲數(shù)據(jù),提前剪枝沒有機會成為 Skyline的數(shù)據(jù),由此來構(gòu)建一個可以留在內(nèi)存的最小 候選集,從而提高運算效率,但在處理高維數(shù)據(jù)集時, R 樹搜索速度降低,導(dǎo)致算法效率不理想。文獻(xiàn)[25] 在內(nèi)存駐留一個候選列表,對于新到的對象,根據(jù)其 有效時間對相應(yīng)列表進(jìn)行更新,對于過期的對象,根 據(jù)其有效時間對某些數(shù)據(jù)重新進(jìn)行判定,以實現(xiàn)對不 確定數(shù)據(jù)流Skyline的實時更新。文獻(xiàn)[26]不是在閾值 或top-k語義下進(jìn)行概率限制性Skyline分析,而是關(guān) 注一個更一般的問題,旨在計算所有對象的限制性 Skyline 處理非常大規(guī)模的數(shù)據(jù)集時 概率。盡管該算法在理論上具有高效性 ,計算復(fù)雜度仍然可能成 ,但在 為一個瓶頸。這可能需要額外的優(yōu)化措施或硬件資 源來支持,對于某些特定情況(如偏好區(qū)域由d-1個比 率約束描述時) ,算法需要預(yù)處理步驟來構(gòu)建索引或 數(shù)據(jù)結(jié)構(gòu)。這可能會增加算法的初始設(shè)置成本。
這類算法處理的是數(shù)據(jù)流環(huán)境下的Skyline查詢, 主要解決的是如何針對數(shù)據(jù)集中數(shù)據(jù)的動態(tài)插入和 動態(tài)退出對結(jié)果產(chǎn)生的影響,一般采用的是對查詢結(jié) 果實時更新的方式來保證查詢結(jié)果的有效性和正確 性,但是當(dāng)數(shù)據(jù)流速度很快時,會對算法的數(shù)據(jù)存儲和處理速度帶來較大的挑戰(zhàn),需要進(jìn)一步研究該問題 對數(shù)據(jù)流Skyline查詢算法的影響。
3 組合Skyline查詢算法
在實際應(yīng)用中,有時會需要從數(shù)據(jù)集中選出一個 或若干個最優(yōu)的組合,每個組合都包含相同數(shù)量的對 象,對于這樣的問題,倘若直接采用傳統(tǒng)的Skyline查 詢方法,運算效率極低。基于此,組合Skyline應(yīng)運而 生,特別是在團(tuán)隊組建、資源分配等方面具有顯著的 應(yīng)用價值,通過組合Skyline查詢,可以更加精確地了 解各個選項在多個維度上的表現(xiàn),從而找到最優(yōu)的資 源分配方案。文獻(xiàn)[27]提出了一種k-元組組合的Sky? line,即選出那些由k個元組形成的組合,且每個組合 均不被其他含有相同數(shù)量元組的組合所支配。文中 采用壓縮輸出算法、輸入剪枝算法和搜尋區(qū)域剪枝算 法來完成對組合 Skyline 的求解,算法提出了適用于 SUM、MIN 和 MAX 的特定順序性質(zhì),以及僅適用于 MIN 和 MAX 的弱候選生成性質(zhì),以有效地剪枝搜索 空間并加速Skyline組的發(fā)現(xiàn)過程。文獻(xiàn)[28]首次提出 了針對確定數(shù)據(jù)集的組合 Skyline 查詢(Combinatorial Skyline Queries,簡寫CSQ) 的概念,并在一系列定理的 基礎(chǔ)上,提出了DA(Decomposition algorithm) 算法。文 章采用遞歸分層的方法依次計算各級的組合Skyline, 即以傳統(tǒng)的Skyline結(jié)果作為起始,計算組合基數(shù)為2 的組合Skyline,依次增加組合基數(shù),直到獲得符合要 求的查詢結(jié)果,避免了直接對龐大的數(shù)據(jù)組合進(jìn)行運 算。文獻(xiàn)[29]首次提出了Pareto最優(yōu)化組合Skyline查 詢,省略了對組合函數(shù)的使用,采用序列對比的方式 定義組合支配的概念,進(jìn)而從全新角度對組合Skyline 進(jìn)行計算,先后提出 Point-wise 算法和 Unit Group wise算法求解組合Skyline。文獻(xiàn)[30]采用并發(fā)方式求 解多層查詢,然后提出快速PWise算法和快速UWise 算法求解查詢結(jié)果,文中從數(shù)據(jù)的多個維度同時掃 描,在過濾掉大部分無用數(shù)據(jù)的同時,更快地得到了 各層的數(shù)據(jù)分布,在此基礎(chǔ)上,分別從單個點的角度 和單元組合的角度分別對組合Skyline 進(jìn)行計算。文 獻(xiàn)[31] 提出了基于Skyline layer的SLGS算法和基于頂 點覆蓋的 VCGS 算法來計算 top-k 組 Skyline ,但是這 兩種算法的排序策略都是對Skyline 點組中不同Sky? line layer的點進(jìn)行計數(shù),需要遍歷所有層的所有數(shù)據(jù) 點,在結(jié)果輸出的漸進(jìn)性方面比較差,而且排序依據(jù) 不能完全反映組合的支配能力。文獻(xiàn)[32]基于正交查 詢范圍回答了G-Skyline查詢的why-not問題,并充分 利用了 G-Skyline 的特點,通過提前修剪大大縮短了 計算時間。文獻(xiàn)[33]提出了一種基于預(yù)排序和枚舉的 快 速 計 算 大 型 數(shù) 據(jù) 庫 top-k G-Skyline 群 的 算 法 TGPE。這些算法從不同角度對組合Skyline查詢進(jìn)行 了設(shè)計和計算,打破了傳統(tǒng)Skyline查詢以面向單個對 象為查詢單位的慣例,進(jìn)一步擴(kuò)展了Skyline計算在數(shù) 據(jù)查詢領(lǐng)域的應(yīng)用,使得查詢結(jié)果不但可以采用集合 的方式出現(xiàn),而且能限定結(jié)果集的大小,提升了Sky? line查詢技術(shù)的靈活性和適應(yīng)性。
上述算法突破了傳統(tǒng)Skyline查詢結(jié)果以單個對 象為基本單位的限制,從對象組合的角度看待該組合 整體的支配能力,使得數(shù)據(jù)集中的對象不再單獨存 在,進(jìn)一步挖掘了數(shù)據(jù)集中的潛在有價值信息。由于 組合數(shù)量巨大,因此這類算法的運算量比傳統(tǒng)Skyline 計算的計算復(fù)雜度更高,雖然當(dāng)前算法在組合篩選和 結(jié)果的判定上采用了一定的策略,但是在減少組合數(shù) 量和計算量方面還有更大的可提升空間。
4 應(yīng)用領(lǐng)域
Skyline查詢技術(shù)最初用于多標(biāo)準(zhǔn)優(yōu)化問題,隨著 學(xué)者不斷地深入研究,在數(shù)據(jù)庫領(lǐng)域里,Skyline查詢 技術(shù)逐漸應(yīng)用于多類場景,主要有地理信息系統(tǒng)、推 薦系統(tǒng)、大數(shù)據(jù)處理,以及多標(biāo)注優(yōu)化決策等方面。 在地理信息系統(tǒng)中,Skyline查詢技術(shù)可以在電子 地圖中查詢滿足用戶需求的地理對象,比如查詢到某 個景區(qū)距離較近且價位不高的酒店,查詢到用戶所在 位置距離較近且評分較高的中餐館,該例中只從距離 和評分兩個參數(shù)來評價酒店,通過Skyline查詢,可以 得到所有在這兩個參數(shù)上都不差的酒店,從而供用戶 進(jìn)一步選擇,方便了用戶的出行需求。
在推薦系統(tǒng)中,為了能精準(zhǔn)捕捉用戶感興趣的對 象,需要在眾多的商品中篩選盡量滿足用戶需求的對 象,從而提高成交量,這就需要考慮用戶的多個關(guān)注 點。例如在常用的網(wǎng)絡(luò)電商平臺中,產(chǎn)品的信息包括 價格、用戶評價、品牌、地域、銷量等多個方面,要想能 為用戶推薦其感興趣的商品,需要對產(chǎn)品進(jìn)行上述多 個維度的評價和計算,通過Skyline計算,可以為用戶 返回在這些維度上都不差的商品,因此,在電商交易 如此普及的今天,Skyline查詢技術(shù)在推薦系統(tǒng)中起到 越來越重要的作用。
在大數(shù)據(jù)處理方面,隨著 5G 的普及和信息技術(shù) 的創(chuàng)新,各行業(yè)每天都在產(chǎn)生海量的數(shù)據(jù),通過"Sky? line 查詢技術(shù),可以從海量用戶數(shù)據(jù)中提取出具有代 表性的用戶群體,從而更好地理解用戶需求和市場趨 勢。例如,通過Skyline算法,可以從用戶行為數(shù)據(jù)中 挖掘出潛在的行為模式,如用戶活躍度、購買周期、偏 好變化等。這些模式有助于企業(yè)更好地理解用戶需 求和行為習(xí)慣,從而制定更有效的營銷策略。在電商 行業(yè)中,Skyline算法可以分析不同商家的銷售額、用 戶評價、市場份額等數(shù)據(jù),識別出表現(xiàn)突出的商家和 潛在的競爭威脅,為企業(yè)的市場定位和競爭策略提供 參考。
5 結(jié)束語
Skyline 查詢技術(shù)作為一種典型的數(shù)據(jù)查詢與優(yōu) 化方法,可以從海量的多維數(shù)據(jù)集中挖掘有價值的信 息,為用戶決策提供依據(jù),可應(yīng)用于多標(biāo)準(zhǔn)決策、數(shù)據(jù) 挖掘等多個領(lǐng)域。本文綜述了"Skyline 查詢技術(shù)的基 本概念、主要算法和應(yīng)用領(lǐng)域。隨著云計算、區(qū)塊鏈 和人工智能技術(shù)的發(fā)展,會出現(xiàn)更多的應(yīng)用場景, Skyline查詢技術(shù)應(yīng)與這些先進(jìn)技術(shù)進(jìn)行有效融合,提供更加智能、實時、高效的查詢與優(yōu)化方案,例如研究 更高效的"Skyline 查詢算法,特別是針對高維數(shù)據(jù)和 數(shù)據(jù)流的算法。探索"Skyline 查詢技術(shù)與其他新興技 術(shù)的融合,例如深度學(xué)習(xí)、區(qū)塊鏈等。擴(kuò)展"Skyline 查 詢技術(shù)的應(yīng)用領(lǐng)域,例如生物特征識別、異常檢測等。 總之,Skyline查詢技術(shù)具有廣闊的應(yīng)用前景和巨大的 發(fā)展?jié)摿Γ虼嗽谖磥淼陌l(fā)展中,需要針對不同的應(yīng) 用場景,不斷創(chuàng)新和優(yōu)化數(shù)據(jù)的查詢、過濾等技術(shù)方 案,以滿足用戶的實際需求。
參考文獻(xiàn):
[1] ASSUN??O M D,CALHEIROS R N,BIANCHI S,et al.Big data computing and clouds:trends and future directions[J].Journal of Parallel and Distributed Computing,2015,79:3-15.
[2] BORZSONY S,KOSSMANN D,STOCKER K.The Skyline opera? tor[C]//Proceedings 17th International Conference on Data En? gineering. Heidelberg, Germany. IEEE Comput. Soc, 2001: 421- 430.
[3] CHOMICKI J,GODFREY P,GRYZ J,et al.Skyline with presort? ing[C]//Proceedings 19th International Conference on Data En? gineering (Cat. No. 03CH37405). Bangalore, India. IEEE Com? puter Society, 2003:717-719..
[4] TAN K, Eng P, Ooi B. Efficient progressive Skyline computa? tion[C]. Proceedings of International Conference on Very Large Data Bases, Rome, Italy, 2001, 301-310.
[5] KOSSMANN D,RAMSAK F,ROST S.Shooting stars in the sky [M]//VLDB '02: Proceedings of the 28th International Confer? ence on Very Large Databases.Amsterdam:Elsevier,2002:275- 286.
[6] PAPADIAS D,TAO Y F,F(xiàn)U G,et al.Progressive Skyline compu? tation in database systems[J]. ACM Transactions on Database Systems,2005,30(1):41-82.
[7] TAO Y F,XIAO X K,PEI J.SUBSKY: efficient computation of Skylines in subspaces[C]//22nd International Conference on Data Engineering (ICDE'06).April 3-7,2006.Atlanta,GA,USA. IEEE,2006:65-65.
[8] 李松,賓婷亮,郝曉紅,等.道路網(wǎng)多用戶偏好Top-k天際線查 詢方法[J].計算機研究與發(fā)展,2023,60(10):2348-2358.
[9] MENG X F,ZHANG X Y,HUO H J,et al.Top-k approximate se? lection for typicality query results over spatio-textual data[J]. Knowledge and Information Systems,2024,66(2):1425-1468.
[10] AWASTHI A, BHATTACHARYA A, GUPTA S, et al. K dominant Skyline join queries:extending the join paradigm to K-dominant Skylines[EB/OL].2017:1702.03390. https://arxiv. org/abs/1702.03390v1.
[11] 孫國璋,黃山,艾力卡木·再比布拉,等.基于Flink的k-支配 Skyline體并行求解算法[J].計算機工程與科學(xué),2023,45(1): 17-27.
[12] ?ZGüVEN Y M, EKEN S. Distributed messaging and light streaming system for combating pandemics[J].Journal of Ambi? ent Intelligence and Humanized Computing, 2023, 14(2): 773-787.
[13] ZHOU X,LI K L,ZHOU Y T,et al.Adaptive processing for dis? tributed Skyline queries over uncertain data[J].IEEE Transac? tions on Knowledge and Data Engineering, 2016, 28(2): 371-384.
[14] PEI J, JIANG B, LIN X. Probabilistic Skylines on uncertain data[C]. Proceedings of International Conference on Very Large Data Bases, 2007, 38 (1):15-26.
[15] GAVAGSAZ E. Parallel computation of probabilistic Skyline queries using MapReduce[J].The Journal of Supercomputing, 2021,77(1):418-444.
[16] QI Y N,JAIN R,SINGH S,et al.Threshold query optimization for uncertain data[C]//Proceedings of the 2010 ACM SIGMOD International Conference on Management of data.Indianapolis Indiana USA.ACM,2010:315-326.
[17] 周虹宇.基于learned index的動態(tài)Skyline查詢方法的研究 [D].大連:大連海事大學(xué),2022.
[18] 蔣森安,白梅,王習(xí)特,等.一種高效的分布式動態(tài)Skyline查 詢算法[J].計算機應(yīng)用與軟件,2022,39(5):39-47,139.
[19] LI H, YOO J. Efficient continuous Skyline query processing scheme over large dynamic data sets[J].ETRI Journal,2016,38 (6):1197-1206.
[20] YIN B, ZHOU S, ZHANG S.On efficient processing of continu? ous reverse Skyline queries in wireless sensor networks[J]. KSII Transactions on Internet and Information Systems,2017, 11(4):1931-1953.
[22] LIN X, YUAN Y, WANG W, et al. Stabbing the sky: efficient Skyline computation over sliding windows[C]. Proceedings of International Conference on Data Engineering, 2005:502-513.
[23] 白梅,信俊昌,王國仁,等.數(shù)據(jù)流上動態(tài)輪廓查詢處理技術(shù) 的研究[J].計算機學(xué)報,2016,39(10):2007-2030.
[24] ZHANG W J,LIN X M,ZHANG Y,et al.Probabilistic Skyline operator over sliding windows[C]//2009 IEEE 25th Interna? tional Conference on Data Engineering. March 29-April 2, 2009.Shanghai,China.IEEE,2009:1060-1071.
[25] DING X F,LIAN X,CHEN L, et al.Continuous monitoring of Skylines over uncertain data streams[J].Information Sciences, 2012,184(1):196-214.
[26] GAO X , LI J , MIAO D .Computing All Restricted Skyline Probabilities for Uncertain Data[J]. ArXiv, 2023, abs/ 2303.00259
[27] LI C , RAJASEKARAN S , ZHANG N , et al. On Skyline Groups[J]. IEEE Transactions on Knowledge amp; Data Engineer? ing, 2012, 26(4):2119-2123.
[28] CHUNG Y C,SU I F,LEE C A.Efficient computation of combi? natorial Skyline queries[J]. Information Systems, 2013, 38(3): 369-387.
[29] LIU J F,XIONG L,PEI J,et al.Finding Pareto optimal groups[J]. Proceedings of the VLDB Endowment,2015,8(13):2086-2097.
[30] YU W H,QIN Z,LIU J F,et al.Fast algorithms for Pareto opti? mal group-based Skyline[C]//Proceedings of the 2017 ACM on Conference on Information and Knowledge Management. Singapore Singapore.ACM,2017:417-426.
[31] LIU J,CHEN W,CHEN Z Y,et al.Optimized query algorithms for top-K group Skyline[J].Wireless Communications and Mo? bile Computing,2022,2022:3404906.
[32] LI G H, LI Y H, YANG Y, ET AL. Solving G-Skyline query in the range of orthogonal query[J]. Journal of Central South University for Nationalities: Natural Science Edition, 2023,42 (5):678-688.
[33] WANG K G,HAN X X,WAN X L,et al.Efficient computation of Top-k G-Skyline groups on large-scale database[J].Infor? mation Sciences,2024,670:120614.
【通聯(lián)編輯:王 力】