

摘要:在智慧城市中,每時(shí)每刻都有大量服務(wù)處于應(yīng)用狀態(tài),而在信息技術(shù)成熟發(fā)展的背景下,出現(xiàn)諸多相似服務(wù),如何結(jié)合用戶需求為其精準(zhǔn)推薦高質(zhì)量服務(wù)并有效保護(hù)用戶隱私成為急需解決的問(wèn)題。基于此,文章先分析智慧城市中數(shù)據(jù)隱私及服務(wù)推薦算法研究的意義,進(jìn)而重點(diǎn)探究智慧城市中數(shù)據(jù)隱私及服務(wù)推薦算法的應(yīng)用和智慧城市推薦算法系統(tǒng)的設(shè)計(jì)。
關(guān)鍵詞:智慧城市;隱私保護(hù);服務(wù)推薦
Research and Application of Data Privacy and Service Recommendation Algorithms in Smart Cities
WEN Xiaotang
(School of Data Science, Guangzhou Huashang University, Guangzhou 510655, China)
Abstract: In smart cities, there are a large number of services in application at all times, and in the context of the mature development of information technology, many similar services have emerged. How to accurately recommend high-quality services based on user needs and effectively protect user privacy has become an urgent problem to be solved. Based on this, the article first analyzes the significance of research on data privacy and service recommendation algorithms in smart cities, and then focuses on exploring the application of data privacy and service recommendation algorithms in smart cities and the design of smart city recommendation algorithm systems.
Key words: smart city; privacy protection; service recommendation
1" "智慧城市概述
智慧城市是指在城市醫(yī)療、交通、住宿、飲食等各個(gè)方面融入先進(jìn)信息技術(shù),包括大數(shù)據(jù)技術(shù)、云計(jì)算技術(shù)等,以智能化、自動(dòng)化、精細(xì)化管理城市,使城市居民生活質(zhì)量提升。智慧城市發(fā)展涉及信息化城市、數(shù)字化城市、智能化城市三大階段。智慧城市的出現(xiàn),為城市發(fā)展帶來(lái)較大影響,其主要在四方面著重體現(xiàn),一是加大城市管理力度;二是促進(jìn)創(chuàng)新型產(chǎn)業(yè)快速發(fā)展;三是推動(dòng)科技創(chuàng)新建設(shè);四是為城市居民創(chuàng)設(shè)高質(zhì)量生活。
2" "智慧城市中數(shù)據(jù)隱私及服務(wù)推薦算法研究意義
信息技術(shù)的成熟發(fā)展致使諸多相似服務(wù)出現(xiàn),這雖為用戶提供了大量選擇,但同時(shí)也為用戶帶來(lái)了大量挑戰(zhàn),而預(yù)測(cè)服務(wù)質(zhì)量能有效解決這一問(wèn)題。在智慧城市中,交通屬于重要環(huán)節(jié),交通擁堵現(xiàn)象會(huì)對(duì)城市生活造成影響,減緩城市運(yùn)行效率。為預(yù)防城市交通擁堵現(xiàn)象,可基于服務(wù)推薦算法來(lái)預(yù)測(cè)道路狀態(tài),向用戶提供最優(yōu)道路選擇。本研究提出基于差分隱私的用戶數(shù)據(jù)保護(hù)方法和時(shí)間感知服務(wù)推薦算法,在后者中應(yīng)用前者,不僅能解決以往服務(wù)推薦算法較為局限的問(wèn)題,還能有效保護(hù)用戶隱私。
3" "智慧城市中數(shù)據(jù)隱私及服務(wù)推薦算法研究
3.1 基于差分隱私的用戶數(shù)據(jù)保護(hù)方法
在QoS基礎(chǔ)上的服務(wù)推薦中,預(yù)測(cè)準(zhǔn)確性和用戶隱私保護(hù)是目前存在的兩個(gè)問(wèn)題。本研究通過(guò)提出具有隱私保護(hù)的時(shí)間感知服務(wù)推薦框架來(lái)解決上述問(wèn)題。現(xiàn)階段,多數(shù)服務(wù)推薦算法的目的在于權(quán)衡數(shù)據(jù)應(yīng)用價(jià)值和用戶隱私保護(hù),在本研究中,首先,通過(guò)拉普拉斯分布方式保護(hù)原始數(shù)據(jù)隱私;其次,立足多個(gè)維度,包括用戶、時(shí)間和服務(wù),來(lái)劃分這些數(shù)據(jù),實(shí)現(xiàn)全新用戶、服務(wù)和時(shí)間矩陣的拼接,以此降維處理數(shù)據(jù),形成二維矩陣;再次,使用K-Means聚類算法聚集矩陣中的相似數(shù)據(jù),將原始數(shù)據(jù)為不同類簇劃分;最后,運(yùn)用L1范式低秩矩陣分解算法預(yù)測(cè)各類簇缺失的數(shù)據(jù)。
(1)差分隱私保護(hù)階段。目的在于保護(hù)用戶隱私,結(jié)合拉普拉斯分布在服務(wù)器節(jié)點(diǎn)原始數(shù)據(jù)中隨機(jī)加入噪音獲得新數(shù)據(jù),進(jìn)而向同一節(jié)點(diǎn)集中新數(shù)據(jù)以供后續(xù)處理。通常情況下,在服務(wù)推薦過(guò)程,用戶調(diào)用的服務(wù)不會(huì)來(lái)自相同服務(wù)器節(jié)點(diǎn),這是由于用戶處于實(shí)時(shí)移動(dòng)狀態(tài),所以為向用戶提供精準(zhǔn)推薦,需要集中分布式數(shù)據(jù)節(jié)點(diǎn)內(nèi)的數(shù)據(jù)。而節(jié)點(diǎn)數(shù)據(jù)中有夾帶用戶隱私信息的可能,為在集中數(shù)據(jù)時(shí)對(duì)用戶隱私信息進(jìn)行保護(hù),通過(guò)拉普拉斯分布添加噪音以實(shí)現(xiàn)差分隱私。需要注意的是,噪聲的添加需要滿足一定條件,即確保用戶相似性[1]。
(2)多節(jié)點(diǎn)數(shù)據(jù)整合階段。目的在于整合加入噪音后的數(shù)據(jù)生成新用戶、服務(wù)和時(shí)間三個(gè)維度矢量數(shù)據(jù)。在差分隱私保護(hù)過(guò)程,將噪聲添加到各服務(wù)器節(jié)點(diǎn)數(shù)據(jù)中后將其發(fā)送給總節(jié)點(diǎn)進(jìn)行預(yù)測(cè),總節(jié)點(diǎn)接收并整合這些數(shù)據(jù),進(jìn)而生成上述新三維矢量數(shù)據(jù)。從本質(zhì)上講,服務(wù)質(zhì)量屬于三維向量,其代表用戶在某一時(shí)間調(diào)用某項(xiàng)服務(wù)的質(zhì)量。
(3)多維度切分階段。目的在于分割三維矢量數(shù)據(jù),立足用戶維度、時(shí)間維度和服務(wù)維度進(jìn)行劃分,分別得到用戶片集合、時(shí)間片集合以及服務(wù)片集合,進(jìn)而將其分別拼接后生成新用戶矩陣、新時(shí)間矩陣和新服務(wù)矩陣。
(4)K-Means聚類階段。目的在于通過(guò)K-Means聚類算法將拼接后的矩陣數(shù)據(jù)劃分為不同類簇,在同一類簇中集合相似數(shù)據(jù),以提高預(yù)測(cè)精準(zhǔn)性。需要預(yù)測(cè)的數(shù)據(jù)量通常十分龐大,如果對(duì)拼接后的整體矩陣進(jìn)行分解要消耗大量時(shí)間,所以基于K-Means聚類算法將數(shù)據(jù)劃分為不同類簇后,分別分解每一類簇,能顯著減少分解時(shí)間,同時(shí),在同一類簇集合相似數(shù)據(jù)后也能得到更為精準(zhǔn)的預(yù)測(cè)結(jié)果。
(5)L1范式低秩矩陣分解階段。通過(guò)L1范式低秩矩陣分解算法預(yù)測(cè)用戶類簇、服務(wù)類簇和時(shí)間類簇,分別得到用戶矩陣、服務(wù)矩陣和時(shí)間矩陣,進(jìn)而得到預(yù)測(cè)矩陣。這一階段分為兩步:一是通過(guò)低秩矩陣分解聚類數(shù)據(jù)來(lái)預(yù)測(cè)服務(wù)質(zhì)量;二是對(duì)平均絕對(duì)誤差進(jìn)行計(jì)算,并對(duì)均方根誤差進(jìn)行計(jì)算。
3.2 基于時(shí)間感知的服務(wù)推薦算法
本研究中進(jìn)一步提出K-Means聚類以及L1范式矩陣低秩分解的時(shí)間感知推薦算法,并將時(shí)間維度融入推薦系統(tǒng)當(dāng)中,率先從多種維度切分三維矢量數(shù)據(jù),借助K-Means聚類算法針對(duì)類似數(shù)據(jù)進(jìn)行全面整合并將其匯聚至相同類簇內(nèi),隨后針對(duì)各個(gè)類簇通過(guò)低秩矩陣分解算法預(yù)測(cè)、補(bǔ)全原本較為稀疏的QoS矩陣,進(jìn)一步融合時(shí)間維度優(yōu)化矩陣分解魯棒性。
在本研究中,采用基于K-Means聚類以及分解時(shí)間感知推薦算法包括三種步驟,一是數(shù)據(jù)處理,立足多種維度切分初步構(gòu)建三維矢量,隨后進(jìn)行拼接并將其轉(zhuǎn)化成二維矩陣;二是K-Means聚類,針對(duì)K-Means聚類中心數(shù)進(jìn)行設(shè)置,數(shù)目為K,將相同數(shù)據(jù)劃分至同一個(gè)類簇內(nèi);三是L1范式矩陣分解,借助相關(guān)分解算法準(zhǔn)確預(yù)測(cè)原矩陣內(nèi)QoS缺失值。在處理數(shù)據(jù)時(shí),結(jié)合原始數(shù)據(jù)集構(gòu)建三維矢量R,三種維度即為時(shí)間TIME、服務(wù)SERVICE、用戶USER,其中,用戶集是U={U1,…,Um};服務(wù)集是S={S1,…,Sn};時(shí)間集是T={T1,…,Td}。劃分后各個(gè)時(shí)間片如圖1所示。
通常情況下,服務(wù)推薦主要根據(jù)時(shí)間維度進(jìn)行劃分,代表各個(gè)時(shí)間片中相關(guān)用戶調(diào)用服務(wù)所形成的QoS值。此外可以從其他兩種維度劃分QoS值,根據(jù)服務(wù)維度、用戶維度進(jìn)行數(shù)據(jù)集劃分。在從用戶維度層面劃分時(shí),不同用戶片中QoS值代表用戶處于不同時(shí)間內(nèi)的服務(wù)調(diào)用狀況。如果從服務(wù)維度層面劃分,則不同用戶片中QoS值表示服務(wù)處于不同時(shí)間段內(nèi)用戶調(diào)用狀況。根據(jù)這一基礎(chǔ)思路,可以從三種維度區(qū)針對(duì)原始三維矢量數(shù)據(jù)集進(jìn)行劃分,得到服務(wù)片、用戶片以及時(shí)間片對(duì)應(yīng)集合S、U、T。K-Means聚類面對(duì)大量數(shù)據(jù)擁有較高處理效率,是一種廣受歡迎的聚類算法。在K-Means聚類迭代中,需要明確聚類中心數(shù)目,并于初始點(diǎn)數(shù)據(jù)庫(kù)隨機(jī)抽取K個(gè)聚類中心,隨后計(jì)算各點(diǎn)至聚類中心距離,在相距最近聚類中心內(nèi)全面關(guān)聯(lián)N-k個(gè)點(diǎn)。隨后對(duì)各個(gè)集群質(zhì)心實(shí)施重新計(jì)算,將其當(dāng)成最新聚類中心,對(duì)上述迭代過(guò)程進(jìn)行重復(fù)直到聚類中心沒(méi)有任何變化,結(jié)束迭代過(guò)程。
結(jié)合時(shí)間維度切分原始三維矢量R能夠進(jìn)一步獲得時(shí)間片集合,其中不同元素代表不同時(shí)間用戶的服務(wù)調(diào)用狀況,隨后針對(duì)集合內(nèi)不同時(shí)間片段實(shí)施有效拼接,變成T_M二維矩陣,隨后利用L1范式矩陣分解補(bǔ)全二維矩陣缺失值,隨后得到完善矩陣p。立足于用戶維度對(duì)三維矢量進(jìn)行切分,能夠得到用戶集合U,其中不同元素分別代表不同用戶在不同時(shí)間內(nèi)服務(wù)調(diào)用狀況,隨后將拼接集合元素轉(zhuǎn)化成二維矩陣U_M,最后通過(guò)矩陣分解補(bǔ)全二維矩陣內(nèi)缺失值,得到完善矩陣Q。從服務(wù)維度切分三維矢量R能夠獲得S服務(wù)集合,其中不同元素分別代表不同時(shí)間內(nèi)用戶的服務(wù)調(diào)用狀況,隨后融合不同元素將其拼接成二維矩陣S_M。并通過(guò)矩陣分解預(yù)測(cè)其中缺失值,最終獲得完善矩陣M。經(jīng)過(guò)上述方式得到三種預(yù)測(cè)結(jié)果后,為綜合考慮不同維度影響,針對(duì)三種補(bǔ)全矩陣實(shí)施加權(quán)計(jì)算,具體公式為
(1)
式中,P是矩陣分解針對(duì)T_M二維矩陣預(yù)測(cè)缺失值所形成矩陣;Q是U_M二維矩陣缺失值預(yù)測(cè)所形成矩陣;F是最終計(jì)算出的預(yù)測(cè)矩陣;屬于負(fù)平衡因子,且三者相加等于1,通過(guò)能夠?qū)θN預(yù)測(cè)結(jié)果比例進(jìn)行合理控制,使最優(yōu)值與數(shù)據(jù)集存在一定聯(lián)系。
4" "智慧城市中推薦算法系統(tǒng)應(yīng)用
4.1 系統(tǒng)設(shè)計(jì)
(1)數(shù)據(jù)庫(kù)和數(shù)據(jù)庫(kù)表設(shè)計(jì)。結(jié)合系統(tǒng)需求設(shè)計(jì)用戶數(shù)據(jù)庫(kù)、道路數(shù)據(jù)庫(kù)和日志數(shù)據(jù)庫(kù),進(jìn)而設(shè)計(jì)用戶數(shù)據(jù)庫(kù)表、道路數(shù)據(jù)庫(kù)表和日志數(shù)據(jù)庫(kù)表。首先,用戶數(shù)據(jù)庫(kù)表用于記錄全部用戶信息,內(nèi)含六個(gè)字段,即用戶ID、用戶昵稱、用戶密碼、用戶手機(jī)號(hào)、用戶狀態(tài)和用戶郵箱。用戶ID為本表主鍵,通過(guò)自增長(zhǎng)和唯一設(shè)置方式,避免相同ID出現(xiàn)。在登入系統(tǒng)時(shí)要輸入戶手機(jī)號(hào)和密碼,通過(guò)與數(shù)據(jù)庫(kù)數(shù)據(jù)比對(duì)確認(rèn)相符后方可成功登入。用戶郵箱主要用于用戶密碼找回和重置。其次,道路數(shù)據(jù)庫(kù)表用于記錄全部用戶前往目的地可能通過(guò)的全部道路,僅擁有權(quán)限的管理者才可修改表中數(shù)據(jù),本表內(nèi)含有5個(gè)字段,即道路ID、道路名稱、道路維度、道路經(jīng)度和道路狀態(tài)。道路ID為本表主鍵,通過(guò)自增長(zhǎng)和唯一設(shè)置方式,保證所有道路都具有專屬編號(hào),以此區(qū)分不同道路。道路狀態(tài)分為通常、擁堵、嚴(yán)重?fù)矶?種,分別用綠色、黃色和紅色表示,這一參數(shù)與系統(tǒng)主要功能相聯(lián),間隔30分鐘更新一次。最后,日志數(shù)據(jù)庫(kù)表用于記錄用戶選擇道路的情況,內(nèi)含四個(gè)字段,即日志ID、用戶ID、道路ID以及經(jīng)過(guò)時(shí)間。
(2)系統(tǒng)功能設(shè)計(jì)。本系統(tǒng)功能模塊包括用戶管理模塊、用戶信息收集模塊、道路預(yù)測(cè)模塊、日志管理模塊。其中,用戶管理模塊用于管理系統(tǒng)用戶,提供注冊(cè)注冊(cè)管理、登錄管理、添加用戶、刪除用戶、密碼修改等功能,用戶可利用手機(jī)號(hào)注冊(cè)登錄,完整填寫(xiě)個(gè)人信息,并在系統(tǒng)中修改密碼;管理者可管理普通用戶,實(shí)施授權(quán)或刪除。用戶信息收集模塊用于匯總用戶日常出行對(duì)道路的選擇情況,進(jìn)而按照用戶、道路、時(shí)間格式進(jìn)行整理,向總服務(wù)器上傳。道路預(yù)測(cè)模塊用于預(yù)測(cè)當(dāng)天道路擁堵情況,進(jìn)而將預(yù)測(cè)結(jié)果推薦給用戶,這一模塊為系統(tǒng)核心,用戶是主要的使用對(duì)象,通過(guò)點(diǎn)擊預(yù)測(cè)單元,系統(tǒng)會(huì)基于本研究提出的算法自動(dòng)預(yù)測(cè)道路擁堵情況,并針對(duì)道路暢通、擁堵和嚴(yán)重?fù)矶氯N狀態(tài)分別用綠色、黃色以及紅色進(jìn)行標(biāo)注,以此向用戶推薦最優(yōu)道路。
4.2 功能實(shí)現(xiàn)
本系統(tǒng)在提供道路推薦服務(wù)時(shí)主要以Web頁(yè)面形式呈現(xiàn)。首先,用戶管理模塊頁(yè)面提供用戶注冊(cè)窗口和用戶登錄窗口,用戶可在該頁(yè)面內(nèi)注冊(cè)、登錄或修改密碼。其次,管理者可點(diǎn)擊道路預(yù)測(cè)模塊頁(yè)面訓(xùn)練按鈕,通過(guò)相應(yīng)算法來(lái)訓(xùn)練日常采集的道路選擇信息,進(jìn)而點(diǎn)擊預(yù)測(cè)按鈕來(lái)智能預(yù)測(cè)所有道路擁堵情況,分別用綠色、黃色和紅色進(jìn)行道路標(biāo)記。最后,日志管理模塊通過(guò)分頁(yè)形式顯示日志,可輸入查詢?nèi)掌趯?duì)用戶道路選擇情況進(jìn)行查詢。管理者有權(quán)限刪除日志。
5" "結(jié)束語(yǔ)
本研究提出了具有隱私保護(hù)的時(shí)間感知服務(wù)推薦系統(tǒng),以提高服務(wù)預(yù)測(cè)準(zhǔn)確性,對(duì)用戶隱私予以有效保護(hù)。由于智慧城市發(fā)展中交通擁堵問(wèn)題最為常見(jiàn),所以本研究后續(xù)將以智慧城市交通預(yù)測(cè)為例對(duì)系統(tǒng)進(jìn)行設(shè)計(jì)和應(yīng)用,以期為相關(guān)行業(yè)人員提供指導(dǎo),實(shí)現(xiàn)精準(zhǔn)服務(wù)推薦,對(duì)服務(wù)推薦過(guò)程中存在的用戶隱私保護(hù)問(wèn)題加以解決,從而促進(jìn)智慧城市良好發(fā)展。
參考文獻(xiàn)
[1] 崔睿宇.混合多元信息的個(gè)性化服務(wù)推薦算法研究[D].西安:西安石油大學(xué),2020.
項(xiàng)目基金:校級(jí)青年學(xué)術(shù)類科研項(xiàng)目(2022HSXS088)。
作者簡(jiǎn)介:文曉棠(1986-),女,湖南醴陵人,講師,碩士研究生,研究方向?yàn)橥扑]算法、深度學(xué)習(xí)。