□ 胡 敬
幾十年來(lái),縱觀世界范圍信息化的發(fā)展,大致經(jīng)歷了3個(gè)階段:從1941年第一臺(tái)電子計(jì)算機(jī)的誕生到1995年,是以單機(jī)應(yīng)用為特征的數(shù)字化階段;從1995年到2015年,是以聯(lián)網(wǎng)應(yīng)用為特征的網(wǎng)絡(luò)化階段;從2015年至今,開(kāi)啟了以數(shù)據(jù)的深度挖掘和融合應(yīng)用為特征的智慧化階段。應(yīng)該說(shuō),是大數(shù)據(jù)催生了信息化的3.0。與此相伴,“智慧城市”也應(yīng)運(yùn)而生,旨在融合大數(shù)據(jù)、物聯(lián)網(wǎng)、云計(jì)算、人工智能等一系列最新的信息化技術(shù),打造智慧城市的大腦,提高我們的生活質(zhì)量。
隨著智能手機(jī)的普及、廉價(jià)及功能的極大豐富,以及無(wú)人機(jī)、無(wú)人車(chē)等智能移動(dòng)終端的廣泛商用,傳統(tǒng)“以物為中心”的物聯(lián)網(wǎng)架構(gòu)逐漸暴露了移動(dòng)性差、部署成本高、響應(yīng)時(shí)間長(zhǎng)等問(wèn)題。為了更好地進(jìn)行物聯(lián)網(wǎng)類(lèi)大數(shù)據(jù)的采集,進(jìn)而有效地提升大數(shù)據(jù)驅(qū)動(dòng)下的“智慧城市大腦”,多年來(lái),北京理工大學(xué)劉馳教授團(tuán)隊(duì)專(zhuān)注于面向智慧城市的“人機(jī)協(xié)同”群智大數(shù)據(jù)采集方法研究,為新一代“智慧城市”藍(lán)圖提出自己的“三十六計(jì)”。
當(dāng)人們的生活已經(jīng)習(xí)慣了使用智能手機(jī),大到各國(guó)元首召開(kāi)遠(yuǎn)程視頻會(huì)議,小到人們?nèi)粘2樵?xún)天氣、打車(chē),看不見(jiàn)的高速通信網(wǎng)絡(luò)日夜為我們服務(wù),讓我們足不出戶(hù)就可以遍覽大好河山,和遠(yuǎn)隔萬(wàn)里的朋友面對(duì)面談笑風(fēng)生。但是,當(dāng)暴雨、地震、洪水等一系列難以預(yù)料而又破壞力極強(qiáng)的災(zāi)難降臨時(shí),地面通信基礎(chǔ)設(shè)施遭到損毀,智能手機(jī)無(wú)法工作,而數(shù)量有限的搜救人員面對(duì)廣闊的受災(zāi)區(qū)域往往顯得心有余而力不足。如何切實(shí)有效地恢復(fù)地面通信成了智慧城市7/24不間斷服務(wù)的關(guān)鍵。
劉馳團(tuán)隊(duì)創(chuàng)新性地提出了基于分布式深度強(qiáng)化學(xué)習(xí)的多無(wú)人機(jī)通信覆蓋技術(shù)。無(wú)人機(jī)彼此之間借助WiFi等無(wú)線(xiàn)網(wǎng)絡(luò)保持聯(lián)通,其中少數(shù)可和通信衛(wèi)星連接,共同為地面用戶(hù)構(gòu)建與外界相連的“空中生命線(xiàn)”。由于通信覆蓋區(qū)域面積大,無(wú)人機(jī)數(shù)量較少,需要?jiǎng)討B(tài)調(diào)整無(wú)人機(jī)的方位實(shí)現(xiàn)動(dòng)態(tài)部署。與此同時(shí),無(wú)人機(jī)運(yùn)動(dòng)中的電量消耗是延長(zhǎng)網(wǎng)絡(luò)生存時(shí)間的關(guān)鍵,這樣在保持無(wú)人機(jī)群的適當(dāng)移動(dòng)不放過(guò)一個(gè)死角的同時(shí),也需減小移動(dòng)帶來(lái)的電量消耗。再者,無(wú)人機(jī)網(wǎng)絡(luò)需要保持時(shí)刻聯(lián)通,這樣保證了數(shù)據(jù)鏈路上通下聯(lián)。具體地,劉馳團(tuán)隊(duì)突破傳統(tǒng)深度強(qiáng)化學(xué)習(xí)技術(shù),如DQN方法只能處理非常有限的離散動(dòng)作空間的限制,在連續(xù)動(dòng)作空間控制actor-critic方法的基礎(chǔ)上,定義了一個(gè)新的能效利用率指標(biāo),來(lái)綜合考慮平均通信覆蓋率、通信覆蓋公平性、無(wú)人機(jī)群聯(lián)通性及能耗。劉馳團(tuán)隊(duì)提出了一種無(wú)人機(jī)群控制新方法——DRLEC3(DRL-based Energy-Control for Coverage and Connectivity),并且通過(guò)大量的仿真實(shí)驗(yàn)證明了它的有效性、魯棒性和優(yōu)越性,在使用深度強(qiáng)化學(xué)習(xí)訓(xùn)練無(wú)人機(jī)群提供通信覆蓋的智能控制領(lǐng)域走在了前列。相關(guān)成果連續(xù)發(fā)表在本領(lǐng)域頂級(jí)期刊IEEE JSAC和IEEE Trans.on Mobile Computing上。英國(guó)愛(ài)丁堡大學(xué)的研究團(tuán)隊(duì)在IEEE Communications Surveys & Tutorials評(píng)價(jià)這項(xiàng)研究“能夠動(dòng)態(tài)學(xué)習(xí)環(huán)境狀態(tài),并與主流算法相比取得了突出的性能優(yōu)勢(shì)”。
群智感知的感念最早由美國(guó)Dartmouth College的A. Campbell教授在2008年提出,即“People-centric sensing”(以人為中心的感知),旨在破解傳統(tǒng)物聯(lián)網(wǎng)需人為部署傳感設(shè)備帶來(lái)的弊端。劉馳團(tuán)隊(duì)是國(guó)內(nèi)較早開(kāi)始此類(lèi)研究的團(tuán)隊(duì),旨在解決以下關(guān)鍵科學(xué)問(wèn)題:如何評(píng)判參與者提供的感知數(shù)據(jù)的質(zhì)量,并滿(mǎn)足任務(wù)發(fā)布者的需求?如何保障參與者、任務(wù)發(fā)布者及本系統(tǒng)運(yùn)營(yíng)者三方的利益?劉馳團(tuán)隊(duì)發(fā)表在IEEE INFOCOM、IEEE Trans. on Mobile Computing等本領(lǐng)域頂級(jí)會(huì)議和期刊上的文章,得到了國(guó)際同行廣泛引用并積極評(píng)價(jià):是“最早將信息質(zhì)量(Quality of Information)引入到群智感知系統(tǒng)激勵(lì)設(shè)計(jì)的工作之一”(IEEE Fellow、美國(guó)密蘇里科技大學(xué)Prof. S. Das教授團(tuán)隊(duì));是一種“具有代表性的工作,來(lái)提出一個(gè)群智感知網(wǎng)絡(luò)管理框架”(美國(guó)南佛羅里達(dá)大學(xué)研究團(tuán)隊(duì))。
劉馳團(tuán)隊(duì)提出了一種保障感知數(shù)據(jù)質(zhì)量的實(shí)時(shí)激勵(lì)機(jī)制,該機(jī)制兼顧群智感知平臺(tái)和參與者的雙方利益,允許平臺(tái)提供額外獎(jiǎng)金來(lái)進(jìn)一步激勵(lì)優(yōu)秀數(shù)據(jù)提供者。通過(guò)在若干真實(shí)數(shù)據(jù)集上的廣泛模擬,劉馳團(tuán)隊(duì)證明了所提出算法具備數(shù)學(xué)上的真實(shí)性、個(gè)體合理性、預(yù)算可行性和高效計(jì)算性等優(yōu)質(zhì)特性。
通過(guò)合理的參與者選擇與在線(xiàn)激勵(lì),智能手機(jī)真正地成了一個(gè)“神奇口袋”,而任務(wù)發(fā)布者僅需支付一定的報(bào)酬,就可以獲取過(guò)去難以獲取的城市大數(shù)據(jù)。
傳統(tǒng)的群智感知系統(tǒng)充分利用了人所攜帶的智能終端進(jìn)行城市大數(shù)據(jù)采集,這比提前部署傳感器已經(jīng)智慧了一些,但人類(lèi)活動(dòng)不可能做到全區(qū)域全天候覆蓋,且考慮到不穩(wěn)定的人為因素。隨著無(wú)人機(jī)、無(wú)人車(chē)等技術(shù)的日趨成熟,商用化成本逐漸降低,“忠心耿耿”的無(wú)人設(shè)備為“人機(jī)協(xié)同”群智感知這一新技術(shù)的發(fā)展鋪平了道路。自2017年起,劉馳團(tuán)隊(duì)是國(guó)內(nèi)外最早進(jìn)行此項(xiàng)課題的團(tuán)隊(duì)之一,并迅速取得了突破性進(jìn)展,研究成果連續(xù)發(fā)表在IEEE JSAC、IEEE Trans. on Mobile Computing等本領(lǐng)域頂級(jí)期刊上。
劉馳團(tuán)隊(duì)利用攜帶豐富傳感器的無(wú)人移動(dòng)終端(如無(wú)人車(chē)、無(wú)人機(jī))在城市中進(jìn)行數(shù)據(jù)采集,這些無(wú)人移動(dòng)終端均配備了“設(shè)備—設(shè)備”的通信接口(如WiFi、NB-IoT等),它們通過(guò)相互通信來(lái)獲取必要的信息。無(wú)人設(shè)備根據(jù)各自學(xué)習(xí)到的策略在一個(gè)區(qū)域中自主移動(dòng)并收集數(shù)據(jù)。但是,它們所攜帶的電池是有限的,而增加電池的尺寸會(huì)進(jìn)一步增加重量,這對(duì)無(wú)人機(jī)而言尤其致命。同時(shí),所攜帶的傳感器的感知范圍和感知精度均受限,城市中也存在很多障礙物(如建筑、道路維護(hù)路段等),無(wú)人移動(dòng)終端需學(xué)會(huì)避障。最后,通過(guò)部署后端中央控制中心來(lái)調(diào)度無(wú)人設(shè)備會(huì)十分低效,因此需設(shè)計(jì)分布式導(dǎo)航方案。
面對(duì)這樣復(fù)雜的群智感知任務(wù),劉馳團(tuán)隊(duì)創(chuàng)新性地提出了“e-Divert”調(diào)度算法。其在傳統(tǒng)actor-critic方法的基礎(chǔ)上,通過(guò)引入長(zhǎng)短期記憶模型LSTM對(duì)時(shí)間軌跡特征進(jìn)行提取,并輔助卷積神經(jīng)網(wǎng)絡(luò)CNN做到時(shí)空數(shù)據(jù)分析。同時(shí),采用了Ape-X機(jī)制,為智能體創(chuàng)造“分身術(shù)”,從而在環(huán)境的訓(xùn)練副本中實(shí)現(xiàn)更廣泛深入的探索,優(yōu)化了經(jīng)驗(yàn)復(fù)用機(jī)制的性能。實(shí)驗(yàn)表明,算法在保證合作策略的同時(shí),有效地提取了當(dāng)前狀態(tài)序列的時(shí)空特征,進(jìn)而學(xué)會(huì)了類(lèi)似“瞻前顧后,揚(yáng)長(zhǎng)避短”的行為策略。

面向智慧城市的人機(jī)協(xié)同群智感知系統(tǒng)
除此之外,為了保障系統(tǒng)工作過(guò)程中的數(shù)據(jù)完整性、數(shù)據(jù)安全性和數(shù)據(jù)可靠性,劉馳團(tuán)隊(duì)又提出了一個(gè)結(jié)合Ethereum區(qū)塊鏈的深度強(qiáng)化學(xué)習(xí)框架。它既可以幫助每個(gè)移動(dòng)智能終端感知附近的數(shù)據(jù)點(diǎn),從而實(shí)現(xiàn)上述高效的數(shù)據(jù)采集效果,同時(shí)也使區(qū)塊鏈在不同終端之間共享數(shù)據(jù),有效地保障了數(shù)據(jù)的安全級(jí)別。
智慧城市迅速發(fā)展的關(guān)鍵在于物聯(lián)網(wǎng)類(lèi)大數(shù)據(jù)的有效獲取,用來(lái)補(bǔ)充互聯(lián)網(wǎng)數(shù)據(jù)在物理空間表征中的信息缺失。展望未來(lái),在“人機(jī)協(xié)同”群智感知技術(shù)這一新的研究方向下,劉馳團(tuán)隊(duì)計(jì)劃從關(guān)鍵理論和場(chǎng)景技術(shù)兩個(gè)方面進(jìn)行攻關(guān)。具體地,在關(guān)鍵理論方面,將嘗試通過(guò)設(shè)計(jì)高效記憶機(jī)制來(lái)更好地利用人機(jī)協(xié)同條件下移動(dòng)軌跡中的時(shí)空信息;在場(chǎng)景技術(shù)方面,將深入研究多任務(wù)深度強(qiáng)化學(xué)習(xí)技術(shù),探索不同城市內(nèi)群智感知任務(wù)的知識(shí)遷移、任務(wù)與激勵(lì)分配等核心技術(shù)。
多年來(lái),為了破解智慧城市中物聯(lián)網(wǎng)類(lèi)大數(shù)據(jù)的獲取技術(shù),北京理工大學(xué)劉馳教授團(tuán)隊(duì)一直在堅(jiān)持不懈地努力,也一直走在業(yè)界的前列。劉馳團(tuán)隊(duì)的終極目標(biāo)是實(shí)現(xiàn)真正完備的人機(jī)協(xié)同群智感知系統(tǒng),為“智慧城市大腦”的發(fā)展提供源源不斷的數(shù)據(jù)資源,為大數(shù)據(jù)、云計(jì)算、人工智能等技術(shù)與智慧城市中的實(shí)體經(jīng)濟(jì)深度融合提供有力支持。到那一天,技術(shù)走進(jìn)千家萬(wàn)戶(hù),百姓的生活質(zhì)量會(huì)得到進(jìn)一步提升。能夠助力美好中國(guó)的發(fā)展,劉馳團(tuán)隊(duì)也會(huì)因?qū)夹g(shù)的執(zhí)著追求取得的成果而流露出一絲欣慰。