許建平
(海軍裝備研究院 北京 100073)
隨著抗惡劣環境計算機的發展和中國信息化建設的不斷深入,抗惡劣環境數據中心要求能夠在開放式網絡環境下提供多維度大數據量的信息處理。用于處理本地的各種計算、存儲等服務。云計算作為當前抗惡劣環境數據中心技術的主要運營模式,用于處理本地的各種計算、存儲等服務。用戶通過網絡使用云計算提供的各種計算,存儲和其他資源,消除了用戶獲取,管理和維護的成本,提高了資源的利用率[1]。
云計算的核心思想是通過不斷提高“云端”(計算中心)的處理能力來集中處理用戶終端的任務,最終用戶終端被簡化為簡單的輸入和輸出設備,即瘦終端,并且可以按需享受由“云”提供的強大的計算處理能力。現有的云計算平臺是基于大型數據中心的集中式結構[2],通過建立集中的大型數據中心和計算中心形成“云”端。由“云”端對外提供用戶所需的各種服務;用戶通過網絡使用“云”端提供的服務,如圖1所示。
基于資源集中的云計算模型具有強大的計算、存儲能力,可以為抗惡劣環境數據處理節省大量開銷。但這種集中式處理模式卻存在一定的缺陷:
1)集中式云計算能力逐漸無法匹配大量邊緣數據;
2)從終端設備發送到云數據中心的數據增加了傳輸帶寬的負載量,導致一定的網絡時延;
3)終端設備數據涉及隱私和安全的問題變得尤為突出;
4)數據傳輸導致終端設備消耗大量電能。
針對上述問題,邊緣計算的概念應用而生。邊緣計算模型將原始云計算模型的一些或全部計算任務遷移到終端設備,并在網絡終端設備上執行任務計算和數據分析,從而減少云計算中心的計算負載,減輕網絡帶寬的壓力,提高數據處理效率。
邊緣計算是指在網絡邊緣執行計算的模型。如圖2為邊緣計算模型,其中,邊緣計算的邊緣指云計算中心與數據源之間任何的計算與網絡資源。云計算中心不僅從數據庫收集數據,還從邊緣設備(如傳感器)收集數據。這些設備兼顧數據生產者和消費者。因此,云中心與邊緣設備之間的請求傳輸是雙向的。網絡邊緣設備既可以向云中心請求服務,也執行一些計算任務,包括設備管理、數據處理、緩存、存儲、隱私保護等。因此,有必要更好地設計網絡邊緣設備的軟硬件關鍵技術,以滿足可靠性和數據安全性的要求。
隨著網絡邊緣設備的增加,現有的集中式云計算模型已無法完全高效地處理由網絡邊緣設備產生的大量數據。因此,越來越多的國內外研究人員正致力于解決云計算中心的傳輸帶寬和計算負載問題。主要的研究模型包括:分布式數據庫模型、CDN模型、P2P模型、霧計算模型、移動邊緣計算模型和海云計算等。

圖2 邊緣計算模型
1)分布式數據庫模型
分布式數據庫模型是指將數據庫分布在互聯網、企業網、自組織網絡及其獨立計算機上[3]。數據存儲在多臺計算機上。分布式數據庫在大數據環境中提供數據存儲,較少關注設備端的異構計算和存儲功能,主要用于分布式存儲和數據共享。分布式數據庫技術需要大量空間和低數據隱私。數據一致性技術是分布式數據庫的重要挑戰。
2)CDN模型
CDN模型(Conttent Delivery Network)是基于互聯網的緩存網絡[4]。它是構建在網絡之上內容分發網絡,依靠部署在各地的邊緣服務器,通過中心平臺的負載均衡、內容分發、調度等功能模塊,使用戶就近獲取所需內容,降低網絡堵塞,提高用戶訪問速度和命中率[5]。
3)P2P模型
P2P(peer-to-peer computing)模型在2000年被提出并發展為分布式系統重要的子領域,它用于實現文件共享系統[6]。在P2P模型中網絡的參與者共享它們所擁有的一部分資源,這些資源通過網絡提供服務和內容,能被其他對等節點直接訪問,網絡的參與者既是服務者,又是資源的獲取者。P2P模型的主要優勢包括:非中心化、可擴展性、健壯性、自治性、隱私性和負載均衡。
4)霧計算模型
霧計算模型于2012年被思科提出[7],霧計算模型是一個高度虛擬化的計算模型,用于將云計算中心任務遷移到網絡邊緣設備。霧計算在云計算中心和網絡邊緣設備之間提供計算、存儲和網絡服務[8]。相比于集中式云計算,霧計算擴大了網絡計算模式,將網絡計算從網絡中心擴展到了網絡邊緣,從而更加廣泛地應用于各種服務。
5)移動邊緣計算模型
移動邊緣計算(Mobile Edge Computing,MEC)由歐洲電信標準協會于2014年率先提出[9],如圖3所示。MEC系統允許設備將計算任務卸載到網絡邊緣節點,如基站、無線接入點等,在滿足了終端設備計算能力的擴展需求的同時也彌補了云計算時延較長的缺點。MEC具有能縮短任務執行時延、提升網絡能效、提供更高服務可靠性等優點。MCE也面臨著一些關鍵性挑戰:如任務卸載效率的提高、可靠性的保證及可擴展性的提升等。

圖3 MEC系統基本架構
6)海云計算
中國科學院于2012年開展“海云計算系統項目”的研究,其核心是將“云計算”與“海計算[10]”進行協同和整合,從而增強集中式云計算的能力。其中,“海”端即指客戶端。“海云計算”系統的目標是實現ZB級數據處理的能量效率是現有技術的1000倍。
目前,許多行業應用對實時性,可靠性和安全性都有著嚴格的要求,邊緣計算在許多商業場景有了一定的應用。如云計算任務遷移、智能家居、邊緣計算視頻監控、智能交通、智慧城市等。
1)云計算任務遷移
在邊緣計算中,邊緣設備通過使用某些計算資源來實現一些或所有任務從云中心到邊緣端執行。例如,在商業應用的在線購物應用中,用戶頻繁地操作購物車,通過將購物車狀態改變的操作從云中心遷移到邊緣節點可以減少用戶請求的響應延遲、提高用戶體驗。
2)智能家居
邊緣計算模型作為構建智能家居系統的最佳平臺,在家庭內部的邊緣網關上運行邊緣操作系統。使用此操作系統連接和管理家庭中的智能家居設備,并在本地處理這些設備生成的數據。該模型減少了數據傳輸帶寬的負擔,優化了資源管理和分配操作。
3)邊緣計算視頻監控
與傳統的城市安防視頻監控系統相比,邊緣計算視頻監控系統提高了前端攝像頭的智能處理能力。邊緣設備預處理視頻圖像以去除視頻圖像的冗余信息,從而降低了對云計算中心的計算、存儲和帶寬要求。
4)智能交通
智能交通旨在解決城市居民面臨的出行問題。智能交通控制系統在邊緣服務器上運行,根據實時分析的路面數據信息,調節交通信號燈或引導車輛改變路線。邊緣計算在無人駕駛、無人機飛行、多飛行器之間的協調控制等領域也得到了一定的應用。
5)智慧城市
智慧城市是智能家居的擴展與延伸。根據邊緣計算中將數據處理最大化遷移到數據源附近的原理,用戶需求在邊緣處理。采用邊緣計算進行智慧城市管理具有處理數據大、低延時和位置識別等優勢。
邊緣計算技術的發展不僅給抗惡劣環境數據中心技術帶來了發展機遇,同時也帶來了挑戰。
邊緣計算技術給抗惡劣環境數據中心帶來的機遇可以從數據量,時效性,多樣性三個方面來進行討論,圖4和圖5分別表示集中式云計算與邊緣計算的數據處理,總結邊緣計算為抗惡劣數據中心帶來的優勢如下。
1)在數據量方面,邊緣計算模型較集中式云計算模型具有更強的承受能力;
2)在時效性方面,邊緣計算模型較集中式云計算模型具有更快的數據處理速度;
3)在多樣性方面,邊緣計算模型較集中式云計算模型具有不同的數據處理方式。

圖4 集中式云計算模型數據處理

圖5 邊緣計算模型數據處理
邊緣計算模型將一部分最初屬于云中心的計算工作分配給邊緣設備,不僅提高了數據的傳輸效率,還降低了云中心的計算負載,使得抗惡劣環境數據中心具有更高的性能。
邊緣計算技術能夠給抗惡劣環境數據中心帶來的優勢是毋庸置疑的,但由于其起步較晚,還存在很多問題需要研究,下面對其中的幾個主要問題進行分析。
4.2.1 多主體的資源管理
不同于云計算中心的集中式管理,邊緣計算的資源分散在數據的傳輸途徑上,因此,需研究多主體資源管理。一種直觀的解決方案是每個實體自我管理資源,然后通過中間服務提供資源。但這種方法不能滿足使用者的特殊需求,如自動供給,因此需要依賴各個主體提供API。各個API的靈活性直接影響著抗惡劣環境數據中心的性能,因此實現靈活的多主體資源管理是一個十分富有挑戰性的問題。
4.2.2 虛擬化技術
為了促進資源的有效管理,邊緣計算需要虛擬化技術的支持。邊緣計算對虛擬化技術的要求體現在3個方面:虛擬化技術實現最小化對應用程序運行時環境的約束、虛擬化技術實現資源的最大化利用以及虛擬機技術對不同任務的隔離。這三個方面可能存在沖突,系統應根據自己的需要在它們之間進行權衡。目前,新型虛擬化技術層出不窮,其中許多技術突破了虛擬機和容器的規則和界限,將兩者充分融合,同時具備兩者的優勢,如LXD,Hyper,Rancher OS等。因此,設計適應抗惡劣環境數據中心的邊緣計算特性的虛擬化技術也是一項挑戰。
4.2.3 數據分析
數據分析中的數據量越大,通常提取的值信息就越多。但是收集數據需要時間,而價值信息通常是時間敏感的。邊緣計算允許數據在收集過程中被處理與分析,但這個過程可能存在著大量價值信息的丟失,因此如何權衡提取信息的價值和及時性是一個關鍵問題。
4.2.4 編程模型
邊緣計算資源的動態、異構和分散性使得應用程序的開發非常困難。Hong等針對該問題提出了一個邊緣計算模型[11]。該模型適應分散的異構資源環境,并使程序能夠根據負載動態擴展。但是,該模型假設資源之間的網絡拓撲必須是樹狀的,并且不能適應邊緣計算資源的動態性。Sajiad等提出了流應用的編程模型[12],將任務區分為本地任務和全局任務,本地任務可以在更接近數據源的計算節點上執行,從而減少應用在網絡上傳輸的數據量。
隨著邊緣數據的增多,集中式云計算模型將無法有效解決抗惡劣環境數據中心傳輸帶寬、負載、數據隱私保護等問題。邊緣計算模型中的計算模型可以保證更短的響應時間及更高的可靠性。另外,如果可以在邊緣設備上處理大部分數據而無需上傳到云計算中心,則可以大大節省設備端的傳輸帶寬和功耗。我們相信,隨著邊緣計算面臨的技術問題得到解決,該技術必將在抗惡劣環境數據處理領域得到廣泛地應用。