陳曙東,李偉煒,杜 蓉,高昊君,張雪婷,董奕辰
(1.中國科學(xué)院微電子研究所,北京 100029;2.中國科學(xué)院大學(xué) 集成電路學(xué)院,北京 100049)
隨著5G和人工智能技術(shù)的融合發(fā)展,工業(yè)互聯(lián)網(wǎng)、自動駕駛等物聯(lián)網(wǎng)應(yīng)用快速發(fā)展。這些新興應(yīng)用對通信網(wǎng)絡(luò)服務(wù)的智能化和多樣性的需求越來越迫切[1],未來通信網(wǎng)絡(luò)將開始更加注重提供更貼近用戶需求和體驗的智能化服務(wù)[2]。
實現(xiàn)面向萬物互聯(lián)的智能化通信服務(wù),當(dāng)前的通信網(wǎng)絡(luò)面臨以下主要挑戰(zhàn):
① 現(xiàn)有基于標(biāo)識的通信網(wǎng)絡(luò)內(nèi)沒有語義信息,無法支持基于網(wǎng)絡(luò)語義的路由、緩存等智能服務(wù);
② 物聯(lián)網(wǎng)應(yīng)用需要實時感知環(huán)境語義,進行快速檢索和內(nèi)容獲取,支持分布式的高并發(fā)請求,現(xiàn)有通信網(wǎng)絡(luò)需要提升分布式查詢效率。
用戶訪問網(wǎng)絡(luò)的主要行為之一是對海量內(nèi)容的獲取,因此未來網(wǎng)絡(luò)應(yīng)該從當(dāng)前以“位置”為中心的體系架構(gòu),演進到以“信息”為中心的體系架構(gòu)[3]。2006 年施樂帕克研究中心(Xerox PARC)提出內(nèi)容中心網(wǎng)絡(luò) ( Content Centric Network,CCN)[4],以數(shù)據(jù)為導(dǎo)向,根據(jù)內(nèi)容訪問數(shù)據(jù),放棄了傳統(tǒng)IP網(wǎng)絡(luò)架構(gòu),不再包含顯式的主機或接口地址等位置信息,從根本上改變了IP包的封裝結(jié)構(gòu)和尋址方式,具有短時延、低功耗、高可靠等特點。2010年FIA的命名數(shù)據(jù)網(wǎng)絡(luò)(Named Data Networking,NDN)[5]項目也采用類似的架構(gòu),使用沙漏模型結(jié)構(gòu),采用類似 URL 的層次化內(nèi)容命名。由于CCN/NDN構(gòu)建的新型移動通信架構(gòu)是一種革命性的解決方案,顛覆了傳統(tǒng)的IP技術(shù)架構(gòu),路由策略、轉(zhuǎn)發(fā)策略、緩存機制和安全性尚需進一步研究,當(dāng)前難以部署和實施。
目前網(wǎng)絡(luò)層地址統(tǒng)一標(biāo)識體系的方案主要有HIP(Host Identifier Protocol)[6]、Shim6[7]、MobilityFirst[8]、XIA(eXpressive Internet Architecture)[9]等。HIP在網(wǎng)絡(luò)層和傳輸層之間插入主機標(biāo)識層,為上層應(yīng)用提供固定不變的主機標(biāo)識,屏蔽了IP地址變化,同時維護主機標(biāo)識與IP地址的綁定關(guān)系;HIP報文格式采用IPin IP方式,外層為用于路由尋址的IP地址,內(nèi)層為用于標(biāo)識身份的128位主機標(biāo)識。Shim6協(xié)議修改終端網(wǎng)絡(luò)協(xié)議棧,在IP路由子層和終端子層之間插入Shim 層,使標(biāo)識符( Identifier ) 和定位符(Locator)分離。MobilityFirst的體系架構(gòu)使用ID與Locator分離的機制、扁平地址結(jié)構(gòu)、利用公鑰基礎(chǔ)設(shè)施實現(xiàn)標(biāo)識的驗證,支持快速的全局名稱解析、存儲轉(zhuǎn)發(fā)的路由方式、緩存和逐跳的分段數(shù)據(jù)傳輸?shù)取IA使用標(biāo)識和地址分離的設(shè)計,引入NID代表網(wǎng)絡(luò)域或子網(wǎng),路由時用來定位網(wǎng)絡(luò)地址。這些工作研究將網(wǎng)絡(luò)標(biāo)識作為現(xiàn)有網(wǎng)絡(luò)的補充,將標(biāo)識和地址分離,但是都沒有關(guān)注標(biāo)識的語義信息,難以支持基于語義的路由、緩存等智能網(wǎng)絡(luò)服務(wù)。
其他一些工作研究構(gòu)建高效的網(wǎng)絡(luò)資源調(diào)度[10]和內(nèi)容分發(fā)[11],雖然實現(xiàn)了通信感知一體化[12]的體系,但在應(yīng)對不同場景下智能化網(wǎng)絡(luò)服務(wù)供給方面仍然面臨挑戰(zhàn)。
為滿足更貼近應(yīng)用需求網(wǎng)絡(luò)服務(wù),本文提出一種面向萬物互聯(lián)的支持語義解析的智能通信服務(wù)網(wǎng)絡(luò)架構(gòu),基于報文相關(guān)語義信息構(gòu)建語義標(biāo)識,提供可感知場景語義的智能化通信服務(wù)。本文提出的新型網(wǎng)絡(luò)架構(gòu)沿用現(xiàn)有的IP技術(shù)體系,無需協(xié)議轉(zhuǎn)換即可實現(xiàn)與網(wǎng)絡(luò)層IP承載的無縫連接,支持簡單便捷的端到端業(yè)務(wù)部署和管理,便于基于TCP/IP協(xié)議棧開發(fā)的相關(guān)應(yīng)用快速移植。
本文詳細(xì)論述所設(shè)計的智能通信服務(wù)網(wǎng)絡(luò)的整體架構(gòu)和支持語義解析的網(wǎng)絡(luò)報文構(gòu)建方法;闡述如何利用深度學(xué)習(xí)模型實現(xiàn)語義信息的編碼和解碼,構(gòu)建通信場景的語義知識庫;設(shè)計如何構(gòu)建語義標(biāo)識倒排索引,以實現(xiàn)快速語義檢索,賦能智能化應(yīng)用場景;搭建了視頻會議測試場景,對語義編解碼的精度和語義查詢速度的實驗結(jié)果進行了分析和總結(jié)。
依據(jù)5G的愿景與需求并結(jié)合基于語義網(wǎng)絡(luò)數(shù)據(jù)與位置解耦、強制簽名以及網(wǎng)內(nèi)緩存等特點,構(gòu)建一個支持語義解析、標(biāo)識與地址分離機制的新型網(wǎng)絡(luò)架構(gòu),如圖1所示。

圖1 支持語義解析的通信網(wǎng)絡(luò)架構(gòu)
在現(xiàn)有底層通信和上層應(yīng)用之間增加了一個基礎(chǔ)語義服務(wù)層,首先對上層應(yīng)用中的圖像、文本等信息進行語義編碼,并作為唯一且不變的語義編碼標(biāo)識SID,生成支持語義解析的網(wǎng)絡(luò)報文;然后在底層通信設(shè)施中構(gòu)建語義標(biāo)識的倒排索引,以支持語義標(biāo)識的快速檢索,進而實現(xiàn)基于語義的智能網(wǎng)絡(luò)路由、緩存等服務(wù)。
在語義解析通信服務(wù)網(wǎng)絡(luò)中,語義解析服務(wù)維護語義標(biāo)識SID 與它們的網(wǎng)絡(luò)地址 NA 之間的映射關(guān)系。IP 是互聯(lián)網(wǎng)的基本路由協(xié)議,可作為語義解析通信服務(wù)網(wǎng)絡(luò)的網(wǎng)絡(luò)地址,語義解析服務(wù)維護 SID 和 IP 地址之間的映射關(guān)系,用戶面可以通過 IP 進行轉(zhuǎn)發(fā)。網(wǎng)絡(luò)層報文的NA 地址字段包括語義標(biāo)識 SID 對應(yīng)語義內(nèi)容的多個候選存儲地址集合或其他引用信息。SID為語義標(biāo)識,由語義編碼器輸出的語義標(biāo)識編碼、位置編碼、實體關(guān)聯(lián)編碼等構(gòu)建而成。SID根據(jù)語義解析通信服務(wù)網(wǎng)絡(luò)所支持的智能化應(yīng)用的不同需要具有不同的類別與形式,通常包含圖像類數(shù)據(jù)索引、文本關(guān)鍵詞類索引等內(nèi)容。語義解析通信服務(wù)網(wǎng)絡(luò)基于語義標(biāo)識SID和IP之間的映射關(guān)系進行路由和轉(zhuǎn)發(fā),實現(xiàn)對數(shù)據(jù)語義內(nèi)容的查找和定位,加快路由、轉(zhuǎn)發(fā)和查找的速度,縮短響應(yīng)時間。
語義解析通信服務(wù)網(wǎng)絡(luò)的報文組成方式如圖2所示。首先根據(jù)入網(wǎng)實體的入網(wǎng)信息和相關(guān)場景語義信息生成語義標(biāo)識SID,然后與報文Header、網(wǎng)絡(luò)地址NA、數(shù)據(jù)Payload拼接生成網(wǎng)絡(luò)報文。

圖2 語義解析通信服務(wù)網(wǎng)絡(luò)報文結(jié)構(gòu)
入網(wǎng)信息生成將數(shù)據(jù)包入網(wǎng)的時空信息以及其他狀態(tài)信息編碼成入網(wǎng)信息,作為網(wǎng)絡(luò)ID的字段。其中空間信息可使用將經(jīng)度、緯度等信息作為輸入,同時可以加入其他狀態(tài)信息映射成入網(wǎng)信息,能夠提升ID標(biāo)識自驗證的安全特性。
語義編碼生成融合語義知識庫的語義標(biāo)識元素編目以及語義標(biāo)識屬性(包括入網(wǎng)實體的位置信息、邏輯及推理關(guān)系等),通過語義編碼器處理,截取形成語義編碼字段,能夠體現(xiàn)語義標(biāo)識的編碼、位置信息、不同實體間邏輯關(guān)系和其他相關(guān)屬性特征。
語義標(biāo)識SID生成將語義編碼和入網(wǎng)信息字段拼接,同時保留一定的預(yù)留位形成網(wǎng)絡(luò)ID,與Header和網(wǎng)絡(luò)地址NA、Payload共同組成最終的網(wǎng)絡(luò)報文。
為智能化地支持萬物互聯(lián)場景,所設(shè)計的語義解析通信服務(wù)網(wǎng)絡(luò)主要包括支持語義的控制面、面向現(xiàn)場的用戶面和語義解析服務(wù),如圖3所示。

圖3 支持語義解析的5G通信服務(wù)
支持語義的控制面提供語義智能網(wǎng)絡(luò)控制服務(wù),包括基于語義的路由選擇、具有彈性的資源控制和計算能力;面向現(xiàn)場的用戶面主要考慮邊緣端現(xiàn)場計算和現(xiàn)場存儲的能力,負(fù)責(zé)執(zhí)行一些面向用戶應(yīng)用場景的動作和處理邏輯,可以滿足不同應(yīng)用現(xiàn)場的處理需求,支持時間敏感型的服務(wù);語義解析服務(wù)對文本和視頻進行編碼,構(gòu)建支持語義解析的語義網(wǎng)絡(luò)標(biāo)識和基于語義的倒排索引,支持快速的語義匹配和搜索。
新型通信網(wǎng)絡(luò)架構(gòu)在當(dāng)前底層通信與上層應(yīng)用中間增加了一層基礎(chǔ)語義服務(wù)層,通過對入網(wǎng)實體的標(biāo)簽、網(wǎng)絡(luò)位置等屬性構(gòu)建語義檢索,建模語義關(guān)系,提供以內(nèi)容為中心的智能化通信服務(wù)。支持執(zhí)行分布式的快速并發(fā)查詢,提升網(wǎng)絡(luò)數(shù)據(jù)查詢以及獲取效率和速度,支持快速的內(nèi)容檢索和分發(fā),從而提升網(wǎng)絡(luò)服務(wù)質(zhì)量。
移動性方面構(gòu)建基于語義標(biāo)識的網(wǎng)絡(luò)服務(wù),使標(biāo)識與位置解耦,不會因用戶地址的改變而降低網(wǎng)絡(luò)傳輸效率。由于基于語義標(biāo)識的網(wǎng)絡(luò)服務(wù)內(nèi)生支持多徑路由與網(wǎng)內(nèi)緩存,可大大減輕因數(shù)據(jù)產(chǎn)生者移動而對通信過程產(chǎn)生的影響。因此,在基于語義網(wǎng)絡(luò)移動通信架構(gòu)中,不同接口可采用統(tǒng)一的語義標(biāo)識來支持移動性,提高傳輸效率。
數(shù)據(jù)路由方面能夠支撐基于語義的轉(zhuǎn)發(fā)與路由操作,提供快速的語義查詢檢索服務(wù),通過語義標(biāo)識對數(shù)據(jù)包進行檢索,并依據(jù)檢索結(jié)果對存儲在轉(zhuǎn)發(fā)平面中的記錄進行更新、插入和刪除。
網(wǎng)絡(luò)緩存方面使用語義知識庫將數(shù)據(jù)緩存在路由節(jié)點中方便后續(xù)用戶使用,為實現(xiàn)網(wǎng)絡(luò)資源利用率的最大化,基于語義標(biāo)識信息可以構(gòu)建智能的緩存替換策略,適應(yīng)不同應(yīng)用場景的數(shù)據(jù)緩存需求。當(dāng)前網(wǎng)絡(luò)中適用于單個節(jié)點的緩存替換策略為最近最少和最近最多使用策略、最少頻繁使用策略。在加入語義信息后,基于語義特征來支持智能的網(wǎng)絡(luò)數(shù)據(jù)緩存,提升整體網(wǎng)絡(luò)性能。
本節(jié)以視頻會議為例,詳細(xì)介紹語義解析服務(wù)的工作原理。如圖4所示,在視頻場景中,語義編碼模塊接收視頻會議應(yīng)用的相關(guān)圖像和文本標(biāo)簽,結(jié)合應(yīng)用時間地點形成語義編碼,構(gòu)建支持語義檢索的網(wǎng)絡(luò)報文,以支持視頻應(yīng)用場景下的智能緩存和路由網(wǎng)絡(luò)服務(wù)。例如:需要檢索前一段視頻流中特定會議參與者發(fā)言數(shù)據(jù),語義解析接口接收請求,語義檢索語義標(biāo)識SID中匹配到對應(yīng)會議參與方發(fā)言的時空標(biāo)簽和圖像語義標(biāo)識,將對應(yīng)數(shù)據(jù)結(jié)果實時反饋。當(dāng)一個用戶加入會議時,可以基于語義查詢解析相應(yīng)屬性語義信息,獲取會議場景下實體的網(wǎng)絡(luò)位置,包括攝像頭、麥克風(fēng)等設(shè)備信息,語義檢索匹配到相應(yīng)列表,然后進行支持語義的相關(guān)操作,例如對特定攝像頭的控制操作、基于語義的圖像數(shù)據(jù)網(wǎng)絡(luò)緩存策略等。

圖4 視頻會議場景下的智能通信服務(wù)工作流程
語義可能受不同主客觀環(huán)境因素影響,如視頻會議應(yīng)用標(biāo)簽、圖像特征等信息均可能對語義產(chǎn)生影響。單純依靠單個或者一類傳感器(如攝像頭)采集的信息難以全面識別應(yīng)用感興趣的語義信息。因此,將視頻會議應(yīng)用屬性、圖像特征,以及時間、地點標(biāo)簽等多信息融合編碼,構(gòu)建語義標(biāo)識,適用于不同的智能應(yīng)用場景。
視頻應(yīng)用中有著大量數(shù)據(jù)和請求,網(wǎng)絡(luò)中的冗余流量占據(jù)大量資源,而且在不同場景之間的內(nèi)容請求差異較大,造成不同語義內(nèi)容的緩存需求差異較大。面對這種情況,現(xiàn)有的緩存放置算法無法很好地應(yīng)對。構(gòu)建基于語義標(biāo)識的網(wǎng)絡(luò)報文,使網(wǎng)絡(luò)具備支持語義的路由、網(wǎng)絡(luò)內(nèi)置緩存以及請求聚合等特點,能夠有效地減少網(wǎng)絡(luò)冗余、降低網(wǎng)絡(luò)開銷、緩解網(wǎng)絡(luò)壓力。因此,在視頻會議場景中,適合采用支持語義解析的通信網(wǎng)絡(luò)進行視頻的內(nèi)容分發(fā)。利用語義編碼信息,能夠快速捕捉網(wǎng)絡(luò)流量的變化;采用沿路徑緩存放置算法,能夠在內(nèi)容經(jīng)過某節(jié)點時,智能地根據(jù)網(wǎng)絡(luò)中快速變化的流量,實時調(diào)整緩存放置。
語義解析通信服務(wù)網(wǎng)絡(luò)在構(gòu)建數(shù)據(jù)源的語義標(biāo)簽并形成相應(yīng)的語義索引時,需要解決如何進行知識和語義表征的問題,即如何從傳輸?shù)臄?shù)據(jù)源中提取出所支持的語義解析服務(wù)需要的語義內(nèi)容并將之轉(zhuǎn)化為可路由、可轉(zhuǎn)發(fā)的語義編碼。語義解析通信服務(wù)網(wǎng)絡(luò)支持計算和搜索基于文本、圖像、語音等多種數(shù)據(jù)源生成的語義編碼,且能對語義編碼所指代的語義實體間的邏輯關(guān)系予以表征。
基于數(shù)據(jù)源中的語義信息形成語義標(biāo)識需要消耗大量的運算和儲存資源,完成語義分析的計算任務(wù)無法僅僅分?jǐn)偟酵ㄐ虐l(fā)送方和接收方的終端,往往需要利用外部的運算與儲存資源,從而實現(xiàn)數(shù)據(jù)和信息的融合、共享。一種較有效的處理方法是在整個語義解析通信服務(wù)網(wǎng)絡(luò)中,注冊認(rèn)證大量邊緣計算服務(wù)器和存儲設(shè)備,分布式地部署在用戶側(cè)形成資源集群,以供輔助完成智能化通信服務(wù)所需要的各種語義解析任務(wù)。用戶側(cè)可以將需要密集計算的語義提取和語義接收對應(yīng)的編碼、解碼任務(wù)實時加載到最近的資源集群服務(wù)器上,并僅在本地執(zhí)行輕量級的語義標(biāo)識生成。邊緣計算服務(wù)器即時地響應(yīng)用戶側(cè)的語義解析算法需求,迅速進行語義編碼器、解碼器的模型訓(xùn)練和數(shù)據(jù)傳輸、存儲等任務(wù)。為了實現(xiàn)數(shù)據(jù)和信息的融合共享,支持語義解析整體運行效率的提升,各邊緣計算服務(wù)器可以通過聯(lián)邦學(xué)習(xí)、分布式計算等方式,在數(shù)據(jù)預(yù)處理、訓(xùn)練編碼解碼模型、知識共享時相互協(xié)作,以實現(xiàn)資源集群中的計算資源和負(fù)載的最優(yōu)分配。
語義知識庫是構(gòu)建文本、圖像或其他源數(shù)據(jù)的語義標(biāo)識的基礎(chǔ),其中包括語義標(biāo)識庫和實體之間的邏輯及推理關(guān)系。語義解析服務(wù)一般需要依賴于公共的語義知識庫對知識表征進行協(xié)議化、統(tǒng)一化的規(guī)范與管理。語義模型庫則根據(jù)語義知識庫定義的不同編碼組成方案的要求,儲存面向各種智能化應(yīng)用場景及圖像、文本等常用的源數(shù)據(jù)中識別和提取語義的主流AI模型和技術(shù)流程。
語義知識庫的另一個作用是依照語義解析通信服務(wù)網(wǎng)絡(luò)所支持的不同類別的語義解析服務(wù),定義每種服務(wù)所需要的語義標(biāo)識類型、邏輯關(guān)系、實體位置、屬性等信息,以及相應(yīng)的編碼組成方案。語義知識庫中的實體概念和邏輯關(guān)系,在語義知識庫中被協(xié)議化地定義與規(guī)范,并作為通信發(fā)送與接收方使用語義解析服務(wù)的基礎(chǔ)協(xié)議。
語義隨著應(yīng)用場景的變化而變化,這就要求語義知識庫必須具有自學(xué)習(xí)和自更新的功能:當(dāng)有新實體出現(xiàn)時,知識庫需要識別、分析該實體可能的含義和適用場景,然后將該實體概念和由推理得出的與已有實體間的邏輯關(guān)系等信息添加到語義知識庫中[13];同時,知識庫還應(yīng)當(dāng)能夠?qū)π聦嶓w的使用熱度進行實時的冷熱分析與實時更新。這部分工作可基于眾包、爬取、多模態(tài)感知融合等多種技術(shù)來完成,將用戶群體在不同背景、語言和場景下積累的普適性知識和語義信息傳輸給就近的資源集群,識別、分析完成后,再更新至語義知識庫中。
在一般的通信系統(tǒng)中,對源端數(shù)據(jù)編碼主要為了方便信息的存儲和傳輸,并盡可能地保留源數(shù)據(jù)的所有信息。其結(jié)果只含有輸出符號序列的標(biāo)識,并不包含輸出符號序列的語義含義。而在本文提出的語義解析通信服務(wù)網(wǎng)絡(luò)中,語義編碼提取源端數(shù)據(jù)中用戶側(cè)需要的語義內(nèi)容,并進行智能化任務(wù)導(dǎo)向式編碼。此過程的主要目的是對源端數(shù)據(jù)中與特定智能化應(yīng)用任務(wù)相關(guān)的語義信息通過稠密向量進行表示,丟掉與任務(wù)無關(guān)的信息,在知識庫與模型庫的協(xié)同下,遵照特定智能化應(yīng)用對應(yīng)的語義編碼方案對源端信息中隱含的語義信息進行提取與映射獲得語義編碼。因此,語義編碼需要根據(jù)語義解析通信服務(wù)網(wǎng)絡(luò)所支持的智能化應(yīng)用,具有不同的類別與形式。
語義編碼器檢測與抽取源端信息中所涉及的具體語義特征,并同時壓縮和刪除與語義無關(guān)的信息。語義編碼器通常根據(jù)不同的智能化處理任務(wù)具有不同的模型框架與參數(shù),并支持處理各種形式的源端信息。例如當(dāng)傳輸內(nèi)容為圖像或文本時,編碼器借助語義知識庫在模型庫中匹配相應(yīng)預(yù)訓(xùn)練好特征提取模型作為編碼器,進而提取傳輸內(nèi)容中的語義實體特征、實體間關(guān)系特征、實體位置及其他屬性特征形成高維特征編碼序列,以此作為構(gòu)建語義標(biāo)識SID的基礎(chǔ)。
當(dāng)傳輸內(nèi)容為文本時,語義編碼器采用語義模型庫中的面向文本類任務(wù)的主要模型(例如LSTM、Transformer模型等)理解與提取語義信息。在預(yù)處理階段,每段待傳輸?shù)奈谋緸閃=[w1,w2,w3,…,wi],其中,wi為待傳輸?shù)奈谋局械牡趇個詞。編碼器的作用相當(dāng)于函數(shù)f,待傳輸?shù)奈谋網(wǎng)經(jīng)編碼器編碼后得到序列B=f(w)。編碼器先將輸入文本序列t以句子為單位進行拆分,并在每個句子前后添加起始、結(jié)束分隔符,再將每個句子s的所有詞進行高維度的詞嵌入映射,生成高維的表示向量,映射后形成的文本高維嵌入表示序列E=[e1,e2,e3,…,ek],ek指代輸入文本序列中第k個詞的高維嵌入表示向量,分別包含向量嵌入、關(guān)系嵌入與位置嵌入三部分:向量嵌入是將詞高維映射后得到的詞特征;關(guān)系嵌入是第k個詞與文本序列的其他詞的關(guān)系表征;位置嵌入用來表征詞的位置編碼,以便表征順序信息。
傳輸內(nèi)容中的文本常用基于Transformer及其衍生出的其他語言模型的編碼塊進行編碼,將E通過編碼映射為經(jīng)過Transformer模型提取語義信息后隱含了上下文關(guān)系的抽象語義,再經(jīng)過編碼匹配、哈希映射形成不同語義解析服務(wù)所需要的語義標(biāo)識SID。Transformer類模型的編碼塊由多頭注意力層(multi-head attention layer)和位置感知的前饋層組成,對于一組查詢向量、鍵值和值,多頭注意力模塊執(zhí)行次注意力計算:
MultiHead(Q,K,V)=Concat(head1,head2,…,headh)WO,

對于源數(shù)據(jù)中的圖像類內(nèi)容,語義編碼器采用語義模型庫中的面向圖像類任務(wù)的主要模型(例如CNN、Transformer模型等)理解與提取語義信息。本文不再展開詳細(xì)論述。
源數(shù)據(jù)經(jīng)過語義編碼器后形成包含傳輸?shù)脑磾?shù)據(jù)全部語義信息的語義編碼,為得到語義標(biāo)識SID還需要根據(jù)語義知識庫定義的不同語義解析服務(wù)所需的語義標(biāo)識類型、語義標(biāo)識的邏輯關(guān)系以及實體位置、屬性等其他信息,對語義編碼進行語義編碼匹配與哈希映射,語義編碼匹配模型與哈希映射規(guī)則來自在邊緣計算服務(wù)器和存儲服務(wù)單元內(nèi)的知識庫。
語義解碼器將語義編碼中隱含的語義信息還原為按照接收端的需求,或智能化任務(wù)的期望展現(xiàn)的具體形式。例如可以將語義信息解碼為從傳輸文本中提取的關(guān)鍵詞、從2D圖像中重建的三維結(jié)構(gòu)、甚至從多模態(tài)源數(shù)據(jù)中生成的AR全息投影并呈現(xiàn)給接收端用戶。相關(guān)解碼的模型與還原規(guī)則存儲在邊緣計算服務(wù)器的語義知識庫。例如,當(dāng)進行從傳輸源數(shù)據(jù)的文本中提取作者信息的任務(wù)時,解碼器由雙向LSTM模塊拼接CRF(條件隨機場)模塊組成。其中,雙向LSTM模塊的輸入來自語義編碼器的輸出,用來獲取傳輸文本中的句子表示;CRF模塊接收上層雙向LSTM模塊的輸出,并對傳輸文本中的命名實體進行序列標(biāo)注。
由于網(wǎng)絡(luò)服務(wù)需要處理大量數(shù)據(jù)和請求,語義查詢服務(wù)需要滿足高并發(fā)與可靠性。針對這一需求,支持語義的通信服務(wù)網(wǎng)絡(luò)構(gòu)建了語義倒排索引來實現(xiàn)分布式語義查詢。倒排索引作為典型且高效的信息數(shù)據(jù)檢索結(jié)構(gòu),對各條記錄中所有字段或部分語義編碼字段分析處理,各個索引項將排列出一系列帶有該索引項的標(biāo)識,利用查找索引項,能檢索出相應(yīng)的索引結(jié)果。基于倒排索引的分布式語義查詢架構(gòu)如圖5所示,包括分布式倒排索引構(gòu)建和在線語義查詢處理兩個部分。

圖5 基于倒排索引的分布式語義查詢架構(gòu)
① 分布式倒排索引構(gòu)建:根據(jù)時間、空間、關(guān)聯(lián)關(guān)系等約束條件查詢標(biāo)識,構(gòu)建分布式倒排索引,支持網(wǎng)絡(luò)海量數(shù)據(jù)的語義搜索。
② 在線語義查詢:構(gòu)建支持語義關(guān)聯(lián)的分布式語義查詢處理和相關(guān)性評分模型,支持網(wǎng)絡(luò)海量數(shù)據(jù)的分布式查詢標(biāo)識和快速多級標(biāo)識解析;支持讀寫權(quán)限分離,保障數(shù)據(jù)安全性,支持節(jié)點自動同步更新,保證數(shù)據(jù)一致性。
構(gòu)建屬性數(shù)據(jù)語義知識融合的倒排索引結(jié)構(gòu),將語義信息封裝到倒排索引中,減少查詢前處理和后處理,提高語義查詢速度和準(zhǔn)確率,分布式倒排索引結(jié)構(gòu)如圖6所示。

圖6 分布式倒排索引構(gòu)建
構(gòu)建支持語義關(guān)聯(lián)的分布式語義查詢處理和相關(guān)性評分模型,輸出比傳統(tǒng)的倒排索引更具語義相關(guān)性的結(jié)果。支持讀寫權(quán)限分離,保障數(shù)據(jù)安全性,節(jié)點自動同步更新,保證數(shù)據(jù)一致性。在查詢處理中,可以引入分布式查詢處理算法,加上在查詢評估過程中檢索和排序相關(guān)查詢答案所需的專用相關(guān)性評分措施。此外,可以對索引構(gòu)建和查詢算法的詳細(xì)復(fù)雜性、有效性和效率分析進行查詢優(yōu)化。
將應(yīng)用場景語義信息直接封裝到倒排索引中,根據(jù)時間、空間、關(guān)聯(lián)關(guān)系等約束條件查詢標(biāo)識,構(gòu)建離線分布式倒排索引,并支持在線快速解析查詢。通信服務(wù)網(wǎng)絡(luò)語義查詢服務(wù)如圖7所示。

圖7 通信服務(wù)網(wǎng)絡(luò)語義查詢服務(wù)
索引模塊按照數(shù)據(jù)信息產(chǎn)生索引文件,并將其存放到索引庫中以實現(xiàn)檢索功能,數(shù)據(jù)信息的搜索流程一般包括以下幾點:
數(shù)據(jù)讀取數(shù)據(jù)采集模塊中所得到的文本和圖像被存放在分布式數(shù)據(jù)庫的各個數(shù)據(jù)節(jié)點中,并使用分布式處理引擎對文本和圖像進行預(yù)處理,完成數(shù)據(jù)的格式化。
數(shù)據(jù)分析對文本數(shù)據(jù)以塊或標(biāo)簽分類,過濾部分非關(guān)鍵字,降低存儲和搜索信息功耗。對于圖像視頻,基于應(yīng)用編碼方式進行單幀或多幀采樣,以匹配對應(yīng)的語義匹配模塊輸入。然后,根據(jù)不同的應(yīng)用需求,選擇相應(yīng)的處理模塊進行處理。
搜索與存儲基于Lucene實現(xiàn)索引的創(chuàng)建操作,生成倒排索引文件保存于分布式索引庫中,并定時對增量數(shù)據(jù)進行匯總。
基于語義編碼對網(wǎng)絡(luò)位置的查詢速度,是支撐快速實時應(yīng)用的基礎(chǔ)。以視頻會議場景為例,對視頻會議相關(guān)圖像和文本標(biāo)簽,結(jié)合應(yīng)用時間地點形成語義編碼,每個語義編碼為一個查詢實體。系統(tǒng)在5G模擬環(huán)境中運行,使用6臺服務(wù)器在一個子網(wǎng)中構(gòu)建分布式集群,包括數(shù)據(jù)和網(wǎng)絡(luò)節(jié)點。
在構(gòu)建的模擬環(huán)境中驗證了系統(tǒng)語義編碼功能,支持文本和圖片的語義提取,使語義標(biāo)識與位置解耦,可以支持高移動性應(yīng)用;測試驗證了語義索引構(gòu)建功能,語義標(biāo)識分布式倒排索引,支撐快速的語義查詢。同時,測試了不同編碼實體量下語義檢索的性能,語義查詢的測試流程如圖8所示。在測試用例中,使用目標(biāo)語義查詢匹配的報文網(wǎng)絡(luò)位置,通過倒排索引從海量的實體中進行語義匹配,從緩存和磁盤中獲取目標(biāo)實體內(nèi)容,返回結(jié)果,測試所用時間。測試結(jié)果顯示,語義查詢耗時隨著實體增加而增加,在10萬、20萬和30萬實體下,查詢耗時分別達到了12.5 ms、14.5 ms和17.2 ms,能夠?qū)崿F(xiàn)快速的語義檢索,提升內(nèi)容查詢和獲取效率。

圖8 測試用例流程
本文提出一種支持語義解析的智能通信服務(wù)網(wǎng)絡(luò)架構(gòu),在現(xiàn)有底層通信和上層應(yīng)用之間增加基礎(chǔ)語義服務(wù)層,利用深度學(xué)習(xí)模型實現(xiàn)語義信息的編碼和解碼,構(gòu)建通信場景的語義知識庫,設(shè)計語義標(biāo)識倒排索引。網(wǎng)絡(luò)在服務(wù)質(zhì)量方面,支持執(zhí)行分布式的快速并發(fā)查詢,提升網(wǎng)絡(luò)數(shù)據(jù)查詢以及獲取效率和速度,支持快速的內(nèi)容檢索和分發(fā),提升網(wǎng)絡(luò)服務(wù)質(zhì)量;在移動性方面,將語義標(biāo)識與位置解耦,支撐高移動性應(yīng)用;數(shù)據(jù)路由方面,通過語義標(biāo)識對數(shù)據(jù)包進行檢索,提供語義查詢檢索服務(wù);在網(wǎng)絡(luò)緩存方面,基于語義標(biāo)識信息可以構(gòu)建智能的緩存替換策略,適應(yīng)不同應(yīng)用場景的數(shù)據(jù)緩存需求。測試結(jié)果表明提出的智能通信服務(wù)網(wǎng)絡(luò)架構(gòu)實現(xiàn)了語義編碼和解碼,能夠提供語義解析服務(wù),支持快速語義檢索和內(nèi)容獲取,有效支撐面向萬物互聯(lián)場景的通信智能化。