張樺
(中共廣州市委黨校信息網絡中心,廣州 510070)
深度偽造是“生成對抗網絡”的產物,具有智能化和高度的逼真性,使得非當事人很難分辨真假。加之,制作成本低、品質高,這使得深度偽造愈發對社會、政治制度和商業構成重大威脅。自2017年Reddit用戶發布Deepfake視頻[1]后,深度偽造對社會產生了廣泛的威脅。如深造偽造可以使新聞業面臨巨大的公眾信任問題;深度偽造可以通過傳播政治宣傳或破壞選舉活動來威脅國家安全;深度偽造可能會妨礙公民對政府或權威機構發布信息的信任;深度偽造可以用于發布虛假信息進行市場操作;深度偽造還可進行身份欺詐等活動。
隨著網絡、信息技術的發展,人類生存除依賴于物理空間提供的基礎物質外,愈發依賴于網絡、信息所構建的網絡空間,網絡空間已經成為人類賴以生存的除物理空間外的第二大空間[2]。當前,深度偽造已在國外引起了重視,特別是在政治民主安全、社會公眾安全、軍事安全等方面[3-7]。
國內外對于深度偽造技術威脅的防御基本都處于起步階段。在技術層面,主張通過自動檢測技術(如基于深度學習的自動檢測)或新技術(如基于區塊鏈的驗證系統)的方法檢測、防御深度偽造[8-11]。標稱深度偽造技術的檢測準確率在71%~95%之間。在社科層面,主張通過可靠平臺向社會科學研究人員發布大型社交媒體數據集,以研究錯誤虛假信息傳播的解決方案[12-13]。在管理層面,主要是主張加強深度偽造的有關立法,明確媒體平臺、創作者等的責任,制定切實可行的處罰措施[14-16]。
本文根據深度偽造生成的特點,結合目前最新研究成果,將技防和人防相結合,構建了基于時空網眾包的深度偽造威脅防御體系。
參考文獻[17-19],定義如下:
定義1時空網眾包任務。一個時空網眾包任務被該任務的請求者發布,通常被定義為如下六元組的形式,記為,其中,lt表示該眾包任務的位置;pt為該任務的網絡地址(IP),st為該任務的發布時間;et為該任務的截止時間;rt為該任務發布的空間范圍,即在此范圍內的眾包參與者才有機會接收到該任務;wt是完成該任務的權值(可以獲得的獎勵或效用,通常表示為任務的價格或獎金)。
對于任意的時空網眾包任務,上述六元組中的前四者應必須被包括以標記此任務的時空網屬性;是否包含后兩者視具體應用而定。例如,某些任務希望眾包平臺的每位眾包參與者都獲知,則可去除此空間范圍約束。另外,如果某些任務不為參與者帶來任何獎勵,也可刪除該項內容。
此外,時空網眾包參與者定義如下。
定義2時空網眾包參與者。一位時空網眾包參與者也被稱為時空網眾包工人,通常被定義為如下七元組的形式,記為t=,其中,li表示該參與者當前的空間位置;pi為此參與者的網絡地址(IP),si為此參與者的抵達時空眾包平臺的時間;ei為該參與者預計離開時空眾包平臺的時間;ri為該參與者的空間服務范圍,即對于該范圍外的眾包任務,此參與者將不能提供服務;ci代表該參與者計劃承擔的眾包任務數量;qi度量該參與者提供服務的可信度,通常表示為歷史任務守信率或歷史累計失信率等形式。
與時空網眾包任務的定義相似,對于任意時空網眾包參與者的七元組,也是前五者應被包括,而后二者可視具體應用而定。注意:上述時空網眾包任務與時空網眾包參與者的定義皆為基礎性定義,根據不同的應用需求,可在上述兩個定義的基礎上進行擴展。因此,基于上述定義,可將時空眾包定義如下。
定義3時空網眾包。時空網眾包通常是指通過互聯網設備實時地在時空網絡空間眾包平臺上匯聚眾包任務與眾包參與者,并通過平臺對眾包任務進行分配調度與質量控制,從而使眾包參與者在物理世界和網絡空間共同完成眾包任務并滿足任務約束條件的過程。
綜上所述,時空網眾包旨在通過整合物理世界和網絡空間中智能群體,組織其在網絡空間中完成機器難以解決的問題,從而有效地利用人群智能與硅基智能的資源。
在深度偽造防御網絡空間中,眾包具有脫“虛”向“實”的作用。時空網眾包的時、空、網屬性,強調了在深度偽造防御中的真實性、可信度性和可追溯性。因此,時空網眾包無論是在眾包任務上、眾包參與者,還是眾包平臺上都存在與傳統眾包的差異。
在眾包任務上,傳統眾包任務更多地在于在網絡空間中完成,而時空網的眾包更關注于任務發生的現實世界。因而基于時間、地點和網絡空間的任務使得第一現場成為辨別真偽的關鍵。在眾包參與者方面,傳統眾包只需要在網絡空間上即可參與,而時空網眾包需要參與者跟眾包任務發包方在時、空、網三者上具有臨近約束或真相約束,參與渠道是使用平臺的工人或用戶。在眾包平臺上,傳統眾包無時空網約束,具有廣泛性,而時空網眾包平臺,具有篩選性,且需要平臺注重時空網數據的隱私處理。
在構建時空網眾包的深度偽造防御時,首先注重深度偽造的使用者和典型的應用場景,然后著重從技術體系、社科體系和管理體系三個層面予以構建。
深度偽造從定義上著重于偽造現實,其威脅強調通過逼真的“欺詐性”來達成,使得深度偽造安全防御不同于常規網絡安全防御,深度偽造安全防御更應該著重于“反欺詐性”。從深度偽造產生的源頭分析,產生于機器學習算法,具體是“生成對抗網絡”的產物,這使得其安全防御必須應對機器生成的“海量性”問題。
在構建針對深度偽造威脅的防御體系時,除了借鑒一般網絡安全防御體系的構建,在結合深度偽造的生態體系和典型場景后,還要特別專注于深度偽造的特性。針對“反欺詐性”,必須給予現實的、真實的、可信的應證,而現實的、真實的、可信的應證正是人類所長,在構建深度偽造安全防御體系時,注重于“人的要素”的考慮,從社科層面和管理層面進行構建;針對“海量性”,必須給予批量的、可規模化的處理,這正是機器所長,注重于“技的要素”,從技術層面進行構建。三個層面相互融合,互為支撐,共同構建深度偽造威脅防御體系。
構建時空網眾包的深度偽造威脅防御體系,立足于人群群體智能計算對抗以硅基為基礎的“云機”智能計算。在進行網絡安全防御時,分別在管理層面、社科層面和技術層面進行可信眾包防御體系構建。
2.2.1 時空網眾包防御模型
從深度偽造的生態構成分析,不難發現深度偽造發生在網絡空間信息發布、流通環節,如果深度偽造不借助網絡空間發布和流通,其威脅就無從談起。因此在構建時空網眾包防御模型時,圍繞深度偽造信息發布流通環節進行。如圖1所示。

圖1 可信時空網眾包防御模型示意圖
(1)平臺用戶通過平臺渠道提交信息(該信息一定是未進行真假審核)。
(2)平臺在收到該用戶發布的信息后,進行基于時空網眾包的生成工作,完成后進入(3)。
(3)進行時空網眾包的任務分配,首先分配給“硅基”智能進行第一輪眾包。即在技術層面,基于“硅基”智能計算通過自動檢測技術或新技術等對時空網眾包任務中時間St、空間位置lt、網絡地址pt等信息按照一定的算法進行可信任務分配,在“硅基”智能對該信息進行判定后,將結果返回給平臺,進入(4)。
(4)平臺在收到“硅基”智能對該信息的判定結果后,對該信息進行分析,評估之前“硅基”智能對該類信息判定的可信度kt,把真實域中隨機去重抽取比例at的該類信息和偽造域中該類信息作為人群智能時空網眾包的輸入,進入社科層面(5)。
(5)在社科層面,同樣,平臺根據時空網眾包任務中時間St、空間位置lt、網絡地址pt和可信度qi等信息按照一定的算法向平臺工人用戶分配眾包任務,平臺工人用戶在領取任務后,通過“人群”智能計算進行判定,并將判定結果返回給平臺,進入(6)。
(6)平臺通過分析“人群”智能計算的結果,根據判定票數進行博弈判定。并根據判定結果修正、更新“硅基”智能計算樣本集。進入(7)。
(7)平臺判定結果,如果真實合規,則完成該用戶請求發布該信息;如果是偽造合規,同樣發布,但打上偽造標簽(可對用戶端透明,但平臺必須標注自己清楚);如果是偽造違約,則拒絕響應該用戶請求,拒絕發布。進入(8)。
(8)發布后的信息,進入用戶、公眾和管理層面的視野。
(9)管理層面的立法、行規監督、檢查、指導平臺、用戶的網絡空間行為。
對于存量的網絡空間信息需要真偽審核的,從(8)進入(1)由平臺進行自動深度偽造防御流程。
2.2.2 任務生成及分配
任務分配是眾包模式的研究熱點問題之一,對于時空網眾包任務而言,平臺很容易獲得請求用戶的時空網屬性:用戶發起信息發布請求(稱為任務發包方)的位置信息lt、網絡地址(IP)信息pt,發起的時間St。根據任務發包方的時空網信息,構建該任務的平臺眾包任務工人集合S=
假設構建的m名該任務眾包工人之間沒有交互、相互獨立,所以每次博弈都可以被視為零和博弈(都是眾包工人對任務發包方真與假的判定)。對于任意工人si用zi表示該工人的博弈過程包含的總周期數。同時,用zij表示工人si的第j個博弈周期。眾包工人接受眾包任務需要激勵機制,即構建任務權值wt。在社科領域對于一個人對于某項工作的勝任,一般是看能力和忠誠度。在眾包任務權值時,引入工人的眾包能力因子poweri和可信度因子honi,則工人si第j個任務的能力因子表示為powerij,可信度為honij,其中:

工人si的可信度首次接受任務時默認都是完全可信的,其后,根據工人si累計失信的次數k和累計失信的能力poweri,j-1生成。工人si第j個任務的權值表示為gij,生成權值集合:

其中:

2.2.3 質量控制
深度偽造時空網眾包任務的質量控制,關鍵在于其眾包工人集S的生成質量qg和判別質量aq(可信度)。生成質量依賴于眾包工人的能力因子power,設生成質量控制閾值q0,power≥q0。判別質量aq依賴于眾包工人的可信度hon,假設判別質量控制閾值a0,hon≥a0。
由于眾包工人之間相互獨立,且眾包工人每次博弈結果只有兩種真與假,且眾包工人si判別正確的概率,即m個眾包工人發生的概率互斥且和為1,服從多項式分布。由多項式分布的期望E(Si)=nvi、方差var(si)=nvi(1-vi)和協方差Cov(si,sj)=-nvi vj,n為眾包工人n次博弈周期且對角線上的元素為各眾包工人的方差。由此可以以協方差矩陣的數值量化時空網眾包的任務質量情況。
2.2.4 隱私保護
構建時空網眾包深度防御,其隱私保護是內在要求,既保護眾包參與者的時空網信息,又可根據眾包參與者保護后的時空網信息指導其有效地完成任務是眾包平臺自身的建設的內在要求,其本質是平臺信息隱私保護。有關信息隱私保護的研究眾多,技術上有各種加密算法、方法和處理模型,將信息進行脫敏處理;平臺和管理上有“數據合規”、網絡、數據安全法規。這是目前網絡空間隱私保護研究的話題。
在構建時空網眾包深度偽造威脅防御時,本文已充分考慮了平臺對參與者時空網信息的有效利用,對于時空網信息的隱私保護,眾包平臺重在使用其價值,并非對時空網信息的擁有。因此對于眾包平臺時空網信息的隱私保護,在對時空網信息進行已有技術脫敏處理的同時,加大社科和管理層面制度建設構建眾包平臺隱私保護的“黑匣子”,即基于時空網信息任務的生成、分配只能在“黑匣子”內完成,將結果輸出至平臺,且“黑匣子”的開啟只能在平臺注冊的第三方數據局,平臺只管對其任務判定結果的使用。如圖2虛線方框內為“黑匣子”部分所示。

圖2 時空網眾包平臺的“黑匣子”示意圖
居民垃圾投放是居民生活必不可少的日常行為,垃圾分類是居民垃圾投放的重要手段。最近對于垃圾分類的討論在各社區議論紛紛,有人發起圖文并茂的“偽垃圾分類說”——居民垃圾分類投放,而垃圾運輸車無分類,均是同一個車運走,垃圾分類只是給居民造成投遞麻煩,根本沒有分類的效果。為判定這類居民圖文的說話是否屬實——即是否是居民分類投放,而垃圾車運輸車卻無分類,同一車混裝運輸。擬采用本文的深度偽造判別法來對事實進行判別,以驗證本文時空網眾包深度偽造防御的有效性。
(1)該社區根據上級主管部門要求,垃圾分為兩類:餐廚垃圾和其他垃圾。
(2)垃圾運輸車分為兩類:餐廚垃圾運輸車和其他垃圾運輸車,車型、大小、外觀均相同,只是餐廚垃圾運輸車車廂側面有“餐廚垃圾”白色字樣,而其他垃圾運輸車則沒有任何提示字樣。
(3)該社區垃圾運輸車每天來2次,上午9:30~10:00,晚上9:30~10:00。
(4)該社區居民垃圾分類定時投放點和誤時投放點均在該社區同一個地方,且社區無其他垃圾分類投放點。居民定時投放時間是:上午7:00~9:00,晚上7:00~9:00,其他時間為誤時投放,定時投放時間有垃圾分類指導員,誤時投放則沒有指導員。
首先構建該社區的偽垃圾分類時空網眾包平臺,3公里以內的平臺眾包工人分布均勻。
將原圖文并茂的偽垃圾分類說進行偽造,換其他社區真實圖片10份,修改部分文字標點10份,總計21份任務。
平臺內眾包工人的首次使用初始化時,眾包工人在注冊時均能獲取眾包工人的地理位置、網絡地址(IP)和注冊時間。根據3.4.2節,剛開始平臺眾包工人的可信度均為hon=100,歸一化可信度為hon=100∕100=1,工作能力取簡單的歐幾里得距離。

△li為用戶注冊的位置與眾包任務中事件位置的空間距離差。△pi為用戶注冊的IP與眾包任務發布IP的地理位置空間距離差,△si為用戶最近一次登陸平臺的時間或在線時間與眾包任務的時間差。gij初始時取值工作能力的初始取值。如下:

通過平臺的計算的時空網眾包平臺,向任務發生位置3公里內的用戶發布眾包任務——判定該社區表內的圖文并茂的“偽垃圾分類說”是否屬實。向1050個用戶發出眾包任務,有759個用戶瀏覽了該任務,最后由178個用戶完成了眾包任務,其中有128位判定“偽垃圾分類說”為假,其眾包任務的權值之和WF=0.051;50位判定為真,其眾包任務的權值之和WT=0.083,由于眾包任務權值WT>WF,時空網眾包任務最終判定結果為該社區群“偽垃圾分類說”為假。事后實地考證,結果是餐廚垃圾和其他垃圾是分類運輸的,圖文偽造了其他垃圾車身,在其他垃圾車身PS了餐廚垃圾的車身字樣,差別細小,極具偽造性。
本著審查、可追溯和注重隱私保護的原則,探討了深度偽造防御問題,著重基于時空網眾包以人群智能的所長,應對機器智能深度偽造的所長,這對深度偽造的“欺詐性”做了很好的回應,將網絡空間脫實向虛發展和威脅防御需要的脫虛向實發展結合起來。設計的時空網眾包具有鮮明的地域特色,旨在平臺信息發布處就截住虛假的深度偽造信息,實驗論證具有良好的網絡效果。對于防御體系的管理層面,更多的是合規和立法方面的內容,本文沒有做過多的探討,因為對于法條的實用性、針對性、可操作性和法學原理的論證、解釋、說明不是本文的重點。需要說明的是,在管理層面,在于法規的精準有效。在基于時空網眾包的防御體系中,法規需抓住如下幾個關鍵:
(1)各信息發布平臺、應用等發布信息都不得收集用戶隱私信息,對于任何含有隱私的信息都必須有獨立于平臺和應用的“黑匣子”的判定,該“黑匣子”的監管獨立于平臺和應用,平臺和應用只有使用其輸出結果的權力和執行共同監督的權力。
(2)對于深度偽造的合規信息,必須有明確的標識,至少是在監管視圖內有明確標識,對于用戶視圖為了更好的娛樂性和經濟效益,可以屏蔽該標識。
(3)對于實時性的把握,本文顯得不足。此外,多少量值的任務完成才使得任務有效和終止,是需要大量實驗的累計和實踐。因此,本文的防御體系暫時不宜發生在涉及國計民生的政府新聞媒體和宣傳、國防安全、應急管理等方面,但對于眾多普通網民防御深度偽造的威脅具有針對性。同時,在兼容社會效率和干凈可控的網絡空間如何找到合適的取舍也是下一步研究的重要內容。