鄧萍萍
面對海量測試任務和眾多白帽,如何進行個性化、精準化運營是當前眾測平臺面臨的難題。目前,用戶畫像由于其靈活、高效的檢索優勢,已被各領域深度推廣。本文將詳細剖析眾測用戶畫像的構建流程,并通過畫像對平臺業務進行全面分析和精準定位,實現眾測平臺個性化運營。
(一)用戶畫像的定義
Alan Copper最早提出,用戶畫像是指通過差異化的呈現方式描述用戶真實數據而形成的目標用戶模型。簡單來說,用戶畫像是通過抽象用戶的社會屬性、生活習慣和消費行為等信息形成標簽化的一個用戶模型,即用戶的信息標簽,它是實現海量數據分析的必要手段。
隨著互聯網和大數據技術的深入發展,平臺越來越關注怎樣利用大數據實現精準服務以提升運營效率和用戶感知度,作為一種分析和預測客戶、精準定位客戶群體的有效工具,用戶畫像被廣泛應用于金融、社交、電子商務等各領域。
(二)眾測用戶畫像
隨著網絡技術的前進和信息化的發展,安全漏洞已成為引起網絡信息系統脆弱性的主要原因,如何檢測和修復漏洞成為網安的重要工作,網絡安全眾測應運而生。
眾測平臺利用互聯網“眾包”模式發布安全測試任務,并授權社會上有安全滲透測試能力的白帽志愿者們完成,最終依據測試成果向白帽發放賞金。通過引入懸賞機制,眾測平臺吸引和激勵廣大白帽主動挖掘漏洞,以便及時發現和修復漏洞,增強企業的網絡安全的防御能力。
隨著人們對通過眾包方式發掘網絡安全漏洞的需求越來越高,眾測平臺收集的漏洞數量也呈爆炸式增長,琳瑯滿目的眾測任務和漏洞隱患使得任務發布方和白帽應接不暇。然而,眾測成果很大程度依賴于白帽的參與度與技能水平,如何利用用戶畫像技術對平臺海量的白帽的用戶行為及漏洞信息數據進行分析,以使眾測平臺由信息服務向知識服務轉型,為眾測開展提供便利,是我們目前急需解決的問題。
用戶畫像的構建過程一般可以分為數據收集、標簽建模和畫像構建這三步。
(一)數據收集
數據收集是指采集、整理用戶的基礎信息、業務行為、網站行為等數據。為了更精準地分析數據,我們最好同時收集用戶行為數據和發生該行為的場景信息。數據收集完畢后,需要補充采集數據中缺失的部分,訂正錯誤的部分,以便提升后續分析的準確性。
我們把用戶數據分為靜態、動態兩類:靜態數據是用戶的基本屬性,相對穩定,一般不會變化;動態數據則變化較快,會隨時間和空間變化而變。
眾測平臺的數據收集主要關注平臺白帽、漏洞和資產三個維度,見圖1。

1.白帽數據收集
主要來源于平臺注冊的所有白帽信息,包括:白帽的性別、年齡、歸屬公司等基礎信息;報名的眾測、挖洞的目標資產、提交漏洞時間、挖洞的工具技能、提交漏洞數量、有效漏洞級別、獲得的積分等業務行為數據;平臺注冊時間、登錄頻次、登錄時間段、瀏覽收藏的頁面、評論互動的模塊等網站行為數據。
2.漏洞數據收集
主要來源于平臺收集的所有漏洞信息,包括:漏洞是否有效、提交時間、狀態等基礎信息;漏洞資產類別、漏洞類型、漏洞等級、漏洞積分、被發現工具/技能等業務行為數據;漏洞所屬資產、所屬任務、歸屬責任單位、提交人等漏洞歸屬數據。
3.資產數據收集
主要來源于平臺發布眾測任務的所有資產信息,包括:資產地址、資產類別、資產所屬單位等基礎信息;資產涉及的眾測任務、資產任務參與的白帽、資產被測試的工具/技能、資產被發現漏洞的類型、資產被發現漏洞的級別、資產被發現漏洞的數量等業務行為數據;資產錄入的時間、資產發布眾測任務的次數/頻度等網站行為數據。
(二)標簽建模
標簽是基于用戶數據剖析提煉后,人為規定并高度概括的、能精確體現用戶的某種特性的用戶特征標識。
標簽建模階段,我們對采集到的數據進行統計、聚類分析等,以抽象出短文本化標簽,再逐級分類形成基本信息、內容偏好、行為特征、心理特征和社交網絡等高度精煉的標簽模型。需要注意的是,本階段主要考慮大概率事件,如果可能,需要通過數學算法盡可能排除用戶的個別偶然行為數據。有了標簽,我們可以簡單、直觀的了解用戶的某些特征。
眾測平臺可利用大數據模型對前期收集的眾測數據進行分析,形成相應白帽、漏洞和資產的用戶標簽。比如:我們可根據白帽在漏洞挖掘的過程中的行為記錄,細粒度的分析其用戶特性,形成一定的白帽標簽,便于后期分析白帽特征的基本屬性;白帽根據各自擅長和偏愛的領域,也被打上特定的標簽;以往提交的漏洞記錄,會幫助完善這樣的用戶標簽;根據用戶的標簽屬性,組建不同類型的專家支撐隊伍,用于支撐后期不同類型的重點保障任務。
(三)畫像構建
用戶畫像是對用戶各類特征標簽進行分析、提煉、集合,從而構建出的用戶模型,是實際用戶的虛擬模型。對用戶的行為習慣或者特定屬性進行提取分析,就是給用戶打標簽的過程;當一個用戶被打的標簽足夠多時,就產生了用戶畫像。
一個成功的用戶畫像構建則可以精準還原用戶信息。該階段在分析標簽建模結果的基礎上,采用差異化的展示效果來呈現用戶各個維度的標簽。
1.構建白帽畫像
對白帽提交漏洞報告質量、擅長挖洞工具、偏愛資產類型/區域、綜合挖洞能力等進行數據建模,并根據白帽提交的漏洞報告質量、擅長挖洞工具、偏愛資產類型/區域、綜合挖洞能力等標簽屬性,進行推送相關競賽的推送和活動、培訓的組織,用于支撐后期不同類型的重點保障任務。
2.構建漏洞畫像
根據漏洞有效性、高危比例、漏洞資產分布、漏洞區域分布、漏洞適用的工具等進行數據建模,并根據漏洞的特征和分布情況,對用戶和資產進行相關安全風險信息的推送。
3.構建資產畫像
對資產歸屬、資產主要的攻擊類型、資產風險級別、資產活躍度、關注的白帽群等進行數據建模,并根據資產的風險級別、受影響的攻擊類型和被關注的白帽群,進行相關的安全競賽和風險評估活動的推薦,以保障資產的安全。
用戶畫像已經滲透到我們社會生活的方方面面,不斷運用于各行各業中。安全領域也在積極探索用戶畫像對眾測平臺業務運營的潛能,特別是在目前安全眾測業務需求日益精準化、個性化的市場環境下,眾測用戶畫像已經被安全業內廣泛運用,發展前景得到廣泛的認同。
眾測平臺最初基于粗放型運營模式下,給所有白帽選手都推送同樣的眾測任務,所有的任務發布方無法了解承接任務的白帽群體的技能水平,眾測運營內容及方向完全由運營工作人員把握,這樣的運營是粗顆粒的,精準度不高。
通過對眾測用戶畫像的分析,眾測平臺可以定位每個獨立白帽、資產、漏洞的特征屬性,根據用戶個人獨特偏好或需求提供眾測用戶相關內容,可開展基于個人推薦的個性化運營。比如:可深入理解白帽的需求,洞察他們的興趣以及個性化偏好等,分析白帽群體的潛在價值空間,從而提供個性化、精細化的測試任務推薦;對任務發布方推送資產風險威脅、眾測發布推薦和適合任務的白帽群體;在此過程中,把用戶畫像真正利用起來,以做出針對性的運營。這種個性化運營的方式不僅最大程度的提高了業務的精準性,同時也大大提升了眾測的用戶體驗和活躍度。
作者單位:中通服咨詢設計研究院有限公司