朱開昊,徐宇凡,呂楊輝,肖 文,王 勵
(浙江嘉興數字城市實驗室有限公司,浙江 嘉興 314000)
自從黨的十九大提出推動大數據與實體經濟深度融合以來,數據要素價值日益凸顯,尤其在醫療教育、社會治理、疫情防控、安全生產等領域,數據更是發揮其巨大效能。深入挖掘數據要素價值已經成為社會共識,相關政策和立法已經逐步為數據要素市場發展打牢基礎。
2020年4月,中共中央、國務院發布《關于構建更加完善的要素市場化配置體制機制的意見》(以下簡稱為《意見》),將數據與土地、勞動力、資本、技術并列為關鍵生產要素,并提出加快培育數據要素市場。與此同時,《中華人民共和國網絡安全法》《中華人民共和國數據安全法》《中華人民共和國個人信息保護法》三大法律陸續出臺,明確數據定義,規范網絡數據處理活動,保護個人、組織在網絡空間的合法權益,構筑了數據要素市場發展法律邊界。為貫徹落實《意見》等文件精神,各地政府積極探索數據要素市場化配置改革,奮力打造數據賦能場景,加快釋放數據要素價值。但是,當前我國數據要素市場體系亟須健全完善,如數據統籌力度弱、創新資源配置難等問題阻礙了數據價值的充分釋放。因此在推動數據要素市場化配置的過程中,如何高效整合資源、創新資源應用以充分發揮數據要素價值成為當前研究的熱門話題。
當前,國內80%可利用、可開發、有價值的數據資源在政府手中[1],充分研究政府公共數據平臺數據,創新開發未來數字化應用場景,促進政府公共數據資源向社會開放,對于充分發揮數據要素價值具有重要意義。因此,本文依托城市公共數據平臺[2],以個人數據作為切入口,挖掘與梳理個人全量數據資源,建立城市級個人全量信息畫像,開展個人畫像應用研究。
交互設計之父Alan Cooper最早提出用戶畫像的概念,定義為真實用戶的虛擬代表,是建立在一系列真實數據之上的目標用戶模型[3]。用戶畫像依托特定系統形成個人標簽,被普遍應用于商業決策分析,其側重于用戶基本信息與用戶行為分析的研究,充分挖掘數據內在價值為管理層提供決策指導,以提高公司的經濟效益。
目前,大多數用戶畫像研究會根據用戶屬性分為靜態屬性和動態屬性[4-5]。靜態屬性的信息是用戶畫像建立的基礎,一般指的是用戶基本個人信息和其他相對穩定的信息;動態屬性信息指的是用戶在使用特定系統時產生的行為信息,此類信息具有實時性和易于變化的特點[5]。
區別于用戶畫像,本文所定義的個人畫像,即個人信息的具體化和標簽化,本質上是脫離特定系統描述個人全量信息,構建個人畫像。本文將個人畫像屬性劃分為三類:基本屬性、關系屬性和特定屬性。基本屬性是指個人的自然屬性,具有穩定性、直觀性的特點[6]。關系屬性是指在一定時間與空間下,人與人或人與物之間的交互產生了關聯信息(如家庭信息、車輛信息等)。特定屬性指個人在具體應用場景下產生的個人屬性信息(如醫保信息、用電信息等)。
圖1 個人畫像總體架構
個人畫像構建本質上是對個人數據進行收集、挖掘和畫像展示[7]。
數據收集是建立個人畫像的根基,主要方法有生物識別信息采集法、電子信息收集法等。生物識別信息采集法,通過特定的儀器采集指紋、虹膜、人臉等信息。電子信息收集法,通過電子媒介收集結構化信息,以及尚未進行結構化處理的互聯網用戶行為信息。
數據挖掘是對已收集的個人信息進行建模與挖掘。該階段常用到數理統計、在線分析處理、機器學習、情報檢索等方法[8]。陸敬筠等[9]通過數理統計、K-means算法等方法,根據上海市公共數據開放平臺功能使用的用戶瀏覽數據,通過建模區分不同用戶群體。
畫像展示是通過數據挖掘構建畫像并通過自定義圖像化方式進行展示。目前主要的方法有標簽云、數理統計圖表等。陸敬筠等[9]人利用柱狀圖、餅圖、檢索關鍵詞的標簽云形式展現以用戶應用注冊情況、檢索行為偏好等為基礎構建的用戶畫像。
本文所研究的個人畫像主要針對公共事務領域應用[10-12]。研究表明,通過在線健康社區個人畫像區分患者、疑似患者、醫師、奉獻者和社區管理員5類的社會群體,可以提高對疑似患者和奉獻者的疫情風險實時監控能力[10]。通過高校學生在校表現和互聯網金融分析構建個人信用畫像,輔助教育工作者指導高校學生的日常行為[11]。利用基于大學畢業生基本信息、學校管理數據等構建成的畢業生個人畫像,為畢業生精準推送崗位信息,可以實現“人職匹配”[12]。
基于個人需求場景,匯聚各政府部門與社會的個人數據并進行數據分類與治理,形成個人畫像專題庫。基于“數據不動程序動,數據可用不可見”理念,在沙箱環境開發個人數據應用,建立城市級個人全量信息畫像平臺,依托平臺探索數字化應用場景,打造具有特色的個人數據產品(見圖1)。
以長三角地區XX市為例,依托城市公共數據平臺,對全市38個政府機構、13個黨委機構、8個縣(市、區)的公共數據資源進行全面梳理,共編目1 639張信息資源,40 293個字段,形成公共數據資源目錄。
基于該目錄,本文從中抽取與人相關的信息要素,篩選出數據資源目錄443張,涉及字段7 889個。通過數據分類與治理,建立城市級個人全量信息畫像,從中分析出與人相關的標簽56個,與人相關的信息有7種類型,為后續與人相關的公共數據治理、個人數據服務、多跨業務創新等提供指導。
2.2.1 個人標簽
通過初步梳理,篩選出與人相關的標簽56個,分別為殘疾人、信訪人群、重點車輛人群、法定代表人、司機、強制執行人、行政處罰人員、低收入人群、低保人群、失信被執行人、最低生活保障、黑名單人員、學生、老人、重點青少年、兒童、重點關注人群、網格員等。
2.2.2 與人相關信息類別
本研究圍繞基本屬性、關系屬性和特定屬性對個人數據進行整合與分類,梳理出與人相關的7大類別,建立城市級個人全量信息畫像(見表1)。
表1 個人信息類別
基于城市級個人全量信息畫像,本文從政府、個人、企業層面出發,探索數字化應用場景。
3.1.1 數據治理考核
因歷史原因,政府部門被數據質量問題困擾已久,一般會采用普查等傳統方法來提高個人數據質量,這不僅存在投入成本高、工作效率低、數據質量難提高等問題,而且不能從根源真正解決個人數據質量問題。
因此,本文提出了政府自主發現個人數據問題并由政府糾錯與個人自主上報個人數據問題并由政府糾錯雙循環的方法。依托城市級個人全量信息畫像平臺,讓用戶在應用場景驅動下實現信息便捷查詢與數據糾錯功能。用戶一旦發現個人數據問題,通過平臺應用提交數據糾錯申請同時附上證明材料,工作人員將在工作日內完成審批,并根據審批結果完成個人數據糾錯。這極大提高數據質量以及減輕政府部門數據治理負擔,真正從源頭解決個人數據質量問題。
3.1.2 社會治理服務
政府人員在社會治理過程中往往會憑借工作經驗構建人群畫像,并指導工作的開展,但往往會導致實際工作開展成效表現不佳。究其原因,該方式對人群畫像的構建具有片面性,無法實現社會治理精準化思維。
因此,構建城市級個人全量信息畫像平臺來協助政府人員社會精準治理具有重要意義。根據平臺提供個人全量標簽,輔助政府人員對社會不同人群進行分析與研判,從而減少社會治理成本,增強社會治理成效,保證社會穩定與安全。
3.2.1 業務便捷辦理
在政務服務、銀行貸款、醫院就醫等各大業務場景下,個人為了完成身份信息核驗常常會遇到出示紙質材料多、辦理時間長、業務跨部門辦理等問題,給個人業務辦理造成極大不便。
城市級個人全量信息畫像平臺擁有個人全量數據,個人在辦理業務時,利用平臺將個人相關數據授權給辦理業務人員,即可完成個人業務便捷辦理,大大簡化材料和流程,切實提升個人辦理效率,真正實現讓數據多跑路,讓個人辦理少跑腿,加快推進“最多跑一次”改革進程。
3.2.2 個人補貼政策
個人在滿足補貼政策申報條件下可以享受到一定的補貼政策福利,但由于個人補貼政策存在時效性低、公布渠道分散、推廣力度較低、解讀較為復雜,使得個人難以及時獲取到當前滿足申報條件的個人政策補貼事項。
依托城市級個人全量信息畫像平臺,實現個人自主了解政策補貼到政策補貼自主推送至個人的轉變,幫助個人及時獲取滿足申報條件的個人政策補貼事項。
3.3.1 個人服務場景打造
當前個人應用服務場景眾多,且大多分布在各個企業側服務平臺,沒有形成統一集成的平臺服務于個人;同時,服務場景應用存在同質化現象,未根據當地特點深入挖掘形成具有本地特色的應用。
因此,結合本地化特色,整合現有應用便民服務場景,聯合核心企業打造未來數字化場景,統一匯聚在城市級個人全量信息畫像平臺供個人使用,讓個人實時享受生活便捷與福利,與企業一同切實優化社會秩序。例如,考慮與本地旅游公司聯合打造旅游出行服務場景,個人只須打開該應用即可獲取景區信息、旅游方案推薦等,為個人旅游規劃做出輔助決策;與本地銀行聯合打造業務辦理服務場景,讓群眾知曉每家銀行工作時間、業務辦理人數、等待時長等信息,協助用戶合理規劃業務辦理。
3.3.2 個人數據流通服務
當前,各個國家或者地方法律條例的頒布保護了個人數據權益,加強了企業對于個人數據開發與使用的合法合規,但在促進個人數據流通方面仍存在較大提升空間。
為了促進個人數據流通,保證數據安全前提下,針對企業真實的便民服務場景,城市級個人全量信息畫像平臺為企業提供基于個人授權的數據結果。企業按照平臺要求申請購買所需的個人數據并提交相關資料;平臺根據場景的合規性審核企業申請的數據;審核通過后,企業需要與平臺簽訂合約;依據合約內容,企業通過銀行完成交付與結算,并生成數據交易憑證;平臺根據雙方簽訂的合約與數據交易憑證給企業提供基于個人授權的數據結果。
本文以長三角地區XX市為例,基于城市公共數據平臺,梳理全市個人公共數據資源清單,建立城市級個人全量信息畫像,以數據安全與數據隱私保護為前提,統一監管與規范個人數據,圍繞政府層面、個人層面、企業層面,探索個人數據數字化應用,為政府提供具有完整性、準確性的全市個人數據畫像,為個人打造便民服務場景與惠民服務政策,為企業提供規范合理的個人數據使用渠道。
為了實現數字化應用,拓展個人數據賦能場景,釋放個人數據價值,本文遵循“數據不動程序動,數據可用不可見”的理念,探索個人數據授權運營應用場景,促進個人數據向個人開放,讓用戶知曉個人數據資產,管理好、使用好個人數據,享受數字化時代帶來的便利。