999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

筑基數據安全流通 隱私計算讓數據“可用不可見”
——記锘崴科技創始人、董事長王爽

2022-03-25 02:31:52劉玉杰
科學中國人 2022年1期
關鍵詞:醫院模型

劉玉杰

在中共中央、國務院2020年4月發布的《關于構建更加完善的要素市場化配置體制機制的意見》中,數據已成為同土地、勞動力、資本、技術等傳統生產要素并列的五大核心要素之一,作為一種新型生產要素參與分配。數據的作用和價值逐步凸顯,數據資源的開放共享、交換流通已成為橫跨多個行業的重要趨勢,業界對深入、全面挖掘數據價值的需求也日益強烈。

在對數據“功能性”不斷探索的同時,近年來頻發的數據安全事件,也顯示出數據利用的另一面——數據內容缺乏有效保護、數據泄露風險逐漸增加。這無疑對從業者提出了更高的要求:既要應用數據,又要保護數據安全。如何兼顧發展和安全,平衡效率和風險,在保障安全的前提下充分發揮數據價值?這成為杭州锘崴信息科技有限公司(以下簡稱“锘崴科技”)創始人、董事長王爽一直在思考的重要課題。經過多年研究和應用實踐,王爽及其團隊通過以安全聯邦學習為代表的隱私保護計算技術,為流通過程中數據的“可用不可見”提供了兼具全面性和個性化的解決方案。他們期待在破解數據保護與使用之間的矛盾、放大數據要素的效能和價值、提升技術的創新速度和維度等層面不斷加碼,使得數據要素資源為經濟社會高質量發展提供強大助力。

王爽

破局“隱私之困”

2009年,時任美國總統的奧巴馬宣布“要建立一個更堅強、更智能的電網”。為了更準確地了解居民何時用電、用電多少的實際情況,從而根據實際用電量來實時調度電力,每15分鐘上傳一次電量數據的智能電表,成了美國能源部門構建智能電網的“主力干將”。然而智能電表的推廣計劃很快“遇冷”——美國民眾將其視作“監控隱私”的“內鬼”,反對智能電表的呼聲日高。這場聲勢浩大的討論,引起了當時正在讀博士的王爽的注意。憑借自身在密碼學基礎性研究領域的經驗,王爽敏銳地意識到,民眾對于智能電表泄露隱私的擔憂并不是“庸人自擾”——“利用一些特定的算法,就可以通過用電數據推算整個屋子里的活動情況,例如屋主什么時候做飯、用電腦、看電視、洗衣服等,全都能計算出來?!蓖跛忉尩?,“而這些數據一旦被濫用,可能會對個人乃至整個社會造成嚴重后果?!?/p>

難道數據利用和隱私保護,就真的無法“共存”嗎?智能電表“進退兩難”的境遇,讓王爽不由得開始思考這個問題。很快他發現,就智能電表這一具體案例來說,電廠僅需統計信息而并不需要個體數據。結合智能電表的分布式結構,王爽將自己在分布式編碼方面的技術成果運用其中,既讓電廠拿到各項統計數據(即加密的中間計算結果),又不暴露單個用戶的用電量,為數據和隱私的“和平共處”提供了一個行之有效的解決方案。以此為開端,王爽開始涉足隱私計算領域,并投身到將隱私計算服務于不同應用場景的嘗試中。

兩年后,博士畢業的王爽受邀加入了美國加州大學圣地亞哥分校(UCSD)醫學院。在對于隱私保護要求更高、需求更迫切的醫療領域,王爽也迎來了自己新的挑戰:他需要從學術的角度搭建一個服務于美國生物醫學計算網絡的隱私保護計算構架。這個項目是美國國家生物醫學計算中心最核心的部分,要用技術打通數百家醫院的醫療數據在隱私保護下的安全共享與分析,并制定一套隱私計算標準。基于醫療數據的特殊性,在傳統的醫療數據處理中,有過“通過性別、生日和郵編這3個信息即可能唯一確定患者身份”并導致其隱私泄露的先例。而這一情況,隨著人類基因序列數據的引入,變得更加棘手——“一個人有30多億個基因位點,只要挑出具有代表性的十幾個位點,就能唯一確定一個人,準確率比指紋高得多。”王爽解釋道。與此同時,由于基因序列數據應用中對于數據質量的要求很高,諸如匿名和泛化這種常規的醫療數據處理方式難以用于基因序列數據的“脫敏”處理。與基因數據“脫敏”處理難相對的,是囿于各家醫院樣本的有限性,推動醫院間的數據共享、用技術提升醫療效率、打通醫院之間信息壁壘同樣具有其現實必要性。然而基因序列數據涉及病人及其血親的隱私、醫院數據安全、技術競爭等諸多層面,數據安全問題不解決,在現有情況下醫院間的數據共享就不可能完全實現。如何在不給出原始數據的情況下,讓數據的價值得以最大限度地釋放?冥思苦想間,曾經的“智能電表方案”給了王爽新的靈感,用于醫療領域的隱私計算方案以“安全聯邦學習”的面貌出現在眾人面前。

據王爽介紹,在這套名為“隱私保護下的分布式機器學習(即安全聯邦學習)”方案中,多個合作的醫院不需要將各自的原始數據拿出來進行多中心模型“訓練”,而是反其道而行之,將模型訓練置于各個醫院,基于醫院的本地數據訓練出一個“小的”本地模型。隨后將幾家醫院分別訓練出的“小模型”放到一起,訓練出一個更厲害、更準確的大的全局AI模型。在每次使用各醫院的數據時,只需把要分析的模型放到各個醫院的數據池中,進行運算后交互加密的模型參數,而不用提取具體的原始數據。整個過程中任何一家醫院都不會暴露各自的原始數據,卻又可以將多方的數據用于研究分析,做到數據的“可用而不可見”。此后,王爽還不斷對這一方案進行完善,以實現每一個醫院或中心機構的加入或離開不會對整體研究進程造成影響的目標。同時他還在數據安全性層面不斷加碼,引入各種安全挑戰并主動填補“漏洞”,確保整個系統的安全平穩運行。至此,多中心生物醫療數據研究的隱私困境終于被解開,一個包含美國加州大學旗下5所附屬醫院的多中心聯合分析網絡也由此建立起來。以此為開端,數據的安全流通讓越來越多的醫院和機構聞訊加入。2013—2015年之間,一個橫跨美國西海岸10多個醫共體、串聯起上百家醫院、覆蓋數千萬個病患數據的網絡全面建成,王爽將之命名為“安全聯邦學習”的隱私計算成果也在醫療領域綻放出耀眼的光芒。上述成果的理論基礎,都是基于王爽2012年形成的學術論文工作,該論文也成為全球首篇關于醫療在線安全聯邦學習的文獻,引起了業內廣泛的重視和借鑒。“所謂安全聯邦學習,就是允許多個參與者在不共享原始個體數據的情況下,構建一個通用強大的機器學習或統計模型。簡單來說就是,通過‘數據不動加密模型動’的方法,來解決如數據隱私、數據安全、數據訪問權限和對異構數據訪問等問題。具體到醫療環境中,過去醫院在治療罕見病時往往受限于單中心數據量不夠等問題,在解決了數據隱私問題后,就可以整合全行業數據為病人尋找最有效的治療方案。原來需要數周尋找治療方案,現在可能會縮短至1天甚至更短。”王爽驕傲地說。

2016年,谷歌AI在技術博客文章中首次引入“聯邦學習”的概念,隨后這項技術也逐漸成為AI領域的熱門研究內容,引起從業者的廣泛注意。而此時,王爽已經在這一領域深耕多年,但他并未就此止步,讓技術“走出去”、讓人才“走進來”,成了王爽前進的新方向。

用比賽彌合隔閡

因小見大,在完成美國國家生物醫學計算中心項目后,王爽在研究過程中看到了隱私計算巨大的發展潛力,“置身其中”的他也很快意識到了培養、發掘、集結專業人才團隊的重要性:“隱私計算光靠一兩個團隊的話,進展太慢?!贝送猓谧咴L各個密碼學和安全專家時,王爽發現整個密碼學界、安全界跟醫學界處于“相對獨立”的狀態:“懂醫學的人基本不懂密碼學和安全,懂密碼學和安全的基本不懂醫學。”王爽解釋道,“從密碼學研究的角度來說,很多傳統的密碼學理論尚未針對實際應用場景提供具體化解決方案。有時候密碼學專家設計了一套非常精巧的方案,在密碼學上是完全正確的,可是其中很多計算都是在假想環境下進行的,或者當下的算力尚無法滿足其提出的計算需求,方案自然無法‘落地’,缺乏實用價值;從實際應用的角度來說,有時候醫院接到一個病人,需要在數據庫里尋找是否有相似的病人、曾用過什么診療方法、效果如何等數據進行參考。此時,如何從醫院研究工作的實際情況出發,準確定義‘相似的病人’,盡量避免可能出現的錯誤,是密碼學界、安全界需要切實思考的問題?!痹谕跛磥恚鉀Q上述問題,實現技術與產業的磨合,最好的方式就是通過一類活動把技術與產業的人聚集到一起,消除“搞密碼學的群體和醫生群體之間的gap(隔閡)”。而王爽選擇的“聚集”方式,即是競賽。

2014年,王爽主持創辦了“iDASH 全球隱私保護計算大賽(iDASH Privacy Protection Challenge)”。由于該項目的全球影響力,作為項目負責人,王爽創辦的競賽也受到了美國國立衛生研究院(NIH)的支持。王爽希望通過競賽的形式,將實際的醫學問題轉化成計算機/密碼學領域專家能夠理解的算法問題,從而拉動更多的專業學者參與到隱私計算的具體應用場景中,以技術手段去服務于真實場景下的數據交互和價值轉換。

萬事開頭難,這場當時知者甚少的競賽,首屆參賽的10支隊伍中有很多都是靠著王爽發郵件、朋友圈“刷臉”,甚至拽著朋友、合作伙伴來參加的高校團隊,但其新穎的比賽模式、先進的研究方向及搭建隱私計算學術研究和醫療產業溝通橋梁的決心,在參賽者心中留下了深刻的印象?!胺错懯呛芎玫?。”王爽回憶道。次年,在美國基因研究領域的權威媒體GenomeWeb和Nature News的報道下,iDASH全球隱私保護計算競賽“聲名鵲起”,學界幾乎所有從事隱私計算或基因的研究者都對這個新生的競賽有了初步認識。加之民眾隱私保護意識的覺醒及相關法案的推動——如號稱史上最嚴的隱私數據保護法案《通用數據保護條例》(以下簡稱“GDPR”)的最終稿公布,規定將對沒有做好用戶隱私保護的公司處以天價罰款,因此數據安全迅速成為各大科技公司需要妥善解決的重要課題,也使越來越多的科技公司加入對數據安全保護技術方案的探索過程中。自第三屆比賽開始,如微軟、英特爾、IBM等商業公司也開始派隊參賽,iDASH隱私保護計算競賽的規模、影響力不斷擴大。目前,iDASH全球隱私保護計算競賽的參賽隊伍已涵蓋互聯網大廠、創業公司、著名高校等多個領域,參賽隊伍超過百支,這一競賽也正在成為各大隱私計算廠商及高校展現實力的角逐場。據了解,iDASH全球隱私保護計算競賽現已成為全球隱私計算領域頗具影響力的賽事之一,有“隱私計算領域的奧林匹克”之稱。后續在2021—2022年,王爽也發起了中國首屆“隱私保護計算競賽”。該競賽包括醫療數據隱私保護在內,下設多個領域的隱私保護計算賽道,成為進一步提升隱私保護計算在中國影響力和競爭力的重要推力。

在為技術方和需求方搭建溝通橋梁的過程中,憑借在隱私計算領域研究及應用的先行優勢,王爽及其團隊參與到更多的隱私保護項目中,美國衛生保健研究與質量局(AHRQ)項目、多項美國國立衛生研究院(NIH)項目、英偉達(NVIDIA)高性能計算項目、亞馬遜(Amazon)云計算項目等重要項目中都有王爽團隊的身影。除聯邦學習的技術路線以外,王爽基于硬件的可信計算環境結合軟件的密碼學解決方案,為一種名為“川崎病”的兒童罕見病研究提供了強大助力,這是全球首次應用安全聯邦學習架構解決在合規基礎上的跨國罕見病聯合分析難題。此外,王爽還將同態加密和多方安全計算等加密技術應用到解決實際問題的過程中,與英特爾、IBM、微軟等頭部公司展開合作,推動隱私計算的商業化應用。幾年時間,王爽掌握的技術方案不論是在安全性,還是計算效率和復雜度上都在飛速提升,能應對的問題范圍也越來越廣。2017年,王爽牽頭創辦了國際同態加密標準委員會并制定相關的國際標準,形成廣泛的國際影響力。

王爽參加首屆BEYOND國際科技創新博覽會

在學術界行走日久,王爽自問,是否要安于這樣的現狀?很快他就給出了否定的回答:“總是處在比較安逸的環境也不太好,我還是想做一些有挑戰性的事情?!痹谝淮螌W術報告中,王爽結識了在生物醫藥行業深耕十余年的硅谷資深科學家鄭灝博士,對于“隱私計算的風口即將到來”的共識讓兩人一拍即合,抓住風口投身創業的想法也在王爽心中逐漸清晰起來。

說做就做,但這時的王爽來到了一個新的“岔路口”:留美創業還是回國創業?盡管美國在隱私計算領域有著更成熟的產業環境、配套設施及技術優勢,然而“第一次踏上飛往美國的飛機時,我就知道自己有一天會回來”的信念,讓王爽堅定了回國創業的決心。恰逢國家推進“青年高層次人才引進計劃”,王爽順利通過選拔,以當年隱私計算領域唯一上榜者的身份回到暌違多年的祖國。在回國的飛機上,王爽給自己提出了一個問題:“中國人的隱私,會被重視起來嗎?”隨即,他堅定地回答自己:“我相信,一定會的?!?/p>

讓數據更有價值

2019年,王爽和鄭灝聯合創辦的锘崴科技落戶杭州。以獨有的安全聯邦學習技術為基礎,年輕的锘崴科技“兵分三路”,梳理出隱私查詢、隱私建模和隱私推理3條主要隱私計算產品功能,推出擁有完全自主知識產權的锘崴信?隱私保護計算平臺。據王爽介紹,隱私查詢主要用于在數據源中在保護各方隱私的前提下查找匹配條件的數據,如藥企開發靶向藥物需要查找符合條件的病人信息、稅務部門和機場對限制高消費人群身份的比對等場景,這一過程涉及多項數據交互,需要強有力的隱私保障。為此,锘崴科技的隱私查詢產品通過算法和模型優化,保證數據源匹配模型、查詢條件、查詢結果不被泄露且查詢結果準確,滿足醫療、金融、政務、安防等多個領域的查詢需求。隱私建模即是通過多中心聯合訓練一個算法模型,同時確保各個中心具體數據和模型不被暴露,以滿足使用者在樣本不足情況下,通過橫向或者縱向安全聯邦學習以補足樣本量及補充維度之需求,從而實現更精準的模型和畫像,廣泛適用于醫療系統聯合分析研究、新型藥物研制、精準營銷及金融機構大數據風控等具體場景。隱私推理則是在使用他人已經訓練好的模型時,向模型輸入一些信息源,對自有數據進行保護的產品。通過隱私計算,使用者可在加密的參數下對加密的數據進行計算并產生加密的結果,從而在保護所有的相關信息不泄露的情況下,又能用對方的模型來處理數據。這一產品可用于諸如征信分數或者臨床輔助診斷結果等場景中,幫助使用者在各方不互信的情況下完成隱私保護的相關操作。

憑借豐厚的技術積累和千萬級的數據驗證,锘崴科技的產品呈現出明顯的技術優勢和深厚的場景理解力,“開箱即用”的使用體驗更讓其在實際應用場景中大放光彩:2020年上海某三甲醫院牽頭的基于隱私計算的全國首例關于風濕免疫疾病的跨省多中心臨床研究取得上海市科技進步獎一等獎,其聯合研究過程中使用的隱私計算方案,就來自锘崴科技。在普惠金融領域,锘崴信?隱私保護計算平臺賦能跨多個數據源的、更加精準的風控模型構建,以服務于中小微企業的貸款需求;在保險行業精準營銷領域,通過锘崴信?隱私保護計算平臺對接醫院和體檢中心,以及銀聯或移動運營商等數據庫,對用戶的健康狀況和財富狀況進行多維度分析,以構建更精準的營銷模型并提高相關保險的轉化率;在政務服務領域,锘崴科技與國家職能部門展開深度合作,幫助其完成政務數據的開放和應用。同時通過隱私保護計算,實現密態下人臉識別的技術支持,有效避免人像采集過程中諸多明文信息交互的合規風險。“锘崴科技的3項產品功能基本可以覆蓋目前隱私保護計算在數據領域的絕大多數需求?!蓖跛f,“隱私計算的技術門檻也成為我們在行業激烈競爭之中的突出優勢。”目前,锘崴科技已經完成了超過100個項目的PoC(驗證性測試),有50多個落地的項目,潛在客戶則超過200家。成立不到兩年的锘崴科技也在2021年順利完成億元級B輪融資,著眼于技術落地的锘崴科技已然成為行業加速前進過程中的重要力量。

構建數據網絡,做鏈接數據與價值間的橋梁,打造最安全高效的大數據價值轉化平臺,是锘崴科技未來的奮斗目標。王爽希望通過這一平臺,讓每個使用者都能以安全、快捷、方便的模式,完成不同場景下合規的、受保護的數據價值轉換,使數據發揮其最大價值。在隱私計算節點搭建和推動相關行業標準方面重點發力,讓打通跨行業數據變成一件水到渠成的事情,王爽和他帶領的锘崴科技一直在路上。

猜你喜歡
醫院模型
一半模型
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
我不想去醫院
兒童繪本(2018年10期)2018-07-04 16:39:12
3D打印中的模型分割與打包
萌萌兔醫院
帶領縣醫院一路前行
中國衛生(2015年8期)2015-11-12 13:15:20
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
看不見的醫院
中國衛生(2014年11期)2014-11-12 13:11:28
減少對民營醫院不必要的干預
中國衛生(2014年8期)2014-11-12 13:00:54
主站蜘蛛池模板: 亚洲国产日韩在线观看| 亚洲成人免费在线| 欧美日韩亚洲国产| 亚洲V日韩V无码一区二区| 久久窝窝国产精品午夜看片| 亚洲高清日韩heyzo| 丁香六月激情综合| 97精品久久久大香线焦| 成人毛片免费观看| 蜜桃视频一区二区三区| 99热这里只有精品免费国产| 精品一区二区三区四区五区| 日韩高清成人| 青草精品视频| 亚洲国产精品无码AV| 91破解版在线亚洲| 日本不卡免费高清视频| 91精品国产自产在线观看| 中文无码精品A∨在线观看不卡| AV无码无在线观看免费| 99久久99这里只有免费的精品| 成人午夜福利视频| 成年人国产网站| 国产麻豆精品久久一二三| 国产美女自慰在线观看| 亚洲无限乱码| 欧美第九页| 欧美色图久久| 国产一区二区福利| 国产在线观看一区精品| 国产成人亚洲精品无码电影| 亚洲无码在线午夜电影| 成人另类稀缺在线观看| 全免费a级毛片免费看不卡| 波多野结衣亚洲一区| 国产乱子伦手机在线| 中国国产一级毛片| 中国美女**毛片录像在线| 99这里只有精品在线| 久久婷婷五月综合97色| 久久精品人人做人人爽| 中文一区二区视频| 色哟哟国产精品| 日韩大乳视频中文字幕 | 日韩AV无码免费一二三区| 波多野结衣国产精品| 色欲国产一区二区日韩欧美| 亚洲AⅤ永久无码精品毛片| 久久一日本道色综合久久| 日韩高清成人| 国产91在线免费视频| 一本大道视频精品人妻| 黑人巨大精品欧美一区二区区| 亚洲成人高清无码| 在线不卡免费视频| 伊人大杳蕉中文无码| 人妻精品久久无码区| 久久精品无码一区二区国产区| 精品无码日韩国产不卡av | 国产在线麻豆波多野结衣| 免费观看亚洲人成网站| 免费99精品国产自在现线| 性色一区| 麻豆国产精品一二三在线观看| 在线观看av永久| 精品人妻AV区| 三级国产在线观看| 国产极品粉嫩小泬免费看| 欧美综合区自拍亚洲综合绿色| 亚洲天堂日本| 丝袜亚洲综合| 蜜臀av性久久久久蜜臀aⅴ麻豆| 亚洲精品日产AⅤ| 国产精品亚欧美一区二区三区| 国内熟女少妇一线天| 国产美女一级毛片| 日韩国产综合精选| 呦视频在线一区二区三区| 国产一区二区三区在线精品专区| 精品无码视频在线观看| 亚洲成AV人手机在线观看网站| 亚洲三级色|