彭海艷 何 振
數據是數字經濟時代的基礎性戰略資源,是中國經濟轉型和社會發展的新引擎。運用數據進行政府治理已經成為社會共識,有利于提升政府決策質量、促進政府職能轉變、優化行政流程以及改善政府績效等。隨著人工智能技術的蓬勃發展和在政府領域應用的不斷深入,政府數據安全問題日益凸顯,譬如隱私數據泄露、數據過度采集、數據非法使用等,給人民的生命財產安全和經濟社會的快速發展帶來不利影響。近年來,黨和政府對數據安全問題高度重視。2016 年,國家“十三五”規劃明確提出:“要強化信息安全保障,加快數據資源安全保護布局?!?017 年,習近平總書記在中共中央政治局第二次集體學習時指出:“要切實保障國家數據安全。要加強關鍵信息基礎設施安全保護,強化國家關鍵數據資源保護能力,增強數據安全預警和溯源能力。”①中華人民共和國中央人民政府網:《習近平主持中共中央政治局第二次集體學習并講話》,http://www.gov.cn/xinwen/2017-12/09/content_5245520.htm。2018 年,習近平總書記在中共中央政治局第九次集體學習時強調:“要加強人工智能發展的潛在風險研判和防范,維護人民利益和國家安全,確保人工智能安全、可靠、可控。”①中華人民共和國中央人民政府:《習近平主持中共中央政治局第九次集體學習并講話》,http://www.gov.cn/xinwen/2018-10/31/content_5336251.htm。2020 年,黨的十九屆五中全會明確提出:“保障國家數據安全,加強個人信息保護?!雹诠饷骶W:《發展數字經濟的新航向》,https://theory.gmw.cn/2020-12/19/content_34477163.htm。可見,政府數據安全問題已然成為事關國家安全和經濟發展的重大問題,加強政府數據安全治理是當前各級黨政機關和政府職能部門必須面對的一個時代課題。
人工智能技術的更新迭代為人工智能賦能政府數據安全治理提供了可能,其智能決策、精準感知、數據挖掘功能給政府數據安全策略制定、數據安全風險監測、數據安全隱患防范等方面提供新的機遇。
一是智能決策為政府數據安全策略制定提供有力支持。制定數據安全策略(包括數據流轉管控策略、數據分級分類策略、數據安全稽查策略等)是開展數據安全治理的重要基礎工作,也是保障數據安全的指導方針,可有效維護政府數據的完整性、保密性和可用性。隨著人工智能技術的快速發展,智能決策能力也隨之提升,機器可基于高度數據集成,自動化編排方案并進行比選,從而輔助決策者選出最優策略。因此,政府可依托智能決策,運用深度學習等相關數據分析技術,幫助掌握數據全生命周期各個環節中的數據加密狀態、數據脫敏狀態、應用通道、數據使用行為等更多細節信息,盡可能排除相關因素的干擾,并根據不同的決策環境進行模擬計算,幫助解決決策復雜性,制定和尋找最優數據安全策略,持續優化,確保它們安全可用,從而減少重大決策失誤。③唐新華:《智能決策在國家治理現代化中的應用探析》,《當代世界》2020 年第3 期。
二是精準感知為全面監控政府數據風險提供條件。當前的政府數據安全風險監測存在著效率低、風險識別周期長、風險防控滯后性強等不足。據IBM 發布的《2020 年數據泄露成本報告》數據顯示,識別數據風險需要一定時間,如金融行業識別風險所需時間為177 天,醫療保健行業識別風險所需時間為236天。④IBM:《2020 年數據泄露成本報告》,https://www.ibm.com/downloads/cas/BK0BB0V1,2020 年7 月24 日。而時間越長,數據風險所造成的危害就越大。人工智能技術的超強計算和智能感知可實現對數據的全域精準感知、對異常數據智能識別與智能警報,打造動態監測、精準防控、提前預警的智慧監控模式。在該模式下,可幫助政府有效計量、監測和控制各類風險,實時識別、標記并上報政府數據異常行為,大大縮減風險識別的時間成本,大幅提升數據安全風險感知的真實度、精確度、全面度與及時度。
三是數據挖掘為消除政府數據安全隱患提供可能。隨著人工智能技術的發展,數據挖掘能力得到顯著提升。數據挖掘具備基于大量數據、隱含性、價值性等多重特性,可對龐大的、不完整的、有干擾的數據集開展智能分析,通過關聯分析、分類、聚類或偏差檢測等方法,自動搜索隱藏于其中有著特殊關系性的數據和信息,快速、準確地檢測異常數據、預測安全風險,進而幫助應體快速采取應對措施?;诖耍瑢⒅悄芡诰蚣夹g應用于政府數據安全治理領域,可建立起具備快速運算能力、精準風險識別的數據安全預測模型,通過對海量數據進行多維度、長周期的深度挖掘分析和計算,精準考察政府數據利用行為是否合理、數據是否真實可信、是否存在隱私數據濫用行為等,快速識別并提前預警政府數據安全治理中的漏洞和不足,為政府工作人員提供重點監管方向,推動政府數據安全風險“主動防御”,為消除政府數據安全隱患提供可能。
技術是一把雙刃劍。人工智能在政府數據安全治理領域,同樣存在著“安全賦能”和“安全伴生”效應⑤參見方濱興主編:《人工智能安全》,北京:電子工業出版社,2020 年。,既加劇了傳統的數據安全風險,如數據過度采集、數據竊??;也催生出新的數據安全問題,如數據投毒、樣本偏差問題,給政府數據安全保障、數據安全風險防范、個人隱私數據防護等方面提出新的挑戰。
一是技術自身發展給政府數據安全保障提出更高要求。首先,要求完善數據安全標準體系。人工智能技術自身面臨的數據安全、算法安全、隱私泄露風險,極易引發政府數據安全問題,亟待加強人工智能數據安全標準建設,保障人工智能背景下的數據安全與開發利用。其次,要求加強數據安全風險監控。人工智能背景下政府數據安全風險更加多發頻發、更加隱蔽,傳統的數據安全風險監控技術已經難以滿足政府數據安全治理的需要。因此,有必要對政府數據安全風險進行全方位的監控。再次,要求構建多元化的數據安全治理人才隊伍。從安全產品的簡單堆砌到數據安全的全流程治理,從提供產品到提供服務,不僅需要技術手段創新,更離不開專業化技術人才隊伍。因此,構建多元化的政府數據安全治理人才隊伍勢在必行。
二是技術惡意或不當應用導致政府數據安全風險增多。人工智能的濫用或不當應用,加劇了個人隱私數據泄露、數據投毒、逆向攻擊、模型竊取等風險,嚴重者可導致政府數據分級分類、數據安全決策發生錯誤。2018 年,世界上最大的國營生物識別數據庫Aadhaar 數據泄露,根據印度《論壇報》(Tribune)的調查顯示,超過10 億印度公民的個人資料(包括用戶的姓名、家庭住址、Aadhaar 號碼、指紋和虹膜等生物識別信息)被在線出售。此外,人工智能可增強數據挖掘能力、快速發現系統漏洞,當其被不法分子惡意應用時,可以讓行動者執行原本不可行的攻擊,如深度造假、破解驗證碼、蜂擁式攻擊等,進而竊取機密數據,造成政府數據泄露。
三是技術偏見或算法黑箱導致個人隱私數據泄露嚴重。政府掌握大量隱私數據,這些數據在存儲、復制、傳播的過程中,容易產生隱私泄露等倫理風險,尤其是人工智能存在的技術偏見和算法黑箱更容易導致個人隱私數據泄露嚴重。當前,私人技術公司因負責算法設計與運行而掌控算法,政府公共部門僅僅明確算法輸出端的信息即算法目標或算法結果,而社會公眾則幾乎完全被排除在算法“黑箱”之外①譚九生、范曉韻:《算法“黑箱”的成因、風險及其治理》,《湖南科技大學學報(社會科學版)》2020 年第6 期。。這意味著,在數據產業鏈中的安全能力薄弱主體可能會使整個數據鏈面臨風險,產生數據泄露或數據盜取的危害。2015 年,重慶、上海、山西、沈陽、貴州、河南等超過30 個省市衛生和社保系統出現大量高危漏洞,數千萬用戶的社保信息可能因此被泄露,其中包括社保參保信息、財務、薪酬、房屋等敏感信息。②騰訊網:《數千萬人社保信息或遭泄露》,https://tech.qq.com/a/20150422/002390.htm,2015 年4 月10 日。同時,“算法黑箱”或算法不透明性可能成為“隱形”惡意武器,操控決策致使算法權力誘導個人行為,竊取或販賣隱私數據。
當前,中國政府數據安全治理尚處于初步探索階段,人工智能背景下的政府數據安全治理在權責關系、法律法規、安全審查、智能監控、技術應用等方面還存在一些亟待解決的問題,政府數據安全治理任重道遠。
加強組織制度建設,是政府數據安全治理的根本保障。但是,當前中國政府數據安全治理在組織建設方面仍面臨一些困境。主要表現在:
一是責任邊界模糊。省級行政單位設有大數據管理機構承擔數據安全治理責任,但市、縣政府卻無此類機構銜接,數據安全責任散落于網信、通信管理等部門,導致數據安全治理責任邊界模糊。一旦發生政府數據安全事件,則難以溯源,各級政府、部門之間容易出現互相扯皮、推諉的現象。尤其是在人工智能場域中,人與機器的界限越來越不明顯,與技術本身相關各方的行為失當、責任界定不清③全國信息安全標準化技術委員會:《網絡安全標準實踐指南——人工智能倫理安全風險防范指引》,https://www.tc260.org.cn/upload/2021-01-05/1609818449720076535.pdf。等問題,使得政府數據安全責任更難認定、責任邊界更加模糊。
二是權力歸屬不明晰。受傳統科層制和“權力本位”觀念影響,中國治理相關權力在多層級政府體系中呈現出層層上收的特點。④田玉麒:《職責優化與組織調適:政府治理體系現代化的雙重進路》,《社會科學戰線》2020 年第4 期。上級政府對下級政府沒有進行明確的授權,或雖進行明確授權卻又掌握著任意干預權,這就使得下級政府的治理權變得非制度化、殘缺或薄弱①向靜林、艾云:《政府治理創新的層級差異及其組織根源——以互聯網金融治理為例》,《學?!?021 年第3 期。,這種不明確、有“卸責”意味的數據安全治理權力配置使得層級政府間的數據安全治理難以協同,降低了數據安全治理效能。此外,中國行政體系中的條塊分割,也容易導致同級政府部門間數據安全治理權力歸屬的混亂,例如,數據安全監管政出多門,既有數據管理部門也有網信部門行使監管權力,在信息不對稱的情況下,容易形成數據安全監管真空,難以全面防護政府數據安全風險。
三是職能劃分不合理。當前,中國尚未構建全國統一的政府數據安全治理行政機構,各級政府內部也沒有設立專門的政府數據安全管理部門,雖然部分地區設置了數據管理機構,但其對數據安全方面的職能要求尚不完善②孟慶國、林彤等:《中國地方政府大數據管理機構建設與演變——基于第八次機構改革的對比分析》,《電子政務》2020 年第10 期。,數據安全治理的決策、組織、協調、控制、監督等職能缺乏有效的頂層設計和統籌規劃,對網信、公安、數據管理部門等安全責任主體的職能劃分不太合理。對于數據安全治理由誰來牽頭、誰來負責、誰來落實、誰來監督以及誰來考核等問題均缺乏詳細的規定。
政府數據安全治理需要法律法規和標準規范的指導與約束,這是政府數據安全治理有效實施的前提和基礎。但是,當前中國政府數據安全治理在法治建設方面相對滯后,已經不能滿足人工智能發展的需求。
一是有關法律法規的系統性有所欠缺。目前,現有的數據安全治理法律法規仍未形成完整的體系,首先,數據安全治理相關法律法規之間缺乏銜接性與一致性。譬如,《個人信息保護法》規定了個人信息收集使用的“明確同意”規則;《民法總則》則對其采取更為寬松的立法理念,收集、轉讓或者使用個人信息,既可以通過書面等其他明示形式做出,也可以以默示的方式做出③楊蕾:《數據安全治理研究》,北京:知識產權出版社,2020 年。;《民法典》對隱私權和個人信息處理進行了界定,承認隱私權是一種人格權,但沒有規定自然人對個人信息享有人格權,僅規定自然人的個人信息受法律保護。此外,《民法典》所定義的隱私和個人信息的范圍存在重疊④中國法制出版社編:《中華人民共和國民法典:實用版》,北京:中國法制出版社,2020 年。,相關法律條文仍不夠細化,可操作性和可執行性略顯不足。如有關數產權的規定目前仍為原則性規定,數據產權規則不清晰,可能會導致多方數據主體之間的利益沖突。⑤利刃出鞘:《〈數據安全法〉下中國數據保護路徑解讀》,https://www.pkulaw.com/lawfirmarticles/8d31eb44ffda0aeda1f c5702b38eaf3fbdfb.html,2021 年8 月3 日。
二是配套政策缺乏系統性。雖然中國人工智能和數據治理政策體系已初見雛形,但是專門針對人工智能背景下的政府數據安全治理的規定非常少見,散見于人工智能和數據治理的頂層設計和戰略規劃等相關文件中,缺乏統一和協調。另外,雖然現有數據安全頂層設計和宏觀政策比較多,但是其顆粒度大,針對性和系統性不強,實施效果大打折扣。以地方政府為例,當前地方政府數據安全政策文件內容主要集中于安全體系、安全技術、安全審查機制、安全監測等方面的宏觀論述,有的政策文件論述過于精簡,有關數據安全內容甚至不足100 字符。⑥冉連、張曦:《地方政府數據開放全生命周期安全管理政策研究——基于全國17 個省級政府的政策文本分析》,《情報雜志》2021 年第8 期。
三是標準規范仍需完善。人工智能數據安全通用標準缺乏,術語定義、參考架構、分級分類等基礎類指標不太明確,導致不同組織制定出來的數據標準各不相同,難成體系;人工智能數據安全采集、流通、使用和共享等關鍵技術標準還未建立,覆蓋政府數據全生命周期安全的技術標準亟待制定,包括分類分級、去標識化、數據跨境、風險評估等內容;人工智能數據安全的部分重點領域相關標準仍存在空白,政府數據安全評估、重要數據保護以及人工智能背景下的跨境數據流動、政府數據合規使用等相關的標準規范尚需建立。
從當前的情況來看,中國政府數據安全審查乏力的情況時常發生,數據安全風險仍然頻發。其主要表現在:
一是數據安全審查不規范。根據已有的法規政策文本,雖然明確要求建立數據安全審查制度,但相關內容尚不具體、未細化。例如,對數據安全審查制度的實施主體、實施機制、審查內容和覆蓋范圍等方面還不明確,可執行性不強,易導致政府具體實踐中的無所適從。此外,絕大多數政府數據安全審查集中在數據開放階段,以保密審查、脫敏審查為主,而隨著人工智能技術在政府領域的嵌入,數據采集、數據流轉、數據銷毀等階段都有可能存在著數據泄露、隱私侵權等安全風險,政府應當對數據全生命周期開展安全審查。
二是數據安全審查方式較陳舊。現階段,政府數據安全審查以傳統的方式為主,而傳統的數據安全審查方式,對工作人員的專業知識和經驗具有很強的依賴性,且在非自動化審查和大量人工干預下,審查周期長、成本高。網絡安全審查通常在45 個工作日內完成,情況復雜的會延長15 個工作日;對于進入特別程序的審查,審查周期為90 個工作日或者更長。此外,傳統的數據安全審查方式容易受主觀因素的影響從而忽略某些審查內容,導致一些數據安全問題產生。比如,2015 年,由于政府數據開放安全審查不到位,北方某省一住房和城鄉建設局在公示人員名單時,公布了公民完整的身份證號碼等個人信息,侵犯了公民個人隱私。
三是數據安全審查非常態化。中國數據安全審查一般在開展數據活動(如數據共享、數據開放)前進行,暫未形成常態化、規律性的制度化工作。但在日常工作中,也需要定期開展數據安全審查。這是因為,在人工智能背景之下,數據安全風險變得更為隱蔽,政府數據采集環節中可能存在隱私侵犯問題、數據質量問題,在數據存儲、使用等階段都有可能存在數據泄露、數據遭篡改等安全問題。例如,2018 年某公務員利用職務之便非法獲取出售、提供82 萬條包含居民身份證號碼、手機號碼、固定電話等在內的個人信息。
當前,圍繞數據安全治理平臺建設的議題,政府面向市場上多家企業尋求解決思路,并取得一定進展。然而,在人工智能背景下,政府數據安全治理平臺支撐體系仍未建立,尚存在著平臺兼容性差、風險智能監控不足的問題。具體而言:
一是人工智能系統平臺兼容性差。將人工智能系統嵌入數據安全治理平臺可以大大提升政府數據安全風險監控的自動化與智能水平。但從實踐情況來看,由于系統設備智能化的關鍵處理器和操作系統絕大部分并非由中國研發與生產,這就意味著人工智能從算法到芯片、從軟件到硬件都有可能存在差異和信息安全風險。
二是數據安全治理平臺兼容性差。政府數據安全風險監控需要基于數據全生命周期構建一條完整堅實的數據安全監控鏈。然而,現階段政府數據安全平臺體系大多缺乏自上而下的頂層規劃,數據接口標準、技術標準等缺乏統一規范,致使各平臺多為封閉生態,平臺與平臺之間兼容性差,智能水平也各不相同。在此情況下,“各自為戰”的數據安全平臺容易阻滯風險分析數據的匯集,導致全域風險分析和研判難以開展,數據安全風險難以溯源。廈門市建立的大數據安全開放平臺,通過采用“數據安全屋”技術開展政務大數據安全開放,重點監控政務數據開放共享中的數據安全風險,難以形成覆蓋全流程的數據安全智能監控平臺體系。
三是跨部門政務數據平臺兼容性差。當前政府各部門之間的政務平臺兼容性差,數據壁壘問題突出。江蘇無錫市公共數據中的人口數據、歷年排污企業目錄、排污量等數據分別保存在無錫統計官方網站、無錫市生態管理局官網中,政府各部門數據平臺間數據流通不暢、整合困難①周林興、崔云萍:《智慧城市視域下政府數據開放共享機制研究》,《現代情報》2021 年第8 期。。然而,實現政府數據安全風險智能監控離不開數據支持,政府部門數據壟斷問題阻滯了政府全量數據資產的數據狀況梳理、敏感數據流轉路徑和動態流向感知,無法實現對政府數據安全風險發展與變化情況全程監督,以及多維度、全方位智能風險核驗、實時預警與攔截操作,智能監控稍顯不足。
近年來,中國在人工智能數據安全技術攻堅方面雖然取得了一些成績,清華大學創業公司的瑞萊智慧團隊開發了“珠算”概率編程庫,對數據標準和數據模型安全提供了可靠技術。但是,從總體上看,仍存在一些亟待解決的問題。主要體現在:
一是智能技術應用保守、網絡攻擊防范不力。部分政府部門在應用智能技術時仍然比較保守,“不想用”“不敢用”“不會用”等現象普遍存在。與此同時,網絡攻擊防范也不力,當人工智能技術被不法分子利用時,其超強算力與自適應能力,也能夠幫助網絡黑客實現政府平臺自動化漏洞檢測與攻擊。根據英國網絡安全公司Darktrace 分析顯示,集成人工智能技術的勒索軟件可自動瞄準更具吸引力的目標,如政府數據庫文件等。
二是智能技術過度應用、隱私泄露風險加劇。人工智能技術在大幅度提升數據安全管理效率的同時,也讓人產生了對技術的依賴,從而容易引發技術過度應用問題(過度采集、過度挖掘、過度利用等)。隨著各類智能設備和智能系統的應用普及,公民活動的任何痕跡以及人臉、指紋等具有強個人屬性的生物特征信息都可能會被智能終端自動采集,一旦這些數據被泄露或者濫用,將會對公民權益造成嚴重危害。在數據采集中,2019 年中國人民大學WAMDM 實驗室發布的《中國隱私風險指數分析報告》顯示,約10%的數據收集者獲取了99%的權限數據,公民個人隱私信息被嚴重侵犯。
三是智能技術缺乏監管、數據安全存在不可控。2021 年4 月,歐盟委員會提出了一項旨在加強人工智能(AI)技術監管的法規草案,該法案致力于解決人工智能技術在實際應用中給人類及社會發展帶來的風險。相比之下,中國人工智能技術缺乏有效監管,安全漏洞日益凸顯。360、騰訊等企業安全團隊就曾多次發現TensorFlow、Caffe、Torch 等深度學習框架及其依賴庫的安全漏洞,攻擊者可利用相關漏洞篡改或竊取人工智能系統數據①魏薇、景慧昀、牛金行:《人工智能數據安全風險及治理》,《中國信息安全》2020 年第3 期。,如果將未經監管的人工智能技術應用于數據安全治理,很大程度會導致數據安全不可控。
當前,為了應對人工智能發展給政府數據安全治理帶來的沖擊以及解決人工智能背景下政府數據安全治理面臨的一些困境,須重點從深化數據安全頂層設計、共筑數據安全標準規范、完善數據管理保障機制、搭建數據綜合治理平臺、強化核心技術自主創新等方面進行。
人工智能背景下的政府數據安全治理是一個系統工程,為此,應重點加強頂層設計、完善政府數據安全組織建設,形成權責明晰的組織結構。
一是加強政府數據安全頂層設計。政府數據安全治理離不開國家戰略規劃的指引,如英國發布的《數據安全戰略》中提供了國家層面的數據安全治理方案。中國應根據人工智能數據安全特點、業務模式、組織架構等因素進行戰略規劃,力爭將其上升為國家戰略,以實現國家層面的統籌協調。明確人工智能背景下的政府數據安全治理目標,旨在降低數據安全風險、保障數據合法合規,從而使數據使用更加安全;確定政府數據安全治理的重點領域,主要包括數據分級分類管理、數據安全風險防范與監測預警、數據安全事件應急處置與動態跟蹤等;制定政府數據安全治理總體策略和行動綱領,明確政府數據安全治理的主體、內容、工具、方式、方法、流程等,為政府數據安全治理提供實踐指南。
二是建立政府數據安全治理機構。建議由中共中央網絡安全和信息化委員會辦公室和國家互聯網信息辦公室牽頭,聯合各級政府部門的大數據管理機構和數據治理機構共同組建統一的政府數據安全行政管理機構。各級政府部門設立相應的數據安全保護部門,專門負責政府數據安全治理工作。此外,成立由各級黨委、政府主要領導牽頭的數據安全治理工作領導小組,加強集中統一領導。設立政府數據安全治理委員會、政府首席數據保護官、數據安全管理專員等,負責相關政府數據安全保護措施的監督和落實。
三是明確政府數據安全治理相關方的權責關系。一方面,政府部門應基于人工智能背景制定權力清單。從宏觀上對各級政府數據治理機構所擁有的權力邊界和活動范圍進行統一規定,明確各級政府數據安全治理機構的職責權限,從而防止各級政府數據安全治理機構“權責交叉”“多頭執法”“相互推諉”等問題出現。另一方面,劃定責任界限。按照“誰生產、誰擁有、誰負責”和“權責統一”的原則,明確責任主體,劃清每個部門的職責邊界,要明確相關方的法律責任,也要規定相關方人員的倫理責任。
四是構建政府數據安全多元協同治理機制。人工智能時代的政府數據安全問題日益突出,構建以政府為主導多元主體共同參與的協同治理機制,是人工智能背景下政府數據安全治理的內在需求。政府部門要加強“縱向大聯動,橫向大合作”工作,吸納企業、行業組織以及社會公眾等不同主體廣泛參與到政府數據安全治理工作中來,發揮不同主體在政府數據安全治理中的作用,為人工智能背景下的政府數據安全治理營造良好的生態環境。
加強政府數據安全治理,提升數據安全防護水平,推進國家治理體系和治理能力現代化,必須加強法治建設。
一是完善政府數據安全法律法規。一方面,繼續推動數據安全治理法律法規體系建設,加強政府數據安全治理和人工智能領域的立法,明確政府數據安全治理不同參與主體所享有的數據權利與承擔的安全責任,并對人工智能技術監管以及數據過度采集、偏見歧視、資源濫用、深度偽造等突出問題進行規制。另一方面,基于數據生命周期管理理論,圍繞政府數據采集、存儲、傳輸、開放、共享、交易、使用等方面,建立政府數據全生命周期安全管理專項法規,增強數據安全法律條文的可操作性以及數據安全重點領域的約束規范。
二是制定政府數據安全標準。2020 年的“人工智能與數據安全”分論壇已提出“人工智能和數據安全的治理需要世界各國和組織聯合起來,構建統一的人工智能模型與系統的安全評估準則和標準?!币虼?,中國可通過與IEEE、ISO/IEC/ITU 等國際化標準組織聯合發聲等方式,實質性參與人工智能數據安全相關國際標準制定工作,提出更多的人工智能政府數據安全相關提案,以開放協同的方式進行科學研究和技術交流,推動人工智能數據安全標準快速落地。同時,以中國人工智能安全標準框架為指引,重點加強對人工智能政府數據安全技術標準、安全管理標準、運行平臺標準、安全評估標準、數據質量標準等方面的制定,完善中國人工智能背景下的政府數據安全標準體系。
三是推進政府數據安全執法。執法部門應嚴格按照人工智能政府數據安全相關法律法規的規定,依法開展政府數據安全治理工作,特別是要加強對政府數據收集、使用、共享等高風險環節的安全執法,加大對政府數據過度采集、數據濫用與違規使用、個人隱私侵犯、數據泄露等行為的處罰力度,創新和規范人工智能政府數據安全事件處置程序和方法,促進人工智能政府數據安全法律法規的有效實施。同時,還要進一步優化人工智能背景下政府數據安全執法體制,提升執法能力,規范執法行為,敢于追究違法行為,并能有針對性地提出整改建議,以提高人工智能背景下政府數據安全執法實效。
良好的安全制度是政府數據安全治理的前提和基礎,人工智能背景下政府數據安全治理應建立專門針對人工智能發展需要的政府數據安全綜合管理制度,從制度層面保障政府數據安全。
一是健全政府數據安全審查制度?,F階段,中國《數據安全法》明確規定要建立數據安全審查制度,《網絡安全審查辦法(修訂草案征求意見稿)》將“數據安全”納入審查范圍。鑒于此,應進一步完善政府數據安全審查制度,明確數據安全審查主體,規范審查內容。建議由網絡安全審查辦公室統一負責數據安全審查工作,審查內容應當圍繞政府數據采集、存儲、加工、使用、交易、開放、共享等活動進行操作稽核、合規性檢查、日志審計、例行安全檢查以及風險評估等。此外,針對審查所發現的安全問題,網絡安全審查辦公室應當牽頭協調各部門提出改進方案,要求相關部門落實解決且對其持續跟蹤檢查,防范化解重大政府數據安全風險。
二是實施政府數據分級分類制度。政府數據分類分級是政府數據安全治理的前提,如美國頒布的《國家安全信息分類》《受控未分類信息》等就對聯邦數據分級分類進行了統一規范。為此,中國應依據數據的來源、內容和用途對數據進行分類,根據政府數據的價值、敏感程度和影響程度等進行數據分級,并出臺相應的政策文件對政府數據的分類、標記、評估、保護等諸多方面進行規制。同時,在數據分級分類過程中,針對海量的政府數據,可運用機器學習、模式聚類等技術,打造數據分級分類引擎,實現對數據進行基于內容的實時、自動、精準分類分級。
三是完善政府數據安全管理保障機制。主要指健全政府數據安全保密制度。在數據安全審查過程中,相關部門要嚴格承擔保密責任,尤其是做好重要數據和重要儲存介質的安全保密工作,未經批準和授權,任何人不得隨意使用數據和泄露數據;推進政府數據容災備份管理制度。政府部門應利用人工智能等新興技術構建政府數據容災系統,堅持數據級備份與應用級備份相結合,通過異地備災、實時備份和在線備份等多種途徑,防范各類政府數據安全風險;建立政府數據安全應急處置機制。在數據分級分類管理和安全審查過程中,應按照“誰主管誰負責、誰運行誰負責”的原則落實應急處置責任,及時做好數據安全應急處置工作。
人工智能背景下,搭建運行有效的政府數據綜合治理平臺,實現數據安全監管、數據安全加固、數據安全應急,是確保政府數據保密性、完整性、可用性的重要保障。
一是組建圍繞業務流程的數據安全監管平臺。政府數據安全是一個動態變化的過程,政府部門需要關注數據的流動性特征,組建圍繞業務流程的數據安全監管平臺。利用物聯網、人工智能、云計算等技術,針對各類設施設備、數據資產以及資源(如空間、帶寬、端口、容量、IP 等),進行浸入式、全景式的數據資產、數據流動等自動化、可視化跟蹤管理。并通過頂層設計與數據加密、數據授權、數據脫敏、安全審計等產品進行深度聯動,突破傳統的單點防護方案,實現政府業務平臺數據在存儲、使用、傳輸、共享等流轉環節中的數據安全風險聯防聯控、實時動態監測、智能分析、態勢評估和快速響應。
二是完善面向數據開放的數據安全加固平臺。根據《2020 年中國互聯網網絡安全報告》的統計數據,中國境內被篡改的政府網站有494 個;被植入后門的政府網站有256 個。政務網站被“黑客”植入暗鏈或黑頁等諸如此類的問題,很容易造成隱私數據泄露。為此,政府部門應著重面向數據開放開展數據安全加固,針對數據存儲、數據流通、數據訪問等環節中的敏感數據泄露、接口設計風險、數據流動風險等,利用數據識別算法、敏感接口識別策略以及智能識別引擎,對數據開放共享進行風險智能識別,并同時出具實時數據安全加固方案,對諸如賬號安全、敏感信息、網絡架構、安全產品配置以及安全漏洞方面進行針對性的加固,從而打造政府部門安全用數開放平臺。
三是構建針對數據安全突發事件的應急平臺。一方面可依托具備智能感知的風險監管平臺和數據安全智能監測系統對政府數據采集風險、數據組織存儲風險、數據流動傳輸風險、數據開發利用風險等進行精準識別,為精準防范數據風險提供基礎。另一方面,應積極打造數據安全應急預案庫、數據安全智能應急決策引擎,針對匯聚的數據安全風險數據開展高效研判,并及時對政府數據安全風險進行快速預警。與此同時,應急平臺應依據預警信息分級響應,實時啟動應急預案,協調政府各部門采取不同的處置措施,以最短時間,快速從事件中恢復、使影響降至最低,并避免再次發生。
人工智能背景下的政府數據安全治理需要嚴密有效的技術予以保障。因此,應著力研發人工智能和政府數據安全相關技術,為實現人工智能背景下的數據安全治理提供支撐。
一是完善政府數據安全技術。政府可聯合社會組織和企業,通過成立聯合實驗室、共同投資等方式,開展人工智能背景下政府數據安全技術研究。首先,圍繞政府數據全生命周期,加強對加密技術、入侵檢測技術、訪問控制技術、隱私保護技術、個人信息去標識、數據標簽技術、數據交換技術、數據安全風險監測技術等相關政府數據安全技術研發。其次,加強對人工智能技術攻堅,增強對人工智能技術與物聯網、區塊鏈等其他信息技術融合研究,進一步解決人工智能技術的強數據依賴性、算法黑箱性等問題。
二是建立中國人工智能開源開放平臺。目前,較為流行的開源框架仍然由國外公司或機構開發。為了從根本上解決過度依賴國外開源代碼的問題,中國應在核心技術上實現自主可控,可依托新一代人工智能產業技術創新戰略聯盟,建立自有的人工智能開源開放平臺。同時,通過中國市場優勢,加快培育自有人工智能開源平臺共享應用生態圈和產業鏈,為人工智能行業的發展提供新動力,為人工智能背景下的政府數據安全技術研發提供基礎平臺。
三是研發人工智能相關技術。利用國家資金和社會資源引導社會各界聯合研發以政府數據保護為前提的人工智能技術,突破小樣本學習、遷移學習、聯邦學習、差分隱私等人工智能數據安全保護核心關鍵技術。通過研發基于隱私的機器學習技術如同態加密、安全多方計算、差分隱私等,可以有效保護用戶的數據安全。通過研發減少數據需求的技術如遷移學習、數據增強技術等,可以從根本上解決人工智能對海量數據需求帶來的數據安全問題。通過完善數據偏見監測技術、數據攻擊防御技術、對抗樣本監測技術等,可以有效防止政府數據被惡意破壞和篡改。
綜上所述,人工智能背景下保障政府數據安全是當前的重要議題。中國政府數據安全治理困境主要體現在治理主體權責不明、法規標準滯后、安全審查乏力、平臺兼容性差、技術應用不力五個方面,亟須從組織架構、法規標準、保障機制、治理平臺、技術手段多個維度采取措施解決問題,從而促進人工智能在數據安全領域中的高效賦能,力求實現人工智能與數據安全的良性互動發展。不過,本文提供的只是理論層面的觀點,人工智能背景下政府數據安全治理本身是一個異常復雜的系統問題,不僅需要實踐來驗證和完善,還需要學術界更進一步的關注和探索。