周 環(huán),幸強(qiáng)國,唐 泳
21世紀(jì)是大數(shù)據(jù)時(shí)代,政府?dāng)?shù)據(jù)開放在國家經(jīng)濟(jì)社會發(fā)展以及政府治理中的重要地位凸顯[1]。2015年國務(wù)院發(fā)布《促進(jìn)大數(shù)據(jù)發(fā)展行動綱要》,提出在2018年底前建成國家政府?dāng)?shù)據(jù)統(tǒng)一開放平臺、加快政府?dāng)?shù)據(jù)開放共享[2]。截至2019年4月,82個(gè)地方政府?dāng)?shù)據(jù)開放平臺上線,數(shù)據(jù)開放總量、容量、主題覆蓋面迅速增長,更多優(yōu)質(zhì)數(shù)據(jù)集上線運(yùn)行,數(shù)據(jù)開放增質(zhì)提速[3]。隨著政府?dāng)?shù)據(jù)開放的不斷深化發(fā)展,人們對隱私安全問題的隱憂加劇。開放數(shù)據(jù)中含有大量公民隱私,增大用戶使用過程中隱私泄露風(fēng)險(xiǎn)。屢見不鮮的隱私泄露案例折射出無論是政府?dāng)?shù)據(jù)開放平臺的運(yùn)維管理還是用戶使用等方面都存在隱私安全隱患。單一視角考慮數(shù)據(jù)開放問題,會造成隱私風(fēng)險(xiǎn)隱患;反之亦然。毋庸置疑,數(shù)據(jù)開放和隱私保護(hù)的協(xié)同和平衡是我國政府?dāng)?shù)據(jù)開放事業(yè)可持續(xù)、高質(zhì)量發(fā)展的關(guān)鍵,尋求兩者的協(xié)同與平衡亦受到社會各界的共同關(guān)注。在此背景下,順應(yīng)政府?dāng)?shù)據(jù)開放發(fā)展的實(shí)踐需要,聚焦數(shù)據(jù)開放和隱私保護(hù)兩個(gè)看似矛盾的主題協(xié)同度研究,在大數(shù)據(jù)時(shí)代具有重要的理論意義和現(xiàn)實(shí)意義。
從公共政策角度審視,公共政策作為高效有力的戰(zhàn)略性指導(dǎo),對實(shí)踐有巨大的推動作用。從美國、英國、澳大利亞、加拿大等國實(shí)踐看[4-7],成功的政府?dāng)?shù)據(jù)開放實(shí)踐需要法規(guī)政策支持。政府?dāng)?shù)據(jù)開放平臺的隱私政策是用于規(guī)范平臺數(shù)據(jù)開放和隱私保護(hù)的重要政策,其主題協(xié)同度將直接影響實(shí)踐中數(shù)據(jù)開放和隱私保護(hù)兩者的協(xié)同度和平衡性。鑒于此,本文跳出定性分析框架,采用政策文本計(jì)算方法對隱私政策進(jìn)行深度挖掘,從定量視角揭示政策文本主題間的博弈關(guān)系,以豐富數(shù)據(jù)開放與隱私保護(hù)主題協(xié)同度領(lǐng)域的理論研究,并基于評估結(jié)果對現(xiàn)行政策調(diào)整完善提供有價(jià)值的參考依據(jù),進(jìn)而更好地推進(jìn)我國政府?dāng)?shù)據(jù)開放的可持續(xù)發(fā)展。
政府?dāng)?shù)據(jù)開放給個(gè)人隱私保護(hù)制度帶來新的挑戰(zhàn)和沖擊[8],學(xué)界圍繞政府?dāng)?shù)據(jù)開放實(shí)踐中的隱私保護(hù)問題展開熱烈討論。在理論探討方面,有對政府?dāng)?shù)據(jù)開放、隱私保護(hù)的基本概念辨析[9]、隱私保護(hù)現(xiàn)實(shí)困境[10]、隱私保護(hù)實(shí)現(xiàn)途徑[11-12]進(jìn)行研究;也有以數(shù)據(jù)生命周期理論為視角展開論析,數(shù)據(jù)全生命周期過程分為數(shù)據(jù)創(chuàng)建與采集、數(shù)據(jù)組織與處理、數(shù)據(jù)存儲與發(fā)布等5個(gè)階段,涉及不同主體,流轉(zhuǎn)過程復(fù)雜,導(dǎo)致政府?dāng)?shù)據(jù)開放過程中有較多風(fēng)險(xiǎn)點(diǎn)[13]。應(yīng)當(dāng)建立縝密的隱私影響評估分析機(jī)制,在政府?dāng)?shù)據(jù)流轉(zhuǎn)過程的各個(gè)階段強(qiáng)化隱私評估的研判和審查[14];或是焦距于政策建構(gòu)、數(shù)據(jù)管理和利益相關(guān)者參與等3個(gè)維度,識別和解決政府?dāng)?shù)據(jù)開放過程中隱私風(fēng)險(xiǎn)問題[15]。在實(shí)證分析方面,Andrei針對隱私影響評估這一政策工具,與計(jì)算機(jī)科學(xué)相結(jié)合,認(rèn)為可采用閾值規(guī)則、樣本權(quán)重、使用啟發(fā)式與使用記錄鏈接等隱私影響評估方法[16];Elisa等運(yùn)用區(qū)塊鏈技術(shù)構(gòu)建P2P(Peer-to-Peer)分散式系統(tǒng),該系統(tǒng)的特點(diǎn)是既能保證個(gè)人隱私安全,又能夠提高公共部門的信任度[17];Zou等開發(fā)了隱私保護(hù)算法(Privacy Protection Algorithms),該算法可以高效識別隱私風(fēng)險(xiǎn)從而有針對性地采取技術(shù)防范策略來保護(hù)個(gè)人隱私[18];也有學(xué)者從數(shù)據(jù)收集、用戶權(quán)利等維度設(shè)計(jì)16個(gè)測量指標(biāo)對我國70個(gè)大中城市政府門戶網(wǎng)站的隱私政策進(jìn)行分析研判[19];或通過梳理美英澳等三國的數(shù)據(jù)開放平臺隱私政策,結(jié)合中國實(shí)際構(gòu)建隱私風(fēng)險(xiǎn)評價(jià)體系,對我國政府?dāng)?shù)據(jù)開放平臺隱私保護(hù)現(xiàn)狀進(jìn)行實(shí)證研究[20]。
綜上,關(guān)于政府?dāng)?shù)據(jù)開放實(shí)踐中隱私保護(hù)領(lǐng)域方面的研究已涌現(xiàn)出一批成果,但進(jìn)一步研究空間仍存在。我國絕大多數(shù)研究聚焦于怎樣尋求數(shù)據(jù)開放和隱私保護(hù)兩者在實(shí)踐中的平衡,鮮有研究溯源對數(shù)據(jù)政策的數(shù)據(jù)開放和隱私保護(hù)的主題間協(xié)同度開展研究,探討政策文本的主題協(xié)同度對于指導(dǎo)開放實(shí)踐中尋求兩者的平衡至關(guān)重要。
政策文本是政策研究的重要工具和載體。對政策文本協(xié)同度的研究,在理論探討方面,馬海群等對政策協(xié)同的基本概念、理論基礎(chǔ)進(jìn)行論述,基于政策科學(xué)方法體系初步構(gòu)建我國政策協(xié)同的研究框架,開啟我國開放政府政策協(xié)同的研究[21]。既有文獻(xiàn)研究主要集中在實(shí)證分析方面,彭紀(jì)生等對政策內(nèi)容進(jìn)行結(jié)構(gòu)化賦值,并運(yùn)用數(shù)學(xué)公式建模,從政策力度、政策措施和政策目標(biāo)等三個(gè)維度出發(fā),對我國1978-2006年間的創(chuàng)新政策協(xié)同現(xiàn)狀進(jìn)行定量分析[22];毛子駿等以12個(gè)省市數(shù)據(jù)開放相關(guān)政策為研究樣本,從縱向政策協(xié)同、橫向政策協(xié)同兩個(gè)維度分析,揭示城市之間政策的協(xié)同狀況[23];姜鑫等基于政策文本分析視角,構(gòu)建政策文本內(nèi)容分析單元,對數(shù)據(jù)開放政策與個(gè)人數(shù)據(jù)保護(hù)政策兩類政策群進(jìn)行政策協(xié)同評估[24];張娜在對我國國家層面的299篇公共信息資源開放政策文本編碼基礎(chǔ)上,從政策力度和政策工具兩個(gè)維度出發(fā),通過構(gòu)建政策效力和政策工具協(xié)同測度模型,對我國公共信息資源開放政策協(xié)同進(jìn)行分析[25];張濤等基于政策文本計(jì)算方法分析446條政策文本的主題協(xié)同度,采用LDA主題聚類方法,選取關(guān)鍵詞,分別計(jì)算主題分布、政策力度等3個(gè)子維度的數(shù)值,加權(quán)計(jì)算得出最終的政策文本主題協(xié)同度數(shù)值[26]。
以上關(guān)于政策協(xié)同研究對本文有著較大的啟示。但既有研究均未置身于政府?dāng)?shù)據(jù)開放平臺這一特定環(huán)境下,隱私政策是解決隱私保護(hù)問題的一個(gè)新途徑,其政策要素的主題協(xié)同及內(nèi)容的完整性將直接影響實(shí)踐中數(shù)據(jù)開放和隱私保護(hù)兩者的協(xié)同和均衡。
基于上述認(rèn)識,本文聚焦于政府?dāng)?shù)據(jù)開放平臺的隱私政策協(xié)同度研究,引入一種交叉融合政策分析科學(xué)和計(jì)算科學(xué)的研究方法——政策文本計(jì)算方法,以全國66個(gè)政府?dāng)?shù)據(jù)開放平臺的隱私政策為研究對象,運(yùn)用數(shù)學(xué)算法逐一計(jì)算我國政府?dāng)?shù)據(jù)開放平臺隱私政策數(shù)據(jù)開放和隱私保護(hù)的主題協(xié)同度,并把計(jì)算的結(jié)果結(jié)合具體政策文本,深度分析挖掘政策文本中數(shù)據(jù)開放與隱私保護(hù)兩個(gè)主題之間關(guān)系,形成進(jìn)一步完善政府?dāng)?shù)據(jù)隱私政策主題協(xié)同的對策及建議。
政策文本計(jì)算,或稱計(jì)算機(jī)輔助文本分析(Computer Assisted Text Analysis,CATA),是大數(shù)據(jù)環(huán)境下政策分析科學(xué)和計(jì)算科學(xué)交叉融合的產(chǎn)物。它是基于計(jì)算機(jī)科學(xué)、語言學(xué)和政治學(xué)理論而建立的對海量政策文本深度挖掘和計(jì)算分析框架,主張運(yùn)用政策編碼、政策關(guān)鍵詞詞表或政策與語詞之間的映射關(guān)系進(jìn)行政策概念的自動識別和自動處理,最終構(gòu)建從政策文本到政策語義的自動解析框架,并在此基礎(chǔ)上關(guān)注政策文本及其內(nèi)涵分析[27]。本文的出發(fā)點(diǎn)是政策文本的自然語言處理,以語句和詞語為主的編碼規(guī)則,在研究過程中主要采用關(guān)鍵詞抽取法、主題聚類法(LDA)、主題分析法和共現(xiàn)分析法相結(jié)合的計(jì)算方法對政策內(nèi)容進(jìn)行分析,在主題分析和共現(xiàn)分析的計(jì)算上,借鑒了張濤等學(xué)者研究的計(jì)算方法[26]。具體研究流程如圖1所示。

圖1 協(xié)同度研究的方法流程圖
以上線運(yùn)行的82個(gè)政府開放平臺為基礎(chǔ),篩選出66個(gè)政府?dāng)?shù)據(jù)開放平臺(省級12個(gè),副省級和省會城市8個(gè)、地級市46個(gè)),以這66個(gè)平臺的隱私政策作為研究對象。將數(shù)據(jù)開放和隱私保護(hù)的兩類主題作為政策目標(biāo)。用Python自編語言程序?qū)崿F(xiàn)政策文本預(yù)處理、LDA主題聚類、關(guān)鍵詞分析計(jì)算等3個(gè)核心步驟。首先對樣本政策文本進(jìn)行編碼和分詞、去停用詞、導(dǎo)入政策詞表等技術(shù)操作,將其轉(zhuǎn)換為可分析處理的格式;然后用LDA主題聚類方法對預(yù)處理后的政策文本進(jìn)行主題聚類,形成政策文本主題詞語列表,接著用關(guān)鍵詞分析及人工篩選的方法確定數(shù)據(jù)開放和隱私保護(hù)主題關(guān)鍵詞23個(gè)(見表1);最后進(jìn)行主題頻次計(jì)算、主題共現(xiàn)強(qiáng)度計(jì)算等兩個(gè)方面的關(guān)鍵詞分析計(jì)算。運(yùn)用數(shù)學(xué)算法對政府?dāng)?shù)據(jù)開放平臺隱私政策的主題協(xié)同度進(jìn)行計(jì)算,分別計(jì)算數(shù)據(jù)開放和隱私保護(hù)的主題分布值以及兩主題的共現(xiàn)強(qiáng)度,在此基礎(chǔ)上,加權(quán)計(jì)算出主題協(xié)同度數(shù)值。根據(jù)主題協(xié)同度計(jì)算的定量結(jié)果結(jié)合實(shí)際政策文本,多視角解讀政府?dāng)?shù)據(jù)開放平臺的隱私政策文本,進(jìn)而形成對策及相關(guān)建議。

表1 數(shù)據(jù)開放和隱私保護(hù)所提取的關(guān)鍵詞表
(1)計(jì)算主題分布頻次率。根據(jù)表1中數(shù)據(jù)開放和隱私保護(hù)兩類主題的關(guān)鍵詞來計(jì)算主題頻次分布情況,設(shè)置數(shù)據(jù)開放類主題的關(guān)鍵詞個(gè)數(shù)為n1,隱私保護(hù)類主題的關(guān)鍵詞個(gè)數(shù)為n2,政策語料的數(shù)量為m。
步驟1,根據(jù)數(shù)據(jù)開放和隱私保護(hù)兩類主題關(guān)鍵詞構(gòu)建如下的主題矩陣X1和X2:

步驟3,分別計(jì)算數(shù)據(jù)開放主題X1和隱私保護(hù)主題X2在m篇文檔中出現(xiàn)的頻次Px1i和Py2j,將以上兩個(gè)頻次絕對值分別除以文本總?cè)萘縕,可得出兩個(gè)相對比值,即數(shù)據(jù)開放主題頻次率C1和隱私保護(hù)主題頻次率C2,計(jì)算公式如下:

(2)主題間共現(xiàn)強(qiáng)度公式。步驟1,根據(jù)數(shù)據(jù)開放和隱私保護(hù)的主題矩陣X1和X2中語句之間共現(xiàn)關(guān)系來交叉計(jì)算求和形成T,見公式(3),進(jìn)而得出矩陣T的行列式,計(jì)作 ||T。步驟2,形成矩陣T m,T m為m篇政策文本中語句共現(xiàn)矩陣。步驟3,共現(xiàn)強(qiáng)度計(jì)算如公式(4)所示,Eij代表主題詞共現(xiàn)強(qiáng)度,Si表示數(shù)據(jù)開放類關(guān)鍵詞在文本語句片段的數(shù)量,Sj表示隱私保護(hù)類關(guān)鍵詞在文本語句片段的數(shù)量,Sij表示兩類關(guān)鍵詞共現(xiàn)在文本語句片段的數(shù)量。

(3)計(jì)算主題協(xié)同度。定義主題協(xié)同度為XTD,C1為數(shù)據(jù)開放主題分布頻次率,C2為隱私保護(hù)主題分布頻次率,兩者間共現(xiàn)關(guān)系為Eij,主題協(xié)同度如公式(5)所示,將三者加權(quán)計(jì)算,得出主題協(xié)同度數(shù)值。

通過“數(shù)據(jù)+開放”“公開+數(shù)據(jù)”“政府+數(shù)據(jù)”“地名+數(shù)據(jù)”等關(guān)鍵詞進(jìn)行搜索,參考復(fù)旦大學(xué)數(shù)字與移動治理實(shí)驗(yàn)室公布的《2019年中國地方政府?dāng)?shù)據(jù)開放報(bào)告》中的條件進(jìn)行篩選,篩選符合以下特征的樣本:(1)gov.cn作為政府官方認(rèn)可平臺的依據(jù),平臺域名中需出現(xiàn);(2)平臺所代表的地方政府的行政級別為省級、副省級及地級;(3)平臺形式是“集中專有式”或“集中嵌入式”;(4)平臺上有可通過下載或接口形式獲取的電子格式的數(shù)據(jù)集?;谏鲜鲈瓌t,選定了82個(gè)政府?dāng)?shù)據(jù)開放平臺,在此基礎(chǔ)上,剔除筆者調(diào)查期間無法訪問的或可以訪問但沒有發(fā)布相關(guān)隱私政策的樣本(調(diào)查截止時(shí)間2020年5月6日),最終確定66個(gè)地方政府?dāng)?shù)據(jù)開放平臺的隱私政策作為研究對象,涉及政策文本的語句片段4,391條。
3.2.1 從行政層級分析
按行政層級對樣本平臺進(jìn)行分類統(tǒng)計(jì),其中:平臺所代表的省級行政區(qū)(港澳臺除外)12個(gè),占省級地方政府總數(shù)的38.71%;8個(gè)副省級城市,占總數(shù)的53.33%;46個(gè)地級城市開放平臺,占總數(shù)的14.47%,詳見圖2。

圖2 樣本平臺行政層級分布圖
3.2.2 從分布區(qū)域分析
按地區(qū)常規(guī)地理劃分標(biāo)準(zhǔn),將樣本平臺所屬地區(qū)劃分為東北、華北、西北、中南、華東、華南和西南7個(gè)區(qū)域。樣本分布較廣泛,具有代表性。政府?dāng)?shù)據(jù)開放平臺以區(qū)域劃分:東北1個(gè),華北2個(gè),西北1個(gè),中南3個(gè),華東32個(gè),華南18個(gè),西南9個(gè)。華東華南的沿海省份山東廣東、西南的貴州3個(gè)省所轄的各地市均有政府?dāng)?shù)據(jù)開放平臺上線運(yùn)營,其余地區(qū)上線運(yùn)營的數(shù)據(jù)開放平臺較少,區(qū)域分布差異較為明顯。
3.2.3 從標(biāo)準(zhǔn)規(guī)范建設(shè)分析
66個(gè)樣本平臺中,僅廣東、山東專門針對數(shù)據(jù)開放制定地方標(biāo)準(zhǔn),其中山東制定的數(shù)據(jù)開放地方標(biāo)準(zhǔn)對各級政務(wù)部門的數(shù)據(jù)管理如數(shù)據(jù)開放、數(shù)據(jù)脫敏等以及數(shù)據(jù)開放的應(yīng)用和服務(wù)如數(shù)據(jù)開放程度的評價(jià)工作均有規(guī)定。貴州在《政府?dāng)?shù)據(jù)分類分級指南(試行)》中明確對政府?dāng)?shù)據(jù)進(jìn)行分級分類正確利用的同時(shí),對數(shù)據(jù)資源的開放和共享也有較多涉及[3]。其下轄城市的政府?dāng)?shù)據(jù)開放平臺均發(fā)布有較完備的隱私政策(聲明);上海市經(jīng)濟(jì)和信息化委員會制定的《上海市公共數(shù)據(jù)資源開放年度工作計(jì)劃》,是專門針對政府?dāng)?shù)據(jù)開放的年度工作計(jì)劃。大多數(shù)樣本平臺在標(biāo)準(zhǔn)規(guī)范建設(shè)方面還有較大的提升空間。
3.3.1 主題分布:頻次率整體偏低,數(shù)據(jù)開放主題數(shù)值大概率高于隱私保護(hù)主題數(shù)值
利用公式(1)和公式(2)分別計(jì)算出政府?dāng)?shù)據(jù)開放平臺隱私政策主題數(shù)值的分布情況(見圖3)。主題分布頻次率是主題關(guān)鍵詞與政策文本總?cè)萘康谋嚷?,反映的是主題關(guān)鍵詞在政策文本中出現(xiàn)的相對頻次,是衡量主題間協(xié)同度的重要指標(biāo)。實(shí)證結(jié)果表明:數(shù)據(jù)開放和隱私保護(hù)兩類主題的分布頻次數(shù)值體均偏低,從數(shù)據(jù)呈現(xiàn)特點(diǎn)反映政策文本的主題不突出。具體分類別看,數(shù)據(jù)開放主題類中,最高值0.09457,35個(gè)分布0.02~0.1,占比53.03%;分布0~0.02的政策文本15個(gè),占比22.73%;數(shù)值為零的有16個(gè),占比24.24%。隱私保護(hù)主題類,最高0.03456,25個(gè)分布在0.01~0.035,占比37.88%,數(shù)值分布在0~0.01的平臺30個(gè),占比45.45%,數(shù)值為零分的11個(gè),占比16.67%。如圖3所示,大多數(shù)點(diǎn)集中在圖形底部,說明絕大多數(shù)政府?dāng)?shù)據(jù)開放平臺隱私政策的隱私保護(hù)主題數(shù)值小,絕大多數(shù)平臺隱私政策的數(shù)據(jù)開放主題分布值大概率高于隱私保護(hù)主題數(shù)值。66個(gè)平臺中,46個(gè)數(shù)據(jù)開放分布數(shù)值高于隱私保護(hù)數(shù)值,占比69.70%;其中36個(gè)平臺的數(shù)據(jù)開放主題分布數(shù)值是隱私保護(hù)數(shù)值3倍以上,也從數(shù)據(jù)上印證我國政府?dāng)?shù)據(jù)平臺開放實(shí)踐中的現(xiàn)實(shí)悖論:更重視數(shù)據(jù)開放,對隱私保護(hù)的關(guān)注明顯滯后。

圖3 主題間分布散點(diǎn)示意圖
從單一主題的視角具體分城市分析,在12個(gè)省級樣本城市中,貴州[28]、山東[29]兩個(gè)政府?dāng)?shù)據(jù)開放平臺隱私政策涉及的隱私保護(hù)主題分布值數(shù)值較大,分別為0.03456和0.00959。通過查看以上2個(gè)平臺的政策文本發(fā)現(xiàn),貴州的政府?dāng)?shù)據(jù)開放平臺發(fā)布有專門的隱私政策,政策文本從信息收集及保存、Cookies使用、信息安全、信息使用、限制利用原則等方面對用戶的隱私保護(hù)進(jìn)行較為明確規(guī)范和說明,特別強(qiáng)調(diào)了平臺要采用技術(shù)措施和管理制度對個(gè)人信息進(jìn)行保護(hù)。山東省公共數(shù)據(jù)開放網(wǎng)將隱私保護(hù)相關(guān)條款嵌入到網(wǎng)站聲明中,相較于其他地方的隱私政策,特別增加有“山東公共數(shù)據(jù)開放網(wǎng)的權(quán)利與義務(wù)”一章對平臺內(nèi)容版權(quán)、內(nèi)容審核等進(jìn)行了規(guī)范。
在8個(gè)副省級樣本城市中,成都[30]公共數(shù)據(jù)開放平臺隱私政策涉及的數(shù)據(jù)開放類主題分布值最大,數(shù)值為0.09457;武漢[31]的數(shù)據(jù)開放主題分布數(shù)值緊隨其后,為0.06130。以上兩個(gè)城市的開放平臺隱私政策均為平臺聲明(網(wǎng)站聲明),從提供服務(wù)、用戶的權(quán)利和義務(wù)等方面對數(shù)據(jù)開放方面的情況進(jìn)行規(guī)范和申明。其他城市如哈爾濱、寧波只簡單提及尊重并保護(hù)所有網(wǎng)站用戶的個(gè)人隱私權(quán),沒有給出具體保護(hù)措施,內(nèi)容較為空洞,在主題聚類時(shí)難以聚類到隱私保護(hù)類的關(guān)鍵主題詞,因而其政策隱私保護(hù)主題數(shù)值相對較低。從數(shù)值上來看,其余的副省級城市平臺政策的特點(diǎn)不突出。
在46個(gè)地級市中,貴州下轄的遵義、六盤水,山東下轄的臨沂、菏澤等隱私政策的內(nèi)容較規(guī)范、內(nèi)容相似度高,因而這些平臺政策在隱私保護(hù)類主題中排名相對靠前、數(shù)值分布較均勻。廣東下轄的地級市平臺在數(shù)據(jù)開放類主題中數(shù)值較高,如佛山和珠海的數(shù)值排名靠前。南通、泰州、宣城、雅安等7個(gè)城市平臺隱私政策的數(shù)據(jù)開放和隱私保護(hù)兩類主題的分布數(shù)值均為零,究其原因是數(shù)據(jù)開放平臺均屬于“集中嵌入式”,即政府開放數(shù)據(jù)統(tǒng)一匯集于一個(gè)欄目版塊,通過將該版塊嵌入在政府門戶網(wǎng)站或政務(wù)服務(wù)網(wǎng)站實(shí)現(xiàn)政府?dāng)?shù)據(jù)開放,其網(wǎng)站聲明或管理規(guī)范的內(nèi)容均很短,內(nèi)容往往針對政府門戶網(wǎng)站所有的子欄目,而不是專門針對政府?dāng)?shù)據(jù)開放欄目,因而政策文本內(nèi)容較為籠統(tǒng)、主題較為分散。
3.3.2 主題共現(xiàn)強(qiáng)度:整體較差,近五成平臺為零分
利用公式(4)對隱私政策文本中數(shù)據(jù)開放和隱私保護(hù)的主題共現(xiàn)強(qiáng)度進(jìn)行計(jì)算(見圖4)。主題共現(xiàn)強(qiáng)度是通過計(jì)算主題關(guān)鍵詞在語句片段中共現(xiàn)的相對比率,是判斷主題在語句片段中的緊密結(jié)合程度和衡量主題協(xié)同度重要的指標(biāo)之一。實(shí)證結(jié)果表明:政府?dāng)?shù)據(jù)開放平臺隱私保護(hù)政策中的數(shù)據(jù)開放和隱私保護(hù)兩主題的共現(xiàn)情況整體較弱。66個(gè)樣本平臺中有31個(gè)平臺的共現(xiàn)強(qiáng)度數(shù)值為零,占比接近五成;有27個(gè)平臺的分值分布在0~0.02低分段區(qū)間內(nèi),占比為40.91%;0.02~0.03分段有6個(gè)平臺,占比為9.09%;超過0.03即高分段,僅有成都、貴陽兩個(gè)平臺;高比例的政府?dāng)?shù)據(jù)開放平臺主題共現(xiàn)強(qiáng)度數(shù)值分較低,表明大多數(shù)平臺的政策文本沒有體現(xiàn)出數(shù)據(jù)開放和隱私保護(hù)間的主題共現(xiàn)關(guān)系,政策文本主題間共現(xiàn)情況較差。

圖4 數(shù)據(jù)開放與隱私保護(hù)共現(xiàn)強(qiáng)度散點(diǎn)圖
具體分城市來看,貴陽[32]、成都[30]的主題共現(xiàn)強(qiáng)度得分較高,分別為0.08889和0.05926,通過查看以上兩個(gè)高分段平臺的隱私政策文本發(fā)現(xiàn),其在數(shù)據(jù)開放共享和隱私保護(hù)兩個(gè)方面予以同等重視并強(qiáng)調(diào),政策文本具體在提供服務(wù)、授權(quán)聲明、用戶義務(wù)、平臺保護(hù)、隱私保護(hù)等6個(gè)方面從數(shù)據(jù)開放和隱私保護(hù)兩個(gè)維度做出了較為詳盡的規(guī)范和要求,如平臺保護(hù)章節(jié)中,詳細(xì)列舉了平臺保護(hù)的內(nèi)容范圍,以及明確平臺內(nèi)容受法律保護(hù)。強(qiáng)調(diào)了從技術(shù)層面對平臺內(nèi)容的保護(hù)等。貴陽的政策文本在第二章“授權(quán)聲明”中要求:“…用戶…,不受歧視地享有免費(fèi)訪問、獲取、使用、傳播分享和利用及再利用數(shù)據(jù)資源的權(quán)利,但不得有償轉(zhuǎn)讓在本網(wǎng)站中獲取的各種數(shù)據(jù)資源?!睌?shù)據(jù)開放和隱私保護(hù)兩類主題關(guān)鍵詞在同一文本語句片段中共現(xiàn),類似的情況在政策文本中出現(xiàn)較多,因此從數(shù)值呈現(xiàn)和內(nèi)容分析上來看兩個(gè)主題有著較強(qiáng)的關(guān)聯(lián)性。主題共現(xiàn)度排名第3的是上海[33],上海是首個(gè)制定政府?dāng)?shù)據(jù)開放法規(guī)的城市,先后發(fā)布《上海市政府信息公開規(guī)定》《2014年度上海市政府?dāng)?shù)據(jù)資源向社會開放工作計(jì)劃》《上海推進(jìn)大數(shù)據(jù)研究與發(fā)展三年行動計(jì)劃》,有較完善的數(shù)據(jù)開放和隱私保護(hù)政策體系,體現(xiàn)在開放平臺的隱私政策上,即是隱私政策內(nèi)容較全面,政策文本從接受條款、網(wǎng)站保護(hù)、收費(fèi)政策等6個(gè)方面對數(shù)據(jù)開放和隱私保護(hù)做了較為全面的規(guī)范和說明,比較詳盡地規(guī)范了用戶在使用平臺數(shù)據(jù)時(shí)必須遵循的原則,強(qiáng)調(diào)從技術(shù)上加強(qiáng)隱私保護(hù),還對平臺上的外部鏈接的例外情況進(jìn)行了必要說明。內(nèi)容分析上來看兩個(gè)主題的關(guān)系相對也較為均衡,其計(jì)算主題共現(xiàn)強(qiáng)度數(shù)值為0.02778,從數(shù)值呈現(xiàn)和內(nèi)容分析上來看有著較強(qiáng)的關(guān)聯(lián)性。
反觀低分段平臺的隱私政策文本,尤其是得分為零的平臺,如海南等平臺政策文本,其網(wǎng)站說明往往很簡短,政策文本僅僅針對網(wǎng)站開放的簡要說明,內(nèi)容空洞,僅僅泛泛而談地提及數(shù)據(jù)資源的特點(diǎn)、來源、重要性以及開放數(shù)據(jù)資源的目的,通篇幾乎沒有關(guān)注隱私保護(hù),更談不上把數(shù)據(jù)開放和隱私保護(hù)放在同等的位置予以重視強(qiáng)調(diào),無論是從數(shù)據(jù)呈現(xiàn)還是具體內(nèi)容分析看,文本兩個(gè)主題的共現(xiàn)強(qiáng)度的關(guān)聯(lián)性微弱。還有個(gè)別數(shù)據(jù)開放平臺如陜西的網(wǎng)站說明就只有是“免責(zé)聲明”,側(cè)重于規(guī)避平臺的自身責(zé)任風(fēng)險(xiǎn),并非主動地關(guān)注如何在數(shù)據(jù)開放和隱私保護(hù)之間尋求協(xié)同與平衡。這也從一個(gè)側(cè)面反映出部分地方政府?dāng)?shù)據(jù)開放平臺在數(shù)據(jù)開放的同時(shí)隱私保護(hù)意識薄弱,制定隱私保護(hù)政策時(shí)沒有把將數(shù)據(jù)開放和隱私保護(hù)在政策中予以同等重視,導(dǎo)致兩者的共現(xiàn)主題強(qiáng)度數(shù)值較低。
3.3.3 主題協(xié)同度:數(shù)值整體偏低,貴州及廣東、山東沿海城市群相對較好
根據(jù)公式(5)分別逐一算出樣本平臺隱私政策主題協(xié)同度的數(shù)值,主題協(xié)同度與主題共現(xiàn)強(qiáng)度數(shù)值呈現(xiàn)的規(guī)律類似。實(shí)證結(jié)果表明,我國政府開放平臺隱私政策數(shù)據(jù)開放和隱私保護(hù)的協(xié)同度數(shù)值較低,主題間的協(xié)同度關(guān)系較弱。如圖5所示(橫軸為主體協(xié)同度的數(shù)值分布區(qū)間,縱軸為主體協(xié)同度的數(shù)值分布區(qū)間所對應(yīng)的平臺數(shù)量),66個(gè)樣本平臺的協(xié)同度數(shù)值整體偏低。其中,有32個(gè)平臺協(xié)同度數(shù)值為零,占到考察樣本的48.48%,占比接近五成;有26個(gè)平臺的分值分布在0~0.02區(qū)間,占比為39.39%;0.02~0.03分段僅有6個(gè)平臺,占比為9.09%;超過0.03的平臺僅有成都、貴陽兩個(gè)。

圖5 主題間協(xié)同度數(shù)值區(qū)間分布圖
分城市看,貴州及其所轄大部分地級市,主題分布數(shù)值、主題共現(xiàn)強(qiáng)度、主題協(xié)同度數(shù)值均排名相對靠前,究其原因:貴州省作為我國云計(jì)算及大數(shù)據(jù)發(fā)展戰(zhàn)略布局中的重要省份,2008-2018年,全省出臺近70個(gè)數(shù)據(jù)政策,形成較完善的數(shù)據(jù)開放和隱私保護(hù)政策群;轄內(nèi)省、市、縣(區(qū))各級政府均有較強(qiáng)的政策執(zhí)行力,完善的數(shù)據(jù)政策體系和較好的政策執(zhí)行力,使得數(shù)據(jù)政策在貴州省的各級政府中落實(shí)較好。這些得天獨(dú)厚的優(yōu)勢,促使了貴州省的大數(shù)據(jù)產(chǎn)業(yè)快速發(fā)展,目前貴州省相繼有國家大數(shù)據(jù)中心及國內(nèi)眾多優(yōu)秀互聯(lián)網(wǎng)企業(yè)的數(shù)據(jù)中心落戶,這在一定程度上強(qiáng)化了貴州各級政府?dāng)?shù)據(jù)開放和隱私保護(hù)的協(xié)同意識。具體體現(xiàn)在其開放平臺的隱私政策中,就是數(shù)據(jù)開放和隱私保護(hù)均有關(guān)注,兩主題間的協(xié)同關(guān)系較好。成都市近年來致力于促進(jìn)大數(shù)據(jù)產(chǎn)業(yè)發(fā)展,數(shù)據(jù)開放進(jìn)步顯著。在《2019年中國地方政府?dāng)?shù)據(jù)開放報(bào)告》中,成都市綜合表現(xiàn)最為優(yōu)異,在2019年的“開放數(shù)林指數(shù)”評比中獲得“新數(shù)輩出”獎。在有序推動數(shù)據(jù)開放的同時(shí),成都同樣重視隱私保護(hù),其政府?dāng)?shù)據(jù)開放平臺發(fā)布的網(wǎng)站聲明中含有系列隱私保護(hù)條款內(nèi)容,對平臺的隱私保護(hù)做了較為詳盡的說明??梢?,西南地區(qū)的城市平臺政策協(xié)同度較好。
廣東、山東下轄的城市群數(shù)據(jù)開放和隱私保護(hù)的協(xié)同度數(shù)值排名相對靠前、分值較為接近,直接原因是下轄城市群的政府?dāng)?shù)據(jù)開放平臺隱私政策內(nèi)容較為規(guī)范、具有高度相似性。廣東、山東作為數(shù)據(jù)開放大省,所轄的地市全部上線政府?dāng)?shù)據(jù)開放平臺,在數(shù)據(jù)開放增質(zhì)提速的同時(shí),兩省還對政策規(guī)范體系的建設(shè)給予了相當(dāng)重視,在制度層面形成了一套較為完備和富有實(shí)效的數(shù)據(jù)政策體系,搭建良性互動的數(shù)據(jù)政策生態(tài)系統(tǒng),廣東、山東是全國僅有的專門針對數(shù)據(jù)開放制定地方標(biāo)準(zhǔn)的兩個(gè)省份。其中,廣東出臺《電子政務(wù)數(shù)據(jù)資源開放數(shù)據(jù)技術(shù)規(guī)范》,對政府開放數(shù)據(jù)的分類組織方式、元數(shù)據(jù)、數(shù)據(jù)格式等進(jìn)行了規(guī)范,對開放數(shù)據(jù)管理的角色與職責(zé)、管理過程、開放內(nèi)容、數(shù)據(jù)開放各環(huán)節(jié)的管理要求等方面進(jìn)行了詳盡說明。廣東、山東轄內(nèi)城市群形成了良好的數(shù)據(jù)開放利用生態(tài)系統(tǒng),體現(xiàn)在政府?dāng)?shù)據(jù)開放平臺的隱私政策主題協(xié)同度上,即數(shù)據(jù)開放和隱私保護(hù)的主題協(xié)同度較好。山東在2019年的“開放數(shù)林指數(shù)”評比中獲得“數(shù)開叢生”獎;深圳市獲得“數(shù)飛猛進(jìn)”獎。
本文基于政策文本計(jì)算的方法,對我國政府?dāng)?shù)據(jù)開放平臺隱私政策的數(shù)據(jù)開放和隱私保護(hù)主題關(guān)系協(xié)同度進(jìn)行研究,進(jìn)而探討目前我國政府?dāng)?shù)據(jù)開放平臺隱私政策文本數(shù)據(jù)開放和隱私保護(hù)主題協(xié)調(diào)的現(xiàn)狀及存在的主要問題。實(shí)證研究發(fā)現(xiàn):(1)主題分布數(shù)值整體偏低,數(shù)據(jù)開放主題數(shù)值大概率高于隱私保護(hù)主題數(shù)值。(2)主題共現(xiàn)情況整體較差,近五成平臺的政策主題共現(xiàn)情況得分為零。(3)政府?dāng)?shù)據(jù)開放平臺隱私政策數(shù)據(jù)開放和隱私保護(hù)主題協(xié)同數(shù)值整體偏低,大部分平臺政策的主題協(xié)同度關(guān)系較弱;貴州及廣東、山東沿海城市群相對較好。為確保在健康有序推進(jìn)政府?dāng)?shù)據(jù)開放的同時(shí)更好地開展隱私保護(hù),本文提出三點(diǎn)建議。
實(shí)證分析發(fā)現(xiàn):66個(gè)樣本中近一半平臺隱私政策的主題協(xié)同數(shù)值為零,低分段和高分段平臺政策差異明顯,各平臺的隱私政策質(zhì)量良莠不齊。眾所周知,政府開放平臺的隱私政策作為微觀層面的執(zhí)行政策,是對宏觀數(shù)據(jù)政策提出目標(biāo)的具體落實(shí),其質(zhì)量好壞和協(xié)同度離不開整個(gè)數(shù)據(jù)政策網(wǎng)絡(luò)體系和政策集群所形成的政策生態(tài)環(huán)境。根據(jù)萬維網(wǎng)基金會和開放數(shù)據(jù)研究所聯(lián)合發(fā)布的第4版《開放數(shù)據(jù)晴雨表》報(bào)告,在世界范圍內(nèi)我國的開放政府?dāng)?shù)據(jù)評價(jià)排名第71位,其中在準(zhǔn)備度評價(jià)指標(biāo)中,其子評價(jià)指標(biāo)政府政策中的數(shù)據(jù)開放政策分值非常低[34],這從一個(gè)側(cè)面說明我國目前數(shù)據(jù)政策集群效應(yīng)不明顯,也與本次實(shí)證反映出的多數(shù)平臺隱私政策協(xié)同度不高的現(xiàn)象相吻合。因此應(yīng)完善數(shù)據(jù)政策網(wǎng)絡(luò)體系,提升數(shù)據(jù)政策集群效應(yīng)。應(yīng)加強(qiáng)數(shù)據(jù)政策供給,重點(diǎn)圍繞《促進(jìn)大數(shù)據(jù)發(fā)展行動綱要》《大數(shù)據(jù)產(chǎn)業(yè)發(fā)展規(guī)劃(2016-2020年)》《國家信息化發(fā)展戰(zhàn)略綱要》等我國關(guān)于大數(shù)據(jù)的戰(zhàn)略性頂層設(shè)計(jì),健全數(shù)據(jù)管理政策群體系,為地方各級政府提供框架性、原則性的指導(dǎo);應(yīng)當(dāng)加快制定出臺隱私保護(hù)基本法——《個(gè)人隱私保護(hù)法》[35]、建立遵循國際標(biāo)準(zhǔn)的元數(shù)據(jù)[36]等。地方政府在遵循中央政府頂層設(shè)計(jì)的前提下,結(jié)合自身實(shí)際情況,制定出更具實(shí)踐意義的細(xì)化政策,逐步豐富完善數(shù)據(jù)政策網(wǎng)絡(luò)體系的內(nèi)容,形成更加完善的政策體系,為數(shù)據(jù)開放和隱私保護(hù)提供高質(zhì)量和高協(xié)同度的政策儲備。
主題分布值是計(jì)算協(xié)同度的一個(gè)重要指標(biāo),根據(jù)文本計(jì)算結(jié)果發(fā)現(xiàn),有46個(gè)樣本平臺的數(shù)據(jù)開放主題分布值高于隱私保護(hù)主題值,其中,有78.26%的平臺數(shù)據(jù)開放主題分布數(shù)值是隱私保護(hù)數(shù)值的3倍以上,數(shù)據(jù)開放主題數(shù)值遠(yuǎn)高于隱私保護(hù)主題數(shù)值,反映出目前我國數(shù)據(jù)開放實(shí)踐中的一個(gè)現(xiàn)實(shí)悖論是更重視數(shù)據(jù)開放,對隱私保護(hù)的關(guān)注卻明顯滯后。因此應(yīng)加強(qiáng)隱私保護(hù),為數(shù)據(jù)開放的良好發(fā)展創(chuàng)造更為有利的環(huán)境??蓪?shí)施應(yīng)用隱私影響評估(PIA)這一政策工具,作為隱私風(fēng)險(xiǎn)管理的重要組成部分,隱私影響評估是指系統(tǒng)評估特定的數(shù)據(jù)項(xiàng)目,以確定該項(xiàng)目的隱私相關(guān)風(fēng)險(xiǎn),并針對性地制定管理、消除或最小化隱私風(fēng)險(xiǎn)的解決方案[37]。可通過制定以隱私影響評估指南為核心的隱私影響評估政策體系,設(shè)置專門的隱私影響評估組織或機(jī)構(gòu)以督查隱私影響評估實(shí)踐,建立依托隱私影響評估工具的隱私風(fēng)險(xiǎn)管理體系等措施,將隱私影響評估視為隱私風(fēng)險(xiǎn)管理的有效工具,全面治理隱私安全風(fēng)險(xiǎn)[38]。同時(shí)提升公眾和政府相關(guān)部門的隱私保護(hù)意識,我國公民的隱私意識還處于蘇醒階段,特別是在公共信息資源領(lǐng)域,個(gè)人隱私保護(hù)意識相對淡薄[39]。政府主管部門可以通過加強(qiáng)隱私保護(hù)宣傳、技術(shù)設(shè)定等多重舉措提升公眾的隱私保護(hù)和隱私安全意識,通過加強(qiáng)教育培訓(xùn)、將數(shù)據(jù)開放和隱私保護(hù)工作納入干部教育培訓(xùn)體系和職業(yè)素養(yǎng)考核體系等方式增強(qiáng)政府工作人員的隱私保護(hù)意識,從而為政府?dāng)?shù)據(jù)開放的良好發(fā)展創(chuàng)造更為有利的環(huán)境。
從前文的文本計(jì)算結(jié)果可以發(fā)現(xiàn):我國大多數(shù)開放平臺隱私政策的主題協(xié)同數(shù)值整體偏低,有32個(gè)平臺協(xié)同度得分為零,高分段平臺僅2個(gè)。按照協(xié)同論的觀點(diǎn),協(xié)同是指內(nèi)部元素或主體通過互動、沖突或合作,共同努力以實(shí)現(xiàn)既定目標(biāo)或協(xié)定目標(biāo)的過程、作用方式和程序[40]。在政府?dāng)?shù)據(jù)開放實(shí)踐中尋求數(shù)據(jù)開放和隱私保護(hù)的平衡,除了需要內(nèi)容要素協(xié)同的政策文本提供支撐之外,還需要主體之間的協(xié)同。政府?dāng)?shù)據(jù)開放實(shí)踐中的隱私保護(hù)涉及多個(gè)利益相關(guān)者。多元協(xié)作機(jī)制是指政府內(nèi)部不同部門之間,以及政府機(jī)構(gòu)與非政府組織、新聞媒體、公民個(gè)體等其他主體之間通過相互合作、集體行動的方式,共同開展和實(shí)施政府?dāng)?shù)據(jù)開放隱私保護(hù)行動。建立多元協(xié)作機(jī)制在西方國家的政府?dāng)?shù)據(jù)開放隱私保護(hù)實(shí)踐中被證明具有重要價(jià)值與意義。構(gòu)建多元協(xié)作機(jī)制,應(yīng)統(tǒng)籌考慮政府?dāng)?shù)據(jù)開放過程中涉及的各類利益相關(guān)主體,倡導(dǎo)、鼓勵(lì)和支持等其他主體積極參與到政府?dāng)?shù)據(jù)開放隱私保護(hù)中,促進(jìn)利益相關(guān)方在政府?dāng)?shù)據(jù)開放隱私保護(hù)中的協(xié)作參與作用[35]。多元協(xié)作機(jī)制的構(gòu)建可以為政府部門之間或政府與公眾之間提供有效的交流渠道,進(jìn)而促使政策實(shí)施中形成有效合力和協(xié)同,實(shí)現(xiàn)整體效應(yīng)大于各組成部分簡單相加之和的效果,提升政策的協(xié)同效力和治理效能,達(dá)到政策治理整體效果的“帕累托最優(yōu)”狀態(tài)。