陳萬球++石惠絮
摘 要:實現城市善治目標,必須以充分掌握治理對象各種信息為前提。大數據技術正好與城市治理對信息的巨大需求不期而遇。大數據技術使城市善治真正成為可能:它不僅模塑治理主體思維,提升城市治理能力,而且將變革城市治理模式,塑造城市的未來。城市治理過程中會遭遇種種數據風險。這種風險存在于數據的收集、儲存、分析和使用的全過程之中,形成所謂的“數據失真”、“數據風險”和“數據依賴”等數據異化現象。先進技術并不會自動帶來城市的善治,只有未雨綢繆,才能將城市治理中可能出現的風險降到最低。回歸理性對待數據的理念,建立數據使用規范,確立行為邊界是數據治理的不二選擇。
關鍵詞:大數據;城市治理;數據異化;數據治理
作者簡介:陳萬球,長沙理工大學馬克思主義學院教授,博士(湖南 長沙 410004)
石惠絮,長沙理工大學馬克思主義學院研究生(湖南 長沙 410004)
一、大數據時代城市善治何以可能
城市善治(Good Governance)是人們對城市的經濟、政治、文化和社會事務合理有效進行組織與協調、規范與監督,從而實現公共利益最大化的過程。城市善治目標的實現,是以充分掌握治理對象各種信息為前提。而大數據技術正好與城市對龐大復雜的社會管理信息的客觀需求不期而遇。大數據技術使城市善治成為可能:它不僅能模塑治理主體思維,提升城市治理能力,而且將變革城市治理模式,塑造城市的未來。
從主體看,大數據技術將模塑治理主體思維。大數據對傳統的思維方式帶來巨大挑戰,尤其在城市公共服務領域,它有效集成信息資源的能力,將會為政府管理理念和治理模式的轉變,提供強大的技術支撐。舍恩伯格曾經敏銳地指出:在大數據時代,人們處理數據的思維方式將會發生重大的轉變,即要全體而不要抽樣;要效率而不要絕對精確;要相關而不要因果。事實上,大數據技術帶來思維方式的深刻轉變遠不止于此。在大數據時代,某些特定情形下,人們依然使用樣本分析法,雖然這不是主要的數據分析方式。隨著數據采集、數據存儲、數據管理和數據分析與挖掘技術進展,可以更加便捷地獲得有關治理對象的所有數據,與此相適應,城市治理者的思維方式也將會從樣本思維轉向全局思維,從而更加全面系統地掌握總體狀況,一句話,大數據技術將使治理主體從局部思維走向全局思維。此其一。其二,從精確思維走向容錯思維。在小數據時代,由于樣本信息量小,為避免出現由部分推及整體時的“南轅北轍”現象,必須確保數據精確化。而在大數據時代,大量的半結構化、非結構化的數據集合與數據分析,一方面提升了城市治理者獲取知識和信息的能力,另一方面無疑會對傳統的精確思維帶來了極大挑戰。當擁有巨量即時數據時,絕對精準不再是主要目標,適當忽略微觀上的精確度,容許細枝末節上的錯誤,反而在宏觀上可以擁有更好的洞察力和知識。再者,從因果思維轉向相關思維。在相關關系分析基礎上的預測正是大數據的核心議題。在大數據時代,人們的思維方式將從因果思維轉向相關思維。通過大數據技術挖掘出事物之間線性和非線性的相關關系,可以注意到以前不曾注意的聯系,掌握以前無法理解和掌握的復雜動態,從而更好地捕捉現在和預測未來。
從過程看,大數據技術將極大地提升城市治理能力。城市是地球表面發展著的區域實體,手工業時代城市管理對數據信息的需求十分薄弱。工業革命以來,城市的迅速發展對數據信息的需求開始大幅度增長。“集中”是城市首要特質。“城市本身表明了人口、生產工具、資本、享樂和需求的集中;而在鄉村里看到的卻是完全相反的情況:孤立和分散。”{1}城市空間密集著齊全的人類社會生活物質產品和精神產品。集中導致城市的另外一個本質特征——復雜性。城市是一個開放的復雜巨系統,其復雜性本質上源于城市中人的復雜性和城市結構的復雜性。這種復雜性造就了城市系統中的確定與不確定、規則與不規則、穩定與不穩定、必然與偶然的統一。20世紀以來,特大城市、大都市區、都市帶和都市網的出現,更是加劇了城市的這種復雜性,使得城市管理對數據信息的要求愈來愈高,對數據依賴也愈來愈強。而大數據技術借助海量數據最大限度解決城市治理主體的主觀世界與城市復雜性客觀世界之間的信息不對稱性難題,使人們對城市的認識能力和水平得到空前提升。得數據者得天下,給我提供一些數據,我就能做一些改變;給我提供所有數據,我就能拯救世界。這是一個令人震驚得不知所措的變化:一方面,通過海量、動態、多樣的數據有效集成為有價值的信息資源,預測事件發生,使治理體系和治理能力現代化成為可能。舍恩伯格在《大數據時代》中指出:谷歌可以成功地預測甲型H1N1流感爆發,與官方數據相比,谷歌成了為一個更有效、更及時的風向指示標。“這是當今社會所獨有的一種新型能力:以一種前所未有的方式,通過對海量數據進行分析,獲得有巨大價值的產品和服務,或深刻洞見。”{2}另一方面,大數據技術為推動城市治理決策精細化和科學化帶來機遇。針對目前我國城市治理領域普遍存在的服務理念滯后、決策機制不夠科學、部門協作亟須加強、工作方式待改進與工作效率求提升等問題,大數據技術從認識、理論、方法、實踐和效果評估等方面都能給人以啟發。大數據技術通過對海量數據的快速收集與挖掘、及時研判與共享,成為支持城市治理科學決策和準確預判的有力手段,為社會轉型期的城市治理創新帶來了機遇。譬如,利用大數據可以還原社會危機發生的過程,以數據和事實呈現真相;利用大數據對政府業務數據和公眾行為數據進行分析,實現數據的無序向有序、隱性向顯性、靜態向動態轉化,政府可以把低價值度的數據轉變成政府治理能力,從而實現“數據”治理。
從結果看,大數據技術創新城市治理的未來,智慧城市將成為現實。智慧城市是一種虛擬化的城市,是對城市的一種全新的詮釋。智慧城市與大數據技術的相關性在于:大數據技術是生成智慧城市的基礎和關鍵技術,智慧城市的衡量指標由大數據來體現;智慧城市是大數據技術發展的必然產物。智慧城市相對于以往的數字城市而言,其顯著區別在于要對所獲取的巨量數據和海量數據進行分析處理,從而獲取保障智慧城市運行發展的有效信息。智慧城市要真正體現人類社會智慧化的管理目標,必然要對海量數據進行充分的挖掘、分析與利用。所以,實現對巨量信息的智能化處理,前提是引入大數據處理技術,整合分析跨區域、跨部門、跨行業的海量數據,并將特定的信息應用于特定行業和解決方案之中。可以說,智慧城市的實現過程就是對數據采集、分析、存儲和利用的過程。大數據技術像血液一樣遍布智慧政務、智慧交通、智慧醫療、智慧生活等智慧城市的各個應用系統之中,將使城市管理從“經驗治理”轉向“科學治理”。
二、城市治理中的數據異化分析
舍恩伯格警告我們:“大數據會是我們合理決策過程中的有力武器;倘若運用不當,它可能會變成權貴用來鎮壓民眾的工具,輕則傷害顧客和員工的利益,重則損害公民的人身安全。我們所冒的風險比想象中的還要大。”{3}在運用大數據技術進行城市治理過程中,會遭遇種種數據風險。風險與利益成正比,數據愈大,利益愈大,而數據風險愈大。這種風險存在于數據的收集、儲存、分析和使用的全過程之中,形成所謂的“數據失真”、“數據安全”和“數據依賴”等數據異化現象。
(1)“數據失真”。長期以來,人類利用局部的、片面數據來認識和改造世界,在無法獲取實時數據時甚至會純粹依賴主觀經驗和理論假設來把握未知領域,因而其認識往往是表面膚淺,甚至是錯誤和扭曲的。正如《連線》雜志主編克里斯·安德森所說:“面對大規模數據,科學家‘假設、模型、檢驗的方法變得過時了。”{4}大數據來臨使人類掌握了一種全新的技術,通過全面、完整和系統地掌控各種數據信息來探索社會發展規律成為可能。此其一。其二,海量數據可能會帶來數據失真和甚至處處是假規律的現象。許多數據都是草率生成的、令人誤解的、夸張的或者根本是錯誤的,成為不良數據。“數據量大并不意味著數據價值的增加,相反這往往意味著數據噪音的增多。……意味著信息垃圾的泛濫、”{5},“數據量的大幅增加會造成結果的不準確,一些錯誤的數據會混進數據庫”{6}。來源不同的各種信息混雜在一起會加大數據的混亂程度,導致出現“錯誤發現”的風險增加。斯坦福大學教授Trevor·Hastie用“在一堆稻草里面找一根針”來形象比喻大數據時代的數據挖掘現象。問題是很多稻草和針長得幾乎一樣,“如何找到一根針”成為數據挖掘問題上面臨的最大難題,海量數據帶來顯著性檢驗的問題,將使我們很難找到真正的關聯。在城市治理過程中,如果治理是建立在失真數據的基礎之上,就會做出錯誤判斷,甚至可能給城市治理帶來巨大的災難。
(2)“數據風險”。當下,數據安全問題是大數據技術風險另一突出表現。數據風險和隱私保護成為城市治理中數據應用亟待突破的重要問題,其緊迫性不容忽視。Gartner說過:“大數據安全是一場必要的斗爭”{7}。無論是數據抽取與集成,數據隔離與數據存儲,數據分析與數據解釋,安全問題貫穿于數據管理的始終{8}。
首先,大數據成為攻擊的目標。攻擊主要來自外部,不法人群、黑客對數據庫入侵,并盜取想要的資料,使系統無法正常使用。大數據所蘊含的價值信息非常吸引黑客的注意和攻擊,一個有力證據是近幾年來發生的互聯網用戶帳號的信息失竊被非法轉賣事件頻頻發生都與黑客有關。種種跡象表明:我國城市政府網站和重要企業都發生過遭遇境外黑客攻擊的情況。其次,隱私泄露風險日益加大。以往所采用的對隱私的侵犯的物理的、強制性的侵入方式,已經被更加先進、更加微妙的新方式所替代,由此所引發隱私風險也將更為嚴重。如果說在互聯網時代,人們的隱私會受到威脅,那么在大數據時代則更加加劇了這種威脅。互聯網的出現使得監視變得更加容易,亞馬遜監視我們的購物情況,百度監視我們的網頁瀏覽習慣。《大數據時代》指出,美國Facebook、Google、Apple、Amazon正在成為大數據的擁有者和使用者。他們利用種種手段整合碎片化的數據加以利用的趨勢已經顯露無遺。此外,技術發展增加了安全風險。隨著網絡技術的發展,服務器、防火墻等網絡設備和數據挖掘應用系統等技術的廣泛使用,提高大數據自動收集和智能分析效率,相應地也增加了安全風險。一方面,大數據技術本身的安全防護存在漏洞,在密鑰生成、存儲和管理方面的不足都可能造成數據泄漏;另一方面,攻擊的技術水平提高,攻擊者也在利用這些大數據技術進行攻擊。一旦受到惡意攻擊,系統不能正常工作甚至全部癱瘓,整個社會就可能陷入危機之中。
(3)“數據依賴”。“大數據大大威脅到了我們的隱私和自由,這都是大數據帶來的新威脅。但是與此同時,它也加劇了一個舊威脅:過于依賴數據,而數據遠遠沒有我們所想的那么可靠”{9}。數據依賴會導致數據崇拜和數據獨裁。“我們比想象中更容易受到數據的統治——讓數據以良莠參半的方式統治我們。其威脅就是,我們可能會完全受限于我們的分析結果,即使這個結果理應受到質疑。或者說我們會形成一種對數據的執迷,因而僅僅為了收集數據而收集數據,或者賦予數據根本無權得到的信任”{10}。過分癡迷數據,“認為掌握了數據,也就進一步接近了真理(上帝)”,“我們相信上帝,除了上帝,其他任何人都必須用數據說話”{11}。城市治理過程中大數據正在發揮巨大的威力,在爭分奪秒地邁向大數據時代的過程中,城市經濟、社會、文化乃至軍事等行業對數字信息的依賴程度達到了極致。這一方面帶來了城市運行的精準與效率,更便捷的服務效果;另一方面,這種對數字技術的高度依賴性卻反而使得其具有更大的易受攻擊性、毀滅性和脆弱性。在城市治理過程中,可能會出現兩種數據依賴情形:
一是過分迷信數據信息,對超越文化或常識的數據視而不見。譬如城市政府迷信某種宏觀的經濟數據,而將數據的平穩等同于經濟平穩,忽略了潛在的經濟安全威脅。當出現金融危機征兆之時,會出現非理性地引入不當的宏觀數據來掩蓋危機的可能性。
二是過分依賴歷史數據。城市政府把昔日的獲取的數據作為未來政治、經濟、文化教育決策的重要依據。當今世界變化速度之快早已讓經驗主義失去了生機和效力,過去和未來已經不可同日而語,即使是短時間內的重復,也可能產生完全不同的結果。
“在大數據時代,我們不必知道現象背后的原因,我們只要讓數據自己發聲”{12}。過分依賴數據、崇拜數據,“無數據,不決策”,會造成嚴重的風險。在大數據時代,一項決策萬不能沒有數據支撐,但僅僅依靠數據支撐來做決策卻是萬萬不能的。
大數據時代,城市治理者在獲得數據“紅利”的同時,還將面臨海量數據爆炸所帶來的其他數據異化問題。如何有效應對種種數據異化問題將是大數據時代城市治理所面臨的新挑戰。
三、擁抱大數據:數據異化的治理
大數據是一場革命,它對現有生產力和生產關系的影響是顛覆性的,這也許是目前正在進行的科技革命新的發展階段,也許甚至是下一次科技革命的前夜。龐大的人群和應用市場,復雜性高,充滿變化,使得中國成為世界上最復雜的大數據國家。伴隨大數據技術中已經和可能出現的數據異化現象,只有未雨綢繆,才能將可能出現的風險降到最低。
1. 理念:理性對待數據
城市治理中數據失真、數據安全和數據依賴等數據異化現象,本質上與人們關于技術的意識和觀念的錯位、扭曲有關,與人們對大數據技術的盲目崇拜有關。
在人與技術關系發展的歷史長河,曾經產生無數技術崇拜的先例。“技術統治思想之父”圣西門就堅信技術會使大多數社會問題得到解決。19世紀機器推動了歷史的發展,產生了對機器的崇拜;德紹爾在他的“第四王國”中已經將技術活動拔高到人類活動至尊的地位上。20世紀信息技術產生后,出現了以丹尼爾·貝爾和阿爾夫·托夫勒為代表的信息技術崇拜,強調信息技術在社會發展與轉型中的支柱性作用。歷史具有驚人的相似,大數據技術出現后,出現了對大數據的崇拜。在技術與人類社會的關系中,技術始終只是中介性的客體,因此是非目的性、非自我性的。技術是手段,人是目的。“手段之為手段,是就它侍奉目的而言的”{13}。技術雖然能表現出一定的自主性,但它始終是作為客體而存在,它將永遠無法擺脫人類影響和控制。如果因為使用大數據技術而放棄了人類的理性和智力優勢,那是人類自身的放縱和墮落。
“無數據不決策”、“數據是真理”、“數據是上帝”本質上都是城市治理中的數據崇拜,是認識上的誤區,在此,我們要旗幟鮮明地反對。不可否認,新技術的發展到大數據階段,導致生活、工作和思維的大變革,數據在國家治理、社會治理和城市治理中發揮著積極的作用,成為決策的依托,管理的法寶。但是,先進技術并不會自動帶來城市的善治,如果一項技術的改進便能消除城市治理中的所有問題,那便意味著從此以后許多城市治理主體都沒有必要存在下去,中國城市只需很低的成本就能維持高效率的運轉。人在技術面前不能失去自我,不能失去主體性和自由意志:“也許,大數據預測可以為我們打造一個更安全、更高效的社會,但是卻否定了我們之所以為人的重要組成部分——自由選擇的能力和行為責任自負。大數據成為了集體選擇的工具,但也放棄了我們的自由意志”{14}。大數據提供的不是最終答案,只是參考答案。城市治理不能陷入數據崇拜,而必須回歸技術的本位:技術是工具不是目的。可見,面對大數據技術的發展,我們既不要過度地崇拜,也不要因噎廢食、盲目排斥。
2. 制度:建立數據使用規范
數據異化現象產生的根源除了觀念上人們對于大數據技術的崇拜之外,還與制度空白與制度漏洞密切相關。數據失真是因為數據產生過程中出現無序與混亂狀態,錯誤的前提導致錯誤的結論,因而需要制度與法律的有序化和規范化;數據依賴是由于城市治理主體的對數據的使用失度或濫用數據有關,如在使用范圍上把不應該使用數據進行判斷的公務行為“用數據說話”、“用數據判斷”,在使用深度上,過分強調數據的作用。尤其是數據管理中安全問題,數據隱私問題,肆意挖掘個人私密、家庭、健康等隱私信息,騷擾電話不斷、垃圾短信泛濫、“艷照門”事件層出等,大都與法律制度不健全密切相關。數據立法不健全,直接導致我們既喪失了對數據的控制權,也無法管控這些數據會流向哪里,更無法影響獲得信息的人將會對這些數據作何處理。
大數據技術帶來的數據異化不能絕對地歸結于技術本身,應該通過完善人類自身和社會的制度來加以克服,從法律上來加以規范。美國等大數據發展較快的國家,已經制定了關于大數據保護特別是針對普通民眾隱私保護的法律法規。制定完善的大數據應用規則,明確大數據采集和使用所涉及的包括數據隱私、準確性、可獲取性、歸檔和保存等問題在內的應用規則,厘定信息使用權限和職責,確保數據依照規則規范使用,并規定相應的法律責任勢在必行。
規范數據空間的行為,離不開立法的完善,也離不開法律意識的提升。只有數據產生者、數據使用者、數據管理者都樹立法律意識、依法規范行為,同心共智、同頻共振、同力共舉,才能建設出一個健康、有序、和諧的法治化數據空間,才能真正使大數據成為城市治理的未來;只有讓法律體系、社會治理跟上時代發展,我們才能放心地在大數據時代里馳騁。
3. 行為:使用邊界問題
城市治理中數據異化治理還有一個重要問題——使用大數據的行為邊界問題。
以行為預測為例。城市治理中,常常需要對個人和組織的行為進行預測,以便采取相應的預防措施,使城市發展有序化。大數據技術使得人們行為預測成為極其方便和可能的事,因為“通過對大數據的分析,可以看到人類的行為規則是基于優先級排布的問題。每個人都有自己的任務列表,而如何按照優先級排列順序則產生了不同的影響”{15}。大數據預測的準確性越來越高,它能預測人們行為的發生,在人們犯錯之前,提前懲罰。因為預測的結果幾乎不能反駁,人們無法為自己開脫。但是,這種基于預測得出的懲罰不僅違背自由意志的原則,同時也否定人們改變選擇的可能性。
可見,隨著大數據時代的來臨,越來越多的數據被掌握在政府、互聯網企業、社區抑或個人之手。如果真的可以通過大數據進行分析和挖掘,人們的行為都有可能被掌握。那么,數據使用者的行為邊界在哪里?我們認為:大數據使用的行為邊界是:有限自由原則——使用者有使用大數據的自由,但應不以侵犯他人和組織的自由為原則。“你有揮動拳頭的自由,但應止于別人的鼻尖”。人類必須保留部分空間,允許我們按照自己的愿望進行塑造。否則,大數據會扭曲人們最本質的東西——理性思維和自由選擇。
注 釋:
①馬克思、恩格斯:《馬克思恩格斯全集》(第3卷),北京:人民出版社,1979年,第57頁。
②③⑥⑨⑩{11}{12}{14}(英)維克托·邁爾-舍恩伯格、肯尼思·庫克耶:《大數據時代》,盛楊燕,周濤譯,杭州:浙江人民出版社,2013年,第4頁,第195頁,第46頁,第208頁,第210頁,第210頁,第19頁,第207頁。
④Chris Anderson:“The End of Theory:The Data Deluge Makes the Scientic Method Obsolete”,http://www.wired.com/print/science/discoveries/magazine/16-07/pb_theory,2013年2月10日。
⑤孟小峰、慈祥:《大數據管理:概念、技術與挑戰》,《計算機研究與發展》2013年第1期。
⑦陳明奇、姜禾:《大數據時代的美國信息網絡安全新戰略分析》,《信息網絡安全》2012年第8期。
⑧張艷、胡新和:《云計算模式下的信息安全風險及其法律規制》,《自然辯證法研究》2012年第10期。
{13}(德)紹伊博爾德:《海德格爾分析新時代的技術》,北京:中國社會科學出版社,1993年,第8頁。
{15}(美)艾伯特-拉斯洛·巴拉巴西:《爆發:大數據時代預見未來的新思維》,北京:中國人民大學出版社,2012年,第221頁。
City Governance in the Age of Big Data: Alienation of Data and Data Management
CHEN Wan-qiu,SHI Hui-xu
Abstract:Good governance of a city should be based on a full grasp of the various kinds of information about the city. The technology of big data happens to meet the demand of enormous amount of information in the governance of cities. The technology makes good city governance possible in that it molds the thinking of governance subject and enhances the ability of city governance,and that it will change the model of city governance and shape the future of the city. Various data risks will be encountered in the process of city governance. Such risks exist in the collection,storage,analysis,and use of data,resulting in the alienation of data,such as the so-called“data distortion”,“data risk”,and“data dependence”,etc. Advanced technology does not necessarily bring about good governance of cities. The risks can only be reduced to a minimum by taking precautions beforehand. We have to treat data rationally,establish regulations for the use of data and set up boundaries for our conducts in data management.
Key words:big data;city governance;alienation of data;data management
(責任編校:文 建)