999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

大數據質疑述評

2015-01-22 21:03:30于英香
檔案管理 2015年1期
關鍵詞:治理風險大數據

于英香

摘??要:近兩年大數據之熱蔓延至媒體、學界、政府與企業,有人追捧之,有人質疑之。質疑觀點主要有概念炒作論、功能夸大論、倫理悖論、風險論以及治理障礙論等。面對質疑,我們應理性對待,既不否認其創新性、先進性與前瞻性,又要避免大數據發展中的極端傾向,努力構建一個大數據治理體系,使大數據發展過程中的負功能向正功能轉化。

關鍵詞:大數據;炒作;質疑;風險;治理

Abstract:?Nearly?two?years,?Big?Data?spread?to?the?media,?academia,?government?and?enterprise,?some?fans,?some?questions.?The?viewpoint?about?doubting:?hyping?on?concept,?the?function?exaggerated,?ethical?paradox,?risking?and?governance?obstacles,?etc.?Facing?the?doubting,?we?should?treat?it?rationally?,?neither?deny?its?innovative,?advanced?and?forward-looking,?nor?avoid?extreme?trends?in?the?development?of?Big?Data,?make?the?effort?to?build?a?Big?Data?governance?system,?make?the?negative?function?to?the?positive?function?in?the?development?of?Big?Data.

Keywords:Big?Data;Doubt;Risk;GovernanceSystem

1??炙手可熱的大數據

時下,有關“大數據時代”、“大數據浪潮”、“大數據革命”的報道充斥于媒體,學術期刊上的大數據論文爆炸性增長,“大數據”研究炙手可熱。

大數據之熱更熱在政府與企業。政府之熱,表現為在西方發達國家政府大數據計劃帶動下我國政府的緊密跟進。2012年3月,美國政府宣布了2億美元的“大數據研究與發展計劃”,對大數據的研究上升為國家意志;[1]?2013年,歐盟委員會推出了建設100Gbps高速網絡的項目,該項目旨在應對大數據“爆炸”。[2]我國地方政府也出臺了各種扶持大數據的計劃,如,上海市政府制定了《上海推進大數據研究與發展三年行動計劃(2013年~2015年)》,廣東省制定了《廣東省實施大數據戰略工作方案》等。企業之熱,表現為大數據跟風現象愈演愈烈,各種企業、公司都宣稱要進軍和搶占大數據領域。然而,在這一片繁榮景象與大數據研究熱涌的背后,有很多人對其提出了質疑,甚至是尖銳的批判。

2???大數據質疑綜述

對大數據的質疑有概念與理論層面的,也有實踐方面的;有技術層面的,也有倫理方面的,本文將以質疑觀點為線索進行梳理。

2.1??大數據只是時髦的技術熱詞——大數據概念炒作論。一個事物的“熱”與“火”往往與“炒作”分不開。2013年夏季,達沃斯論壇上還專門舉辦了一場關于“大數據概念是否被過度炒作”的辯論會,可見“炒作論”并非空穴來風。對大數據的溢美之詞有“21世紀的新石油”、“寶貴的戰略資源”、“重大的時代轉型”等。對此,IT界很多人士不以為然,他們對近乎神話的大數據提出了質疑,認為大數據只不過是“新瓶裝舊酒”,“換湯不換藥”。

炒作論者認為對大數據的闡釋存在著偷換概念的嫌疑。持此觀點的主要依據是大數據的并行計算技術如MapReduce、Hadoop等并沒有嵌入多少新內容,或者為并行計算帶來本質的飛躍,因為在此之前,很多企業已經在對數據進行大規模并行計算了;大數據的分析工具如數據挖掘技術、圖數據庫等也都是BI用過的舊有技術,只是巧妙地把這筆賬都記在了大數據上。[3]

2.2??大數據不是萬能的——大數據功能夸大論。大數據到底是什么,“仁者見仁,智者見智”,但在大數據概念還處于“霧里看花”,似是而非的時候,一些人就將大數據推向了神壇,似乎是大數據無所不能,將大數據功能一味夸大。學界與業界質疑其功能夸大論的觀點主要有三:

一是大數據技術不是萬能的,人文精神更為重要。該觀點認為,盡管大數據時代催生出了一些新的技術,但是技術只是工具。事實上,在如今的信息化和全球化時代,技術的功能達到了前所未有的頂峰,關于技術崇拜和技術唯上的質疑從來也沒停止過。大數據也是一樣,大數據技術再先進,功能再強大,也是人類通過程序設計使其為人類服務的,不能超越人的主觀能動性,人類也不可能變成機器的奴隸。因此,完全依賴大數據是對人的主觀能動性的最大諷刺。“正確認識事物的是非和利害,遵循人文精神是更為重要的前提。缺少這個前提,‘大數據不僅毫無用處,而且可能會為謬論提供支持。”[4]

二是大數據并不大,“全數據”只是神話。英國大數據學家維克托·邁爾-舍恩伯格所提出的“全數據而不是樣本”的觀點將大數據的“大”引向“超大”與“最大”。然而,理論上的“全數據”是不可能實現的,盡管互聯網與各種社交媒體每時每刻都提供巨量的數據,但是這些數據有可能摻雜著大量冗余的、混亂的、虛假的甚至是有害的內容,價值密度較低。大數據號稱要“擁抱混亂”,但數據分析不可能不經過篩選而維持其完全原始的狀態,真正需要的數據可能被更多混亂的海量“大”數據所掩蓋和淹沒,因此,“全數據”只是一種理想狀態。

三是大數據決策或預測有缺憾,不能完全依靠大數據推出客觀規律。維克托·邁爾-舍恩伯格認為,“人通過探求‘是什么而不是‘為什么,相關關系幫助我們更好地了解了這個世界”。[5]這個觀點解構和顛覆了我們長期以來對科學原理的探尋,似乎一切都應聽從大數據科學家們的猜測。事實上,大數據分析出來的事物變化規律或者說是相關關系,只能說相對于“小數據”(過去的抽樣分析)要準確一些,并不會比人類長期實踐探索得到的經驗更準確。因為,規律是不斷變化的,再“大”的數據也不能完全準確地推出客觀規律。更為重要的是,不是你想得到多大數據就能得到多大,對于一些社會問題大數據的收集,有些“沉默”的群體(弱勢群體)可能不會提供任何數據。曾利用大數據成功預測了2012年美國總統選舉結果的專家?Nate?Silver警告說,企業決策者應該對大數據應用保持謹慎,否則很可能導致一些錯誤的決策。

2.3??大數據分析有違社會公平——大數據分析的倫理悖論。EDventure?Holding公司董事長埃絲特·戴森(Esther??Dyson)認為,大數據的個性化定制有悖公平,引發社會政治難題。她反問道,民主國家的每名公民都有投票權,那么每人得到的福利是否應該相同?大數據如果能夠預測個體結果,那么個人責任和集體任務究竟是什么?她認為,這種不公平現象在教育等領域將變得尤為嚴重,比如我們根據大數據個性化定制所得到的學生的潛能區別對待這些學生,但如果幫助了某些孩子“發展潛能”,是否會因此限制其他人的潛能?[6]

無獨有偶,凱特·克勞福德認為,數據在生成或采集的過程并不都是平等的。大數據由于其所號稱的“大”而使得其比小數據似乎更具有客觀性,由于數據分析可以在整體水平上進行,似乎可以避免對少數或者弱勢群體的歧視。然而,由于大數據能夠做出有關群體不同行為方式的論斷,其使用通常恰恰就是為了實現一個目的——即把不同的個體歸入不同的群體中。[7]這樣原本等級森嚴的社會階層將會分化得更加嚴重,社會不公正現象愈加明顯,社會矛盾日趨激化。

盡管大數據分析是基于理性的數據而不是感性的直覺和經驗,但是人的權利、尊嚴、平等和自由是大數據分析的基礎,當我們利用大數據分析某些社會問題時,仍然要考慮社會倫理與社會公平。

2.4??大數據存在著安全與信任隱憂——大數據風險論。技術的進步與安全一直是一對矛盾,然而,大數據分析卻面臨著除了傳統的物理安全、網絡安全、數據安全等之外的新的隱私保護和信任安全等問題。例如無處不在、無所不能的數據化——“一切皆可量化”,意味著只要你想,就可以從任何事物汲取你所想要的任何信息,甚至包括很多我們認為和“數據”關系不大的事情,比如一個人所處的位置,一個人坐在汽車座椅上的姿勢與受力趨勢,等等,都是可以被監控、被數據化的。風險論者認為大數據存在著諸多風險,如技術風險、決策風險、安全風險、信任風險等,其中安全風險與信任風險尤為突出。

安全風險中最突出的就是大數據中隱含的個人隱私的暴露。盡管許多大數據的提供者盡力消除數據中的個人信息,但還是可以從大量的公共數據集中推斷出個人隱私,如出售給大數據分析公司的醫療、旅行、位置等數據都有可能追查到個人身份,更令人擔憂的是,這些隱含了很多個人隱私的大數據信息將因被黑客或泄露者覬覦而變得風險陡增。“數據的安全性及給個人隱私帶來的威脅,讓本是機會的‘大數據,也同時成為了‘大風險。”[8]

信任風險和安全風險有相似之處,都是涉及個人隱私的暴露,但二者不完全相同。安全風險的著重點在于信息或隱私可能被非法竊取或利用,而信任風險中最突出的問題則是公眾可能在不知情的情況下,被“監視”、被“預測”。大數據推崇的數據獲取中包括諸多侵犯他人隱私權、生存權和精神健康權的文字、聲音與圖像,大數據標榜的是完全讓數據來說話,做決策的是機器而不是人。然而,大數據有關預測的功能會使得一個當下正常的人被預測為將來可能犯罪,從而使得其人身自由被監控,如果讓這種預測合法化,公眾會感覺一直有個“第三只眼”在監視著自己,不信任感如影隨形。

另外,大數據之中可能會隱藏著的一個人的習慣、價值觀,甚至人生痕跡和人生規律(事實上,從社交媒體就很容易獲得),如果這些涉及個人隱私的信息在公眾不知情的情況下被大數據使用者和開發者不恰當地使用,就有可能給具體人生或公共利益帶來侵擾或損害;如果一個人的人生受到數據獨裁行為的干擾,那么其在大數據方面的權利將受到侵害。[9]

2.5??大數據增加了治理難度——大數據治理障礙論。大數據治理有廣義與狹義之分,狹義的大數據治理是基于在大數據處理的過程中,CDO?們面臨的一些問題,如數據散落在不同的系統中,哪些數據是可信的?數據是否面臨更大的風險?如何從海量數據中獲得洞察??[10]大數據治理就是要確保數據本身可用性和可靠性。而廣義上的大數據治理則指向數據政策、數據所有權、數據監控、數據標準以及指導方針,甚至包括“社會治理、國家治理和全球治理水平的提升”。[11]大數據治理將會涉及相應的法律法規。

因此,有專家認為大數據加大了數據治理、確保數據質量和訪問控制方面的難度,因為它既涉及?IT?技術,又與業務部門密切相關,是一個復雜的系統工程。埃森哲的Michael?說:“共享整個企業的數據未必是件容易的事,很難讓整個企業共同來解決這個問題。”[12]

對大數據的質疑還有諸如大數據生態環境問題、政府大數據開放的可行性問題,等等,限于篇幅,本文不再贅述。

3???大數據質疑之思考

大數據作為一個炙手可熱的新生事物,受到質疑是正常的現象,面對質疑,我們應理性對待,并努力消解質疑,使其“負功能”向“正功能”轉化。

3.1??理性對待大數據的炒作與功能夸大。面對大數據的炒作與功能夸大現象,我們應持寬容和理解的態度,因為“這是所有新興創新技術在產生發展之初都必須經歷的過程”。[13]事實上,所有的技術和產業的發展都有泡沫化的過程,如平板電腦、云計算技術等,然而,泡沫破滅的過程也正是這項技術落地的過程。因此,我們須靜待其經歷泡沫化,之后才會迎來光明與高峰。

毋庸置疑,大數據具有創新性、先進性與前瞻性,如CDO概念的創新。CIO是數字化時代的一個標志性概念,而CDO(Chief?Data?Officer,首席數據官)則是大數據時代誕生的一個新型的管理者,其主要職責是根據企業的業務需求、選擇數據庫以及數據抽取、轉換和分析等工具,進行相關的數據挖掘、數據處理和分析,并且根據數據分析的結果戰略性地對企業未來的業務發展和運營提供相應的建議和意見。CDO已經進入企業最高決策層,一般是直接向CEO進行匯報,目前阿里巴巴已經任命了這一職位,預示著數據科學家在機構特別是企業中的特殊地位。又如,大數據對科學研究方法論與研究范式的沖擊與挑戰,值得肯定。圖靈獎得主Jim?Gray?2007年在美國科學研究委員會發表演講,指出科學研究已經從幾千年前的憑經驗、幾百年前的注重理論、幾十年前的計算模擬,進入了第四階段——數據探索階段,[14]即科學研究的第四范式。大數據時代對傳統研究方法中的先有假設再收集數據的否定,提出的用全樣本代替抽樣、相關分析代替因果分析等新的研究方法論思想以及從以計算為中心轉變到以數據處理為中心的數據思維對開拓我們的研究思路具有積極意義。

3.2??構建大數據治理體系。如何有效地治理大數據,使其在發揮為機構服務“正功能”的同時,不要產生一些類似于安全、信任與倫理方面的“負功能”。解決這些問題是一個長期的過程,需要構建一個全面的大數據治理體系。該體系包括戰略、規劃等宏觀領域,制度、組織、流程等中觀領域,軟硬件平臺、標準、法規、技術等微觀領域,并且圍繞著治理中出現的困難、問題和障礙設計具體的解決方案,這個過程需要技術專家、數據分析專家、業務人員以及管理人員的協同合作,這對于檔案大數據的建設同樣重要。

另外,大數據時代,隨著數據的增多,傳統的數據保護方法已無法滿足應對大數據面臨的威脅,對原有規范的修修補補也不足以抑制大數據帶來的風險,因此,我們需要全新的制度規范,而不是修改原有規范的適用范圍,舍恩伯格提出大數據時代應該進行一場管理規范的變革。[15]

大數據熱潮會慢慢趨于平靜,走向穩步爬升的光明期和實質生產的高峰期。然而,無論它有多“大”,也難以窮盡千姿百態的大千世界,我們在享受、利用大數據給我們帶來的驚喜與便利的同時,需要保持理性的態度,既要避免完全否定大數據的傾向,又要警醒大數據發展中的炒作與空談。

*本文受國家社會科學基金項目“‘區域—國家電子文件管理整合模型構建與實證研究”(編號:11BTQ039)資助。

參考文獻:

[1]CCF大數據專家委員會.大數據熱點問題與2013年發展趨勢分析[EB/OL].[2012-11-30].http://www.doc88.com/p-1485951966144.html.

[2]?鄒錚編譯.歐盟委員會計劃建設100Gbps高速以太網[EB/OL].[2013-07-08].http://news.cnw.com.cn/news-international/htm2013/20130708_274654.shtml.

[3]吳勇毅.大數據熱涌背后的冷思考[J].信息與電腦,2012(11):26.

[4]劉建明.“大數據”不是萬能的[N].北京日報,2013-05-06(18).

[5]?[15][英]維克托·邁爾-舍恩伯格.大數據時代——生活、工作與思維的大變革[M].杭州:浙江人民出版社,2013(1):83,?219.

[6]埃絲特·戴森(Esther??Dyson).大數據利弊之辯[J].中國經濟報告,2013(6):24.

[7]凱特·克勞福德.對大數據的再思考[EB/OL].[2013-05-09].美國《外交政策》雜志網站.

[8]鄭志勵.喜憂參半大數據[J].中國圖書評論,2013(8):40.

[9][11]付玉輝.大數據傳播:技術、文化和治理[J].中國傳媒科技,2013(3):62,61.

[10]許繼楠,郭濤.大數據時代更需要數據治理[N].中國計算機報,2011-11-14(15).

[12]沈建苗編譯.大數據應用:理想照進現實[N].計算機世界,2012-08-06(20).

[13]馬梅若,方濱興.大數據不能包治百病[J].中國經濟和信息化,2013(8):48.

[14]俞立平.大數據與大數據經濟學[J].中國軟科學,2013(7):183.

(作者單位:上海大學圖書情報檔案系??來稿日期:2014-10-02)

猜你喜歡
治理風險大數據
諧波分析與治理措施探討
治理背景下我國少數民族傳統體育運動會的發展
體育時空(2016年8期)2016-10-25 18:49:34
淺析網絡輿情治理
經營者(2016年12期)2016-10-21 07:51:37
中國經濟轉型的結構性特征、風險與效率提升路徑
商(2016年27期)2016-10-17 05:33:32
互聯網金融的風險分析與管理
基于大數據背景下的智慧城市建設研究
科技視界(2016年20期)2016-09-29 10:53:22
企業納稅籌劃風險及防范措施
數據+輿情:南方報業創新轉型提高服務能力的探索
中國記者(2016年6期)2016-08-26 12:36:20
主站蜘蛛池模板: 亚洲一区二区三区麻豆| 伊人久久大香线蕉影院| 亚洲成人免费在线| 国产在线97| 亚洲码在线中文在线观看| 亚洲天堂日本| 欧美特黄一级大黄录像| 91精品国产一区自在线拍| 国产精品一线天| 亚洲精品欧美日本中文字幕| 亚洲中文在线看视频一区| 久久亚洲黄色视频| 影音先锋丝袜制服| 久热re国产手机在线观看| 99热这里只有精品免费| 国产91小视频| 97亚洲色综久久精品| 91黄视频在线观看| 国产精品蜜臀| 国产第一页屁屁影院| 日韩成人在线网站| 久久77777| 1024国产在线| 永久免费av网站可以直接看的| 国产人免费人成免费视频| av尤物免费在线观看| 蜜桃视频一区| 亚洲日韩日本中文在线| 久久特级毛片| 亚洲无码视频喷水| 亚洲色大成网站www国产| 国产亚洲欧美在线专区| 国产成人成人一区二区| 色悠久久综合| 久久一日本道色综合久久| 91麻豆国产精品91久久久| 欧美日韩另类国产| 日韩不卡高清视频| 欧美精品高清| 国产95在线 | 免费在线a视频| 专干老肥熟女视频网站| 欧美精品另类| 日韩无码白| 日韩精品成人在线| 91亚瑟视频| 国产毛片一区| 成人蜜桃网| 精品人妻AV区| 欧美狠狠干| 福利在线一区| a亚洲天堂| 国产乱码精品一区二区三区中文| 亚洲首页国产精品丝袜| 狠狠操夜夜爽| 全色黄大色大片免费久久老太| 色综合天天操| 国产亚洲欧美日本一二三本道| 蜜桃臀无码内射一区二区三区 | 精品国产香蕉伊思人在线| 久久不卡国产精品无码| 欧美日韩第二页| 亚洲手机在线| 日韩av手机在线| 中美日韩在线网免费毛片视频| 国产小视频在线高清播放| 亚洲午夜18| 五月综合色婷婷| 国产91丝袜在线播放动漫 | 伊人久久精品无码麻豆精品| 99热这里只有精品2| 97视频免费在线观看| 一本大道香蕉高清久久| 成年女人a毛片免费视频| 国产精品林美惠子在线观看| 88国产经典欧美一区二区三区| 2021天堂在线亚洲精品专区 | Jizz国产色系免费| 99久久精品美女高潮喷水| 四虎成人精品| 久久人妻xunleige无码| 亚洲天堂免费|