陳俊宇
(中南大學 公共管理學院,長沙 410083)
大數據技術的發展及其研究綜述
陳俊宇
(中南大學 公共管理學院,長沙 410083)
“互聯網+”時代,信息技術的廣泛使用極大推動了大數據技術的應用與發展,其已經滲透到人們的日常生活中。本文從大數據技術的概念、發展展開論述,總結了大數據技術對人類發展存在的價值和意義,并分析了使用大數據技術所存在的風險及倫理問題,為大數據技術的進一步研究提供理論指導,并為其實踐應用提供借鑒。
大數據技術;發展;應用價值;應用風險;道德倫理
當前,學術界對于大數據概念還沒有一個完整統一的定義。全球知名咨詢公司麥肯錫(McKinsey)在《大數據:創新、競爭和生產力的下一個前言領域》報告中認為:大數據是一種數據集,它的數據量超越了傳統數據庫技術的采集、存儲、管理和分析能力。權威咨詢公司Gartner則認為:大數據指的是一種新的數據資產,是高數據、高容量、種類繁多的信息價值,這種數據資產需要由新的處理模式來應對,以便優化處理和正確判斷。信息專家涂子沛在其著作《大數據》中認為:大數據之大絕不只是指容量之大,更在于通過對大量數據的分析而發現新知識,從而創造新的價值,獲得大發展。盡管目前學界和產業界對大數據概念尚缺乏統一的定義,但對大數據的基本特征還是達成了一定共識,即大數據具有5個基本特征:數據規模大、種類多、速度快、真實性和數據價值密度稀疏。
大數據技術的興起雖然是近年的事情,但追本溯源則是從20世紀發端的。1989年,Howard Dresner首次提出“商業智能(Business Intelligence)”,它是一種能夠把數據轉化為信息與知識從而幫助企業進行決策從而提升企業競爭力的工具,其核心就在于對大量數據的處理。隨著20世紀互聯網的飛速發展,數據量越來越大,復雜性越來越高,對此,傳統的數據技術已經不能滿足當前處理海量數據的需要,因而對海量數據的收集和處理的技術變得尤為重要,“大數據”這一概念誕生。1997年,考克斯和埃爾斯沃思在第八屆美國電氣和電子工程師協會(IEEE)學術年會上發表了《為外存模型可視化而應用控制程序請求頁面調度》的文章,提出了大數據問題,這是在美國計算機學會的數字圖書館中第一篇使用“大數據”這一術語的文章。2008年,隨著互聯網產業的迅速發展,雅虎、谷歌等大型互聯網或數據處理公司發現傳統的數據處理技術不能解決問題時,大數據的思考理念和技術標準被首先應用到了實際。2010年2月,肯尼斯·庫克爾(Kenneth Cukier)在《經濟學人》上發表了長達14頁的大數據專題報告《數據,無所不在的數據》,認為從經濟界到科學界,從政府到平民,“大數據”概念廣為人知。Twitter、Facebook、微博等社交網絡興起將人類帶入了自媒體時代;蘋果、三星等智能手機的普及,移動互聯網時代的到來,這一時期里,大數據技術逐漸得到空前重視。2011年,麥肯錫(McKinsey)戰略咨詢公司的全球研究院(MGI)發布了名為《大數據;創新、競爭和生產力的下一個新領域》研究報告,認為大數據從技術領域進入商業領域的時機已經到來,大數據的運用將融入到政治、經濟、社會等領域的各個方面。2014年4月,世界經濟論壇以“大數據的回報與風險”主題發布了《全球信息技術報告(第13版)》,認為在未來幾年中針對各種信息通信技術的政策甚至會顯得更加重要,各國政府逐漸認識到大數據在推動經濟發展、改善公共服務、增進人民福祉,乃至保障國家安全方面的重大意義。
在國內外大數據技術的發展日新月異,對大數據技術研究的需要也日益重要。雖然當前學界對大數據技術概念的定義尚未統一,不同機構、公司、企業都對大數據技術有著自身的認識和看法,但對大數據技術的基本內涵還是可以通過研究和分析而達到一個基本的共識和標準,而對大數據技術的內涵、內容、特點等基本問題做出研究和界定,又有利于大數據技術與其研究的進一步發展。
大數據是不斷流動、產生和快速發展的,現在已經成為一種社會資源,具有重大價值。數據產生、解析、存入、共享、檢測、消費形成了大數據的連環網絡,構成了大數據的有機生態結構系統。在每個環節都可能產生不同的需要,而各個環節的不同需要又促進理論、技術和方法的革新。大數據技術與社會應用相結合,使大數據與政策決策和商業決策相關聯,通過大數據技術處理重組和快速利用各類戰略資源,通過大數據技術使信息產生增值價值,以挖掘并發揮大數據技術的巨大潛力和價值。Luciano Floridi指出,大數據的價值論問題在于如何通過數據挖掘找出真正有附加價值的數據新模式以及如何使大數據能夠被真正用來推動經濟社會發展。大數據現在是一種商業資本,通過大數據技術處理可以創造新的經濟利益,通過思維的轉變,大數據就能巧妙用來激發創造新產品和服務。
大數據技術擁有巨大的潛在價值,必須要對大數據技術進行深刻的分析和研究,發現其潛藏的巨大功能和價值,例如大數據技術在政策制定和商業決策方面能發揮巨大作用,同時在醫療和教育等其他領域也可以滲透進去,從而發揮自身的價值。并且在研究大數據技術的價值之后,將其運用于社會生活的各方各面,從而將大數據技術的積極影響發揮出來,創造人類更美好的生活。因此,研究大數據技術的價值具有重要意義。但值得指出的是,學者多從政治、經濟、社會、科學等角度對大數據的價值進行分析,忽視了大數據技術的應用風險問題。任何新的技術都不單單涉及科技和社會生活方面,同時必將其與應用風險相聯系,在研究新技術的誕生和發展的同時,對其應用風險等方面的問題做出思考。
大數據技術在使得社會生活變得便利、快捷的同時,伴隨而來的也包括數據安全風險的增加,主要體現在技術安全、內容安全、管理脆弱等方面。例如在互聯網金融中,大數據技術在互聯網金融業的應用帶來信息的多樣化和決策的正確化等優勢的同時也帶來了巨大風險,互聯網金融與傳統金融的監管體系相比在合法性、規范性和安全性等方面尚存在很多問題,這些問題會威脅互聯網金融的健康發展,甚至國家的長治久安,因而必須建立互聯網金融預警系統以保證互聯網金融業的健康發展。
已有學者從其他角度探討了大數據技術的應用風險,例如黃國彬從信息安全的角度研究了大數據的風險框架,他從基礎設施、數據處理、數據管理、技術漏洞、數據可信度五個角度分析了大數據信息安全風險,這些構成了大數據信息風險的內部框架,而外部框架還包括法律法規、行業自律性、個人隱私意識、黑客攻擊等問題。朱光重點討論了隱私風險問題,他認為已有研究重點關注信息加密技術的改進和完善,忽視了對大數據環境下隱私信息從產生至銷毀的全生命周期過程中所面臨的風險進行宏觀的分析、評估和預測,并且現有研究很少關注對隱私泄露后的追蹤和問責,因而他基于生命周期理論建立大數據隱私風險管理框架,主動監測和評估隱私風險,并對泄露進行溯源追責。Luciano Floridi也指出大數據會造成一系列的開放、共享與數據權利問題,他尤其從安全和倫理學角度討論了隱私問題、身份與信用問題、公正問題、規范問題等,認為大數據技術的發展不能只重視技術的發展,要同時面對并解決這些風險問題。
在面對大數據技術所帶來的革命性影響和各種積極作用的同時,學者們對大數據技術同樣保持警惕。作為一項新興的技術,大數據技術在給人們的社會生活帶來積極影響的同時,也不可避免地帶來消極的后果,因此對大數據技術所可能帶來的風險必須保持警惕,并對其進行深入和深刻的研究。大數據技術是一柄雙刃劍,在帶來經濟利益的同時,也會對人們的安全造成威脅,更會對倫理方面產生難以預料的影響。所以,對大數據技術的風險進行分析討論有著十分重要的意義。
新技術的產生和發展總會帶來新的倫理問題,大數據技術同樣會產生需要關注和研究的倫理問題。雖然大數據技術在社會的各行各業的運用能帶來便捷和利益,但同樣需要對其風險保持警惕,同時由其而來的倫理問題也必須加以關注。
大數據技術是一把雙刃劍,必須鑒定并平衡其利益和風險,對于隱私、安全、數字鴻溝等倫理問題需要給予高度重視。蔣潔認為在大數據預測中存在結果預判挑戰自由、隱私披露挑戰尊嚴、信息壟斷挑戰公平、固化標簽挑戰正義等倫理背反問題,為了解決這些問題,需要健全以尊重原則、橡皮原則、無害原則、可持續發展原則等為核心的后現代數據倫理。薛孚認為大數據隱私倫理問題表現在數據挖掘、數據預測和更全面的監控等方面。產生這些問題的根源在于四個方面,即技術性根源、社會性后果、現實性原因和個體性原因。要解決這些問題,必須做到提高數據使用中的價值透明度、調整個人的隱私觀、搭建共同價值平臺以及尋求合理的倫理決策點。安寶洋探討了大數據技術應用、創新和研發中的信息倫理失范及其治理問題,指出大數據技術在給人類社會帶來了積極變化的同時,也引發了信息異化、數據權利、信息隱私和數字鴻溝等網絡信息倫理問題。針對這些問題應從人道、無害、同意、公正、共濟的原則出發進行倫理治理。宋振超討論了大數據背景下網絡信息的倫理失范問題,認為網絡信息失范的原因在于網絡主體的虛擬性、網絡技術的快速發展和外部規約不足。對此,在遵循現有社會倫理規則之外,還需堅持使用與維護相統一、自律與他律相統一的原則,加強立法、監督和保護意識。
針對大數據技術的倫理,學者們提出了自己所預見的各種倫理問題,并且將大數據技術引入到各個行業中,窺探不同產業和領域中的大數據技術倫理問題。但值得注意的是,已有研究仍多從隱私、安全、風險、利益等角度展開,仍舊不夠深入,因此對于自由(意志)、民主、公正、責任等倫理學問題和概念可以做進一步的深入研究,以論證大數據技術在何種程度上與這些概念發生聯系,并且與這些概念發生何種關系(促進、阻礙或威脅等)。
進入21世紀以來,云計算、大數據等新興科學詞匯頻出,人們在了解、學習這些新興技術的同時,需要客觀看待這些新興事物。從當前來看,大數據技術的發展前景非常可觀,但同時也需要對其應用風險和倫理道德問題做進一步的研究,更好地使用大數據技術,通過對大數據的挖掘、分析,獲得富有價值的信息,從而推動社會發展,造福于人類。
主要參考文獻
[1]L Floridi.Big Data and Their Epistemological Challenge[J]. Philosophy & Technology,2012(4).
[2]Vik tor Mayer-Schonberger. Big Data: A Revolution That W ill Transform How We Live, Work, and Think[M]. London:John Murray Publishers,2013.
[3]楊虎,易丹輝,肖宏偉.基于大數據分析的互聯網金融風險預警研究[J].現代管理科學,2014(4).
[4]黃國彬,鄭琳.大數據信息安全風險框架及應對策略研究[J].圖書館學研究,2015(13).
[5]朱光,崔維軍,張薇薇.信息生命周期視角下的大數據隱私風險管理框架研究[J].情報資料工作,2016(1).
[6]蔣潔,陳芳,何亮亮.大數據預測的倫理困境與出路[J].圖書與情報,2014(5).
[7]薛孚,陳紅兵.大數據隱私倫理問題探究[J].自然辯證法研究,2015(2).
[8]安寶洋.大數據時代的網絡信息倫理治理研究[J].科學學研究,2015(5).
[9]宋振超,黃潔.大數據背景下網絡信息的倫理失范、原因及對策[J].理論與改革,2015(2).
10.3969/j.issn.1673 - 0194.2016.20.097
TP311.13
A
1673-0194(2016)20-0146-02
2016-09-08