許華宇 易茂祥 王道大 劉陸民

摘? ?要:與傳統的信息流動相比,大數據背景下的信息流動在各個層面都具有顯著的差異性,典型體現在數據規模大、關聯性強、復雜度高,導致信息流動的復雜性、不確定性和涌現性。文章從大數據技術特征、網絡信息流動形式、網絡信息流動空間3個方面進行了分析研究,并探討了大數據背景下信息流動所面臨的數據保護、信息安全與隱私問題。
關鍵詞:大數據;信息流;信息流動空間;數據保護
1? ? 大數據發展概述
計算機和信息技術的迅猛發展以及其研究成果快速普及滲透到人們的日常生活中,不僅讓人們可以足不出戶就購買到想要的商品,還可以沖破傳統地理空間約束,在任何時間、任何地點與不同區域、不同領域的人交流。在信息時代,人們不必擔心信息的閉塞,相反,由于網絡上信息量過大,常常會困擾人們的選擇。
隨著人工智能、物聯網、區塊鏈、大數據等互聯網技術快速發展,網絡的信息資源日益豐富,網絡數據出現爆發式增長[1],數據滲入各行各業,并衍生出各種基于數據下的研究和應用,比如生物醫學中“4P醫學”觀點,通過個體患者的疾病診斷和治療中的龐大數據來進行個體化預測、預防和醫療;智慧農業運用大數據理念、技術和方法,解決農業及相關的數據采集、存儲、計算等一系列問題,做到精準農業;金融經濟領域應用大數據網絡分析捕捉非法交易、風險分析、決策分析、情緒測量等。大數據技術幫助人們分析數據中潛在的規律,預測未來發展趨勢,為人們提供了一個最優的信息選擇,進而提高各行業運行效率。文章主要在大數據背景下探討研究其對信息流動所帶來的影響。
2? ? 大數據背景下信息流動性分析
主要從大數據技術特征、信息流動形式、信息流動空間來分析大數據背景下的信息流動以及大數據的發展對信息流動影響的具體表現。
2.1? 大數據發展特點
大數據主要表現在數據的大規模性(Volume)、高速性(Velocity)和多樣性(Variety),又稱“3V”特性,大數據下信息處理主要是對海量數據進行有價值的提取。一般情況下,數據要經過數據采集、數據清理、數據存儲、數據管理、數據分析、數據顯化到最后的產業應用這7個環節[2]。大數據技術的發展幫助人們更好地理解數據,挖掘數據的價值,并根據數據分析結果作出相應的決策。
基于大數據下的應用主要集中在獲得知識與推測趨勢、分析掌握個性化特征、通過分析辨別真相等,在大數據技術的發展背景下,信息流動性也由初始數據收集的隨機性和不規律性發生了微妙的變化,這種流動有其特定的結構,流動方向逐漸從“信息的流動”向“流動的信息”轉變。
2.2? 信息流動性形式
現代科學信息的定義不再是簡單的事物發出的消息,還指指令、數據等所包含的內容。最早對數據的概念就等同簡單的阿拉伯數字,但計算機、互聯網等科學技術的快速發展,數據被賦予更多涵義,其不僅是數字,還可以是字母、表格、文字、圖形等,數據就是反映客觀事物屬性的記錄,數據經過加工處理后就成了信息。
傳統的信息流動形式單一、傳遞慢、不精確,或靠驛差長途跋涉、或口耳相傳、或飛鴿傳書,而現代的信息流動,形式多樣,可以通過電話、郵遞、期刊、報紙、物流、電視、網絡等等,而流動的主力軍就是互聯網,互聯網就像一個大的神經網絡,由于互聯網本身具備的開放性和關聯性特征,信息在這個網絡上流動,信息的流動時間縮短,流動形式多樣、流動空間變大,其價值也變大了。
在大數據技術發展下,人們通過對數據開始進行收集、處理、分析、挖掘出有價值的信息加以應用,部分人通過應用又產生新的數據再反饋給用戶,用戶得到數據后,又產生新的數據,這就形成了流動數據生態圈(見圖1)。信息的源頭不再局限文字、圖形、表格,還可以是實時采集到的視頻數據等。因此,大數據背景下信息流動形式趨向多樣化。
2.3? 信息流動空間分析
信息流動空間不同于傳統的靜態地理空間,它是建立在地域空間基礎上,是一個新的空間形態和布局,具有相互關聯且巨大的三維流動空間性,主要通過現代互聯網信息技術將不同地區連在一個準同步合作的網絡中,具體表現在空間通信網絡、數據庫和信息的融合[3]。在這個網絡生態環境下,數據量巨大,絕大多數數據與空間位置有關,空間數據是大數據基礎,包括空間實體的屬性、位置、數量,因此,大數據背景下信息流動空間關系復雜度更高、數據量更大、空間性和時間性更強,受到地理因素、人為因素、技術因素、基礎設施等影響。
大數據技術就是在整合看似雜亂、繁復的數據,提取出有價值的數據,進而提高信息流動的有效性。因此,大數據背景下信息的流動更具備方向性、目的性和關聯性,它不僅提高了信息流動速度,還增益了信息流的價值。
3? ? 影響
大數據技術促進了信息流動,帶來了信息空前繁榮,在給人們的生產生活帶來許多便利的同時,也帶來一些問題和挑戰。大數據背景下信息流動中的典型問題就是數據保護、信息安全與隱私問題。
首先,大數據中數據的來源可能是互聯網或GPS等技術應用中的數據,也可能是空間數據,由于采集空間數據的設備各不相同,可能是雷達、數碼相機、紅外等,導致數據的格式、形式、類型、粒度、編碼方式等不一致,數據很難有統一的規范[4],在這個背景下信息朝著不同方向流動,空間關系復雜,加大了對流動中數據的保護難度。
其次,將流動在不同地點的數據關聯起來,從而挖掘提取有價值的數據,這是大數據技術的實質,但是這樣就暴露了用戶的網絡數據足跡,進而埋下隱私與數據安全隱患,比如人們通過“人肉搜索”來獲得某人的相關信息,所檢索到的信息越多,個人隱私暴露的系數越大,而這種暴露通常是個人無法預知和控制的,所以,如何在大數據背景下信息的流動中保護個人隱私和數據安全是當前人們關注的熱點。如果為了保護隱私而隱藏數據,數據的價值就無法得到最大化的體現和利用,劉雅輝等[5]提出差分隱私保護技術來保護流動信息的隱私安全,盡可能在不暴露用戶敏感信息的前提下進行數據的挖掘,差分隱私保護算法的關鍵是隱私參數ε,目前在理論上已有很多成果,但在實際應用中還需要繼續深入探討。
最后,網絡空間不同于現實空間,是現實空間的延伸。與技術發展速度相比,網絡空間治理的相關法律滯后,多數情況依靠行業和網民的自律,大數據技術雖然促進了網絡空間信息“監測+預警”管理模式向“預測+防范”轉變,改善了網絡空間治理,但是又存在信息暴露的風險,所以,在大數據背景下信息公開利用與信息安全保護相互博弈。
4? ? 結語
大數據技術是一把雙刃劍,一方面,大數據的發展促進人們挖掘信息數據的價值,加速信息的流動,驅動技術帶來綜合應用、生產力的解放和產業的升級,催生出新的業務模式和產業規律,并帶來互聯網層出不窮的新應用、新模式、新業態;另一方面,大數據在采集、存儲、分析和信息流動過程中面臨著數據安全、信息安全和隱私等問題。機遇和挑戰并存,只要正視當前存在的問題,大數據背景下的信息流動必然能進入一個良性網絡空間生態發展循環。
[參考文獻]
[1]劉智慧,張泉靈.大數據技術研究綜述[J].浙江大學學報,2014(6):957-972.
[2]顧榮.大數據處理技術與系統研究[D].南京:南京大學,2016.
[3]王玉良,丁剛毅,鐘鳴.大數據下的空間數據挖掘思考[J].中國電子科學研究院學報,2013(1):12-21.
[4]童端,呂捷,許宏.大數據背景下的數據安全研究[J].網絡空間安全,2017(12):17-20.
[5]劉雅輝,張鐵贏,靳小龍,等.大數據時代的個人隱私保護[J].計算機研究與發展,2015(1):229-247.