莫 驊
(北京大學,北京 100871)
隨著信息技術的不斷更新發展,電商平臺、交通軟件、娛樂軟件等層出不窮,這些信息化工具極大地方便了我們的生活,但同時也產生了數以億計的數據,我們在不知不覺中便進入了大數據時代。在這樣的一個時代里,我們不用出門就可以非常快捷地完成一次購物,我們可以躺在床上點自己喜歡吃的食物,可以遠程視頻等等,但是提供便捷的背后,往往隱藏著信息泄露、大數據殺熟等問題。根據有關媒體報道,某訂票網站就會根據會員的經濟負擔情況對同一產品給予不同的定價,種種亂象的背后,需要的是法律的約束。
最近最火的一個詞就是“大數據”,無論是媒體鋪天蓋地的宣傳還是從國家戰略層面的不斷加碼,大數據成了網絡熱詞。那么何為大數據?過去有沒有大數據?大數據為什么這么重要?根據官方的定義,大數據就是一組痕跡數據,這個數據通過分布在各處的終端進行運行,然后通過傳輸系統傳送到中央系統,然后被保存下來,這就是大數據的基本定義[1]。通俗一點講,就是我們打個車,打車軟件會自動記錄我們的用車喜好、消費層次、常用路線等等,這些數據被軟件的后臺存儲下來,然后為每個顧客分配一個ID,等這個顧客再次打車的時候,就可以通過算法計算出顧客的打車喜好,從而為顧客匹配最適合他的車輛,從而大大提高運行效率同時提高用戶的滿意度。
大數據時代有以下幾個特征:
(一)大量。數據無時無刻不在產生,從人類學會結繩記事開始,就時刻在產生著數據,過去我們更多的是依賴于紙質媒介,信息技術的發展使得數據的收集和存儲變得非常便捷,過去我們的數據都是用MB進行計算,現在動輒就是G,整整大了幾個數量級。大數據時代的第一個特征就是數據量巨大,這一方面與數據的產生終端增多,另一方面也要得力于通信技術的發展,我們從2G時代進入了5G時代。
(二)多樣。大數據時代的第二個特征就是數據的多樣化,我們從過去的單純文字記錄信息,到時下的多媒體,視音頻記錄信息,從過去的單一模式到如今的復合模式。大數據時代的多樣化特征為我們挖掘數據背后所隱藏的秘密。
(三)價值。大數據最核心的特征是其價值性,這也是我們要開展大數據法律研究的重要原因,大量孤立數據或者說是單一分散在每個個體上的數據看上去沒有任何的價值,也很難在生活中進行應用,但是一旦數據匯總起來,經過人工智能算法的計算,就能從中挖掘出大量的有價值內容,而數據平臺可以充分利用這些數據進行牟利。大數據時代的價值性以及其歸屬是我們必須關注的重點。
根據前面的論述,我們可以發現,大數據最重要的特征是其價值性,正是因為其背后所蘊藏的巨大經濟價值,才會出現各種大數據時代亂象。在大數據時代,我們法律研究需要關注的第一個問題就是大數據的所有權歸屬問題。只有確定大數據的所有權,我們才能開展后續大數據保護、侵權賠償等方面的研究,否則,所有權不確定,一切都是空談。關于大數據的所有權問題,有兩種截然不同的觀點,一種觀點認為,單一孤立的數據是沒有價值的,有價值的是匯總起來的總數據,所以數據的所有權歸數據平臺所有;另外一個觀點認為,大數據是由個體產生的,所有權應該依附于其產生的個體而存在,所以大數據的所有權歸個體所有[2]。關于這個所有權的問題,將成為法律學術界進行深入探討的一個難點,結果將對大數據的保護產生深遠影響。
如何進行大數據的保護將成為法律研究的熱點。大數據是一種虛擬資產,以虛擬的形式存在。大數據的保護主要存在兩方面,一方面是大數據的過度采集問題。現在很多的app軟件,動不動就采集用戶的手機聯系人信息,獲取微信聯系人信息,這些信息雖然是數據的一種,但是更進一步講,是用戶的隱私,肆意利用自己在軟件技術方面的優勢地位收集用戶的隱私信息,從法律上將構成對于用戶的侵權,對用戶的安全也將構成威脅。目前關于這一塊我國工信部不斷出臺相關的規定進行限制,強制下架一些軟件,但是隱私的保護任重道遠,需要從法律角度進行進一步的規范和約束。大數據保護的另外一方面就是大數據的安全問題,大數據的信息泄露屢見不鮮,從某酒店信息泄露到某旅游app用戶數據信息泄露。這些亂象的背后是一群心懷叵測的人所進行故意破壞行為,這些破壞行為如何進行懲罰,如何進一步發揮出法律強有效的制約作用,也是我們未來研究的一個熱點。
大數據的保護從手段上來講,主要是分為兩部分,一部分是技術防范,這種防范的角度主要是針對物,針對大數據本身,通過合理地確定防火墻,設定殺毒軟件、保持物理隔離等手段,大大降低大數據的受保護程度,但是這種模式的對象是物,會出現“道高一尺魔高一丈”的問題,也就是不斷會有新的黑客技術產生出來,進而對大數據的安全產生威脅。大數據的立法主要是針對人,只要有人敢覬覦大數據的寶藏,必將受到法律的嚴懲。所以關于大數據的立法,我國勢必會加快速度,將為大數據的法律保護提供最強有力的武器。
在數據時代,信息的檢索將變得非常便捷和高效,過去需要一個月才能獲取到法院判決數據,現在我們幾天就可以看到,這將大大加快我們法律研究的數字化進程。關于法律研究的探討我們也將擺脫過去單純依靠召開現場會議的形式,在疫情防控期間,很多的法律學術研討會都是通過視頻會議的形式展開的,大大節省了成本,縮短了會議日程,取得了很好的效果。未來在大數據時代,法律研究的數字化特征會更加明顯,我們將更加便捷地獲取到我們開展研究所需要的數據和服務支持。
大數據有著天然的巨大數量性、分布廣散性、易滅失的特點。這導致我們在進行大數據侵權案件的實務中,如何進行證據的有效固定將成為難點[3]。之前筆者就在網上看到過一個案例,一個盜竊網站個人信息數據的團伙落網,這個團伙的主犯在國外,服務器是選擇在國內國外雙向分布,當時警方破獲這起案件的時候,是耗費了大量的人力和物力才把證據固定好的。大數據的天然巨量性需要我們配套建設數據處理中心,對所繳獲的犯罪證據進行及時快速地解析處理,從而分析出有價值的線索數據,為后面開展偵查工作提供支持。
在這里筆者想舉偷稅漏稅的案子,通過這個案例我們可以看到大數據時代,法律實務要關注的一個重點。過去我們在偵破偷稅漏稅案件時候,尤其是對涉及數量眾多的公司的時候,需要依靠很多專業的財會人員對涉案公司的票據進行分析,耗時很長。現在我們警方完全可以通過警務大數據平臺,對每家公司背后的流水,以及錯綜復雜的資金流向進行一鍵解析,各個嫌疑對象之間的資金往來和人情關系一目了然,大大提高了案件偵破效率。再比如,我們在進行老賴資產清算的時候,可以利用大數據系統對老賴的資產進行全網無死角的偵查,從而不放過其一分一毛。
大數據的專業性決定了復合型人才將成為法律實務方向的一個趨勢,學數據的人要懂得法律,學法律的人要懂得數據,只有這樣,我們面對紛雜的大數據的時候,才不至于丈二和尚摸不著頭腦。政法院校要加快開設大數據法律實務專業,從源頭為社會的發展提供復合型人才,各律所也應該重點培養大數據和法律復合人才,這樣可以大大提高我們在行業的競爭力。