王磊
今天我將從四個方面對大數據環境下的數據利用規則進行介紹,分別是數據和商業數據的定義、OPEN API的數據利用規則、脈脈不正當競爭案的思考以及對于一些數據利用的建議。
大數據時代,我們更加關注數據,這正是信息技術的突破性發展。正如開發海量數據進行有效的分析,同時得到商業化的內容,這個時候我們說數據才具有更多商業價值的屬性。無論是互聯網公司還是企業,甚至之前的運營商,認為數據有更多的商業價值。
數據的歸屬不能一概而論
數據到底應該歸誰?數據因為涉及到個人信息、個人隱私,肯定有人身權的屬性,還可能被商業化從而具有財產性的屬性,基于這種屬性的二元論,是不是要將其納入知識產權里?尤其是個人信息權益相關的法律規定。也有產業界的人提出是不是可以形成新的權利,其實我們自己的想法,實際上和具體的信息、具體的數據是有差別的。數據的性質不同,權屬也不同。像我們所說的數據的類型、形式,有些是公共屬性。比如天氣信息,近十年的天氣信息是不是有效的商業屬性?如果是有效的商業屬性,它的權屬怎么樣?我們的個人信息到底怎么樣?這些都是值得討論的。數據應該歸誰?應該和平臺的責任一樣,是要進行區分的。這個區分要看數據的劃分,才能有一定的穩定性。
例如,OPEN API是針對于我們,尤其是移動互聯時代提出的新的接口。API實際上是為了有些移動應用在使用過程中獲取數據,讓信息溝通方便,由數據開放平臺提供API的接口,一些開發者能夠有效的出去。這里面有各方的主體,像信息來源,大多數情況下都是用戶,當然也不排除大數據的交易平臺。同時,數據的平臺方,以微博為例的社交媒體平臺,這里可能有一些UGC的內容,個人信息的地理標識、喜好,甚至相關的職業信息和教育信息,這些都是屬于平臺方自己的數據。同時,數據利用方以及各方的移動APP應用,通過OPEN API的一些協議,獲得相關的數據接口,實際上也是達到了數據導流的方式。此時,有效地解決數據應用的冷啟動問題,有些數據平臺上的用戶,通過OPEN API的協議獲得了新應用的適用。
我們所說的脈脈軟件被訴不正當競爭案就是基于OPEN API。脈脈其實是我們曾經的一個第三方應用軟件的合作方,但微夢公司是微博的實際運營方,在合作過程中發現,脈脈的注冊用戶大量地存在注冊用戶和非注冊用戶混用的現象,比如直接使用了新浪微博的用戶頭像、名稱和職業信息,這個具有很明顯的指向性,被認為可能存在侵犯用戶個人相關隱私的情況??紤]到現有的法律制度,提起了不正當競爭。此案在2016年12月30日宣判,被認為是大數據時代針對個人信息和用戶信息保護的實案。
數據屬性的認定
針對這個案子可以得到一些啟示。第一,對于數據屬性的認定。通過司法案例確認一個數據信息是重要的商業資源,像之前給大家介紹的一樣,它在未來被定義為新石油,對于各個公司的商業價值不言而喻。用戶信息是提升企業競爭力的基礎和核心,對于數據的應用,以及個人用戶信息的濫用,到底通過什么樣的方式進行保護?這個是通過微夢訴脈脈的案子得到了一定的確認。
第二,明確了互聯網中用戶信息的基本原則,用戶明示同意和最少夠用的原則,在此情況下對搜集用戶信息形成相關的數據流以及數據庫,后續再進行商業化利用,這個應該是大數據應用或者大數據時代里面平臺所承擔的基本商業道德和原則。
第三,這是非常有意思的地方,叫做三重模式。之前各位老師也提到了,用戶授權+平臺授權,再回到用戶授權。第三方應用在獲得相關信息時,最初有用戶授權才能通過API的接口,但是API又與平臺簽訂了OPEN API的協議,這個時候已經拿到了用戶的初步授權和平臺授權,但它在進行商業化的時候依然需要用戶進行再確認,目的就是通過三重授權的模式得到有效的規制,同時又明示用戶的義務。脈脈這個應用就是恰恰沒有通過用戶的再授權,導致了不正當競爭的行為,也就構成了侵權。
此外,我們確定了網絡平臺提供方的合法商業化數據的提起訴權的主張權利。無論是數據,還是個人信息,對于數據來說,可能現在的權屬還比較模糊,到底它是什么性質的權利,大家依然沒有確定,這個時候提起訴訟,或者通過司法手段保障自己的權利,還存在著一定的障礙。通過個人信息保護,個人信息保護法正在進行立法的進程當中,此時通過不正當競爭的手段,由網絡平臺提供方提起針對商業化數據的保護主張是非常必要的,而且具有一定的示范意義。數據利用規則及思考
通過此案例可以總結出平臺或者是商業數據利用的基本規則。
第一,合法、正當、必要。在利用數據的過程中,首先要是正當性以及必要性,以及之前提到的最少夠用原則。然后是合法來源,通過非法手段獲取的相關信息,比如像抓取、被盜的非法抓取,商業數據本身存在瑕疵,在后續的商業化利用中就會存在障礙。第二,安全保障原則。在作為數據平臺的過程中,其實具有一定的義務,一定要對自己所收集到的數據信息起到安全保障作用。第三,用戶告知及授權。在合作過程中,要通過用戶的明示得到使用或者商業再利用的方式,此時用戶如果沒有經過告知和授權,這個時候就沒有得到正當合法的源頭。第四,公平、合理、有序。這是在未來過程中,認識到整個大數據行業的發展,其實由于商業的屬性和商業價值,各家的主體,無論是傳統運營商,還是現在的互聯網媒體、平臺,以及各家電商企業都會意識到,充分地挖掘商業屬性,這個時候一個有效、公平、有序的行業競爭秩序是非常有必要的。這是我們經常講的要提供一個好的平臺,設立一個行之有效的標準。這個標準才能更好地、更有利地促進我們所說的大數據行業的發展。
最后,防止數據濫用。一直以來都存在一個困惑或者存在一個博弈,或者利益考量的方式。怎么樣提供數據,如果數據脫敏到形成一張白紙,這個時候商業價值是非常有限的。但如果沒有進行脫敏,這個時候實際上是對用戶或者對數據構成了一定的侵害。此時,數據濫用的尺度和數據濫用的相關范圍,是需要明確的。基于數據利用規則,比如說如何有效地防止數據濫用和以上四個原則結合起來一起使用,才能保障數據既可能實現商業化的價值,同時又有利于保護相關的各方主體的權益。
針對數據利用的思考,提供以下四個方向:第一,加強立法建設工作。無論是數據利用,還是個人信息范圍,都一直處于比較模糊的狀態,無論是立法工作還是行業指導規范,都需進一步加強。第二,作為企業在實踐過程中,有一些黑產業進行不規范的使用,對于整個行業、整個數據,甚至對于平臺都是非常不利的。此時,在執法上怎樣對黑產業進行有效打擊,這也是我們作為企業非常關注的問題。第三,呼吁建立一個數據追溯機制,很好地解決合法和有效來源的問題。即使合法有效來源是安全的,在往上追的時候,可形成倒逼的追責機制,有效避免黑產業和非法數據利用的源頭。最后,授予平臺方對于數據的主體角色。無論是平臺方還是數據方,在數據使用過程中對于數據的商業價值都參與了整個建設工作,這個時候對于數據的保護也好,還是對于數據的使用利用也好,其實平臺方更有主體便利性。第四,如果發生了數據的侵權,平臺方有更好的技術手段和人員配備,可以有效發現這個問題,比如說個人信息。個人信息對于用戶本身來說,可能發現問題會存在一定的延遲性,也可能造成時間上的延遲,導致不可避免的后果。從平臺方授予相關的主體地位,有利于數據產業有效的維權,或者有效凈化,這是非常必要的。