劉業政 凡 菊 姜元春
摘要:網絡的出現在給人們的生活帶來極大便利的同時也引起了網絡用戶對自身隱私信息的關心。為此采用問卷調查的方式,利用統計分析和關聯分類技術,對網絡用戶所關心的隱私信息及其關心程度進行研究。由調查結果發現,雖然中國網絡用戶對自身隱私信息的關心程度不斷提高,但整體來說仍然較低,用戶對自身各類隱私信息的關心程度存在較大差異,且用戶對各類隱私信息中的各項具體信息的關心程度隨著用戶年齡、性別、學歷的差異而有所不同。調查結果為電子商務網站更好地保護用戶的隱私信息提供了依據。
關鍵詞:隱私信息;關心程度;關聯分類
中圖分類號:F224.33 文獻標識碼:Aお
Internet Users' Privacy Concerns
LIU Ye-zheng,FAN Ju,JIANG Yuan-chun
(School of Management, Hefei University of Technology, Hefei 230009, China)
Abstract:
The users' privacy concerns about personal information arise with the emergence of the internet that also brings user's life many advantages.With a questionnaire survey, this paper investigates the personal information concerned by users and the concern level employing the statistical analysis and associative classification technology. The result indicates that Chinese internet user's concern level is still low although the concern level is much higher than ever. Moreover, the concern level for different kinds of privacy information is distinct. The concern level to specific personal information is also varied ranging from the user's age, sex and education level. The conclusions provide some useful suggestions for electronic commerce sites to effectively protect the users' personal information.
Key words:お
一、引言
網絡發展到今天,已經成為人們生活中不可或缺的一種工具。只需輕輕按動鼠標,人們即可隨時隨地購買所需產品或服務、與遠在世界各地的親朋好友交流、從事一些特殊的研究、培訓或工作,還可以及時快速的了解世界各地的新聞,等等。但是,隨著網絡使用率的不斷增高以及相關技術的不斷進步,使得收集大量的用戶隱私信息變得非常容易。Federal Trade Commission (FTC) 在1999年3月所作的一次研究表明:約有92.8%的網站至少收集用戶的一項身份信息,56.8%的網站至少收集一項人口統計學方面的信息[1]。網站和個人的這些收集他人隱私信息的做法引起用戶對自己在網上活動時所留下的個人隱私信息的關心。Harris 等人在1998年所作的調查結果顯示:87%的網絡用戶“關心”在線時自己的隱私信息是否會受到威脅,56%的用戶“非常關心”這一點[2]; Jupiter 于2002年的研究結果表明:70%的美國用戶關心自己的網絡隱私[3];Harris在2004的調查分析得出:65%的被調查者稱自己由于關心自己的隱私而拒絕在電子商務網站上注冊[4]。PC world survey于2003年調查了1500網絡用戶,結果表明88%的人對于網站是否分享他們的e-mail地址非常關心,91%的人關心當自己在線時會不會被網站跟蹤[5];Statistics Canada 在2006年調查結果表明:57%的用戶在線使用信用卡時非常謹慎[6]。與用戶的隱私關注相一致,眾多學者開始從理論角度對隱私問題進行探討,得出了大量的研究成果[7-9]。
許多學者從不同的角度對隱私關心問題進行了研究。其中,大部分的研究是針對隱私關心和隱私行為之間的關系或隱私關心和信任之間的關系[9,10],這些研究僅對用戶是否關心隱私進行調查,建立隱私關心和隱私行為或信任之間的關系,并未對用戶具體關心的隱私信息及關心程度進行研究;Huberman等人使用實驗的方式對網絡用戶的隱私信息進行了定量研究,得出每項隱私信息都有一定的價值,且價值因用戶不同而不同[11],但是并未說明各類用戶的隱私價值在哪些方面存在差異。
中國在網絡隱私權方面的研究越來越多,但是在隱私關心方面卻鮮有研究。筆者針對這一情況,通過調查分析,找出網絡用戶所具體關心的隱私信息及關心程度,為后續更深入的研究網絡用戶對隱私關心程度不同的原因及其他相關問題提供參考。
筆者在此基礎上認為,在中國文化的影響下,中國網絡用戶對于各項隱私信息的總體關心程度是不同的;此外,受性別、年齡和學歷的影響,中國各類用戶對于各項個人隱私信息的關心程度存在一定的差異。因此,筆者提出兩個假設:(1)中國網絡用戶對每項隱私信息的關心程度是不同的;(2)不同性別、年齡、學歷的用戶對各類隱私信息的關心程度存在一定的差異。筆者采用問卷調查的方式,利用統計分析和關聯分類的方法,對這兩點假設進行研究。
二、研究方法
(一)問卷設計
筆者在參閱相關資料的基礎上,重點研究網絡用戶的26項隱私信息,并將其分為人口統計學信息、財務信息、偏好信息、家庭信息、社會信息等五類信息(見表1),這5類信息的劃分并沒有明顯的界限,有些信息可以同屬兩類信息,這對結果并沒有明顯的影響。
筆者采用問卷調查的方式進行研究。問卷共九個問題,每個問題都有被選項(單選和多選均有)。問卷。首先選擇30人做預調查,對預調查的結果請相關領域的專家分析后進行了相應的修改。然后進行大范圍的調查,被調查者為在校大學生、研究生、工程師、醫生、教師、公務員等各個行業一共350人,其中在校大學生及研究生占整個被調查者的三分之一,收回問卷332份,回收率為94.86%,其中有效問卷為324份,針對這324份問卷做了分析。問卷的alpha系數為0.985。
參照中國互聯網絡信息中心(CNNIC)對網民年齡的劃分標準,考慮到不同年齡段的用戶的生活背景,對網絡的認識、接觸網絡的機會以及用途均不同,因此,為了了解各類用戶對各類隱私信息的關心程度的差異性,對被調查者的年齡和學歷進行劃分,劃分結果如表2所示。

(二)數據處理方法
1.統計方法
為了驗證引言中所述的第一個假設,即網絡用戶對各項隱私信息的關心程度是不同的(網絡用戶對各項隱私信息關心程度的差異性),對調查結果進行了分析。由于個人信息項非常多,如果采用劃分等級的方法(即請被調查者針對自己的每項信息都給一個關心等級,如“非常關心”“關心”“比較關心”、“不關心”),可能會使被調查者很難選擇或者全都選 “非常關心”,因此請被調查者在所列出的26項個人信息當中選出不超過15項自己關心的信息,然后再對每項信息進行頻數統計,得出用戶對每項信息的關心程度(見表3)。
2.關聯分類方法
為了驗證第二個假設,得出不同用戶對各項隱私程度關心程度的差異性,筆者采用關聯分類的方式對數據進行了處理。
關聯分類(associative classification, AC)是一類新的面向決策表的規則獲取技術,其核心思想是利用關聯規則挖掘技術,通過頻繁項集挖掘、決策規則生成以及規則剪枝等過程獲取條件屬性與決策屬性的關聯關系,即決策規則 (稱為分類關聯規則(classification association rule) ),并利用生成的分類關聯規則構建決策系統。研究表明,AC方法能夠發現傳統方法挖掘不到的規則[12-15]。因此,筆者以關聯分類為工具,對用戶的隱私信息進行分析,以便找出用戶特征與其對隱私關心的聯系,并且根據這種聯系的強弱,得出用戶對不同隱私信息的關心程度。在掌握網絡用戶對不同隱私信息的關心程度之后,商務網站可以有針對性的重點保護網絡用戶比較關心的個人隱私信息,提高用戶對網站的信任水平,為企業創造更多的商機。

三、結果
(一)網絡用戶對隱私信息的關心程度
根據表3結果,將關心程度分為四個等級(非常關心、關心、比較關心和不關心),關心程度值大于0.7的為“非常關心”,關心程度值大于0.5的為“關心”(其中“家庭信貸情況”這項信息的關心程度值為0.494,非常接近0.5,所以將其劃分到“關心”這個等級),關心程度值大于0.2的為“比較關心”,小于0.2的為“不關心”,根據每項隱私信息的關心程度值將其放入相應位置,建立了個人隱私信息的關心程度矩陣(表4)。
雖然近幾年中國網絡用戶的隱私觀念有所改變,但從表3可以知道,中國網絡用戶對個人隱私信息的關心程度依然不高,僅對銀行卡號和身份證號這兩隱私信息的關心程度超過了0.6。這主要是受中國傳統文化的影響[16]。
為了更進一步的解釋假設一,下面筆者對每類隱私信息的關心程度進行簡要分析。
1.人口統計學信息
從表3中可以看出,網絡用戶最關心身份證號這項信息,其次是姓名和年齡,而對性別、身高、體重等信息則不關心。
在我國,身份證號是確定一個人身份的重要證件,如果此項信息泄露,可能會對個人造成非常大的損失或帶來許多麻煩,所以用戶對此項信息的關心程度非常高是符合實際情況的。由于其他五項個人人口統計學信息僅為用戶個人的信息,不涉及到他人,而且即使泄露,一般也不會對用戶本身或他人造成較大損失,所以用戶對這些信息的關心程度很低。此外,在網絡世界中,為了更好更容易地與他人交流溝通,大部分用戶都隱藏自己的真實姓名和年齡,所以對這兩項信息的關心程度要稍微要高一些。
2.財務信息
從表3中可以看出,對于各類財務信息,用戶均很關心,關心程度最高的是銀行卡號,其次是個人工資、家庭收入、配偶工資和家庭信貸情況等隱私信息。
對于財務信息,不論在中國還是其他國家,網絡用戶都都非常關心。因為這類信息涉及到用戶的經濟情況,如果泄露,會對個人經濟造成極大損失,尤其是銀行卡號,在信息技術如此發達的時代,黑客等網絡高手可能會根據用戶的銀行卡號來竊取用戶的錢財,所以用戶對銀行卡號的關心程度在所有隱私信息中是最高的。至于其他四項財務信息,相對其他類的個人信息來說,關心程度也要高一些。在這四項信息中,值得注意的是個人工資這項信息,在五年前,中國人并不關心這項信息是否泄露,甚至很多人主動告訴他人自己的這項信息,但隨著社會的進步、經濟水平的提高和用戶觀念的轉變,近幾年越來越多的用戶開始關心自己的這項隱私信息。
3.個人偏好信息
從表3中可以看出,對于個人的各項偏好信息,用戶普遍都不關心。因為這類信息僅僅是個人的興趣愛好,即使泄露,也不會對他人造成損失或傷害,一般也不會給個人帶來影響,所以用戶對這類信息的關心程度都很低。
值得注意的是,年齡在31-35歲之間的人,對自己的政治傾向和宗教信仰這兩項信息的關心程度要高出其他信息許多(其他信息關心程度在0.8以下,而這兩項信息均約為0.4)。這是因為,處于這一年齡段的用戶,工作已經進入快速發展期,生活閱歷又比較豐富,已經認識到政治問題和宗教問題可能會對自己的工作產生影響,所以對這兩項信息的關心程度相對來說要高一些。
4.家庭信息
同樣從表3來看,對于各類家庭信息,網絡用戶同樣比較關心,但相比來說,更關心庭住址和家庭電話這兩項信息。
從古至今,家庭對中國人的意義和影響都非常大,這類信息的泄露,極有可能會給用戶及其家庭帶來極大的麻煩甚至傷害,尤其是家庭住址和家庭電話這兩項信息,直接關系到家庭的安全和穩定,所以網絡用戶在對各類家庭信息都很關心的情況下,對這兩項家庭信息的關心程度要更高一些。
5.社會信息
對于個人的各類社會信息,從表3中可以看出,用戶一般比較關心自己的網絡聊天記錄和個人移動電話這兩項隱私信息,其次是個人e-mail地址,而對職業、單位地址和單位電話等隱私信息則不關心。
網絡聊天記錄這項信息,一般涉及到朋友或同事的隱私信息,如果泄露可能會給自己的人際關系帶來影響,甚至影響到自己的工作,所以用戶對這項信息的關心程度比較高。而個人移動電話的泄露會給個人帶來很多麻煩(如經常接到騷擾電話或短信息),所以用戶對這項信息的關心程度也比較高。
(二)各類用戶對各類隱私信息的關心程度比較
在(一)中我們從總體上得出了網絡用戶對個人信息的關心程度,并對各類隱私信息的關心程度進行了簡要分析。為了更進一步的了解各類用戶對個人各項隱私信息的關心情況,筆者采用關聯分類的分析方法得出了各類用戶對各項信息的關心程度的規則。
使用關聯分類分析方法會得出很多的規則,因為篇幅有限,根據網絡用戶的性別、年齡和學歷的不同,僅列出有代表性的規則,并對產生這些規則的原因進行簡要解釋,希望能為進一步研究引起這些現象的深層次原因,如文化因素、社會環境、個人偏好等,提供有益的啟發。
表格5到7中的用戶類別用年齡、性別和學歷三個屬性來來劃分,表示方法為﹡﹡﹡,左邊﹡表示年齡段,中間的﹡表示性別,右邊的﹡表示學歷,如C1Ⅰ表示年齡在25到30歲之間、性別為男性的具有本??茖W歷的用戶。
1.不同年齡用戶對隱私信息的關心程度
如2.1中所述,不同年齡段的網絡用戶的社會經歷不同,隨著年齡的增長,對事務的認識和看法也不同。針對這一現象,筆者從分析結果中找出了不同年齡的用戶對隱私信息的關心程度的差別(見表5)。
規則1 年齡在25到30歲的女性用戶比年齡在21到24歲的女性用戶更關心年齡這項隱私信息。這是因為無論在中國還是西方國家,女性對年齡這項信息都比較敏感,尤其是年齡越大的人,對這項信息越敏感,所以得出了此項規則。
規則2 同樣具有本??茖W歷的男性,年齡在25到30歲的人比年齡在21到24歲的人更關心個人工資、家庭收入和詳細健康狀況這三項隱私信息。在本問卷的被調查者中,約有三分之一的被調查者為在校學生,所以年齡在21到24歲的男性大部分為在校學生,而年齡在25到30歲的男性基本都為從事工作的人,處于這一年齡段的人一開始承擔家庭的各項經濟支出,所以對個人工資和家庭收入這兩項信息更為關心。同時,由于健康狀況可能會影響到自己的工作和家庭,所以他們對自己的詳細健康狀況這項信息的關心程度也比較高。

規則3 年齡在31到35歲的人比年齡在21到24歲的人更關心婚姻狀況和家庭電話這兩項隱私信息。由于前者基本都為成家立業的人,后者大都為在校學生,后者對婚姻和家庭尚未具體的理解和經歷,所以后者對這兩項信息的關心程度比較低是很正常的現象。
規則4 對于職業這項信息,網絡用戶都不關心,但相比來說,年齡在31到35歲的人比其他年齡段的人更關心。由于小于此年齡段的人一般都未開始工作,即使工作也是剛剛起步,而大于此年齡段的人一般工作年限已比較長,工作已經有了一定的基礎并且比較穩定,而處于31到35歲的人正處于工作的重要階段,所以對于這項信息比較敏感,關心程度也較高。
2.不同性別用戶對隱私信息的態度
一般來說,男性和女性在人生觀、世界觀、價值觀方面的差異都比較大,為了了解不同性別的用戶對隱私信息的態度存在哪些方面的差異,筆者對結果進行了分析,得出以下規則(見表6)。
規則5 女性比男性更關心年齡、體重、詳細健康狀況和家庭情況。如前所述,中西方國家的女性對年齡、體重這些信息都很敏感,所以對這兩項信息的關心程度比男性要高,至于更關心詳細健康狀況這項信息,是因為女性一般體質弱于男性,所以對該項信息更為敏感。此外,在中國,女性的家庭觀念更強,所以對家庭情況這項信息也比男性更關心。
規則6 男性比女性更關心姓名、性別、家庭住址、家庭電話。一般來說,在網絡世界里,女性要比男性更容易與他人溝通交流,而從姓名可以大致判斷性別,所以為了更方便的在網絡世界里與他人溝通,男性一般都隱瞞自己的性別,即對姓名和年齡這兩項信息的關心程度比女性高;此外,無論在中國還是西方國家,男性一般要承擔起保護保護家人的責任,而家庭住址和家庭電話這兩項信息的泄露可能會給家人帶來麻煩或危險,所以男性對這兩項信息的關心程度比女性高。
規則7 年齡在25到30歲之間的男性比女性更關心家庭信貸情況這項信息,但年齡在21到24歲之間的具有本專科學歷的女性卻比男性更關心此項信息。處于前一年齡段的人一般為剛成家立業的人,在中國,歷來有男人養家的傳統思想,所以處于這一年齡段的男性要比女性更關心自己的家庭信貸情況;而處于后一年齡段的人大都為在校學生,而女性一般比男性心思更加細膩,對父母更加體貼,所以處于這一年齡段的女性更關心家庭信貸情況是出于對父母的關心。
3.不同學歷用戶對隱私信息的態度
不同學歷的人,所受的教育程度不同,一般在對問題的認識深度等方面會存在一定的差異。筆者從分析結果中找出了不同學歷的用戶在隱私信息的關心程度方面的差異(見表7)。

規則8 具有本??茖W歷的女性比具有碩士學歷的女性更關心身高這項信息,而后者更關心配偶工資和網絡聊天記錄這兩項隱私信息。一般來說,女性對身高并沒有男性關心程度高,但是對于具有不同學歷的女性來說,在學歷上具有優勢之后,對身高這項信息的關心程度自然也就沒有在學歷上具有弱勢的女性高;至于配偶工資這項信息,如果女性本身的學歷比較高,一般都希望配偶的工資能更高,所以對該項信息的關心程度也就比較高;此外,由于在校學生在本次調查中所占比例比較大,而在校本??茖W生一般將網絡用于溝通交流和娛樂,而在校研究生除了將網絡用于交流溝通娛樂外,最主要的一點是用于做研究,從網絡聊天的內容價值來看,碩士研究生的聊天內容價值更高,更需要保密,所以出現具有碩士學歷的女性比具有本??茖W歷的女性更關心網絡聊天記錄這項隱私信息。
四、討論
筆者采用問卷調查的方式獲得了用戶對于自身隱私信息的關心程度,并采用關聯分類的方式分析了各類用戶對于各項隱私信息的關心程度的差別,分析結果驗證了引言中提出的兩項假設。
如前所述,對于網絡隱私問題,研究的人很多,但主要集中在隱私保護技術、隱私關心和隱私行為之間的關系或隱私和信任的關系問題或隱私權問題上。筆者主要是從用戶自身觀念出發,旨在了解用戶到底對自身的哪些信息比較關心。此結論可以為電子商務網站服務,網站在了解用戶關心的各項信息后,可以加強對這些信息的保護,從而提高用戶對網站的信任水平,給網站帶來巨大商機。但是尚存在一些問題,一是調查的信息項僅26項,有許多信息沒有調查;二是樣本僅350人,且樣本年齡跨度小(如調查的年齡主要集中在20-35歲之間),涵蓋的范圍不夠寬;三是在分析用戶對信息的關心程度時僅采用頻數分析,結果可能存在不合理的地方;四是關于各類用戶對各類信息的關心程度的差別僅得出一些結論性的結果和簡單的分析。
目前,關于隱私問題的研究越來越多,也越來越深入。但仍有許多問題值得進一步研究:(1)對本文未作調查的個人隱私信息需要調查研究,得出用戶對這些信息的關心程度(本文只是對小部分信息進行調查,不完全,還需要進一步做詳細的研究);(2)雖然由調查結果得出的規則可以看出用戶對于各種信息的關心程度是不同的,但是對產生這些規則的圓滿解釋還需進一步的研究;(3)得出用戶對于各項信息的關心程度之后,電子商務網站如何利用這些結果提高用戶的信任水平也是值得研究的內容之一。
參考文獻:
[1] Forrester Research(1999). Post-web retail (September) [R/OL]. http://www.forrester.com/
[2] Harris and Associates Inc., Westin, A., 1998. Ecommerce and privacy: what net users want. Privacy and American Business and Pricewaterhouse Coopers. LLP. Available online at: http://www.pandan.org/ecommercesurvey.html. Accessed on 20 June 2005.
[3] Jupiter Research. Seventy percent of US consumers worry about online privacy, but few take protective action [EB/OL], 2002. http://www.jmm.com/xp/jmm/press/2002/pr_060
[4] Harris, 2004. National Survey on Consumer Privacy Attitudes. Available online at: http://www.epic.org/privacy/survey/S, accessed on 22 August 2006.
[5] PC world survey, 2003. Available online at: http://www.pcworld.com/article/id,112468-page,1/article.htmlS, accessed on August 22, 2006.
[6] Statistics Canada, 2006. Available online at: http://ca.today.reuters.com/news/newsArticle, accessed on August 22.
[7] Klein, S.,. The privacy debate: this time it's personal. The Guardian newspaper, April 26. 2004.
[8] Vise, D.,. Fears over Big Brother stalked Gmail. The Sunday Times news paper. Available online at:[EB/OL]http://business.timesonline.co.uk/article/, accessed on 8 December 2005.
[9] Carina Painea, Ulf-Dietrich Reipsb, Stefan Stiegerc, Adam Joinsona, Tom Buchanan. Internet users' perceptions of 'privacy concerns' and 'privacy actions' [J]. human-computer studies2007.65(526-536).
[10] Chang Liu, Jack T. Marchewka, June Lu, Chun-Sheng Yu. Beyond concern-a privacy-trust-behavioral intention model of electronic commerce[J]. Information & Management 42 (2005) 289-304.
[11] Huberman B, Adar E, Fine L. Valuating Privacy [J]. IEEE SECURITY&PRIVACY, 2005: 22-25.
[12] Thabtah F, Cowling P, Hammoud S. Improving rule sorting, predictive accuracy and training time in associative classification [J]. Expert Systems with Applications, 2006(31): 414-426.
[13] Liu B, Hsu W, Ma Y. Integrating classification and association rule mining [C]. Proceedings of the Fourth International Conference on Knowledge Discovery and Data Mining (KDD-98), 1998.
[14] Antonie M, Za?ane O, Coman, A. Associative classifiers for medical images [M]. Lecture notes in artificial intelligence 2797, mining multimedia and complex data. New York: Springer, 2003, 68-83.
[15] Yin X, Han J. CPAR: Classification based on predictive association rules [C]. Proceedings of 2003 SIAM International Conference on Data Mining (SDM'03), 2003, 369-376.
[16] 張夢.中美兩國文化中的隱私觀念比較[J].河南師范大學學報(哲學社會科學版).2006,33(5):37-39.
(責任編輯:呂洪英)