施明儀
摘要:個(gè)人數(shù)字檔案是個(gè)人檔案新的研究領(lǐng)域。簡要闡述了國內(nèi)外個(gè)人數(shù)字檔案存檔的實(shí)踐情況。針對(duì)個(gè)人數(shù)字檔案存檔的過程提出了一些設(shè)想,包括收集渠道、收集范圍、收集方式以及對(duì)數(shù)字檔案的鑒定;對(duì)數(shù)字檔案的組織分類方法及標(biāo)引;對(duì)個(gè)人數(shù)字檔案的管理也從個(gè)人和檔案部門兩方面展開;分析個(gè)人數(shù)字檔案的利用價(jià)值。最后針對(duì)個(gè)人數(shù)字檔案存檔過程中存在的問題提出相應(yīng)的對(duì)策。
關(guān)鍵詞:個(gè)人;數(shù)字檔案;數(shù)字檔案存檔系統(tǒng)
中圖分類號(hào):F24文獻(xiàn)標(biāo)識(shí)碼:Adoi:10.19311/j.cnki.16723198.2018.02.038
隨著電子產(chǎn)品的大量使用,人們?cè)诠ぷ鳌⑸钪挟a(chǎn)生了大量的數(shù)字信息,對(duì)數(shù)字檔案的研究個(gè)人數(shù)字檔案的收集、組織、管理和利用成了新的研究領(lǐng)域。
1國內(nèi)外個(gè)人數(shù)字存檔概況
個(gè)人數(shù)字檔案是個(gè)人數(shù)字存檔的對(duì)象。個(gè)人數(shù)字存檔是采用信息技術(shù)手段對(duì)個(gè)人數(shù)字檔案進(jìn)行收集、組織、管理、利用。國外對(duì)個(gè)人數(shù)字存檔已有相當(dāng)?shù)难芯俊?001年底,微軟研究院成立了MyLifeBits(我的比特人生)項(xiàng)目,旨在“存儲(chǔ)一生中的所有信息”。該項(xiàng)目包括系統(tǒng)開發(fā)(提供檢索功能)和Gordon Bell個(gè)人數(shù)字存檔實(shí)驗(yàn)。2012年,伊利偌伊大學(xué)圖書館的檔案部門也開發(fā)了一個(gè)項(xiàng)目,創(chuàng)建了iKive網(wǎng)站,主要提供了一種集中存檔的方式,可保存桌面文件、社交媒體記錄、電子郵件等文件。Cesar Kuriyama參與了美國的Second Everyday項(xiàng)目,用手機(jī)從30歲開始記錄一天中的一秒生活。這給他的生活帶來了非常積極的影響,讓他更加珍惜生命。CNN曾對(duì)其進(jìn)行過專訪,在2012年時(shí),被TED邀請(qǐng)做演講,引起了不小的社會(huì)反響。
而國內(nèi)卻沒有相應(yīng)的實(shí)踐項(xiàng)目,一部分文章討論了個(gè)人數(shù)字檔案云儲(chǔ)存環(huán)境、網(wǎng)頁存檔、電子郵件存檔和個(gè)人數(shù)字遺產(chǎn)方面的問題,為個(gè)人數(shù)字存檔管理提供了一些建議。
2個(gè)人數(shù)字檔案存檔過程
2.1個(gè)人數(shù)字檔案的收集
人們?cè)谌粘9ぷ鳌W(xué)習(xí)和生活中積累的大量數(shù)字檔案資源往往分散在不同的設(shè)備和載體上,包括各類硬盤、U盤、內(nèi)存卡、電腦等電子產(chǎn)品、可穿戴設(shè)備以及目前較為流行的云盤等。在收集個(gè)人數(shù)字資源時(shí),需要仔細(xì)查看以上涉及的數(shù)字設(shè)備,收集個(gè)人數(shù)字檔案。收集郵件中的數(shù)字資源時(shí),需較全面地了解自身使用過的郵箱,并逐一查看。社交媒體是個(gè)人數(shù)字檔案的重點(diǎn)收集對(duì)象,包括微博、微信、空間、論壇等。最后就是即時(shí)通信中的重要談話內(nèi)容,如阿里旺旺上跟賣家的談話,微信、QQ中重要聊天記錄等。由于個(gè)人數(shù)字檔案形式多樣,內(nèi)容分散,因此還需要注意一些筆記或備忘錄軟件,包括印象筆記、有道筆記等。
在進(jìn)行個(gè)人數(shù)字檔案收集時(shí),需要確定收集范圍,可從兩個(gè)角度來確定,一是內(nèi)容范圍,即根據(jù)個(gè)人數(shù)字檔案存檔需求,查看個(gè)人數(shù)字檔案內(nèi)容是否相關(guān),并確定該以怎樣的形式進(jìn)行存檔;二是時(shí)間范圍,是指在個(gè)人數(shù)字檔案資源信息發(fā)生的時(shí)間上,根據(jù)收集的目的和需求確定范圍。
針對(duì)不同形式的個(gè)人數(shù)字檔案,其收集方式有所區(qū)別,例如對(duì)網(wǎng)頁更新頻率太快,需對(duì)其內(nèi)容進(jìn)行篩選,決定需要收藏的內(nèi)容。
為確保檔案價(jià)值,需對(duì)其進(jìn)行鑒定。2010年6月到2011年12月,澳大利亞Sue McKemmish采訪了20個(gè)人,詢問他們?nèi)绾喂芾砗捅4嫠麄兊臄?shù)字檔案,以及他們對(duì)其有沒有一個(gè)長期的計(jì)劃。在答案中,有關(guān)保存?zhèn)€人數(shù)字檔案的原因有以下幾點(diǎn):希望對(duì)他人有潛在作用,如家族史研究或其他研究;希望自己被家人和朋友記得;極其喜愛某些文件、照片、錄音、視頻或其他數(shù)字的東西;不希望把自己的蹤跡忘在腦后;關(guān)注隱私,保存隱私;私人性質(zhì)的文件,如科研論文、工作總結(jié)等;當(dāng)下對(duì)自己的數(shù)字資源感興趣。
根據(jù)這幾點(diǎn),個(gè)人數(shù)字檔案的鑒定可根據(jù)以下兩個(gè)方面來考慮,一是根據(jù)用戶自身的需求進(jìn)行鑒定。根據(jù)用戶自身喜好,對(duì)數(shù)字檔案進(jìn)行甄別和選擇,自行確定其價(jià)值;二是根據(jù)家庭或社會(huì)的整體利益進(jìn)行鑒定。美國國會(huì)圖書館在2013年1月發(fā)布了題為《Update on the Twitter Archive at the Library of Congress》的Twitter存檔白皮書。主要強(qiáng)調(diào)了社交媒體信息歸檔的重要性,為學(xué)者研究人民群眾的某些活動(dòng)或者習(xí)性提供了有關(guān)社交檔案的樣本數(shù)據(jù),也能夠使未來的學(xué)者們更全面地了解今天。此鑒定原則在一定程度上脫離了個(gè)人判斷,而要求收集個(gè)人數(shù)字檔案的人員有意識(shí)地進(jìn)行選擇。
2.2個(gè)人數(shù)字檔案的組織
個(gè)人數(shù)字檔案分類的方法有很多,包括按個(gè)人數(shù)字檔案產(chǎn)生的時(shí)間分類,即按年度或者時(shí)期進(jìn)行分類;按個(gè)人數(shù)字檔案類型分類,包括照片、音頻、視頻、網(wǎng)站、社交媒體等;按個(gè)人數(shù)字檔案內(nèi)容分類,包括個(gè)人工作類或?qū)W習(xí)類或娛樂類或生活類數(shù)字檔案。
以上這些分類法都是所謂單式分類法,在實(shí)際工作中,單式分類法不能很好地滿足個(gè)人保存和查找時(shí)的需求。因此采用兩種或兩種以上的分類法,進(jìn)行這樣的存儲(chǔ)或查找可以節(jié)省時(shí)間。分類標(biāo)準(zhǔn)不唯一,用戶可根據(jù)個(gè)人習(xí)慣進(jìn)行調(diào)整。
對(duì)個(gè)人數(shù)字檔案只進(jìn)行分類還不夠。個(gè)人數(shù)字檔案中占比最多的是照片檔案。它們很難進(jìn)行精確的分類和整理,對(duì)于個(gè)人用戶來說,想要對(duì)它們進(jìn)行比較精確的劃分,則可采用添加元數(shù)據(jù)和標(biāo)簽的形式,如Instagram中的“tag people”功能,可以為每一張照片添加用戶標(biāo)簽,采用“# 用戶名”的格式。Lightroom可以快速地對(duì)大量照片進(jìn)行管理和后期處理,同時(shí)能為照片添加元數(shù)據(jù),只需在Lightroom中導(dǎo)入想要打開的數(shù)碼照片,在右側(cè)的工具欄中點(diǎn)擊在導(dǎo)入時(shí)應(yīng)用下的元數(shù)據(jù),點(diǎn)擊新建預(yù)設(shè),就能為照片添加詳盡的元數(shù)據(jù)了。
分類和標(biāo)引的最終目的是更好地幫助用戶進(jìn)行檢索。因此需要構(gòu)建個(gè)人數(shù)字檔案目錄,目錄中各條目所記載的文件或文件夾按統(tǒng)一命名規(guī)則進(jìn)行命名,例如“形成時(shí)間+標(biāo)題+類型”。endprint
2.3個(gè)人數(shù)字檔案的管理
個(gè)人數(shù)字檔案記錄用戶生活,保存用戶記憶,因此對(duì)用戶來說是重要的,但是這些數(shù)字檔案本身是脆弱的,需要通過軟件和設(shè)備才能訪問。因此對(duì)它們進(jìn)行合理的保存和管理是必要的。
對(duì)于個(gè)人來說,首先需要有進(jìn)行個(gè)人數(shù)字檔案存檔的意識(shí)。現(xiàn)在很多用戶在使用如U盤、移動(dòng)硬盤等存儲(chǔ)工具方面并沒有問題,但卻無法做到時(shí)常對(duì)數(shù)字檔案進(jìn)行更新,同時(shí),對(duì)類似云存儲(chǔ)這樣的存儲(chǔ)介質(zhì)不甚了解。如今微信成了非常流行的社交軟件,根據(jù)CNNIC第39次中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告(2017年1月):2016年,79.6%的網(wǎng)民最常使用的APP是微信,如圖1所示。
圖12016年網(wǎng)民最經(jīng)常使用的5個(gè)APP
用戶在使用微信等即時(shí)通信工具時(shí),經(jīng)常會(huì)使用朋友圈或QQ空間記錄自己的生活,通常會(huì)以“圖片+文字”的形式出現(xiàn)。這作為數(shù)字檔案會(huì)保存在運(yùn)營商的服務(wù)器中。其次,對(duì)用戶個(gè)人來說,數(shù)字檔案存檔的途徑包括:線上途徑,即使用個(gè)人云存儲(chǔ)。用戶只需要記住用戶名與密碼即可,在有網(wǎng)絡(luò)的環(huán)境下,在電腦、平板或智能手機(jī)上就能在云盤中查看、管理自己的數(shù)字檔案;線上線下結(jié)合途徑,線上發(fā)布數(shù)字檔案的同時(shí),在線下的實(shí)體存儲(chǔ)設(shè)備中保存一份同樣的,有利于日后該數(shù)字檔案的獲取與使用。
而對(duì)于檔案部門來說,如何保存重要的個(gè)人數(shù)字檔案也是為研究人類記憶做相應(yīng)的資源儲(chǔ)備。相對(duì)比較可行的方案是建立個(gè)人數(shù)字檔案網(wǎng)站或系統(tǒng)。國外的個(gè)人數(shù)字存檔系統(tǒng)相對(duì)完善,目前有三款系統(tǒng):人生流、干草堆和無固定位置的文檔。
人生流(Lifestreams)是一種用于管理個(gè)人數(shù)字檔案的新模式和系統(tǒng),采用“時(shí)間軸”的方法來管理個(gè)人數(shù)字檔案。
干草堆(Haystack)是麻省理工學(xué)院的項(xiàng)目。客戶端是一個(gè)研究性個(gè)人信息管理程序(PIM),這個(gè)程序提供了統(tǒng)一的框架,通過一個(gè)單獨(dú)的界面來管理用戶的所有信息。
無固定位置的文檔(Placeless Documents)是由Xerox Palo Alto研究中心的研究團(tuán)隊(duì)開發(fā),是一個(gè)基于個(gè)性化文檔屬性、以用戶為中心的文檔管理系統(tǒng)。
我國檔案部門可以參考以上三個(gè)系統(tǒng)來提供相應(yīng)服務(wù),不僅接受用戶上傳的個(gè)人數(shù)字檔案,而且提供相應(yīng)的鑒定、分類、檢索服務(wù)。相關(guān)檔案人員可從系統(tǒng)設(shè)計(jì)最初就參與進(jìn)去,將檔案管理的理念融入系統(tǒng)中,確保檔案的真實(shí)性、完整性、有效性,為檔案的長期存取提供便利。同時(shí),相關(guān)檔案部門在構(gòu)建系統(tǒng)的同時(shí),可開展相關(guān)的個(gè)人數(shù)字存檔活動(dòng),為系統(tǒng)進(jìn)行前期宣傳。提高用戶的數(shù)字檔案收集、管理意識(shí),強(qiáng)化管理技巧。
2.4個(gè)人數(shù)字檔案的利用
馮惠玲教授認(rèn)為可利用數(shù)字檔案資源構(gòu)建一個(gè)數(shù)字資源庫,通過豐富的多媒體形式記錄我國悠久燦爛的歷史文化和豐富多彩的社會(huì)生活,同時(shí),各地區(qū)、行業(yè)可就本地區(qū)、本行業(yè)構(gòu)建相應(yīng)的子庫。而個(gè)人數(shù)字檔案便可充當(dāng)此資源體系的素材,成為中國記憶中的一部分,記錄生活,折射歷史。
由于個(gè)人數(shù)字檔案具有真實(shí)性,那么人們可以在日常生活中利用它來維護(hù)自己的合法權(quán)益。如工作中通過來往郵件可直接確定責(zé)任人;微信、QQ、阿里旺旺等聊天記錄在具有合法性、真實(shí)性和關(guān)聯(lián)性的基礎(chǔ)上可作為證據(jù)提供。
個(gè)人數(shù)字檔案記錄的是個(gè)人的工作、生活,對(duì)于個(gè)人來說,最大的效用是作為一份回憶存檔,喚醒自身的檔案意識(shí)。同時(shí)由于這些檔案帶有真實(shí)性和原始性,對(duì)于他人來說是一份經(jīng)驗(yàn)參考,具有良好的引導(dǎo)和教育作用。
另外,已有一定數(shù)量的學(xué)者關(guān)注到隱藏在個(gè)人數(shù)字檔案背后的科研價(jià)值,且已有學(xué)者對(duì)此展開了課題研究,對(duì)研究當(dāng)今的文化規(guī)范、交流用語、熱點(diǎn)事件等具有推動(dòng)作用。
3個(gè)人數(shù)字檔案存檔過程存在的問題及對(duì)策
3.1缺少對(duì)用戶隱私問題的關(guān)注
雖然在個(gè)人數(shù)字檔案系統(tǒng)中的文件屬于個(gè)人或家庭,但是它畢竟是社會(huì)記憶的一部分,從長遠(yuǎn)的角度來說,它必然會(huì)面臨向公眾開放的一天。另外,云存儲(chǔ)原本就是一個(gè)大資源池,用戶無法知道他們的個(gè)人數(shù)字檔案被保存在哪個(gè)國家哪個(gè)地區(qū)的哪臺(tái)服務(wù)器上。
想要解決這樣的問題,需要完善的權(quán)限規(guī)則和必要的技術(shù)措施,如馬賽克技術(shù)、數(shù)字簽名技術(shù)等。一方面國家或有關(guān)行業(yè)應(yīng)在法律或行業(yè)規(guī)范上對(duì)用戶隱私進(jìn)行相關(guān)規(guī)定,保護(hù)用戶的合法權(quán)益,另一方面,相應(yīng)的個(gè)人數(shù)字檔案存檔系統(tǒng)應(yīng)從技術(shù)上給予用戶保護(hù)自身隱私的權(quán)利。
3.2標(biāo)注工作給用戶帶來麻煩
用戶個(gè)人產(chǎn)生的數(shù)字檔案量大,從一定意義上來講,用戶標(biāo)注的質(zhì)量高低直接影響整個(gè)系統(tǒng)的使用體驗(yàn)和檢索質(zhì)量。因此,用戶需要花費(fèi)時(shí)間和精力認(rèn)真標(biāo)注。但是相應(yīng)的會(huì)給用戶造成系統(tǒng)缺乏人性化、智能化的印象。
這個(gè)問題的解決方式有兩種,一是發(fā)展技術(shù),實(shí)現(xiàn)內(nèi)容識(shí)別與自動(dòng)標(biāo)引;二是在對(duì)用戶隱私進(jìn)行保護(hù)的前提下,發(fā)動(dòng)大眾進(jìn)行標(biāo)引,即將相應(yīng)的數(shù)字檔案公布在相關(guān)的網(wǎng)站上,通過注冊(cè)的網(wǎng)民即可在該網(wǎng)站上進(jìn)行相應(yīng)的內(nèi)容標(biāo)注,而網(wǎng)站可建立一套規(guī)則進(jìn)行補(bǔ)貼。
3.3個(gè)人數(shù)字檔案的長期保存
對(duì)個(gè)人數(shù)字檔案如何以一種有效、經(jīng)濟(jì)、易于存取的形式保存下來,使這些檔案能夠不受任何技術(shù)水平或者時(shí)間長短的限制,能夠被永久保存、方便地使用。在這個(gè)問題上,首先,需要對(duì)個(gè)人數(shù)字檔案的保存采取一種合理化的策略,什么樣的檔案需要永久保存,不同類型檔案的保存期限,都需要根據(jù)情況進(jìn)行不同的處理方法。另外,長期保存的技術(shù)越來越成熟,包括信息封裝技術(shù)、安全監(jiān)測(cè)技術(shù)、完整性校驗(yàn)技術(shù)、數(shù)據(jù)功能校驗(yàn)技術(shù)等。將保存策略和技術(shù)相結(jié)合,個(gè)人數(shù)字檔案的長期保存才能實(shí)現(xiàn)。
4結(jié)語
本文主要針對(duì)個(gè)人數(shù)字檔案存檔的過程,包括收集、組織、管理、利用提出了一些設(shè)想。在這過程中,還存在很多問題,需要有針對(duì)性的解決方案,這樣才能保障存檔過程的科學(xué)性。隨著數(shù)字化信息的不斷增多,個(gè)人數(shù)字檔案存檔會(huì)日益凸顯其重要性。如何將個(gè)人數(shù)字檔案的價(jià)值發(fā)揮到最大,需要個(gè)人、檔案館乃至整個(gè)社會(huì)的共同努力。endprint
參考文獻(xiàn)
[1]周亞鋒.國外個(gè)人數(shù)字存檔實(shí)踐研究與思考[J].信息資源管理學(xué)報(bào),2016,(02):94100.
[2]Hawkins D T. New horizons in personal archiving: 1 Second Everyday, myKive, and MUSE[A]//Hawkins D T. Personal Archiving: Preserving Our Digital Heritage. New Jersey: Information Today,2013:243257.
[3]National Digital Information Infrastructure And Preservation Program. Perspectives on personal digital archiving[J]. Library of Congress,2013:179.
[4]萬凱莉.美國Twitter存檔項(xiàng)目對(duì)我國社交媒體信息歸檔的啟示[J].浙江檔案,2014,(5):811.
[5]單靜.個(gè)人數(shù)字檔案管理[D].南京:南京大學(xué),2015.
[6]王方.美國國會(huì)圖書館個(gè)人數(shù)字典藏的推廣與啟示[J].新世紀(jì)圖書館,2013,(4):9597.
[7]CNNIC,中國互聯(lián)網(wǎng)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)調(diào)查(2017)[R].中國互聯(lián)網(wǎng)絡(luò)信息中心,2016.
[8]Lifestreams[EB/OL].[2015-12-25].http://www.lifestreams.com/.
[9]Huynh D, Karger D R, Quan D, et al. Haystack: A platform for creating, organizing and visualizing semistructured information[C]//Proceedings of the 8th International Conference on Intelligent User Interfaces. ACM, 2003:323.
[10]周亞鋒.國外個(gè)人數(shù)字存檔實(shí)踐研究與思考[J].信息資源管理學(xué)報(bào),2016,(02):94100.
[11]馮惠玲.檔案記憶觀、資源觀與“中國記憶”數(shù)字資源建設(shè)[J].檔案學(xué)通訊,2012,(03):48.
[12]王海寧,丁家友.對(duì)國外個(gè)人數(shù)字存檔實(shí)踐的思考——以MyLifeBits為例[J].圖書館學(xué)研究,2014,(06):6267.
[13]高旭,趙豪邁.數(shù)字檔案長期保存利用技術(shù)機(jī)制[J].檔案學(xué)通訊,2013,(06):8589.endprint