曹文譯
(上海大學圖書情報檔案系,上海,200444)
微博,即微型博客,是一種通過關注機制分享簡短實時信息的廣播式的社交網(wǎng)絡平臺[1]。據(jù)中國互聯(lián)網(wǎng)絡信息中心(CNNIC)報告,僅在中國,截至2013年12月,用戶規(guī)模就達到2.81億[2]。在全世界范圍內(nèi),微博作為一種信息生產(chǎn)和傳播工具在各國都擁有數(shù)量龐大的用戶群,由此而產(chǎn)生大量內(nèi)容豐富形式多樣的微博信息。這些信息又因其獨特的記錄性和憑證性,能夠從不同視角反映社會歷史事件和社交關系,而成為各信息保存機構新的關注焦點。美國、英國、加拿大等國的圖書館與檔案館紛紛開始探索微博資源的長期保存之道。其中美國國家檔案館在2010年4月接受了來自Tw itter公司捐贈的1700億條微博作為長期保存的對象。美國國會圖書館的通信總監(jiān)蓋爾·奧斯特伯格表示:“收集140字的tw itter信息正好符合美國國會圖書館的使命——收集美國故事和獲取有價值資料的使命”[3]。這1700億條微博由此成為美國國會圖書館館藏的一部分。
然而,作為一種在網(wǎng)絡環(huán)境下新產(chǎn)生的信息資源,微博擁有許多傳統(tǒng)信息資源所沒有的特點,其長期保存和管理也面臨許多新問題。由于字數(shù)限制所造成的信息碎片化,大量信息冗余,虛假信息泛濫以及如何保證其獨特的憑證價值,都是在對微博資源進行長期保存時,所需要關注的問題。就目前而言,還沒有哪一個學科的理論能夠完全應付這些新問題,但是,我們?nèi)匀荒軓牟煌瑢W科的傳統(tǒng)理論中,找到解決的問題的思路。近年來,檔案學界一直存在將微博作為一種檔案對待的聲音[4],無論微博檔案這種稱法最終是否成立,檔案學作為一門信息管理學科,其許多理論和方法都對微博資源的長期保存,具有很高的實踐意義。
所謂微博,即字數(shù)不超過140字的微型博客。微博的這一特點從根本上導致了微博信息無法同其它信息源一樣,形成結構嚴密有組織有邏輯的信息體,而只能是以小片段的形式存在著。同時,這些片段又通過用戶的轉發(fā)和評論,相互連接在一起,形成錯綜復雜的信息網(wǎng),共同實時反映出網(wǎng)絡世界正在發(fā)生和討論的各種事件和話題。作為微博的用戶,在獲取信息時,以一定的“角色”參與到信息網(wǎng)中,通過各種各樣的聯(lián)系,獲取自己所需要的全部信息。然而,這種特點卻造成了大量的信息冗余。
微博的這種特性使得其在被保管機構長期保存時,很難保證信息被有效復用,因為檢索系統(tǒng)無法為利用者提供微博用戶那樣以“角色”進行參與的視角,因此,利用者得到的很可能只是大量的信息碎片,而非信息的本來面目。正如維克托·舍恩伯格在他的書中所敘述的那樣:“在這樣的數(shù)字拼貼畫中,改變只有從兩個矛盾事實相沖突的角度才能看到,而無法從一個演化過程隨著時間變化的角度看到”[5]。通過檢索系統(tǒng),我們能夠看到的或許只是這些信息碎片被按照某一個標準被簡單的組合的在一起,而信息間原本所具有的聯(lián)系,則隨著保存而消失了。
來源原則,是檔案學領域的最基礎的理論之一,其核心思想就是要保證檔案文件之間的歷史聯(lián)系,以維護歷史真實面貌。毫無疑問,來源原則所基于的保持歷史聯(lián)系的精神,正是微博資源長期保存所需要的。它將使微博資源從信息碎片的集合中解放出來,重新還原成為相互關聯(lián)的信息集合。就目前情況而言,在微博資源長期保存中運用來源原則,至少有以下兩個方面要求。
其一是正確看待微博中大量的信息冗余。微博信息的冗余,主要是由于微博轉發(fā)所造成的信息重復。在來源原則的思維模式下,這種冗余并非是無價值的簡單重復,而是反映了信息間重要關系的有效冗余。因此,我們不但不應該將其視為信息垃圾將其刪除,反而應該妥善的保存這部分看似重復的信息。
其二是對微博信息著錄的要求,它要求微博信息在被保存時,除了原有的著錄項目,還應該包括其背景信息和元數(shù)據(jù),并在檢索系統(tǒng)中,提供以此為基礎的檢索入口和檢索方式。從而保證利用者能在利用時在能夠充分了解信息間歷史聯(lián)系的基礎上進行信息的利用和分析。
來源原則作為檔案學領域的經(jīng)典理論,其所包含的對信息間歷史聯(lián)系的尊重,正是數(shù)字化時代,單純的信息檢索所沒有考慮到的。特別是微博這樣以用戶間互動為重要功能的社交平臺,想要長期完整的保存信息,保證信息間的歷史聯(lián)系是十分重要甚至是必須的。
微博由于注冊簡單,操作便捷而受到廣大用戶的歡迎,其一誕生就得到迅速的推廣。然而,作為一種準入門檻低、開放性強、傳播速度極快的社交媒體,微博平臺上所涌現(xiàn)出的豐富信息資源,存在信息質量良莠不齊的問題。特別是由于任何人都能在微博上隨意發(fā)布和轉發(fā)各種信息,導致微博上充斥著大量的虛假信息。這些虛假的信息通過用戶刻意或無意的轉發(fā),往往會產(chǎn)生非常大的負面影響,由此成為人們深惡痛絕的“微博謠言”。
例如,2010年12月7日新浪微博一實名認證用戶突然發(fā)布了一則“金庸因中腦炎合并胼胝體積水于今日19點07分在香港尖沙咀圣瑪利亞醫(yī)院去世”的信息,瞬間在網(wǎng)絡上引發(fā)哀悼狂潮。事后這一消息被證實是一則假消息,但正是這樣一則假消息,卻在網(wǎng)上被反復轉發(fā)和評論,令不少人都信以為真。
由于微博平臺的信息發(fā)布特點,虛假信息雖然為人們所厭惡和抵制,卻又是無法被完全避免和排除的。可以說,只要有微博存在,就必然存在虛假信息,如何對待這些虛假信息是微博資源長期保存中所必須要面對的一個問題。
盡管作為在社會實踐過程中形成的歷史記錄,檔案擁有其他信息材料所無法比擬的真實性與可靠性。但是與其他許多學科不同,檔案學在對待虛假檔案時的立場,卻是格外的寬容的,檔案人更傾向于用辯證的立場對待檔案的真實性,而非只是二元對立的非真即假。
這種辯證的立場是由于檔案人肩負著為社會保存記憶和知識的使命,檔案管理者不僅要留下那些“真實”的檔案來印證歷史,有時候還需要保存那些“虛假”的檔案來證明歷史的另一面。“具體來說,就每份特定的文件或某部分案卷而言,檔案所記載的信息內(nèi)容有的是真實的,也有的是不真實的或不完全真實的。但即使是檔案內(nèi)容有虛假成分以至完全違背事實,它還是反映了檔案形成者的認識水平、本來的意圖或欺騙活動。就此而言,檔案仍不失為其形成者活動的真實的歷史記錄”[6]。
假如我們僅僅因為認定檔案是虛假的而將其毀棄,那么隱藏在這分虛假檔案背后的故事也將永遠消失在歷史的長河中,從而人為地制造出歷史的盲點,一個專業(yè)的檔案工作者絕不會這樣做。而如果我們將檔案學這種辯證的立場帶入到數(shù)字資源長期保存的實踐中去,或許也能收獲新的驚喜。
微博中所包含的大量虛假信息,從傳統(tǒng)角度出發(fā)去看待,似乎是毫無保存價值的。
但是,如果我們愿意借鑒檔案學在對待虛假檔案時的辯證立場去對待這部分虛假信息,會發(fā)現(xiàn)它們同樣是社會記憶的一部分,如果我們想要完整地保存這部分社會記憶,就不應該將它們排斥在外。因為它們同樣可以反映謠言制造者的某種意圖,轉發(fā)傳播者的某種心態(tài),當研究者將它們置于當時的歷史條件背景下,虛假的微博信息同樣能反映出真實的歷史。
檔案學對待信息真實性的這種辯證的立場,對于微博信息而言,還有另一更為特殊和重要意義,那就是發(fā)布在微博上的信息,是不同發(fā)布者站在不同的立場上對某一事件的認識的反映。同一事件,用于記錄人立場的不同,會出現(xiàn)許多不同,甚至截然相反的記載。很多時候,局限于當時人們的認知水平和政治條件,我們無法區(qū)分哪一種記錄是真實的,或者僅根據(jù)官方說法認定某一種記錄是虛假的。這樣,如果我們僅僅根據(jù)當時的判定來決定微博信息的保存與否,就會令后來人永遠的喪失考察真相的可能性。只有我們辯證而寬容地對待了那些虛假的,有可能虛假的以及被官方判定為虛假的信息,我們才有可能為后人留下真相。
微博給了給了每個人發(fā)聲的權利,由此人們在自己的微博上發(fā)布各種各樣的消息。這些消息,隨著時間的推移,很有可能成為人們進行新的社會實踐活動的依據(jù)和憑證。2012年,藥家鑫事件結束后,其父在微博上發(fā)布了一條表達想要出錢補助受害者的微博,時隔月余,受害者家屬,就根據(jù)這一條微博記錄,要求藥家支付20萬元贈予款。無論其中內(nèi)情如何,是非如何,這一案例充分說明,微博的潛在憑證價值已經(jīng)為社會大眾所感知,人們在進行社會活動時,不自覺的就將微博信息納入了可以依憑的范疇。
與其他信息源相比,微博作為一種實時發(fā)布的公開信息,具有相對較強的憑證價值。2015年2月4日,在最高人民法院新發(fā)布的一份司法解釋中:“網(wǎng)上聊天記錄、博客、微博客、手機短信、電子簽名、域名等形成或者存儲在電子介質中的信息可以視為民事案件中的證據(jù)”[7]。這說明微博的憑證價值已經(jīng)得到我國法律的認同。這也使我們保存微博的意義又加深了一重。
盡管微博信已經(jīng)具備了憑證價值,并且得到了法律認可,但是在長期保存的過程中想要確保這種價值并使其真正發(fā)揮作用,卻是一件令保存者頭疼的事。
在檔案學中,所謂“前端控制”是指為保證電子文件的真實性和法律證據(jù)效力,要求系統(tǒng)在設計之初就對電子文件在形成、捕獲、組織、利用的整個生命周期過程中可能出現(xiàn)的問題進行通盤考慮,“把可能預先設定的管理功能納入系統(tǒng)之中,并在文件形成和維護階段進行監(jiān)督”[8]。
檔案學領域前端控制的思想,實際上是檔案學區(qū)別于其他信息學科的又一特色理論,它所代表的檔案學對信息主動而積極的管理態(tài)度,最早體現(xiàn)在檔案學者很早就認識到檔案不是一種被動的搜集物上,“檔案機構不從事搜集材料的活動”[9]。因此,檔案應該是被主動收集的,這種主動的態(tài)度在電子文件管理實踐中,被進一步發(fā)展為前端控制理論,并且大放異彩。
由于電子文件所存在的不穩(wěn)定性和易修改性,使得電子文件的真實性與可靠性都大大降低。而通過對電子文件進行前端控制,主動參與到電子文件的整個生命周期中去進行管理,可以有效規(guī)避電子文件在生成、傳遞和保存過程中所遇到的安全風險,從而保證電子文件的真實性,由此確保電子文件的憑證性。
微博,作為在網(wǎng)絡環(huán)境中生成的一種信息,雖然擁有相對的穩(wěn)定性和第三方平臺的保障,但是如果不能對其進行前端控制,那么在復雜多變的網(wǎng)絡環(huán)境中產(chǎn)生和傳播的微博信息,將面臨比電子文件更大的風險,這會對微博信息的憑證價值造成巨大的威脅。如果我們僅僅只希望從微博信息中獲取情報價值,或僅僅只滿足于保存微博信息為學術研究服務,那么或許保存部門可以安心的做一個信息“收割人”,被動地采集微博信息。但是,倘若我們不愿意放棄微博信息所蘊含的重要的憑證價值,那么,前端控制思想,將為它保駕護航。
因此,我們有必要效仿檔案管理領域對電子文件的前端控制方法,對微博信息也進行前端控制。應該認清微博資源的長期保存所針對的,不是有關機構“搜集”來的微博信息,而是保存主體從微博信息生成之初就介入進行管理而“收集”來的微博信息。
為此,首先應該由有關部門出臺相關規(guī)章,規(guī)定微博運營商所應承擔的義務,為微博資源長期保存打下基礎。
其次,應該確定微博資源長期保存的責任主體(筆者以為一般情況下還是由微博運營商作為責任主體為宜),建立起有效的微博資源管理制度與工作流程,將微博信息從其生成到被保存利用的整個生命周期都納入有效的控制范圍。尤其是某些具有特殊價值的微博,如政務微博,對微博信息的保存有特殊的要求,因此可以采取一些特殊手段,如“各政府機構在建立微博時,要和平臺服務商進行合作,簽訂相應的合同,由平臺服務商保證微博的正常運行以及微博內(nèi)容的保存期限”[10]。
最后,檔案部門作為專業(yè)指導者,應該參與和幫助制定微博資源長期保存的相關標準,如系統(tǒng)設置和元數(shù)據(jù)著錄規(guī)則,加強對系統(tǒng)和微博資源背景信息的管理和控制。
計算機技術與網(wǎng)絡技術為人們開啟了新世界的大門,在新的歷史環(huán)境條件下,舊的信息資源在計算機環(huán)境中有了新的表達,新的信息資源也在不斷產(chǎn)生。面對復雜多變的計算機和網(wǎng)絡環(huán)境,如何長期保存數(shù)字資源成為當代人所必須面對的難題。無論微博這一信息資源是否屬于一種檔案,檔案學作為一門傳統(tǒng)的信息管理學科,對信息的長期保存自有頗具特色的一套理論體系,挖掘其中與微博資源特點相適應的合理內(nèi)核,將為微博資源長期保存,打開新的思路。
[1]微博百度百科[EB/OL].[2014-10- 20].http://baike.baidu.com/link?url=cZTW 4onN7ULlp0rBhdqufw J9d5_JZk-Fkq9aDpfA_WGsHPsvh9TKnfUJ_EM -BlilnaPhMgQLtY lx8S1kKMx4L2fYsG0-iJYuhD1EaqTQwStoe.
[2]中國互聯(lián)網(wǎng)絡信息中心第33次報告[EB/OL].[2014-10-20].http://wenku.baidu.com/link?url=tnFQ8dAF -zHxG12_XpESy5Y_taCr0blaBw rjqe6yECouCLryT6jom -jw_EQ8Rfl57T3YH1JqNiTgd I -hJckS4ALB-ZXZdfjugVu24CSn73Faei.
[3]美國國會圖書館每天收錄4億條tw itter用于研究[EB/OL].[2014-10-20].http://it.sohu.com/20130122/n364343876.shtm l.
[4]左凡凡,張幸媛,劉艷玲.微博應作為檔案[J].檔案與建設,2012(2):12-14.
[5]維克托·舍恩伯格.刪除:大數(shù)據(jù)取舍之道[M].袁杰,譯.杭州:浙江人民出版社,2013:155.
[6]吳寶康.檔案學概論[M].北京:中國人民大學出版社,1988:57-61.
[7]最高法:微博、網(wǎng)上聊天記錄等可作民事案件證據(jù)[EB/OL].[2015-2-12].http://www.chinanews.com/gn/2015/02-04/7033390.shtm l.
[8]金波,丁華東編.電子文件管理學[M].上海:上海大學出版社,2007:47.
[9]謝倫伯格.現(xiàn)代檔案-原則與技術[M].北京:檔案出版社,1983:25.
[10]黃新榮,吳建華.政務微博檔案化保存初探[J].檔案與建設,2012(4):4-6.