劉 超,鄭建程
論微博信息的長期保存價值
劉 超,鄭建程
微博是最受歡迎的社交媒體之一,龐大的微博用戶群體生產了大量有長期保存價值的微博信息,然而與之相關的研究、實踐卻十分匱乏。文章分別論述了微博信息的長期保存價值,以及對微博信息長期保存價值的質疑,指出并建議國內外相關學者、機構應對微博信息保存開展更加全面而深入的研究。
微博 微博信息 長期保存 保存價值
Web 2.0時代,人們不僅可以瀏覽信息,還可以利用各式各樣的社交媒體工具發表觀點、分享經驗,參與到信息的創建、利用和修改活動中。微博作為最受歡迎的社交媒體工具之一,其用戶生產了大量有價值的信息,這些信息是當代數字信息的重要組成部分,應該得到妥善的保管。2010年4月,美國國會圖書館與Twitter簽訂了一項協議,協議要求自簽訂日起Twitter向國會圖書館捐贈自該公司成立以來所有公開的Twitter信息,并且今后會持續地為國會圖書館提供Twitter信息歸檔[1]。國會圖書館以實際行動證明了微博信息具有保存價值。另外,OCLC董事會主席Larry P.Alford也指出學術圖書館的其中一個使命就是要“探索收集社群(會)媒體及其他當代數據信息”[2]。為此,學術圖書館有必要認識到微博信息的長期保存價值,主動承擔起相應的保存使命。
微博(又稱微博客)是一種允許用戶及時更新簡短文本并可以公開發布的微型博客形式,一些微博也可以發布多媒體信息,如圖片、flash、音/視頻等[3]。手機、Pad微博客戶端的出現和普及,以及單條微博140個字數的限制,使得微博的信息傳播成本極低,用戶能夠隨時隨地分享所見所聞、所感所思。Twitter是最早也是最著名的微博,2006年一經推出,便迅速獲得了全世界廣大網絡用戶的歡迎,目前其網站的訪問量位居世界第11位[4]。2009年微博開始在我國流行,CNNIC(中國互聯網絡信息中心)《第32次中國互聯網發展狀況調查報告》的數據顯示,截至2013年6月底,我國使用微博的網民規模已經突破了3.3億,微博在網民中的使用率達到了56%,目前微博已經成為網民獲取信息的重要途徑之一[5]。
微博一詞既可以指代微博這種社交媒體平臺,也可以指微博用戶在微博平臺上發布的短消息,在平時的使用中人們多不加以區分。本文所要研究的對象為后者,故在本文中使用“微博信息”一詞以示區分。
2.1 微博信息的科學研究意義
美國國會圖書館認為[6],Twitter信息的價值體現在三方面:(1)為一些因Twitter而引發的事件提供了最直接的第一手資料;(2)Twitter可視作一個主要信息源(如路透社、紐約時報等)的動態聚合器,并且為公民新聞提供了一個發布、傳播的公共平臺;(3)Twitter上忠實地記錄了普通人的生活,可為后代提供一個了解現代人們生活狀況的窗口。所有這些都可以作為國會圖書館現有文化遺產收藏的有益補充。在其發布的“Twitter存檔現狀的白皮書”中提到[7],雖然目前該存檔還無法對研究者開放,但已經從全世界收到了400條訪問的請求,而且研究者們關注的主題非常廣泛。其實微博信息潛在的研究價值早已突破了網絡信息環境的限制,如卡內基梅隆大學的Jacob Eisenstein教授認為Twitter一類的數據將使得語言研究的“游戲規則”發生實質性的改變,他通過研究發現,美國不同區域的微博語言甚至發展出了不同的“方言”[8]。
國內的微博相較于Twitter更像是一個微媒體,在微博打拐、貪腐舉報、公益募捐等活動上,微博均發揮了不可替代的作用。另外,由于漢語是當今世界上信息量最大的文字符號系統,同樣140個字數的限制,中文微博往往能包含更大的信息量。從這些方面來看,國內本應對微博信息的保存投入更多關注,然而,筆者在研究過程中發現,目前針對微博信息長期保存的中文文獻極為有限[9-10]。
從以上可以看出,西方國家對微博信息的科學研究價值已有所認識,并正在積極地對其進行保存。具有語言優勢的中文微博信息的長期保存更有必要引起重視,以保障當前及未來科學研究的需求。
2.2 微博信息的社會記憶作用
記憶是人的一種生理和心理機能,但從社會學角度來講,純粹的個體性記憶是不存在的,記憶所依賴的語言、邏輯和概念都是在社會交往中實現的。著名社會學家 Maurice Halbwachs認為[11]:存在著一個所謂的集體記憶或記憶的社會框架,它決定著個人記憶能否被回憶起、以什么方式被回憶起。所以,個人記憶實際上是客觀世界經社會記憶映射而呈現的鏡像。從這個意義上來講,社會記憶對人們的認知和觀念的形成具有重要影響作用,某種程度而言,甚至可以影響社會發展的進程。
社會記憶是人類在世代生活生產活動中傳承下來的經驗、教訓、智慧、知識的集合,通常表現為書面記錄信息,而隨著數字化信息技術和網絡的出現與發展,網絡信息也成了社會記憶的有機組成部分。微博是互聯網進化的產物之一,其龐大的用戶群體在微博平臺上發布了大量有價值的信息內容,這些內容正是當代社會記憶不可或缺的一部分。人們通過微博這種社交媒體所發布的內容,既有對生活狀態的記錄,更重要的是有對社會事件的關注和點評,以及對新聞線索的披露和挖掘。相較于傳統媒體而言,微博信息通常具有民主性、及時性等特點,在一些社會科學的研究中被當作第一手資料使用,其價值甚至超越了傳統的信息源。
然而,社會記憶如不妥善保存也會被“遺忘”。由于網絡的特點,微博信息這部分記憶的被“遺忘”速度會更快。所以,數字化網絡化時代的圖書館更應主動擔負起保存這些社會記憶的重任,以發揮和完善其社會記憶功能[12]。
2.3 微博信息是人類數字遺產的一部分
國內有部分學者認為,數字遺產應界定為具有一定審美價值和文化價值,并且能夠起到文化傳承作用的原生數字資源,是數字資源的下位概念,數字遺產的特點有內容形式的多樣性、快速增長性、易消失性、數字形式唯一性以及富有價值性等[13]。從上文的分析中可以看出,微博信息完全符合數字遺產的定義及特點。聯合國教科文組織于2003年頒布的《保存數字遺產憲章》中指出:“無論何種形式遺產的消逝都是全人類遺產的損失,……由于軟、硬件迅速淘汰,維護和保存這類遺產的資金、責任與方法的不確定,以及缺少相關的立法等原因,世界上的數字遺產面臨著消失和失傳的危險。……應優先保存‘原生數字'資源。”[14]有學者指出,圖書館應在充分認識數字遺產與數字資源的區別以及數字遺產價值的基礎上,構建以圖書館為中心的數字遺產合作保存網絡,制定合理有效的數字遺產保存策略,以履行圖書館保存數字遺產的使命[13]。
3.1 對微博信息內容的質疑
雖然大部分人都承認微博可以提供一個真實、客觀的新聞平臺,甚至能在許多重大突發事件的報道和事件的后續發展中發揮重要作用,但也有人對此并不認同,如MarketWatch網站科技專欄作家John C.Dvorak就總結了Twitter作為新聞源有報道片面、“記者”不專業、易受操縱、用戶愛搞惡作劇、缺乏獲取新聞線索途徑、缺乏分析、主次顛倒等七大不足[15]。研究機構Pearanalytics對Twitter短消息的抽樣調查顯示[16],有40.5%的信息屬于“沒有價值的無聊話(Pointless Babble)”,如“我現在正在吃一個三明治”,而且令人意外的是,盡管Twitter在新聞事件中的高引用率,但具有新聞價值的消息只占到全部Twitter內容的3.6%。隨著微博在國內的普及,越來越多的網友將其當作首選的信息獲取渠道和意見表達平臺,但對它的質疑也越來越多。《廣州日報》載文稱,“微博已經從傳播信息、交互式交流平臺淪落成‘公共廁所',是許多垃圾信息、八卦、惡搞甚至謠言的集散地。”[17]央視《朝聞天下》欄目也曾以《微博的倫理底線在哪里》為題報道了“微博造假”現象,引發了網民熱議。
從以上可以看出,對微博信息內容的質疑主要體現在兩方面:一是微博信息內容質量良莠不齊;二是微博信息內容瑣碎、枯燥。而這些質疑也容易令人對微博信息的保存價值產生疑問。
針對第一種質疑,首先應指出的是,互聯網只是社會生活的一個縮影,不能把網絡當作現實社會問題的替罪羊。“惡搞”和“謠言”并非微博獨有的現象,而是互聯網的通病,可通過建立網絡文明公約、強化言論管理等措施得到有效遏制。而且,包括微博資源在內,保存任何一種資源都需要接受評價、遴選等程序的檢驗,造假與不實消息一旦被發現將會被剔除出去。其次,對于微博信息內容中“公民新聞”不專業、主觀片面等的質疑,我們應該看到這些由微博用戶原創的內容與傳統媒體互相補充的意義。美國網絡新聞學的創始人Dan Gillmor提出[18],應該用公平、詳盡、準確和公開四項新原則來替代新聞界歷來所崇尚的客觀性原則,因為人與生俱來會帶有主觀性傾向,完全客觀是個不可能實現的目標,相比較而言,他認為網絡環境下更容易實現以上提到的四個新目標,從而產生高質量的新聞。傳統媒體雖然在信息的采集、加工、傳播等環節嚴格把關,但往往由于過分追求客觀性的目標,反而容易使得媒體觀點僵化,顯得千篇一律。盡管微博上的“公民記者”沒有經過專業的訓練,但他們往往更敢于發表不同的見解和觀點,這無疑有助于豐富公眾對某一社會事件的認知,與傳統媒體相互補充;也將有助于后人更客觀、全面地還原歷史真相。
而針對第二種質疑,事實上,早期博客的長期保存價值也曾經受到過類似的質疑,但隨著人們對博客的認識逐步加深,一些原先將博客排除在外的網絡資源保存項目也將博客納入歸檔范圍內,如澳大利亞國家圖書館啟動的PANDORA項目[19]。正如歷史學家Dan Snow所說,“也許正是(博客中記錄的)那些瑣碎、枯燥的細節對幾百年后的人們來說才具備特別意義。”[20]而且由于微博打破了固定互聯網和移動互聯網之間的限制,且多數微博將字數限制在140個以內,有人從“生產成本”降低這點推算有意愿寫有價值微博的人是博客的4倍,加上“消費成本”的降低,認為微博的傳播力是博客的200倍[21]。從這個意義上來說,由博客進化而來的微博甚至應比博客具有更大的保存價值。
或許未來的人們會好奇二十一世紀人們的日常生活面貌,未來的相關專家、學者會迫切需要了解歷史上某一事件的客觀全貌,以及普通大眾的看法,那么微博就是一個不能繞開的主題。所以,我們要用長遠的眼光客觀辯證地看待微博信息的保存價值。
3.2 對微博信息用戶需求的質疑
評價一種資源是否具有保存價值要看用戶是否對這種資源有需求,而用戶需求不僅體現在當下,更重要的是體現在未來。微博信息的保存價值就更多地體現在用戶的未來需求中。但這種未來需求存在著諸多不確定因素,使得當前的人們無法估測微博的保存價值。興許有人會據此提出質疑,認為只有出現明確需求時,才有必要對一種資源進行保存。然而,如果當前不進行保存,當需求發生時,內容已經消失,由此帶來的損失將無法彌補。
對此,有人提出對于保存價值不確定的數字資源,可采取“購買時間”(經濟學術語)的保存策略[22],即當前投入少許資金將這些數字資源僅僅存貯在安全的物理介質中,而不投資進行其他形式的長期保存管理活動,當未來出現明確需求時,再有選擇地對這些數字資源進行全面保存管理并提供服務,從而避免不可逆轉的損失。不過需要注意的是,對于微博來說,這種保存策略雖然能夠暫時使保存價值不確定的微博信息免于消失的風險,但由于每天都會有新的社會事件產生,用戶每時每刻都在生產微博信息,如此規模巨大且不斷增長的數據量,對存貯的物理介質提出了更高的要求,加上日常維護的費用,前期投入的資金規模也是不容小覷的,這就需要相應的保存機構提前做出縝密的安排和計劃。
微博資源是網絡信息資源的重要組成部分,其中大量有價值的信息內容也是人類數字遺產的一部分,需要引起保存機構的重視。與網絡信息資源一樣,微博信息的保存也面臨著來自技術、法律、經濟以及責任體系等方面的挑戰。相較于一般的網頁信息,微博信息的動態性、數據的海量性、格式的多樣性、信息間的關聯性以及用戶版權與隱私問題的復雜性會增加問題的解決難度。在微博信息長期保存的價值獲得普遍認可后,國內外學者和機構對微博信息保存技術等各方面的研究也應加快步伐。
[1][7]Library of Congress.Update on the Twitter Archive At the Library of Congress[EB/OL].[2014-01-04].http://www.loc.gov/today/pr/2013/files/twitter_report_ 2013 jan.pdf.
[2]Larry P.Alford.把握當下:為學術圖書館的未來而定義[J].嚴丹,錢卓珺,編譯.圖書館雜志,2013(7):4-8.
[3]維基百科.微博[EB/OL].[2014-02-12].http://zh. wikipedia.org/wiki/%E5%BE%AE%E5%8D%9A.
[4]Alexa.Twitter.com Site Info.[EB/OL].[2014-02-12]. http://www.alexa.com/siteinfo/twitter.com.
[5]CNNIC.第32次中國互聯網絡發展狀況統計報告[EB/OL].[2014-02-12].http://www.cnnic.net.cn/ hlwfzyj/hlwxzbg/hlwtjbg/201307/P020130717505343 100851.pdf.
[6]Library ofCongress.The Library and Twitter:An FAQ [EB/OL].[2014-02-12]. http://blogs.loc.gov/loc/ 2010/04/the-library-and-twitter-an-faq/.
[8]BBC News.You have a regional dialect even on Twitter[EB/OL].[2014-02-12].http://www.bbc.co. uk/news/technology-12381912.
[9]廖璠,劉國敏.微博長期保存的可行性研究——基于德爾菲法的調查報告[J].圖書館論壇,2013(3):45-49.
[10]黃新榮,吳建華.政務微博檔案化保存初探[J].檔案與建設,2012(4):4-6.
[11]莫里斯·哈布瓦赫.論集體記憶[M].畢然,郭金華,譯.上海:上海人民出版社,2002:68-69.
[12]黃晨,虎嬌玫.圖書館發揮社會記憶功能的思考[J].圖書館建設,2013(8):8-10.
[13]謝歡,鄭永田.數字遺產保護:圖書館義不容辭的使命[J].圖書館論壇,2012(7):15-20.
[14]UNESCO.Charter on the Preservation of the Digital Heritage[EB/OL].[2014-02-12].http://portal.unesco. org/ci/en/files/13367/10700115911Charter_en.pdf/ Charter_en.pdf.
[15]MarketWatch.The seven flaws of Twitter[EB/OL]. [2014-01-04].http://www.marketwatch.com/story/ as-news-source-twitter-has-seven-deadly-flaws.
[16]Pearanalytics.Twitter Study[EB/OL].[2014-02-12]. http://www.pearanalytics.com/wp-content/uploads/ 2012/12/Twitter-Study-August-2009.pdf.
[17]李光焱.微博還能搏動多久?[N].廣州日報,2011-03-23(C12).
[18]Dan Gillmor.The End of Objectivity(Version 0.91)[EB/OL].[2014-01-04].http://dangillmor.typepad. com/dan_gillmor_on_grassroots/2005/01/the_end_of_ obje.html.
[19]謝春枝.博客長期存取的國外研究與實踐[J].情報研究,2009(4):50-53.
[20]ALA.Thousands blog for British Library[EB/OL]. [2014-02-12].http://www.ala.org/Template.cfm?% 20Section=news&template=/ContentManagement/ ContentDisplay.cfm&ContentID=140832.
[21]劉潔.微博在電視新聞節目中的運用[J].視聽界,2011(3):61-63.
[22]周獻紅.基于案例分析的數字資源保存價值研究[J].圖書館論壇,2011(6):81-83.
On the Long-term Preservation Value of Microblog Information
LIU Chao,ZHENG Jian-cheng
Microblog is one of the popular social networking tools.There is a large number of information,deserving of long-term preservation,produced by its colossal user groups.However,studies and practices on it are scarce.This paper discusses the long-term preservation value of microblog,which,as the authors suggest,is worth doing more research intensely and deeply by scholars and institutions at home and abroad.
microblog;microblog information;long-term preservation;preservation value
格式 劉超,鄭建程.論微博信息的長期保存價值[J].圖書館論壇,2014(6):101-105.
劉超(1989-),男,中國科學院國家科學圖書館2012級碩士研究生;鄭建程(1957-),男,中國科學院國家科學圖書館研究館員,碩士生導師。
2014-01-07