王畫虎
據不完全統計,過去一年內,有10萬微信用戶和30萬Facebook用戶去世,令這類社交平臺成為一個巨大的數據墓地,大量的數據石沉大海。
難以想象,互聯網在短短20幾年內,累積的信息量已經遠超之前幾十萬年在石頭、竹簡、青銅器和書籍中留下的信息量總和。
在信息爆炸的時代里,許多有價值的事情容易被人們忽視,從而忘記。我們討論起幾百年前的事情就像發生在昨天一樣,而我們聊起20年前蘋果發布第一臺Mac時則恍若隔世。
現在的考古學家都開始做直播了,網絡卻向著考古的方向發展。到2024年,網絡每年產生的數據轉換成紙張將有4.37萬光年長。現代人每天要產生數以萬計的數據,你的cookie就是你使用過的“石器”。你一覺醒來給朋友發了一個表情包,上網看了一篇網絡漫畫,發了一條不知道多少KB(千字節)的朋友圈。對于你來說,這就是平平常常的一天——但對于研究網絡文化的考古學家來說,這都是未來研究現代人生活習性的寶貴的用戶數據。
網絡考古還是一個新的概念,目前并未像傳統考古形成細致的分類和體系,但已經有一些民間組織在從事相關的資料整理記錄工作,網上關于網絡考古的討論和猜想也越來越多。
搜索就是最簡單的網絡考古,不是拿著一把鐵鍬就能去掘墓,當然也不是有一臺電腦就能進行網絡考古。要從海量的數據中抽絲剝繭、去偽求真,你得掌握網絡考古的盜墓神器、互聯網界的“洛陽鏟”——Internet Archive網站。
Internet Archive是一個非營利性的互聯網檔案館,成立于1996年,由Alexa的創始人布魯斯特·卡利創辦。互聯網檔案館匯聚了過去20年的網站、音樂、動態圖像和數百萬本書籍的數字數據,跟維基百科一樣可以永久免費存儲及獲取。
Internet Archive是目前世界上最大的網絡考古工具,你可以通過它的“Wayback Machine”厘清一個網站的發展脈絡。通過這把“鐵鍬”,我們可以挖到淘寶、新浪、百度等網站最初拓荒的樣子。
當年互聯網的資費高、網速慢,訪問網頁惜流量如金,很多時候,都是一個人瀏覽之后其他人用緩存繼續瀏覽。那時候的網頁設計都很簡單,為了節省流量,文字遠多于圖片。
要想自己的數據遺產在自己死后得到妥當處理,用戶必須在生前就做好相應的準備,把所有的網絡賬號與密碼寫進遺書。
“Internet Archive保存的也僅僅是互聯網數據的冰山一角,作為第一代在虛擬空間留下大量痕跡的人類,當我們離開后,留在網絡世界里的痕跡會慢慢消失。”Internet Archive的創始人卡利指出,“現在的數據看似無處不在,卻出人意料的脆弱。”
“在21世紀,個人數據可能是大多數人最寶貴的資源。我們把信息交給科技巨擘,讓他們代為傳遞郵件和發送貓咪的視頻,”《人類簡史》的作者尤瓦爾·赫拉利對此表示過擔憂,“假設這些科技巨擘的服務器崩了,那你所有的數據也就蕩然無存。”
如果整個互聯網從人間蒸發,我們不只會倒退幾十年,不計其數的人將驟然失去某些生活必需的東西。這就是Internet Archive存在的意義,它會將人類的互聯網的“上古遺跡”保存下來,供后代追根溯源。
當你還在QQ空間懷念青春的時候,已經有人注意到,互聯網早已形成了不少“上古遺跡”,去瀏覽這些網站或帖子就像去西安看兵馬俑。
2005年2月22日,兩個分別叫“北緯67度3分”和“易燁卿”的網民,在天涯社區進行了一場關于財富、服裝、賽馬的“上流社會”的大辯論,吸引了22.3萬人次圍觀。后來通過網友“人肉”搜索發現,這倆人誰也不是真正的“上流社會”人士。
10年之后再回頭看這些帖子,我們能看到那個時候的中國人對于“上流社會”的想象。我們在瀏覽這些“互聯網上古遺跡”的同時,那個時候人們的想法和精神面貌躍然屏上。
考古學者會通過古代皇帝的詩句和畫作,揣測他當時的情感和社會危機。未來的網絡考古學家若要研究2017年發生了什么,一定會去翻特朗普的推特。