郝瑞芳
(河南職業技術學院,河南 鄭州 450000)
淺議網絡信息老化
郝瑞芳
(河南職業技術學院,河南 鄭州 450000)
文章首先分析了網絡時代的信息特點,并從起源、特征、老化原因等幾個方面闡述了網絡信息老化的研究狀況,接著引出網絡信息資源老化狀況指標為生命周期測度指標和被利用情況測度指標。
信息老化;生命期;測度指標;半衰期
隨著經濟與社會的高速發展,人類已經進入高速發展的網絡信息時代,網絡信息老化問題也逐漸成為大家關注的熱點。M·勞恩曾說過:“文獻增長得越快,半衰期就越短。”網絡信息的高速增長與老化從不同層面反映了信息的動態變化。網絡信息的老化研究是網絡信息計量學研究的重要組成部分:一方面對于網絡信息計量學的學科體系的完善與發展具有重要的意義;另一方面網絡的迅猛發展帶來了信息量爆炸式增長,網絡信息老化的研究可以追蹤網絡信息被利用的過程,指導網絡信息資源的建設。
1.1 網絡信息數量龐大、增長迅猛
互聯網是一個集各種信息資源為一體的資源網,由于政府、機構、企業、個人隨時都可以在網絡上發布信息,因此網絡資源增長迅速。據調查,2013年全球網民達22億,中國占17%居首位。
在Web2.0中,個人不是被動的,而是作為主體參與到互聯網的信息生產中的,個人在作為互聯網的使用者之外,還同時成為了互聯網內容的主動傳播者、作者和生產者。以中國為例,有近65%的網民在互聯網上發過帖或者上傳過內容,特別是近兩年,在不少明星的帶領下,“微博”盛行,上傳照片、視頻等被炒的是如火如荼。
1.2 網絡信息覆蓋面廣、內容豐富
網絡信息資源可以說是資源豐富、包羅萬象,覆蓋了不同領域,不同學科,不同地域,不同語言的信息。在形式上也包括了文本、聲像、軟件等等,是一個知識信息的大集合,是人類資源的寶庫。網絡信息的這一特點足以能解釋為什么有越來越多的人成為“網民”。
1.3 網絡信息更新速度快
網絡信息資源的更新是指信息在載體、組織方式、網址不變的情況下,內容上發生的改變,這是網絡信息不同于傳統文獻信息的顯著特征之一。傳統文獻信息一經發表,內容一般不會發生變化,而網絡信息由于其載體較為特殊,其內容可以隨時改變,更新速度非常快。
網絡信息隨時都在變化,信息的增長、新信息對老信息覆蓋或替換,信息效用價值隨時間不斷改變,甚至最后被刪除或無法訪問,這都是信息的老化。借用傳統文獻信息老化的概念來說,網絡信息的老化就是信息失去利用價值的過程,與文獻老化一樣,是一種客觀存在的現象。
2.1 網絡信息老化的起源
1943年,戈斯內爾發表的博士論文《學院圖書館圖書收集的老化率》被認為是最早進行文獻老化研究的代表作,沿用至今的“半衰期”概念也是在其論文中初步形成的,這一概念的提出成為文獻老化研究的重要指標之一。
1971年,普萊斯提出了普萊斯指數的概念;1974年,LineM· B與Sandison·A發表題為《Obsolescence and changes in the use of literature with time),提出了共時與歷時法對文獻老化的測量效果;1985~1990年間,布萊爾(Burrell Goughlin,Tahue及Gelman分別對mixed化負指數規律影響的研究,以上基本是文獻信息老化研究起源的過程。
2.2 網絡信息老化的特征
網絡信息有其自身的特點,其老化與傳統文獻老化既有相似之處,也有明顯差別,主要表現在:
2.2.1 非累積性。傳統文獻的外部形態和內容是不可分割的,原有信息的修訂、更新、新增必須依靠新的載體,哪怕這些載體上的知識完全喪失利用價值也不會消失,我們稱之為具有累積性,其最重要的特征就是永續存在。而網絡信息其外在形態和核心內容可以相互獨立,可以保持載體、組織方式不變,對其內容不斷更新、修改甚至刪除,我們稱之為具有非累積性。
2.2.2 動態性。動態是指事物變化發展的情況。任何信息都是外在形態與所含內容的有機統一,其載體和組織方式是信息的外在形態,其承載的數據和知識則是核心內容。相同于傳統文獻,半衰期、普萊斯指數的測定都是依據信息的被利用情況;不同的是,由于網絡信息具有動態性,其老化規律的研究還增加了對網絡信息自身生命周期的研究。
2.2.3 不完全性。動態性與非累積性是辯證統一的。紙質文獻的生產和傳播由有關部門統一審核管理,是受控的,其研究對象數量上可數,范圍比較清晰。而在網絡信息的老化研究中,研究對象存在“不完全性”的問題,究其原因:一方面,網絡的開放性決定了信息發布不受控,不能準確地劃定研究對象的數量及范圍;另一方面,網絡信息的動態性和非累積性造成了研究對象在時間坐標上的缺失,難以系統地回溯研究對象的歷史狀態。
2.3 網絡信息老化的原因
網絡信息雖然內容豐富、覆蓋面廣,但信息發布門檻低,組織管控缺失,信息質量參差不齊,呈現出分散無序、優劣混雜的發展狀態。有些學者曾指出:“網絡最大的優勢,同時也是它最薄弱之處,那就是任何人、任何機構都可以隨時在網上發布信息”。造成網絡信息老化的因素很多,大致有以下幾個方面:
2.3.1 網絡信息的消失。在信息化高速發展的今天,每天有數量龐大的信息更新出現,當然也有大量信息由于訪問量過少而慢慢“沉底”,最終被系統或管理員刪除,這些被刪除的信息將消失在網絡信息的世界里。
2.3.2 網絡信息被替代。隨著人類認識水平的提高,原來有漏洞的信息逐步被完善,變成完整而全面的信息。這樣被完善后的信息會被更多人認同利用,而老舊信息逐漸被替代,這就是信息被取代。
2.3.3 網絡信息的迅速增長。網絡時代的發展,使信息出現爆炸式的增長趨勢。截至2013年12月,我國網站總數達320萬個,較去年同期增長19.4%。而中國網頁數量為1500億個,相比2012年同期增長了22.2%。單個網站的平均網頁數和單個網頁的平均字節數均維持增長.因此根據情報學家M·勞恩的理論:“文獻增長的越快,文獻的半衰期越短”,可知網頁信息的半衰期會越來越短。
目前國內信息老化研究的模型應用還不成熟,一般是利用“生命周期測度指標”和“被利用情況測度指標”來衡量信息的老化速度,從而評價網絡信息的生命值。
3.1 生命周期測度指標
3.1.1 半衰期
我們借用物理學領域半衰期(放射性元素的原子核有半數發生衰變所需的時間)這一概念,將網絡信息的半衰期定義為其基本構成元素有半數發生變化所需的時間。
影響半衰期計算的因素很多,以網頁為例:第一,網頁不會勻速地發生變化、消失和增長;第二,一個網頁可能連續多次發生變化;第三,新增網頁也會發生變化;第四,基本構成元素會選擇比網頁更細的單元如鏈接等。
3.1.2 生存期
生存期即對象存在的時間。網絡信息生存期是指特定網絡信息URL(Uniform Resoure Locator:統一資源定位器)的存在時間。之所以選擇URL作為網絡信息生存期的判斷依據是因為URL是區分不同網絡信息資源的唯一標識。只要URL保持不變,無論內容如何變化,都視為同一個網絡信息資源;反之,只要URL被改動,就視為原信息生命的終結和新信息的誕生。
3.2 被利用情況測度指標
與傳統文獻資源老化規律的研究相同,網絡信息依據其被利用的狀況來計量價值周期。
3.2.1 宏觀網絡信息資源半衰期
根據學科文獻半衰期的概念(指某學科現時尚在利用的全部文獻中較新的一半是在多長一段時間內發表的),我們將宏觀網絡信息資源半衰期定義為某主題領域網絡信息所含鏈接的指向資源中較新的一半是在多長時間內產生的。也就是說,假如網絡信息計量學的網絡信息半衰期是1.5年,就表明在統計區間內,在網上發布的網絡信息計量學文獻中的鏈接所指資源的50%是在最近1.5年內發表的。
3.2.2 微觀網絡信息資源半衰期
參照論文半衰期的概念(指引用這篇論文的全部其他論文的二分之一是在這篇論文發表后的多長時間內發表的),我們將微觀網絡信息資源半衰期定義為指向該網絡信息資源的全部其他網絡信息資源的二分之一是在其發布后的多長時間內出現的。比如說,網上某文檔的半衰期是1.2年,就表示該文檔所獲得入鏈的鏈源所在網絡信息資源的50%出現于其發布后的1.2年內。
3.3 普萊斯指數
普賴斯指數的創始人是D.Prlee。普賴斯指數是衡量文獻老化的另一個重要指標。某一學科領域內,對發表年限不超過五年的文獻的引用次數與總的引用次數之比值,即為該學科的普萊斯指數。一般來說,普萊斯指數越大,半衰期就越小,文獻老化速度就越快。
目前,國內對網絡信息老化的研究尚處于初級階段,一方面是借助網絡技術支持下的大型數據庫對文獻老化規律進行實證與應用研究;另一方面是借助功能強大的網絡搜索引擎對網絡結構單元及信息單元進行統計,尋找老化規律。
4.1 實證研究
實證研究在網絡信息老化研究中是非常必要和實用的手段,其顯著特點是對研究工具的依賴性較強。網絡信息老化的研究內容廣泛,比文獻信息老化研究要面臨更多的問題、角度和細節。網上信息數量巨大,增長迅猛,如果仍采用手工方式進行信息計量統計根本不可行。可以這樣說,合適的研究工具是網絡信息老化研究的基礎和保證,沒有合適的研究工具,網絡信息老化研究就無從談起。
4.2 理論研究
老化研究至今已有70多年時間,與經典學科研究相比,是一個新生的研究領域,有些理論雖然已經提出,但尚不完善。因此,基礎理論研究的作用不容忽視,其前瞻性、創新性、抽象性以及批判性等都是老化研究所急需的,特別是在網絡迅速發展的今天,網絡信息老化問題帶來了更為寬泛的研究視野和空間。
網絡信息老化是文獻信息老化在網絡時代的延伸和發展,其研究同樣采用了文獻老化研究中大部分的衡量指標,如半衰期、普萊斯指數等,在借鑒傳統文獻老化研究成果的基礎上,結合網絡媒體自身的特殊性,如信息增長、分布與利用研究等,網絡信息老化研究已經成為網絡信息計量學研究的基本要素之一,對豐富與完善該學科體系具有很高的理論價值,同時對網絡信息資源建設、管理和利用具有重要的現實意義。
[1]2008年中國互聯網絡發展狀況統計報告[R].http://www. cnnic.net.en/uploadfiles/pdf/2008/1/17/104156.pdf.
[2]段宇鋒.網絡信息資源老化規律研究[J].圖書情報知識,2005(8):28-31.
[3]張瑞.網絡信息老化研究[J].情報雜志,2008(8).
[4]王尊然.網絡信息資源老化規律之我見[J].工程技術,2010(5):20-21.
[5]朱夢嫻,許鴻翔,高靜.不同內容網絡信息資源的半衰期比較研究[J].情報雜志,2010,29(9).
[6]王宏鑫,邱均平.關于網絡信息老化研究的若干問題[J].情報理論與實踐,2004(4).
G350
A
1671-0037(2014)05-30-2
郝瑞芳(1983.7-),女,本科,館員,研究方向:圖書館學。