屈健民
(承德石油高等專科學校信息中心,河北承德 067000)
隨著2004、2005年博客(Blog)熱在國內的升溫,RSS也吸引了不少國人的眼球,可以說,Blog的流行從一個側面成就了RSS的流行。RSS在內容發布和信息集成方面的優越性,使其迅速突破最初的新聞和博客領域,開始在信息服務相關行業拓展,目前許多網站已加入RSS技術。因而嘗試將RSS技術引入圖書館網絡信息采集和網絡信息服務工作中,有著積極的現實意義。
RSS(Really Simple Syndication、Rich Site Summary或者RDF Site Summary)是一種描述和同步網站內容的格式,是目前使用最廣泛的XML應用。所有的RSS文件(RSS feeds)都必須符合由W3C發布的XML1.0規范。網站發布一個RSS文件后,這個RSS Feed中包含的信息就能直接被其他站點調用,而且由于這些數據都是標準的XML格式,所以也能在其他的終端和服務中使用。也就是說,RSS就是一種用來分發和匯集網頁內容的XML格式,是站點用來和其他站點之間共享內容的一種簡易方式(也叫聚合內容)。從用戶角度說,RSS又是一種漸漸風行的瀏覽訪問網站的方式,用戶不必登錄實際的網絡站點就可以看到要瀏覽網站內容的及時更新。這種瀏覽方式需要“RSS閱讀器”軟件來閱讀用戶訂購的內容。
在描述方式上,RSS將網站看作一系列頻道(Channels)的組合,各個頻道又包含了一系列資源(I-tems),因此通過對頻道及所含資源的描述可實現對作為資源集合的網站的描述[2]。這個利用RSS元素描述的網站內容匯總文件稱為一個RSS Feed,它由內容提供者的網站發布,再由內容整合者的網站(也稱“門戶”)或獨立的桌面工具(聚合工具)使用。可見,RSS最基本的功能就是信息聚合和信息推送,具有如下特點:
1)簡單、標準、通用、容易自動生成。服務器端內容的RSS包裝在技術實現上極為簡單,RSS Feed可人工生成,也可自動生成,而且是一次性的工作,使長期的信息發布邊際成本幾乎降為零,是傳統的電子郵件、衛星傳輸、互聯網瀏覽等發布方式所無法比擬的[3]。
2)預防垃圾信息,便于本地管理。RSS用戶端閱讀器軟件的特點是完全由用戶根據自身喜好以“頻道”的形式訂閱值得信任的內容來源,如“人民日報中文新聞”、“中國汽車網學車用車”等等。RSS閱讀器軟件完全屏蔽掉用戶沒有訂閱的內容以及彈出廣告、圖片、垃圾郵件等令人困擾的噪音內容。此外,對下載到閱讀器軟件本地的RSS信息,用戶可以進行離線閱讀、存檔保留、搜索排序、相關分類等多種管理操作,使閱讀器軟件不僅是一個“閱讀”器,更是一個用戶桌面的“信息資源庫”。
3)信息“聚合”,真正實現個性化閱讀。因為RSS是一種被廣泛采用的內容包裝定義格式,所以任何內容源都可以采用這種方式來發布信息,包括專業新聞站點、電子商務站點、企業站點、甚至個人站點等。而在用戶端,RSS閱讀器軟件的作用就是使用戶可以根據需要有選擇性地加入多個定制的RSS提要將用戶感興趣的內容來源“聚合”到該軟件的界面中,為用戶提供多來源信息的“一站式”服務[4]。
4)信息的高時效性和價值。RSS閱讀器自動更新你定制的網站內容,保持信息的及時性。RSS技術秉承“推”信息的概念,當新內容在服務器數據庫中出現時,第一時間被“推”到用戶端閱讀器中,極大地提高了信息的時效性和價值[5]。
RSS搭建了信息迅速傳播的一個技術平臺,使得每個人都成為潛在的信息提供者。由于RSS的開放、靈活等眾多優點,使其最初在新聞聚合(NewsAggregation)、網站聯合、博客等領域中得到了廣泛的應用。隨著越來越多的站點對RSS的支持,RSS已經成為目前最成功的XML應用。在國外RSS應用已經非常普遍,從個人博客(Blog)欄目、企業站點到世界級的門戶都提供基于RSS的服務,如IBM公司站點的中文新聞 RSS http://www.ibm.com/news/cn/zh/index.rss,YAHOO 站點的 http://news.yahoo.com/rss,微軟 MSDN 站點的 http://msdn.microsoft.com/aboutmsdn/rss.asp 等等。
RSS的發展還可以在電子商務中發揮作用。如eBay、Amazon、SecondhandMarket等,用戶可對自己感興趣的商品進行定制,并且隨時掌握最新標價等更新信息,一旦完成交易這個信息也就隨之失效。早在2003年3月,在線超市亞馬遜(Amazon.com)就開始在其站點上推出數百個個性化的RSS提要,以供電子商務顧客使用。
除了較為常見的新聞網站、企業網站之外,許多科技網站也提供RSS Feed來發布最新消息,如美國物理研究所(The American Institute of Physics)、加拿大UBC生物信息學中心(UBC Bioinformatics Centre)[6]等。
目前,RSS技術在圖書館的應用也越來越廣泛。國外很多圖書館網站已經提供RSS Feed功能,如休斯敦大學圖書館UH Library Updates、芝加哥圖書館Chi Lib Rocks!、喬治亞州大學圖書館Library News等。國內某些圖書館網站也開始嘗試提供RSS Feed功能,如中國科學院國家科學數字圖書館、廈門大學圖書館[7]等。
隨著現代化技術的運用以及信息的多元化發展,使圖書館文獻采訪工作發生了巨大變化,采訪渠道越來越寬,信息類型越來越多,使采訪的難度增加了。除傳統的紙本文獻、網上電子圖書、電子期刊外,圖書館還要整合網絡資源,搜集網上有價值的信息,建立學科導航庫(或叫學科信息門戶)。RSS的信息聚合功能為我們這方面的工作帶來了巨大的便利。
3.1.1 基于RSS網絡信息采集的技術實現
在信息采集的過程中,需要支持RSS的聚合工具軟件來訂閱那些提供了RSS Feed的站點。RSS聚合工具可選用開放的RSS閱讀器(也稱聚合器),目前應用較多的如SharpReader、NewzCrawler、FeedDemon等,這些軟件對非商業應用或個人一般是免費的;也可以采用支持RSS的任何語言(如Java、PHP、Perl、ASP和C#)來編寫簡單的腳本,根據需要開發自己的RSS信息聚合器,這方面可參考的例子很多,實現起來較簡單,如 O'ReillyXML.com(http://www.xml.com/pub/a/2002/05/22/parsing.html?page=2)提供了一個用 Java 寫的示例;在 Developer.com(http://www.developer.com/xml/article.php/3113931)提供了一個使用PHP、MySQL數據庫服務器和MagpieRSSparser來實現的示例[8]。有了信息聚合工具后,添加和設定一些RSS feed鏈接,來獲取各網站RSS feed并提取數據,將其進行內容過濾、分類并存入數據庫中,然后再將數據庫中的信息根據需要組織成各種數據源提供各種形式的信息服務。
3.1.2 對某些專業性強的領域進行知識過濾和積累
有些提供RSS服務的網站(包括博客、信息門戶等)的學術性比較強,內容一般聚焦在某個主題領域,它所收集的信息一般是經過專家的過濾篩選而來,因而對圖書館有很大的采集價值,使“隱性知識”真正通過網絡實現“顯性”化。如國家科學數字圖書館,它擁有比較權威的關于圖書情報學科的各類新聞、研究進展等信息,并且在它的網站上提供了 RSS Feed(http:∥www.csdl.ac.cn/weblog/index.rdf),我們可以在自己圖書館的網站上使用這些RSS服務。如果以這種方式對高校的重點學科進行信息積累,一定會深化圖書館的特色服務[9]。
3.1.3 網絡信息資源聚合
搜集本圖書館關注的信息,如用RSS信息聚合器定制各學科信息門戶網站、圖書館系統、文獻情報系統網站及其相關網站以獲得最新信息。
3.2.1 服務器端技術實現
網絡信息服務指基于Internet上及本網站的數字資源,借助計算機網絡,針對廣大圖書館網上用戶的一種服務方式。圖書館需要將各種網絡信息資源以頻道方式在服務器端提供動態的RSS feed供用戶訂閱。首先要制作和保存RSS feed:RSSfeed可人工生成,方法是創建RSS文件并保存在網站中的某個位置。一個RSS文件就是一段規范的XML數據,該文件一般以rss、xml或者rdf作為后綴。它通常由4個主要元素構成:<channel>,<image>,<item>和<textinput>。其中,<channel>元素是必需的,<item>元素至少要出現一次。<textinput>和<image>元素是可選的,是否使用要視具體情況而定。也有許多工具和網上服務可以根據網站現有的內容來自動生成RSSfeed,如由SixApart’s制作的一個功能強大的個性化的發布系統MovableType(對個人和非商業網站基本上是免費的)。其次要驗證并發布生成的RSS文件,網上有許多RSS驗證工具,如OnlineRSS0.9xValidator和OnlineRSS1.0Validator可以實現RSS的驗證;另外還要在網站上宣傳并推廣本網站的RSS feed,以通用的RSS圖標提醒用戶注意和訂閱RSS feed。
3.2.2 客戶端信息的接收
對于客戶端來說,使用RSS獲取信息前,需先下載并安裝一個RSS閱讀器,然后將感興趣的提供RSS服務的網站加入到RSS閱讀器的頻道即可。圖書館網站可提供RSS閱讀器下載,并預設圖書館的部分RSS頻道。
3.2.3 基于RSS的網絡信息服務內容及方式
基于RSS技術可以實現的網絡信息服務主要有:
1)新聞、消息、最新資源發布:通過RSS feeds發布圖書館的各種通知如會議、培訓、規則及開館時間的變更等,以及新書(期刊)通報、試用數據庫等,用戶通過RSS訂閱可以隨時獲取最新的信息。
2)信息推送:RSS誕生之初即被稱為“推”技術,圖書館可以利用其實現信息的推送服務,結合信息的更新數量、更新頻率和用戶需求,確定推送信息的內容、推送頻道的多寡和推送方式。如專題信息、最新發布的新聞、消息、最新資源等以及用戶借閱信息如所借圖書到期提醒、催還通知等,均可作為動態信息頻道推送給用戶,而用戶不需要時時刻刻關注圖書館網站的內容更新,而只需登錄RSS閱讀器即可獲得這些信息。
3)實現用戶個性化信息定制及“一站式”服務:在客戶端,用戶利用RSS閱讀器可以定制自己需要的、感興趣的頻道內容,實現個性化閱讀;另外,在RSS對信息有效集成的基礎上,用戶只需通過一次訂閱即只需在第一次使用時提出訂閱請求,在今后的查詢中不必次次訂閱就可檢索圖書館網站所提供的最新相關信息,從而實現“一站式”服務。
4)實現虛擬參考咨詢等深層次服務:圖書館可以構建基于RSS技術的Blog空間,實現與用戶之間的實時信息交流,提供虛擬參考咨詢、課題查新、定題服務等。
圖書館引入RSS技術進行網絡信息采集與服務,并不是要放棄現有的網絡信息采集與服務方式,而是開拓新的工作方法和思路,傳統的網絡服務方式如E-mail、BBS、Chat等應視情況繼續使用,各種方式相互補充、取長補短,共同實現我們所期望的功能。
[1]劉林.基于詞語權重改進的樸素貝葉斯分類算法的研究與應用[D].廣州:中山大學,2009.
[2]黃艷娟.基于RSS的圖書館個性化信息推送服務[J].情報科學,2006(7):1023-1026.
[3]宋邵輝.RSS技術在互聯網上的應用[J].中國信息導報,2006(5):48-49.
[4]伍玉偉.RSS:網絡信息“聚合”利器[J].現代情報,2006(2):221 -222.
[5]張會娥.基于RSS的科技信息聚合系統的設計和實現[J].現代圖書情報技術,2005(7):60-63.
[6]孫彩杰.RSS技術發展及其在圖書館中的應用[J].現代圖書情報技術,2006(6):83-85.
[7]吳振新.RSS元數據在門戶網站建設中的應用[J].現代圖書情報技術,2004(10):60-64.
[8]馬國棟,朱濂.RSS技術在數字圖書館建設中的應用[J].圖書館學研究,2006(4):99-101.