韓新月
(國家圖書館 北京 100081)
2012年,原文化部發布了規范圖書館數字資源統計工作的行業標準——《圖書館數字資源統計規范》(WH/T 47—2012,以下簡稱《規范》)。《規范》構建了圖書館數字資源統計指標體系,對數字資源相關術語、數字資源體系、統計指標和統計方法進行了界定,適用于圖書館數字資源館藏、服務、設施和經費統計[1]。《規范》基于一般圖書館數字資源統計的業務需求制定,統計指標體系涵蓋數字資源的基本屬性,因此在圖書館范圍內得到了廣泛關注和切實應用,是圖書館開展統計和管理工作的重要工具。
標準是通過標準化活動,按照規定的程序經協商一致制定,為各種活動或其結果提供規則、指南或特性,供共同使用和重復使用的文件[2]。行業標準經有關方面協商一致由行業機構通過并公開發布,是在全國某個行業范圍內統一的技術要求[3]。作為行業共同遵守的準則、依據和作業規范,行業標準協同環境變化與科技發展而不斷更新完善,既是標準化工作發展的要求,也是行業發展的必然趨勢。
《規范》自2012年發布實施至今已近八年,圖書館所建設和利用的數字資源從形態、結構、內容到建設手段、服務方式等都發生了巨大變化,對統計工作提出了新的問題和挑戰。因此,適時啟動《規范》更新修訂工作,對增強《規范》的適用性和時效性、激發行業標準發展活力以及提升圖書館標準化工作的整體效能,都具有重要的現實意義。
準確、真實的統計數據不但能夠客觀反映圖書館業務工作的現狀和實績,而且能夠為制定發展規劃提供參考依據。數字資源是當前圖書館館藏構成與服務的重要組成部分,圖書館相關的法律法規、統計標準、評估標準以及戰略發展規劃等文件,從不同角度出發提出了數字資源的統計管理要求,或明確統計對象與統計方法,或提出真實性、準確性、完整性和及時性的統計數據要求,或倡導建立統一標準規范體系[4-7]。以四年一次的全國縣級以上公共圖書館評估定級為例,其針對數字資源的數十項評估指標,數據主要來源于圖書館各項業務統計[8]。
《規范》是圖書館的一項基礎性業務標準,滿足圖書館業務統計要求和評估數據要求是其基本功能之一。隨著文化行業的發展,圖書館數字資源業務范圍不斷拓展,相關評估要求也逐步增加,需要對《規范》進行相應的完善性和適應性修訂。
在應用實踐中檢驗標準并對標準規范進行更新和修訂,是標準化工作的一項普遍原則[9]。可用性是標準化工作的一般目的之一[10]。目前,在圖書館數字資源統計方面具有較大影響力的國內外標準規范多達十余項(見表1)。胡大琴、何青芳、慎金花等學者對相關標準規范的應用情況進行了調研和分析,結果顯示,遵循《規范》提供數字資源統計數據的數字資源生產單位所占比例較低,《規范》的應用性不能完全滿足當前圖書館數字資源統計工作的需要,亟待修訂和改進[11-13]。

表1 圖書館數字資源統計相關標準規范
標準具有一定的有效期,國際標準化組織ISO所制定的標準一般每5年進行一次更新[14]。我國標準化法律規定了標準復審制度,即建立標準實施信息反饋和評估機制,依據標準反饋和評估情況開展復審,復審周期一般不超過5年;經評估和復審,對不適應經濟社會發展需要和技術進步的標準應當及時修訂或者廢止[15]。
國際標準化組織(ISO)注重標準規范版本的修訂,以增強其適用性和流通性[16]。以《規范》采用的兩項規范性引用文件為例:ISO 2789第一版于1974年發布,先后于1991年、2003年、2006年和2013年發布了4個修訂版本,我國國家標準GB/T 13191—2009《信息與文獻圖書館統計》等采用了其2006年的第四版,即《規范》引用的版本;COUNTER于2002年發布第一版,2019年已經更新到第五版,而《規范》引用的是其2008年發布的第三版。從時間線來看,《規范》于2012年發布,其后ISO 2789、NISO Z39.7、ISO 11620、COUNTER進行了多次修訂,《公共圖書館評估系列標準》(WH/T70.1~ 6—2015)、《信息與文獻公共圖書館影響力評估的方法和流程》(WH/T 84—2019)正式發布。這些新訂與修訂的標準規范對數字資源類型與計量方法等進行了一定程度的調整,給《規范》帶來了直接或間接影響。
《全國圖書館標準化工作“十三五”規劃綱要》提出,我國將建立與圖書館事業發展同步的標準定期復審與更新修訂制度,“數字化建設與服務”是“十三五”期間標準制修訂的重點領域,這方面的工作進展為未來開展《規范》修訂工作提供了良好的背景條件[17]。近年來,國內外圖書館統計相關標準規范的制修訂速度明顯加快,《規范》在內容上和方法上出現了一定程度的滯后性,修訂工作勢在必行。
《規范》統計指標體系較為完整,覆蓋較為全面,但隨著數字資源形態的創新發展,其指標內涵需要進行適當的深化和延展才能適應當前及未來一段時間的統計需要。
(1)數字館藏統計指標細化
《規范》所統計的數字館藏是指“圖書館本地擁有的和獲得一定期限使用權的數據庫和數字文獻”,包括購買、許可授權、受繳、捐贈、交換、數字化、網絡信息采集等方式獲得使用權或保存權的數字資源。經圖書館編目、整合并納入其數據庫或數字文獻中的免費網絡資源單獨統計,其他免費網絡資源不計入數字館藏,開放獲取資源作為免費網絡資源統計。該指標雖然涵蓋全面,但是針對開放獲取資源的統計不足,統計覆蓋面和統計粒度均無法滿足開放獲取資源的發展形勢。學術論著、科學數據和政府數據是目前開放獲取資源的三個重要方面,隨著開放獲取運動的深入發展和《科學數據管理辦法》《政務信息資源共享管理暫行辦法》等政策法規的出臺,各類型開放獲取資源對圖書館數字館藏的影響將越來越顯著,具備分類統計意義。而《規范》“數字館藏量”與“數字館藏發布量”統計指標體系中,免費網絡資源類數字文獻并未設計二級指標,僅以“條”作為計量單位也與開放獲取資源特性不符,需要及時進行調整修訂。
(2)數字館藏服務統計指標延展
《規范》對數字館藏服務“當前用戶”和“使用情況”進行統計,根據訪問方式將用戶細分為互聯網用戶、局域網用戶、數字電視用戶、移動通信用戶、專用網絡用戶、光盤用戶、其他用戶。而近年來各類評估均要求進行用戶群體的細分統計,例如:公共圖書館評估指標包含未成年人服務指標,以及包括老年人、殘疾人、農民工在內的其他特殊群體服務指標,但《規范》指標體系卻不能直接提供關于不同類型用戶群體的統計數據,影響了《規范》的兼容性、適用性和落地實施,應考慮通過修訂解決此類問題。

表2 《規范》數據庫相關術語定義
《規范》將圖書館數字資源劃分為“數據庫”和“數字文獻”兩大類,又將數據庫細分為全文數據庫、文摘/索引數據庫、數值/事實數據庫、多媒體數據庫、工具型數據庫、復合型數據庫,并給出了相應的術語定義(見表2)。《規范》各類型數據庫的定義存在一定交叉,各類型數據庫之間的區分不夠明顯,例如:數值/事實數據庫與工具型數據庫均指向帶有數據集成與交互利用功能的數據庫,多媒體數據庫與復合型數據庫均指向多種類型資源綜合的數據庫。在統計實踐中,指標分類分歧可能導致數據重復、數據缺失等問題,影響數據準確性,不利于開展統計分析,建議在修訂中通過精準化定義實現指標一致性。
統計工作與標準化工作在國民經濟發展中具有重要作用,我國通過立法保障相關的工作制度。因此,《規范》制修訂必須在法律框架下開展工作,按照《中華人民共和國統計法》《中華人民共和國統計法實施條例》規定的統計制度設計《規范》統計要求,按照《中華人民共和國標準化法》《中華人民共和國標準化法實施條例》規定的程序開展《規范》修訂工作。
公共圖書館是圖書館行業標準最主要的適用對象,因此,《規范》指標體系應當充分滿足文化行業統計的政策法規要求。例如:原文化部頒布的《文化統計管理辦法》要求文化統計調查對象建立健全原始記錄、統計臺賬和各項管理制度[18],但《規范》中沒有體現相應的響應機制;由原文化部制定、國家統計局批準的《全國文化文物統計報表制度》要求統計公共圖書館網站數,即“有獨立域名的web站點,其中包括CN和通用頂級域名(gTLD)下的web站點”,但《規范》并未統計這項指標[19]。這些問題應當在修訂時考慮補充完善。
如表1所示,《規范》與多項國內外標準規范關系密切,只有從根本上理解和把握它們之間的共性與交叉問題,合理設計指標兼容與指標映射關系,才能真正實現標準的有效接軌。《規范》是對《信息與文獻圖書館統計》(GB/T 13191—2009)數字資源相關統計指標和統計方法的細化,與圖書館統計的國際標準和國家標準銜接良好。相比之下,《規范》與其他標準規范指標體系的銜接則存在不同程度的問題,特別是針對COUNTER標準和公共圖書館評估系列標準(WH/T70.1~ 6—2015)。
COUNTER標準主要用于完成數字資源使用統計,在國內外商業數據庫服務上得到了廣泛應用,成為圖書館領域的一項事實標準,很多圖書館直接采用數據庫服務商根據COUNTER標準提供的數據作為本館服務統計數據。因此,建立與COUNTER標準之間的映射關系對確保《規范》的實用性具有重要意義。以COUNTER標準最新版本The COUNTER Code of Practice for Release 5(《COUNTER電子資源使用統計實施規范》,以下簡稱COUNTER R5)為例,其對資源類型、權限類型和統計維度的劃分均與《規范》存在差異(見表3)。COUNTER R5將用戶活動統計劃分為“請求量(requests)”和“訪問量(investigations)”兩類,前者是指瀏覽或下載實際內容項,后者指所有類型用戶活動,包含前者[20]。這兩個概念與《規范》統計的訪問量、下載量、檢索量指標既有區別,又有聯系[21]。公共圖書館評估系列標準(WH/T70.1~ 6—2015)要求新媒體服務評估指標包括微信公眾平臺與微博服務、移動圖書館、觸摸媒體服務三項評估指標,基本分項包括微信公眾平臺與微博服務用戶人數所占的比例,而《規范》統計移動通信網絡的用戶人次并未按照服務平臺做細分統計。這些問題都需要在《規范》修訂加以考慮。
解決標準規范之間的兼容和銜接問題,不能依靠完全一致的指標定義。《規范》修訂時,可通過發布附錄或操作指南的形式,說明與其他相關標準規范核心指標之間的映射辦法,以增強《規范》數據的通用性,從而達到提高統計效能的目的。

表3 《規范》與COUNTER R5指標維度對照
確保數據質量是統計工作的基本要求,數據質量控制方法應當成為統計標準的一項必備內容。《規范》包含“數字資源統計管理”章節,簡要提出了統計數據管理要求,包括建立制度、明確職責、規范流程等,但缺少提高數據質量的具體方法,修訂時應考慮補充數據核驗要求,強化管理措施。
圖書館數字資源形態豐富,數據格式多樣,數字資源建設、存儲和發布可能由不同業務部門分別承擔,統計數據復雜且來源廣泛,《規范》明確了每個指標的數據采集原則,并提出了去重統計要求,但仍然無法從操作上避免數出多門或一門多數的統計問題。在《規范》中確立標準化的數據核驗方法有助于解決這個問題,包括同步提交完整的數據憑證和記錄、增加人工審核環節、采用信息化手段檢查數據平衡關系和邏輯關系等措施,從加強統計工作管理和完善統計方法兩個方面確保統計數據的準確性、完整性和一致性。
修訂標準的目的是促進標準持續發揮作用。修訂首先是對當前版本標準的繼承,保持較大程度的延續性和連續性,以維護標準文件共同使用和重復使用的功能特性。在保持《規范》穩定性的同時,修訂人員應注意不能模糊修訂工作目標,需要在扎實調研分析的基礎上開展修訂工作,切實拓展《規范》的覆蓋范圍,剔除其中不適應行業發展的規定,根據行業發展要求及時增補和更新統計指標及其計量方法,充分體現這項行業標準的發展性以及修訂工作的必要性,切忌為了追求版本更新而進行無關痛癢的小修小補。
按照我國《標準化法》要求,制定標準應當達到“技術上先進、經濟上合理”,這就要求制修訂標準需要充分應用目標導向、系統分析和整體協調方法等標準化工作的方法論基礎,遵循協同性工作原則[22-23]。從《規范》實施效果考慮,其修訂工作需要開展三維協同:①技術協同。《規范》修訂方向應基本符合數字資源生產與圖書館建設的主要趨勢;②標準協同。《規范》修訂過程應充分融合相關法律法規與標準規范的指標體系;③主體協同。《規范》修訂成果應基本匹配圖書館行業數字資源生產、建設和服務單位的主要統計需求。
數字資源統計工作以及統計標準不可避免地與其他相關法律法規、標準規范以及業務慣例交叉運行,修訂《規范》需要考慮與主要指標體系的兼容,但追求與相關指標體系的完全適配既不可能也沒必要。任何標準都有其局限性,在修訂過程中,應從標準規范的主要目的和應用范圍出發,正確看待局限性,把握總體平衡的原則,處理好本標準與其他相關文件之間的關系[24]。數字資源統計工作涉及很多細節,但標準有抽象性和概況性的要求,對于不宜在標準中予以具體規定的實踐細節,可以通過出臺“操作指南”等類型文件進行細化規定,以增強標準的實用性。
數字圖書館領域急需通過制定標準來完善標準規范體系,對現有標準的修訂和更新同樣不容忽視。以科學分析和評估為基礎,對適應性明顯弱化的標準展開修訂,有利于促進圖書館標準體系的成熟化發展[25]。數字資源統計是圖書館的基礎性業務工作,直接影響數字圖書館資源建設、服務和管理的效率與效用,建議盡快修訂《規范》,通過實踐驅動落實標準化,充分發揮行業標準的規范功能和引領作用。