高美云
(廣州圖書館 廣州 510623)
近年來,國家越來越重視統計數據質量管理,將其作為推動經濟發展、完善社會治理、提升政府服務與監管能力的重要手段。十八大后,中央陸續出臺《關于深化統計管理體制改革提高統計數據真實性的意見》等多項管理辦法,明確從完善統計法律法規,健全政績考核機制,健全統一領導、分級負責統計體制,健全統計數據質量責任制,構建數據共享格局等方面深化統計管理體制改革,提升統計數據質量。圖書館作為公共文化服務體系重要組成部分,應加快構建與國家治理體系相適應的行業統計數據質量管理體制,以數據整合帶動資源融合,推進圖書館治理能力現代化進程。
“質量”一般指產品優劣程度,傳統“數據質量”直接與準確性掛鉤。隨著數據深入運用,“數據質量”內涵發生了認知轉變,美國《統計科學百科全書》將其表述為統計數據自公布后多大程度滿足了用戶對統計信息的需求和期待,即從用戶需求視角衡量數據質量。“數據質量”從狹義的準確性,向廣義的適用性、準確性、及時性、全面性、可取得性、可比性、可銜接性等發展。借助自動化信息系統,統計數據實現了自動化收集、處理,準確性與及時性大大提高;依靠網絡平臺,國內外統計數據唾手可得,可取得性、可比性空前提升。當然,社會各界對統計數據的質量要求亦水漲船高,迫使圖書館提高統計數據管理水平。我國各類圖書館分別歸屬于文化、教育、科技、醫療等部門,傳統條塊式部門垂直管理阻礙了跨部門圖書館之間的橫向交流協作,統計數據零散地摻雜在不同行業數據中。隨著政府職能從管理型轉為服務型,行業協會管理成為大勢所趨。圖書館行業管理,是以圖書館行業協會為行業內部事務管理主體,賦予圖書館協會規劃、協調、規范、監督、服務等職權,對圖書館行業進行自主管理的體制安排[1],旨在改變各系統圖書館缺乏協調的狀態,發揮行業整體資源優勢。構建圖書館統計數據行業管理體系,利用行業扁平化組織管理縮短統計層級關系,提升統計數據質量管理水平,可謂是應然之舉。
我國圖書館界一些研究者對圖書館統計進行了持續研究。筆者以主題為“圖書館”,關鍵詞為“統計”在CNKI、萬方等數據庫檢索,對檢索結果去重和剔除非相關文獻,共獲得100余篇有效文獻。采用內容分析法對所得文獻進行梳理發現,研究主要探討了以下問題:一是圖書館統計的意義、存在問題及解決策略[2];二是統計管理體系[3]、統計評估標準[4]、指標體系[5]、統計信息平臺[6]等統計管理流程;三是借閱服務、參考咨詢服務、館藏資源、數字化服務、閱讀推廣活動等專項統計評價。這些理論研究和實踐探索,為圖書館統計數據質量管理提供了思路與啟迪。然而,研究主要集中在公共圖書館系統或高校圖書館系統,全行業統計管理研究較少。當前,圖書館正處于轉型發展之際,跨部門、跨區域、跨層級的館際資源共享與協調合作勢不可擋,圖書館行業發展亟需高質量的行業數據作為決策參考依據。文章從我國圖書館全行業統計數據現存問題著手,探究數據質量行業管理策略,以期為提升數據質量提供借鑒。
對比發達國家和地區圖書館統計管理實踐,我國圖書館統計數據質量管理任重而道遠。圖書館主管部門、圖書館學會、圖書館機構甚至圖書館內設部門之間缺乏統一協調,各自為政、分散地開展統計管理造成了數據碎片化、重疊化、閑置化,圖書館行業對統計管理不重視、數據使用不規范,甚至不使用數據,導致數據錯漏、矛盾、失真等問題。
按照《統計法》規定,我國建立了以國家統計局為主導機構統籌協調,各部委下屬統計機構縱向管理的行業宏觀統計體系。公共圖書館、高校圖書館、專業圖書館等分布在不同系統,缺乏跨系統的統計機構橫向管理圖書館行業統計。圖書館行業統計法規或制度遲遲未出臺,覆蓋全國各地各類型圖書館的行業統計網絡至今未建立,全面完整的行業數據無從統計。公共圖書館系統統計管理相對完善,以行政發文強制執行方式建立了統計運作管理體系,基本覆蓋了3 000多所縣級以上公共圖書館。縣級以下的街鎮圖書館、社區圖書館暫未被納入統計,這與其他國家覆蓋所有基層公共圖書館的統計口徑存在差異,數據對比參考價值大打折扣。高校圖書館系統在高校圖工委倡議下,構建了統計管理網絡,2019年高校圖書館參與填報率約為40%,數據全面性、適用性還不夠。系統間的信息壁壘造成信息不對稱,依據不同統計制度與統計標準建立的“公共圖書館基本情況年報”“高校圖書館事實數據庫指標體系”統計指標、統計規范、統計口徑自然不一致,制約著兩個系統圖書館統計數據的融合發展與比較利用。國家統計局對外發布的《中國統計年鑒》只包含了縣級以上公共圖書館數據,與國際圖書館統計標準不一致,屢遭發達國家圖書館界詬病。圖書館行業數據碎片化直接呈現了圖書館系統間的割裂狀態,也制約著圖書館行業政策法規的制定出臺,進而影響到圖書館行業治理體系的發展。
隨著信息技術發展和網絡技術普及,各層級圖書館機構紛紛將傳統逐級上報的紙質報表轉為線上統計數據管理系統。但這些系統只支持數據單向流動,即被調查圖書館將統計數據手工輸入系統,經過系統匯總后輸送到數據管理人員手上,不支持數據互動查詢。簡言之,線上管理系統只是紙質報表的電子化。以公共圖書館為例,各館每年1月在“全國文化文物統計系統網絡版”手工填報數據,最終數據只能通過《中國公共圖書館事業發展基礎數據概覽》《中國圖書館年鑒》等紙質出版物查閱,數據時效性往往滯后一兩年,且只能按省份或年份查詢整體數據,不展示公共圖書館城市體系數據或單館數據,給數據利用帶來極大不便。缺乏統計數據平臺獲取現成數據,而現實中績效評價、規劃決策、宣傳推廣又需要其他區域數據作為比較分析依據,為此圖書館機構只能自行搜集數據,數據全面性、準確性難以保障。區域圖書館各自為政,沒有建立數據共享機制,即便通過公文或行業交流途徑也難以獲取其他區域圖書館統計數據,區域之間“數據壁壘”“數據孤島”現象普遍。《公共文化服務保障法》有“建立統計報告制度和年報制度” 規定,《公共圖書館法》亦有“定期公告服務開展情況”條款,但均無配套政策說明數據公開范圍、開放渠道等標準指引。考慮輿論聚焦、宣傳效果和數據安全等因素,圖書館往往揚長避短,只公開優勢數據。因此,從圖書館網站、年報中查詢的統計數據各不相同,且大多數數據缺乏指標定義解釋說明,僅看數據令人費解,其準確性同樣令人質疑。
我國圖書館行業《信息與文獻 圖書館統計》(GB/T 13191—2009/ISO 2789:2006)、《信息與文獻 圖書館績效指標》(GB/T 29182—2012/ISO 11620:2008)等統計標準已頒布多年,頒布之初由于組織實施力度不足,未能很好地在圖書館界推廣落實,頒布之后未根據圖書館發展趨勢更新修訂,部分標準已不能適應現時統計之需。統計標準語言模糊易令人產生不一致理解,進一步削弱了標準的實踐指導作用。目前,我國圖書館行業尚未根據統計標準制定一份科學規范的統計指標體系供行業參考使用,各種圖書館機構統計指標自成一體,進一步加劇了數據分割與重復。“公共圖書館基本情況年報”指標偏重于經費、人員、設備等硬件條件,服務效益指標僅占12.64%。江蘇、海南等地高校圖書館聯盟則在“高校圖書館事實數據庫指標體系”以外另行設計了區域指標體系。政府條塊分割的管理體制造成協調互動難,各層級圖書館管理部門基于自身需求“自上而下”設計指標體系,較少考慮下級圖書館統計需求,層層設計、各行其是的調查項目加重了基層圖書館統計負擔。以筆者所在的廣州圖書館為例,該館除了報送文化和旅游部“公共圖書館基本情況年報”,還需要填報依據評估標準設計的省學會指標體系數據、依據文旅融合設計的主管局指標體系數據、依據《廣州公共圖書館條例》量化目標設計的中心館圖書館指標體系數據,還有其他專項調查等累計數十份。這些調查項目的統計指標、指標定義、統計口徑、采集渠道各不相同,甚至部分調查項目沒有指標定義說明,一方面造成統計人員填報意愿下降隨便應付了事,另一方面“數出多門”令數據頻頻打架,不僅影響了數據價值,也會降低圖書館公信力。
數據絕大部分是在生產過程中生成的,以往囿于技術條件難以從生成過程中剝離出來,只能采用手工統計,造成數據質量低和人工成本高等問題。如今自動化管理系統已在圖書館行業廣泛應用,如資源管理系統、流通管理系統、客流管理系統等,數據從單維統計擴展為多維統計。由不同系統集成商創建的數據系統互不兼容造成圖書館內部數據割裂與分散;館藏狀態、借閱記錄等實時變化令系統數據穩定性較差;系統操作復雜只能依靠技術人員采集數據,一旦統計人員與技術人員在溝通中出現理解偏差,將直接影響數據質量……自動化管理系統為統計帶來便利的同時也造成了統計的復雜性,此時規范管理流程尤為重要。然而,圖書館內部管理流程不規范現象比比皆是:一是統計管理制度不健全,沒有形成規范的統計業務管理流程,統計審核流于形式,數據管理隨意性較大;二是沒有建立長期跟蹤的統計指標體系,只是任務式完成統計報表,容易造成數據錯漏、矛盾、失真;三是滿足于數據采集管理,“數據閑置”問題普遍,分析運用不足難以解決深層次的數據問題,從公共圖書館17份年度報告調查中只有3份公布了數據分析報告可見一斑[7];四是統計人才隊伍建設有待加強,基層圖書館統計隊伍不穩定,統計人員專業素質不夠,統計管理意識薄弱,尚未建立常態化統計培訓機制助推專業隊伍成長。
立足我國圖書館統計數據現存問題,從統計行業管理、法規制度、標準規范、指標體系、審計機制、管理平臺、數據開放共享、數據分析利用等方面構建圖書館行業統計數據質量管理體系,能夠促進行業數據整合性、協調性管理。
毋庸置疑,建立圖書館行業管理體制是重塑統計數據質量的基礎條件。發達國家或地區圖書館一般由協會統籌構建全國行業統計管理體系。日本圖書館協會(JLA)是公共圖書館、大學圖書館的統計執行者,自1952年起每年發布《日本圖書館統計》,數據覆蓋了95%以上的圖書館[8]。美國圖書館統計由圖書館協會與統計機構聯合開展,1988年推出“圖書館統計合作項目”(Library Statistics Cooperative Program),構建了以國家教育統計中心(NCES)負責資金支持,國家圖書館與信息科學委員會(NCLIS)負責會議組織、人員培訓、執行監控,國家統計局負責數據收集、處理,各種圖書館協會負責統計標準、指標體系、政策法規等制定及數據分析研究的行業統計管理體系,數據回收率達到90%以上[9]。我國臺灣地區“圖書館調查統計系統”則由臺灣最高層級的圖書館統籌建設,覆蓋了各類型圖書館[6]。
中國圖書館學會(以下簡稱“中圖學會”)下設18個分支機構,基本囊括了所有類型圖書館,主要職能定位為科學研究、人員培訓、法規宣傳、標準制定、評估認證、資源共建共享等。中圖學會現在還不完全具備行業管理職能,但可以逐步調整組織機構和人力資源配置,轉型擔當行業管理主導者。借鑒歐美經驗,中圖學會可增設專業統計委員會,主要職能包含:一是制定圖書館行業統計法規、制度,加強宣傳,推動組織實施;二是在收集各類型圖書館統計意見基礎上,建立統計標準修訂機制,設計行業統計指標體系;三是負責數據收集、分析、發布與研究;四是組織統計會議、研討會,為各類型圖書館提供統計交流平臺,促進圖書館之間協調合作;五是整合全國圖書館統計資源,開展統計培訓,提升統計人員責任意識和專業素養。專業統計委員會以中圖學會為主體,建立統一管理、分級負責的行業統計管理體系,各級圖書館學會同步增設統計委員會,配置專職人員,具體負責統計協調與數據管理。
法律法規與統計數據密切相關,統計數據為法律法規出臺提供動力,法律法規則為統計數據提供強力保障。英國圖書館事業始終處于國際領先地位,這與其完善的法律體系息息相關,而基于統計數據的調查報告則是推動立法的先行者。英國圖書館協會(LA)發表的3個著名報告意義重大:1849年《公共圖書館特別委員會報告》促成了《公共圖書館法》出臺;1959年《羅伯茲報告》推動了《公共圖書館和博物館法》制訂;1969年《丹頓報告》則為《大英圖書館法》頒布作出了突出貢獻[10]。為了強化圖書館統計調查地位,1992年英國國會通過《公共圖書館調查程序法則》,明確統計調查適用范圍、執行程序、報告分析、數據公開等條款[11]。在法律保護框架下,英國又建立了聯邦大學和國家圖書館學會“績效門戶”(Performance Portal)、“網絡電子資源在線利用統計”(COUNTER)等國際知名統計平臺,發布了《測評我們的價值》(2004年)、《學術圖書館價值報告》(2010年)等國際性報告。
法律與統計管理體系并不存在孰先孰后的必然順序。任何一部法律法規出臺都是多方博弈的過程,我國1993年啟動《圖書館法》立法工作,后因各方分歧而擱淺,這與行業分散管理不無關系。英國圖書館統計持續了近百年,而圖書館統計法近三十年才頒布,在此之前管理制度是保障行業統計管理體系運行的必要手段。統計制度通常包括組織架構、調查程序、管理流程、人員配置、分工權責等。中圖學會履行行業統計管理職能,首先應該從一份行業認同的統計章程入手,以章程協調各類型圖書館統計管理,制定配套統計制度供各層級圖書館機構借鑒使用,以管理制度推進行業統計科學規范運作;待條件成熟后,再出臺統計法規將行業統計納入法律體系,賦予中圖學會統計管理權力及責任,以及各類型各級別圖書館學會統計分工與權責,以法律威懾力保障行業統計正常運行,確保統計數據的連續性、穩定性。
實施標準化的統計業務流程是夯實數據質量的關鍵。歐盟統計局開發的統計業務流程通用模式(GSBPM)將統計流程細分為需求、設計、建立、收集、處理、分析、發布、評估8個環節36個節點[12]。國際標準化組織(ISO)制定了一系列國際通用圖書館標準,特別是ISO 2789、ISO 11620在世界范圍內得到廣泛運用。考慮到技術發展、方法變革、質量安全等形勢變化,其規定標準必須在發布或修訂的五年內重新評價。美國圖書館標準管理機制最為科學完善,主要貢獻在于美國圖書館協會(ALA)橫向協調管理,出臺指導文件幫助各類型圖書館協會、地方政府和專業機構因地制宜制定標準,并允許任何人任何時間向協會委員會提出修訂意見,確定修訂意見后向主席提交議案,分析修訂需求、執行人和修訂目的,同時成立工作組,制定包括信息收集、起草標準、審核草案在內的方案,草案經委員會核定和多方評議通過后進行宣傳推廣[9]。“自下而上”的標準管理機制,避免了統計標準與統計實踐的脫節滯后。
美國圖書館按圖書館類型分別開展統計調查項目,由所屬圖書館協會具體執行,均按國家標準《信息服務和使用:圖書館和信息服務機構統計指標——數據字典》設計指標體系,多數指標保持一致方便行業數據整合,少數不同指標反映了不同類型圖書館特色。法國遵照ISO 2789標準構建了公共圖書館統計指標體系,且在開展統計調查前組織專家研究行業發展特點與趨勢并修訂統計指標,確保統計數據具有科學規范性且與國際接軌;同時在發布統計調查時附帶填報指南,逐項說明指標定義、計算方法與范圍、自動化編輯參數與規則、計量單位、填報方式等,對于容易存疑指標均附事例說明,最大限度消除理解誤差。中圖學會應發揮統計行業管理主導作用,首先抽調行業統計專家擔任技術顧問,研判圖書館行業發展態勢,收集全國圖書館統計意見反饋,建立“自下而上”的標準修訂機制。其次,根據統計標準建立圖書館行業指標體系和配套指南,指導不同類型圖書館學會依據自身特色構建“大同小異”的指標體系,既反映行業特色又有利于行業數據匯總分析。最后,通過科研立項、培訓班、研討會、行政發文等方式,加強統計標準和統計指標體系在相關行業的推廣應用。
統計數據質量既依靠行業協會的統計管理,又取決于個體圖書館的統計執行。現代圖書館引入了眾多操作系統解決服務管理問題,統計流程更為復雜、耗時,統計數據更加多維。操作系統在操作過程中將伴隨式地收集數據,直接從源頭分析日記提取統計數據,可降低數據收集成本,提高數據準確性。但圖書館操作系統眾多,系統之間數據不兼容,系統命令或編程語言操作復雜,技術人員與統計人員溝通偏差易造成數據不準確。因此,集成數據管理系統應運而生。紐約大學健康科學圖書館數據管理系統(NYUHSL)通過調用操作系統API提取不同系統數據至導入器腳本,轉換后再加載到MySQL數字中心,再利用PHP/JavaScript腳本自定義顯示數據[13]。所有數據導入均在凌晨2點自動運行,以保證數據的穩定性;以自定義代碼儲存數據,形成了格式化的存儲信息,方便數據兼容與快速查找;不斷自我更新的統計數據,以可視化圖表展示了服務管理趨勢。受資金與專業技術限制,基層圖書館獨立建設集成數據系統存在一定難度,可依托公共圖書館服務體系建設,以中心館或總館為主力,創建區域性集成數據管理系統,一方面數據自動采集減輕了基層圖書館統計壓力,另一方面優化統計流程直接從源頭采集提高了數據準確性。系統保留手工填報模塊,為部分尚未實現自動化管理的圖書館或無法自動采集的數據提供手工填報窗口。上海圖書館倡導建立的FOLIO系統,制定了關聯數據發布標準、數據質量控制標準、數據接口規范標準、數據挖掘規范標準、可視化規范標準等一系列標準,為有意愿加入的圖書館提供標準化指引。圖書館集成數據管理系統建立示范效應后,以“1+X”管理模式逐步擴大聯盟區域范圍,實行逐級審核后與全國行業統計數據網絡平臺銜接,實現數據自動采集、智能挖掘、關聯分析。
統計審計是預防數據失真的硬協調手段。導致數據失真的因素主要包括人為造假、理解錯誤、方法缺陷、制度殘缺。圖書館自我審核和逐級審核可以起到一定制衡作用。在此基礎上,審計與監督共同對數據進行驗證。統計審計包括數據與標準、行為與制度、流程與程序等一一對照,目的是找出影響數據質量的缺陷,形成改進意見后督促統計管理能力提升。公共圖書館每四年一次的評估定級對評估指標數值進行檢查,一定程度上提高了圖書館行業統計數據質量。美國國家教育中心采用內審、外審、專家專題數據分析復審等內外結合審計機制,有效保障了統計數據質量。國內可借鑒相關經驗,設立中圖學會統計委員會的下設數據審計小組,采用重點抽查和全面普查相結合的方式開展統計審計,審核內容包括統計制度、統計標準、統計方法、調查方案、統計流程、數據采集處理方法、數據分析、數據發布等方面的規范程度。審計過后,數據審計小組提出整改報告,經統計委員會確認后,督促整改方案執行,逐年檢查整改完成情況,必要時可吸納非營利機構或付費邀請第三方機構參與統計審計,形成多方監督的審計管理機制;同步完善基于績效評估的問責機制與獎勵機制,對照崗位責任落實監督檢查,防范和懲治統計造假現象。
“開放”與“共享”是打破“數據孤島”的必經之路,宏觀層面是圖書館治理現代化的現實要求,微觀層面是提升數據質量的必然選擇。新世紀以來,歐美圖書館行業協會紛紛建立集數據收集、分析、開放為一體的統計數據網絡平臺,進一步提高了統計速度。如美國研究圖書館協會LibQUAL+(TM)、美國博物館與圖書館服務機構的IMLS平臺、英聯邦大學和國家圖書館學會網站的“績效門戶”、歐洲委員會的LIBECON系統等[14]都已成為國際知名圖書館統計工具。我國公共圖書館、高校圖書館也創建了數據收集網絡平臺,目前還不支持數據查閱。2015年國務院《促進大數據發展行動綱要》提出建立國家政府數據統一開放平臺,優先推動包含文化在內的民生保障服務領域數據開放,形成跨部門數據資源共享格局。數據安全與隱私保護成為制約數據開放的首要因素。國際知名圖書館統計數據網絡平臺在發布數據時,充分考慮了圖書館隱私保護,公開數據一般按地區或圖書館類型進行分類,無法看到單個圖書館具體數據。美國圖書館協會將數據分為公開和限制使用兩個版本,公開數據無法看到單館具體數據。限制使用版本包括全部數據,接受任何人提出科研申請,說明使用理由和作出保密承諾,申請通過后可為其提供更詳細的數據作為科研和決策依據,但必須在研究報告公開發表前接受審查[15]。臺灣省的圖書館調查統計系統則按權限賬號區別開放數據,保障被調查圖書館的數據使用優先權。我國圖書館行業數據亟須制定數據開放標準,在確保隱私和安全的基礎上促進行業數據在線開放共享,保障數據時效性。數據開放將打破用戶與圖書館之間的信息壁壘,使圖書館從業者、媒體、社會公眾廣泛參與數據利用與質量監督,提升圖書館治理透明度,形成文化事業良性互動機制。
調查報告、年度報告是另一種數據開放形式。數據與文字、圖表相結合能更直觀地展示圖書館行業發展現狀,有助于決策者宏觀把握事業發展趨勢,及時采取措施保障圖書館服務。1915年英國的《圖書館需求與政策報告》通過捐款數額、館舍面積、館藏資源、用戶信息的對比分析,提示了館舍與館藏、城市與農村發展的不均衡格局,推動了農村公共圖書館建設和館際互借[10]。1996年美國佛羅里達州大學圖書館自動化中心(CCLA)利用集成數據管理系統儲存數據,指出該州28所大學圖書館66%的藏書已出版25年以上,成功申請資金用于每年新增5%的館藏[16]。圖書館數據與文化、教育、科研、經濟數據相關聯,佐之以圖書館的成功案例,足以彰顯圖書館的社會價值。英國國家圖書館2004年發布的《測評我們的價值》評價了英國國家圖書館對英國經濟的直接或間接影響[13],以此爭取社會力量參與圖書館建設。“數據越用越準”已經成為共識,數據分析過程中通過關聯指標數據互相驗證、前后數據邏輯推斷、區域數據對比分析等,更能發現數據的深層次問題并及時糾正偏差。
統計數據質量管理是一個持續改善的動態過程。我國圖書館還沒建立互聯互通的行業統計網絡,數據碎片化、數據重疊化、“數據孤島”與“數據閑置”等問題屢見不鮮,統計管理體制改革任重道遠。圖書館治理體系和治理能力的現代化亟須深化行業統計管理體制改革,構建以中圖學會為主導的行業統計管理體制,出臺專業統計制度與法規、健全標準規范機制、建立統計審計機制、創建集成數據管理系統、建立社會監督機制,加強數據分析利用等助力統計數據質量提升,以數據融合帶動圖書館行業協同發展。
(來稿時間:2020年5月)