戴宇丹+陳紅
關鍵詞:政府公報;全文數據庫;數據庫建設
摘要:為加強政府信息公開力度,讓廣大公眾方便快捷地獲取政府信息,充分發揮政府公報對人民群眾生產、生活和經濟社會活動的服務作用,受貴州省政府公報社的委托,貴州省圖書館承擔對《貴州省政府公報全文數據庫》數據庫建設和數據庫更新工作。文章對該數據庫的建設進行了梳理,以期進一步加強和完善此項工作。
中圖分類號:G250.73文獻標識碼:A文章編號:1003-1588(2015)04-0005-04
收稿日期:2015-02-08
作者簡介:戴宇丹(1967—),貴州省圖書館副研究館員;陳紅(1969—),貴州圖書館副研究館員。1政府公報全文數據庫建設的意義
2007年4月,《中華人民共和國政府信息公開條例》的頒布實施,正式確定了公共圖書館成為公眾查閱政府信息的法定通道。實踐證明公共圖書館作為公眾查閱政府信息的場所,在提供政府信息公開服務中具有無與倫比的優勢。首先,公共圖書館的服務群體具有多樣化,任何人,無論身份、地位、性別、知識水平如何,都可平等地享受圖書館的一切服務。其次,在服務時間上公共圖書館360天開放,節假日均正常開放,能方便公眾查詢政府公開信息。在服務方式上,圖書館可提供現場查詢、電話咨詢、信函、電子郵件、網上咨詢等服務方式,為政府公開信息查詢提供便利。其三,更重要的是圖書館擁有一批專業的信息咨詢服務人員,能把分散的政府信息進行重新組織、整理、排序,以方便各類型用戶的信息查詢和政府公開信息的順利獲取。
《貴州省人民政府公報》(以下簡稱:《省政府公報》)是貴州省人民政府主管主辦的唯一政務期刊,也是政府政務公開的主要形式之一。《省政府公報》主要刊載省委省政府統籌全省經濟社會發展的科學決策的政策文件,是以登載法令、方針、政策、宣言、聲明、人事任免等各類政府文件為主要內容的連續出版物,是政府信息公開的重要載體,也是公眾查閱最多,使用最廣的政府公開信息文獻。《省政府公報》于1992年創刊,2004年5月開通網絡版,并在省政府網站首頁設立了“政府公報”欄目,其受眾的范圍逐漸擴大。政府公報作為一種特殊文獻,既是發布政令、依法行政、政務公開的法定載體,又是政府聯系群眾的橋梁和紐帶。但是,貴州省圖書館政府信息公開查閱中心在為公眾實際查找提供《省政府公報》的相關信息時發現,無論紙質版還是網絡版的《省政府公報》,因沒有設置相應的檢索點,很難查到讀者用戶所需的具體文獻。為此,貴州省圖書館向貴州省政府公報室提出《省政府公報》不應僅僅實現簡單的政務信息的發布,而是應建立一個較為完整的《貴州省政府公報全文數據庫》,并完善其檢索與查閱方式,使《省政府公報》的信息更有效地傳遞給用戶,以保障廣大公民、法人和其他組織依法獲取政府信息,提高政府工作的透明度,促進依法行政,充分發揮政府信息對人民群眾生產、生活和經濟社會活動的服務的重要作用。
2《省政府公報》全文數據庫建設
2013年,為加強政府信息公開力度,讓廣大公眾方便快捷地獲取《省政府公報》信息,貴州省政府公報室上報省政府辦公廳批準建立《省政府公報》全文數據庫。貴州省圖書館受貴州省政府公報室的委托,承擔了《貴州省政府公報全文數據庫》數據庫建設和數據庫更新的工作。
2.1數據庫前期調研分析
貴州省圖書館對此項工作高度重視,專門成立了《省政府公報》全文數據庫建設工作小組,并為數據庫建設做好前期調研和設施設備的準備工作。為了掌握和借鑒各省《政府公報》(網絡版)的有關情況,筆者對各省、自治區及直轄市《政府公報》(網絡版)基本情況進行了梳理(見表1)。戴宇丹,陳紅:政府公報全文數據庫建設探析戴宇丹,陳紅:政府公報全文數據庫建設探析表1各省、自治區及直轄市《政府公報》(網絡版)基本情況表
省份展示方式檢索點檢索功能上海市全字段檢索途徑關鍵詞、日期、發行年及期數、標題檢索。檢索結果可按相關度及時間排列。檢索出的政策及法規可進行語音導讀。查全率高,精準度較差。安徽省網頁式文號、關鍵詞、發行年及期數。有分類導航。查全率及精準度差。北京市全字段檢索途徑標題、關鍵詞、文號、公報年度、期數、發文單位、發文日期、實施日期。有下載功能。期號有升降序排列。查全率高,精準度較差。重慶市標題、發布機構、索引號、生成日期、公文字號、主題分類、主題關聯詞、體裁分類。目錄導航完備。進行人工主題標引。查全率及精準度好。福建省全字段檢索途徑發行年及期數、欄目、文件號、中文標題、英文標題、發布單位、文件內容、公布日期。有全國各省市及本省各地市公報鏈接。查全率高,精準度較差。甘肅省部分字段檢索途徑標題、內容、出處、關鍵詞、目錄。檢索點不足,影響查全率及精準率。廣東省網頁式無有架構,各項檢索功能正在完善中。有全國各省市及本省各地市公報鏈接。廣西壯族自治區網頁式無無海南省部分字段檢索途徑關鍵詞、發文日期。關鍵詞在標題及內容方面進行界定,對關鍵詞所在本省內的政府網站進行限定。檢索點不足,影響查全率及精準度。河北省網頁式無無黑龍江省網頁式無無河南省網頁式出版年及期號。無湖北省無網站不能進入。湖南省網頁式無無江蘇省網頁式無無江西省網頁式標題無吉林省網頁式出版年及期號。無遼寧省網頁式出版年及期號。無內蒙古自治區全字段檢索途徑分類、類別、年號、字號、主題詞、關鍵詞。查全率較高,精準度差。寧夏回族自治區網頁式無有架構,檢索目前不能完成。青海省網頁式無架構完整,目前不能進行檢索。陜西省部分字段檢索途徑出版年及期號、關鍵詞。檢索點不足,影響查全率及精準度。山東省網頁式無有架構,目前不能進行檢索。山西省網頁式無有架構,目前不能進行檢索。四川省部分字段檢索途徑出版年及期號、標題、文號。檢索點不足,影響查全率及精準度。天津市部分字段檢索途徑出版年及期號、關鍵詞檢索點不足,影響查全率及精準度。新疆維吾爾自治區網頁式無無西藏自治區網頁式無無云南省網頁式無有架構,目前不能進行檢索。浙江省網頁式出版年及期號。無貴州省網頁式無通過對全國31個省、市自治區及直轄市的《政府公報》信息公開發布平臺情況的調查,能夠進行全字段檢索的政府信息發布平臺只有4家,其中3家由于未進行人工主題標引,僅利用系統在頁面中自動提取識別關鍵詞,其檢索結果存在查全率高但查準率低的情況。隨著信息量的逐年增加精準度還將進一步下降。只有重慶市政府信息網站對所發布文獻進行了人工主題標引,從而大大地提高了文獻的查全率及查準率,此種查全率及查準率不會隨著信息量的增加而下降。有部分字段檢索途徑的政府信息發布平臺5家,由于檢索字段的缺失,造成用戶在使用過程中對信息的獲取發生偏差甚至不能檢出。余下21家都是網頁式發布形式,基本不具備檢索功能。
《省政府公報》全文數據庫建設工作小組在對全國政府公報網站調研分析的基礎上,總結了各方面的經驗,就如何優化《省政府公報》全文數據庫建設,完善貴州政府信息公開發布平臺的檢索途徑,提出了可行性意見和建議。如:各種檢索點的設置應包括文件題名、文件號、發布機構、發布時間、關鍵詞、主題詞、出版年及期號等。
2.2數據庫系統建設原則與方法
2.2.1數據庫系統建設原則
①兼容設計原則:為使《省政府公報》全文數據庫系統有更大地兼容性,要能夠對以后的數據庫系統、網頁采集模塊、網頁資源信息庫、全文檢索庫及對應的硬件環境進行擴展。②穩健性設計原則:要求系統具有高可靠性和穩定性,要解決好《省政府公報》全文數據庫系統的各個單點問題。③高性能設計原則:為了應對《省政府公報》全文數據庫的訪問量的不斷增長,系統必須具有高性能來支撐更大規模的應用,以能應對日訪問量峰值10余萬次的需求。④安全性設計原則:由于系統數據量非常大,為了避免數據被破壞而帶來的損失,需要采取相應的應對措施,并根據安全管理規定,要求保障信息資源訪問和存儲的安全性。
2.2.2數據庫建設方法
《省政府公報》全文數據庫的數據加工和錄入主要分兩部分進行。一是對2004年5月以后有電子版的《省政府公報》數據直接進行標引和元數據加工。二是對1992年至2004年5月的紙質文《省政府公報》進行文獻掃描,掃描的圖片資料按公報系統設計要求進行相關處理后再進行標引和上傳。
文獻標引主要根據《省政府公報》文獻的內容特征和外部特征進行。重點對《省政府公報》中的每條文獻標題、文件號、發布機構、發布時間、關鍵詞、主題詞、出版年及期號進行標引。
《省政府公報》全文數據庫設置有分類導航、時間導航、出版年及期號導航。分類導航以《中國圖書館分類法》(第五版)為依據,涉及各學科分類都可以按樹形結構展開。利用各種導航可縮小檢索范圍,提高查準率和查詢速度。檢索方式設置為簡單檢索(快速檢索)與高級檢索2項,以滿足不同讀者的檢索需求。
嚴把數據庫的數據審核質量關,對公文分類、主題分類、體裁分類等幾十個大類小類反復斟酌、反復商討,確保準確;按照《中國分類主題詞表》規范主題詞標引;閱讀正文提煉關鍵詞;對照原文核對公報的文號、發布機構、發布時間等。
2.2.3數據著錄中存在的問題及解決方法
公文分類的難點和疑點。原先方案設計的分類思路是完全以《中國圖書分類法》(第五版)作為分類依據,但在實際操作中發現公文的類別劃分有其特殊性。例如:《省人民政府辦公廳關于調整省旅游發展和改革領導小組成員的通知》,之前在分類時把該文件分在旅游類,但后來實際工作中此類文件大量出現,小組成員反復討論,在既不違背分類總原則的前提下,又要兼顧公文的特殊性和文件所揭示的主題,最后統一標準,凡涉及此類型的文件都統一劃分到組織機構的人事任免類。再如:《關于省人民政府辦公廳轉發省民政廳關于認真做好全省第四屆村(居)民委員會換屆選舉工作意見的通知》,按公文的分類慣例都是把此類文分到綜合政務類,但實際上從專業的角度來講,選舉應入政治類,并增加了政治與法律條目。主題標引存在的問題。政府公報無專用主題詞表,只能采用《中國分類主題詞表》對公報進行標引。公報主要登載法令、方針、政策、宣言、聲明、人事任免等各類政府文件,其中大量文件還涉及本地區的政治、經濟、文化等方面,有較強的地域特點和鮮明的時代特征。在進行主題標引時,工作人員往往要認真通讀全文,了解主要內容,吃透基本精神,準確提煉主旨,并在此基礎上提煉公報的主題概念。例如《省人民政府關于同意清鎮市犁倭鄉暗流鄉撤鄉設鎮的批復》,由于主題詞表對地區的揭示只到市、縣一級,為了完整地描述文件的主旨,在關鍵詞中對犁倭鄉與暗流鄉進行了揭示,提高了公報的查全、查準率。另外,針對《省人民政府辦公廳關于松桃縣“渴望工程”存在問題的通報》《省人民政府關于實施貴州省“四在農家·美麗鄉村”基礎設施建設六項行動計劃的意見》等類公文,由于主題表中并無“渴望工程”“四在農家”的提法,更需要工作人員讀透文件,提煉出中心思想,進行正確的標引。以上2份文獻的主題標引分別為“扶貧不發達地區、農村飲水、飲水工程、貴州松桃苗族自治縣”和“基礎設施建設、農村、生態環境建設、不發達地區、社會主義建設、建設規劃、貴州”。
3結語
《省政府公報》全文數據庫建設工作小組,經過近1年的努力,順利地完成了《省政府公報》全文數據庫建設并投入使用。該數據庫對1992年以來公開發行的《貴州省人民政府公報》各期的每篇文獻分別進行了分類、標引和錄入,共錄入1992至2014年的《貴州省人民政府公報》366期6,092條數據。用戶可通過主題詞、文獻題目、文號、發布日期等進行檢索。數據庫正式建成發布至2014年年底訪問量達到了42,110人次。同時,《省政府公報》全文數據庫的每年數據更新工作也隨之成為貴州省圖書館的常態化工作,數據庫在具體的應用中所發現的問題和不足,也將得到逐步完善。總之,通過《省政府公報》全文數據庫建設工作的開展,不僅使圖書館專業人員增長了知識,積累了經驗,還為以后規模化數據庫建設奠定了重要基礎。
參考文獻:
[1]田俊.充分發揮政府公報信息公開的作用[J].當代貴州,2014(12):40.
[2]韓葉,樊英穎.探析我國政府公報網絡版的建設與發展[J].秘書之友,2014(1):9-11.
[3]萬華英.公共圖書館與政府信息公開服務芻議[J].內蒙古科技與經濟,2008(18);170.
[4]周艷.地方文獻全文數據庫建設的一點嘗試[J].圖書情報研究,2011(1):60-61.
[5]吳新元.公文分類的原則與方法[J].應用寫作,2002(8):54-55.
(編校:嚴真)第35卷第4期河南圖書館學刊2015年4月