喬楊
(鄭州輕工業學院,河南鄭州 45002)
高校圖書館特色自建數據庫評價方法應用研究
喬楊
(鄭州輕工業學院,河南鄭州 45002)
本文結合鄭州輕工業學院自建數據庫現狀,基于AHP層次分析法與模糊綜合評判法,從數據庫數量、數據庫質量、檢索方便程度、界面友好程度、查全與查準率、更新頻率、滿足程度和收錄內容是否全面等進行了初步評價分析,為自建數據庫建設項目評價體系提供一些參考性建議。
圖書館;自建數據庫;AHP;綜合模糊評價方法
信息存儲和呈現模式的改變,如何綜合利用計算機技術、網絡技術以及信息技術,結合各種豐富的館藏資源和自建數據庫,為師生提供學習和教學科研服務,已成為高校圖書館信息資源服務的目標之一。高校師生對圖書館信息資源的需求飛速增長,高校圖書館特色數據庫建設已成為信息資源建設的重要內容之一。除上述獲得信息資源形式外,自建數據庫作為信息資源的補充完善,也加快了建設的步伐,成為高校圖書館信息資源的主要來源。自建數據庫指圖書館根據本館的特殊館藏或特殊需要自行開發建設的數據庫,也就是自建數據庫。對高校而言,其主要內容包括自行開發書目、期刊目錄、文摘、論文、具有學科特色的專題全文數據庫等不同內容形式。高校圖書館自建特色數據庫成為信息資源數字化工作的重要組成部分,很多高校圖書館投入大量的人力物力進行自建數據庫建設,來積累圖書館信息資源數字化建設的經驗,構建具有鮮明的專業特色、讀者用戶使用方便、操作簡易,實用性強的專業自建數據信息資源。同時發掘有價值的、具有保護性的地域文化與特色資源,為廣大師生服務。
有關信息資源評價指標體系建設方面研究在中國有一些成果,有關信息資源的評價方法也不斷提出,這些信息資源的評價及主要評價方法包括定量評價、定性評價、定量評價和定性與定量相結合的綜合評價方法。如,根據評價標準、指標體系來進行定性和半定量的主體評價方法,根據用戶使用調查、數據資源利用情況統計分析、數據資源性價的比為主的定量評價方法。評價人員專業熟練程度,如何獲得評價指標問題等問題,都很大程度的影響著評價質量、評價方法的選擇,而評價的過程和評價參與人員影響著評價的結果。
在國外,通過在線搜索SDOS、Springer Link、Kluwer及Google搜索引擎等自建數據數據庫評價相關研究可以看出,國外對自建數據數據庫評價相關研究,對電子期刊數據庫評價與利用統計研究相對較早,與國內相比研究內容也不盡相同,側重點主要包括:一是側重數據庫的選擇評價研究。如:電子期刊方面,國外學者認為針對電子期刊的不同特點,可以依然采用印刷型期刊的相關選擇評價標準,構建出自身獨特的選擇評價標準,可以突出電子期刊評價的可及性和可用性;部分國外學者認為除了評價內容外還可以增加評價檢索界面以及檢索功能等方面。二是對電子期刊數據庫的利用統計分析方面研究。在國外,圖書館很注重電子期刊的利用、統計分析工作,很多研究從不同角度對使用數據進行定量的統計分析,來研究電子期刊的使用對圖書館的對用戶需求滿足程度、經費分配情況、不同讀者用戶行為上的差異、投資效益等問題。三是對評價項目方面的研究,這方面的典型研究有:ARL New Measures Initiative(美國研究圖書館協會新測評研究計劃)。
上述國內外研究綜述分析說明,國內的自建數據庫信息資源的評價研究偏向于理論體系,如:評價指標體系建立方法,評價方法和評價的策略等。國外研究對信息資源質量的驗證多是通過績效評價來進行的,達到增強對信息資源質量的管理的水平目的,國外評價指標研究在注重理論體系的同時注重指標體系在實踐中的指導,注重指標體系在實際中的應用情況,而非只是利用某個指標體系進行定性分析或定量評價。
3.1 層次分析法(AHP)
層次分析法——Analytic Hierarchy Process(AHP)T.L.saaty教授于20世紀70年代末提出的一種多層次權重解析法。該方法綜合定性與定量分析方法來進行分析,用數量形式處理表達用戶的主觀判斷,從而確定系統的權重值在各指標中的比重,具有可靠性、時效性、簡明適用性等特點。AHP方法利用多目標綜合評價和網絡系統理論的方法,將決策總體進行了層次分解,包括目標、主準則、分準則等層次,根據不同的分層來聚集評價對象的多項指標信息,以從宏觀整體上來認識評價對象的好壞。這種方法大大降低了評價中的不確定因素,即簡化了評價過程中的系統分析與計算工作,又保持了決策者在思維決策和過程原則一致。該方法適用于不能全部量化處理的管理問題,是一種確定權重的科學方法。
3.2 綜合模糊評價法的概念
模糊反映在概念形成過程中外延的不分明性,指客觀事物差異的中間過渡中“不分明性”或“亦此亦彼性”。模糊綜合評價方法是綜合評價方法的一種,它利用模糊關系原理來定量化那些邊界不清、不易定量的因素,把模糊數學作為基本點。在《信息與控制》中的論文“模糊集合”(美國加利福尼亞大學,1965,扎德A.Zadeh)中提出用“隸屬函數”的概念來描述現象差異的中間過渡,由此誕生了模糊數學學科。該評價方法首先利用構造等級模糊子集的方法,量化反映被評價事物的模糊指標,再利用模糊變換的原理對各指標進行綜合整理。該方法評價結果以向量的形式給出,該向量是一個模糊子集,能夠較為準確地刻劃了事物本身的模糊狀況,提供比其它方法更詳細的評價信息。綜合評判方法具有較強的適用性,既適用于又可用于客觀指標的綜合評判又適用于主觀指標的綜合評價。通過模糊綜合評價的過程來解決的評價指標的可綜合性問題,而無需專門處理。
3.3 AHP-綜合模糊評價方法
層次分析法是系統工程中對非定量事件作定量分析的一種簡便方法,也是對人們主觀判斷做客觀描述的一種有效辦法,其基本思想是根據分析對象的性質和決策或評價的總目標,把總體現象中的各種影響因素通過劃分相互聯系的有序層次使之條理化。而模糊綜合評價法利用模糊理論在處理不確定性問題上的優越性,在數據標準化處理方面取得好的效果。該綜合評價法則既結合多種評價法的優點,又盡量避免了它們各自的缺點,從而取得了較好的效果。
本項目將把評價指標限定在自建數據庫系統建設過程中考慮,首先考慮的是自建數據庫的讀者利用率,采用AHP-模糊綜合評價模型,并結合鄭州輕工業學院自建數據庫項目的實際情況,提出自建數據庫系統建設評價指標并對其進行初步分析。解決自建數據庫評價中的評價指標的權重確定問題、評價過程中的定性問題以及模糊性現象的處理,以及其他各種因素對評價問題的影響,將定性評價與定量計算有機的結合起來。給出自建數據庫評價指標并對其進行初步分析,分析目前關于自建數據庫建設中存在的關鍵問題,并給出解決這些問題的基本策略,為自建數據庫建設項目評價體系提供一些參考性建議。鄭輕院圖書館所建的還不少數據庫的選題還停留在教師論著成果、學生學位論文、隨書光盤資源等傳統數據庫模式上,沒有充分發揮學校的學科優勢和館藏優勢。
我們以鄭輕院圖書館的5個自建數據庫為研究對象,采用主成分分析方法來分析評價自建數據庫,分別以數據庫質量、數據庫數量、界面友好程度、檢索方便程度、更新頻率、查全率、查準率、滿足程度為具體指標,對現有的建設過程中出現問題進行剖析,找出問題的解決辦法,奠定了進一步開發和利用特色自建數據庫基礎。
4.1 AHP-綜合模糊評價的數據來源
AHP-綜合模糊評價調查包括了數據庫質量,數據庫數量、界面友好程度、檢索方便程度、更新頻率、查全率、查準率、滿足程度等內容,AHP-綜合模糊評價的數據來源于隨機調查的本校教師60人,本校研究生60人,本科生300人,調查問卷共420份,其中收回395份,有效填表370份。調查對象是信息庫,學位論文庫等5個自建特色數據庫。
4.2 AHP-綜合模糊評價方法應用
4.2.1 因素論域U的確定
U={u1,u2,……,un},U:因素論域,Un:n個評價指標,該方法首先要確定評價的指標體系,解決用哪些指標Un和哪些方面去評價客觀對象。
4.2.2 評價等級論域V的確定
V={v1,v2,……,vm},V:評價等級集合、決策集,被評對象對應各評價等級隸屬程度并通過這個模糊向量表示出來,體現評價的模糊特性,不同的等級對應不同模糊子集。評價等級個數m一般在4和9之間,m大于9會增加語義區分時間和難度,很難得到對象的等級歸屬,m小于4則達不到模糊綜合評價的質量要求,所以故m的選擇應在4和9之間。
4.2.3 通過單因素方式評價因素,構建模糊關系矩陣R
模糊關系矩陣R表示影響因素與評價對象之間的“合理關系”,是因素集U和評價集V間的一種模糊關系。在模糊關系矩陣R中,第因素素rij代表某個被評事物從因素ui來看對vj等級模糊子集的隸屬度。模糊向量(ri1,ri2,…,rim)用來刻畫一個被評事物在某個因素ui方面的表現。
4.2.4 評價因素權向量確定
由于各因素的影響在總體表現的比重不同,n個評價因素對被評價事物也不是同等的重要。所以在模糊綜合評價中,首先要在合成之前要確定模糊權向量:A=(a1,a2,……,an),元素ai表示因素ui對模糊子集的隸屬度。權向量可以用∑ai=1,(ai≥0,i= 1,2,……,n)來表示。
4.2.5 模糊綜合評價結果向量合成
利用合適的算法合成模糊權向量A與各被評事物的R,并得到各被評事物的模糊綜合評價結果向量B。向量B中的bj是由A與R的第j列利用合適的算法計算得出,bj是被評事物從系統上來講對等級模子集vj的隸屬程度。
4.2.6 分析模糊綜合評價結果向量
模糊綜合評價結果組成了一個模糊向量,該向量給出了更豐富的信息,表示了被評對象對各等級模糊子集間的隸屬程度如何。假設存在多個類型相同的被評價對象,要進一步區分處模糊綜合評價的等級,那么可以利用模糊合成的結果來計算每個評價對象,得出綜合得分,然后根據該得分來比較多個評價對象的好壞。
通過AHP-綜合模糊評價分析得到5個自建數據庫,分別是:鄭州輕工業學院信息庫,鄭州輕工業學院學生推薦書全文閱讀數據庫,鄭州輕工業學院學位論文庫,鄭州輕工業學院教師著作全文閱讀和數字文庫。反映了讀者對數據庫的真實評價,在所有指標中,評價的權重如表1所示。
表1 評價指標中評價的權重
通過表1可以看出,權重結果與抽樣調查得到的整體打分評價是基本一致,因此,可以得出上述6個指標可以初步作為評價自建數據庫的整體狀態,達到很高的可信度。另外從調查表看出,總體評價得分值較低,也說明自建數據庫存在一些問題,有待進一步完善。
4.3 自建數據庫建設的思考
從前節綜述分析可以看出,許多的研究內容涉及到了自建數據庫方面,尤其是特色數據庫建設的研究方面,出現了很多研究文獻。在該項目中,在自建數據庫方面(尤其是特色數據庫建設)還存在一些問題。雖然說是特色數據庫建設,但數據庫具有特色的內容量較少,數據庫內容的深層次加工不足,特色數據庫內容分散,數據庫即時量可以滿足,但還不夠全面,低級重復內容較多,數據庫內容更新遲緩,實時性差等問題,這些都影響了自建數據庫的建設的效益,關鍵問題還可以概括為:
(1)信息資源調查分析---深入調查和分析信息資源的具體來源,統計分析數據庫信息資源的分布、數量、質量、出版商、版權狀況等詳細信息,由此得出信息資源的收集和處理實施方案。另外,數據源的收集要全面。因為數據質量從某種意義上說就是數據庫的質量,數據是數據庫的核心。因此,數據的全面收集也是數據庫建設中重要環節之一。其目標是數據庫信息資源收集的信息要完整和權威。
(2)數據庫附加值分析——要注重數據庫的附加值,注重對文獻的深加工而形成信息資源。例如,可以進一步的圖書館自建數據庫的內容數據進行進一步的組織、整理和加工,從而提高文獻在質量和數量的附加價值和應用效果,形成數量與品質上的優勢,從而提高數據庫的附加值。
(3)功能點調查分析——編制功能需求調查表,對本校師生進行調查,通過對問卷的統計分析和挖掘,結合資源建設單位的技術力量,確定信息資源組織形式和預期實現的功能。分析數據庫信息資源的具體內容,結合本高校的具體情況進行需求分析,確定系統使用群體,用戶群體可以按照所學專業、性別、年級、愛好等形式來劃分。
本文在國內外自建數據庫評價狀況調查的基礎上,分析了自建數據庫評價指標存在的問題,根據自建數據庫評價原則,確定高校圖書館自建數據庫評價的基本原則及主要評價內容及方法。項目結合鄭州輕工業學院自建數據庫現狀,基于AHP層次分析法與模糊綜合評判法,從數據庫數量、數據庫質量、檢索方便程度、界面友好程度、查全與查準率、更新頻率、滿足程度和收錄內容是否全面等進行了初步評價分析,為自建數據庫建設項目評價體系提供一些參考性建議。
由于任何評價都包含一定的主觀活動,這兩種方法雖然在模型的構建與方法的選擇應用方面,大大減少了人為因素,但也包含了專家的選擇與判斷主觀活動,所以,在評價過程專家的選擇、判斷、喜好等都不可避免的影響評價的結果,如何權衡這幾個因素之間的關系,這也是下一步的研究方向。
本文系河南省教育廳科學技術研究重點項目“基于云計算的圖書館數字參考咨詢創新服務模式研究”(編號:13A870370)以及河南省科技廳軟科學研究計劃項目“高校圖書館特色數據庫建設與共享研究”(編號:132400411150)系列成果之一。
G250
A
1003-5168(2014)04-0255-03