摘要:本文分析了文獻主題標引存在的問題及產生的原因,最后談及把握主題標引深度所具備的條件。
關鍵詞:主題標引 標引深度
中圖分類號:G254 文獻標識碼;A 文童編號:1674-098X(2012)02(b)-0233-02
引言
主題標引作為機讀書目數據的重要檢索途徑,其標引是否準確、規范,對書目數據庫的檢索、利用和質量具有重要影響。我們在標引工作中時常發現有關主題標引不全面,對文獻所揭示的內容不夠準確以及漏標文獻的隱含主題的問題。因此,文獻標引就要把握好一個度。
所謂標引深度:簡單說是指一篇文獻所賦予的全部檢索標識的數量。在用詞準確的基礎上,標引深度就是標引文獻平均所用主題詞的數量,對文獻的查壘率和查準率是很有影響的。那么標引一篇文獻究竟用多少個主題詞才算合適呢?我國國家標準局GB/T3860-1 995《文獻敘詞標引規則》規定標引一篇文獻所用敘詞數量為“手檢系統平均標引用詞2~5個,機檢系統平均用詞4-10個”。因此,標引人員要把握好標引用詞數量:首先應視文獻具體內容而定,一般來說,文獻研究的對象和論述的問題,文獻中有參考價值和檢索意義的內容都是主題標引的具體對象;其次應考慮檢索系統功能;另外還有考慮到文獻類型、標引語言類型、服務對象等因素最終確定標引用詞數量。用詞過多或過少都會影響文獻的查全率和查準率。
文獻標引的深度是相對于淺標引和過度標引而言的,筆者在從事這項工作中發現:文獻主題中存在很多淺標引和過度標引,下面將從這兩方面示例和產生的原因一一表述。
1淺標引
淺標引是指文獻中提煉和分析出來的主題少于文獻提供的主題,沒有把符合檢索要求的所有主題提煉出來而造成漏標、漏檢,影響文獻的查壘率。也就是用詞過少導致的淺標引。其表現:
(1)只看文獻題名,不做內容分析:研究表明:80%~90%題名能準確或基本反映文獻的整體內容或主要內容,尤其是自然科學的題名與內容相符率很高。但是,這并不意味著僅憑題名就可以進行主題分析。
示例一:《歐元大崩潰:主權債務危機引發的歐洲經濟大衰退》一書,其內容是對希臘債務危機事件進行了深度分析,并沉淀了控制事件背后的幕后操作者,把歐元的生存危機真實的展現出來。如果只給出:6060#@a歐元@x研究,這樣的主題標引就犯了只看文獻題名,不做內容分析的錯誤。應把6060#@a經濟危機@x研究@y歐洲也應標引出來。
示例二:《家庭應急必備》一書,本書分家庭安全與自救、生病受傷與自救、公共場所突發事件的個人應對、自然災害的避險與自救、出行安全與自救五編介紹了家庭應急必備知識。其內容立足于應對多種突發事件和自然災害,以家庭自救為主。有的標引員只標引出:6060#@a應急@x基本知識,顯然只在文獻題名上做文章,并沒有全面揭示內容本質。應標引為:6060#@a自救互救@x基本知識;6060#@a災害防治@x基本知識。
示例三:《我的五官體驗書》包括嗅覺、味覺、視覺、聽覺、觸覺的秘密,這是一套專為低齡兒童設計的科普圖畫書。該系列通過引導孩子對人體進行細致人微的觀察,讓他們了解人們是如何依靠自己的五官來認識周圍世界的。有的編目員給出了6060#@a常識課@x學前教育@教學參考資料,這是再版編目的主題詞。顯然沒有反映出嗅覺、味覺、視覺、聽覺、觸覺的主標題內容,本書的適用范圍和讀者對象作為限定主標題也沒有反映出來。因此本文獻無論從查全率和查準率兩方面都無從檢索。正確標引形式為:6060#@嗅覺@兒童讀物:6060#@a味覺@兒童讀物等等。
(2)只做文獻整體標引,漏標局部主題:有的標引人員不管文獻內容是否復雜,只對文獻做整體標引,而不注意局部的主題揭示。
示例四:《冷云傳奇》一書,以長篇傳記小說形式講述抗日女豪杰冷云的傳奇人生。300#@a紅色少年讀本抗戰鐵血關東魂。本文獻為少兒讀物。
從掌握這些信息中了解,本文獻應標引為:6060#@a兒童文學@x傳記小說@x中國@z現代~6060#@a兒童文學@x長篇小說@x中國@z現代,6060#@a烈士@x生平事跡@j少年讀物,6060#@a女性@x生平事跡@j少年讀物,這樣讀者可以從不同角度檢索該文獻,滿足讀者檢索途徑。
示例五:《中國社會生活從書》一書,分旅游篇、科考篇、飲食篇等分冊,比如舞蹈篇應標引為:6060#@a社會生活@y中國@j叢書和6060#@a舞蹈史@y中國@j叢書,這樣才能做到完整的標引文獻。從而使文獻用戶在大量的文獻中準確、快速、全面的查到相關特定文獻,滿足讀者閱讀需求。
(3)只標引顯性主題,漏標隱性主題:顯性主題是顯而易見的主題,而隱性主題指在文獻中沒有直接加以描述,而是隱含在不同字面形式中的主題。由于隱性主題具有隱含性、相對性和模糊性等特征,往往難以分析確定,需要通過深入了解文獻的主題內容才能挖掘出來。筆者在從事這項工作中發現很多醫學類文獻都存在漏標隱性主題。
示例六:《實用臨床新藥手冊》,該書收編了近年來用于臨床的進口、國產新藥700多種,并詳細介紹了每種新藥的藥理作用,體內過程、用途、用法與劑量及不良反應和注意事項等。如只標引為:6060#@a藥物@j臨床應用,那么則漏標了其重要的隱含主題:6060#@a藥物@x副作用。我們在作書過程中發現這類文獻的標引國圖數據存在很多,應加以更新。
示例七:《職工文化體育工作與工會活動禮儀》,本書分為七章介紹了職工文化工作的基本知識、職工文化活動的組織策劃、工會應用文寫作、職工體育工作、職工體育運動競賽的組織與方法、工會日常活動禮儀、工會在節日舉辦活動的組織策劃等內容。在主題分析時,標引人員只是根據題名來標引主題,而未注意到書中所涉及的群眾體育的方面的內容。主題只給了6060#@工會工作@Y中國,比較全面的標引還應再給出6060@職工@x群眾體育@Y中國。
2過度標引
過度標引:指從文獻中分析和提煉的主題概念多于應提煉的主題概念,把文獻中有些沒有參考價值或不符合檢索系統要求的主題概念提煉出來,造成重復標引或過度標引,提煉錯誤、題文不符,容易造成誤檢,影響文獻查準率和查全率。
示例八:《明末清初達賴喇嘛系統與蒙古諸部互動關系研究》一書,本書是一本跨學科、多領域的課題,涉及歷史學、民族學、宗教學、文獻學、社會學等學科的許多知識。在做主題分析時,往往錯標為蒙古族、民族歷史、民族問題研究、西北地區、明清時代。把“民族歷史、民族問題研究”提煉出來,顯然屬于過度。而本書主要講述了達賴喇嘛與蒙古各部落的關系。正確標引為:6060#@a達賴喇嘛@x關系@x蒙古族@x部落@x研究@y西北地區@z明清時代。
示例九:《安利銷售模式》一書,作者認為安利的模式在一定程度上代表了國內營銷變革與國際接軌的趨勢,但它卻因介乎直銷與傳銷韻邊緣而備受爭議。顯然本書講述了安利公司的銷售經驗。如果標引為:60102#@a安利公司@x銷售@x經驗@y美國就屬于重復過度標引。因為“安利公司”這個主題詞已經注明是美國公司,創建于1959年。正確標引應去掉“美國”。
示例十:《走向21世紀的亞太經濟》文獻重點研究了亞太地區經澆發展潛力的趨勢,在比較研究中提到了歐共體和北美自由貿易區的一些統計數據,所以應標引為:6060#@a經濟發展@y亞太地區,若把“歐共體、北美自由貿易區”也提煉出來就屬于過度提煉,因為沒有檢索價值。
鑒于以上示例,我認為標引并非越深越好,標引深,檢索途徑多,檢索率商,但過潦,檢索誤差大,檢準率降低。那/厶產生上述兩方面原因是什么?筆者認為,原因有三:
(1)文獻主題標引工作是受標引人員技術水平、知識背景和專業素質制約。標引員對文獻內容了解不充分,不能深入分析文獻的研究對象、研究方法,習慣從文獻題名推測主題內容,習慣使用CIP數據。就拿國圖每天高額的工作量來說,同樣會使標引員犯這個錯誤。為了搶時間,趕速度完成工作定額,不注意在內容概念上分析投入,往往照抄CIP主題。
(2)把好標引審校關是至關重要的。因為標引者之間的文化水平、專業水平及知識面或多或少都存有差異,主題標引水平也會參差不齊,這就需要審校人員本著認真負責的態度把好質量關,統一標引深度。標引員也要通過自檢、互檢形式,對標引結果進行審查,以求高質量的標引結果。
(3)應根據國圖特點、文獻入藏情況,對主題標引方式、標引深度,主題分析要求等做出具體規定,以便標引人員有章可循。
3結語
筆者從事這項工作以來深深體會到主題標引就像國醫大師開處方,不經過長期的實踐積累不能輕易就給出一篇文獻的主題詞,書做的越多,考慮問題角度和內涵越廣。尤其是專業性強、跨學科、多領域的文獻要慎之又慎。因此,我認為標引一篇文獻,要掌握這個度要具備三個條件;一是文獻已具備論述了某方面具體內容-二是有一定的參考價值;三是具有檢索意義。
參考文獻
[1]孫鳳梅,曹高芳,李艷芝.主題標引在文獻檢索中的作用及提高標引質量的對策[J].圖書館論壇,2004,lO,24(5):148~149。
[2]楊潔.主題標引常見問題分析[J],科技情報開發與經濟,2005,15(21).
[3]林娜.淺析中文文獻主題標引準確性[J].重慶圖情研究,2006(3)7:43
[4]楊建,王平南,張宇清.文獻主題標引分析與解決方法[J].現代情報,2005,5(5):124~125.
[5]邱翠云.文獻主題標引適度性探析[J].管理研究:81.