摘要:學位論文作為一種重要的文獻資源,歷來受到各國政府與社會各界的廣泛重視。在學位論文文獻資源開發中,主題標引是其數據加工的必要環節,也是影響數據質量的關鍵因素。本文主要對學位論文主題標引的基本規則、關鍵詞的規范處理等問題進行了探討,同時對主題標引中一些常見錯誤進行了歸納分析。
關鍵詞:學位論文;博士論文;碩士論文;主題標引;敘詞
中圖分類號:G254文獻標志碼:A 文章編號:1002-2589(2011)30-0089-03
學位論文作為一種重要的文獻資源,歷來受到各國政府與社會各界的重視。許多國家對學位論文都有一套嚴格的收藏與管理制度,[1]85-87對這一文獻資源的開發利用也正方興未艾。[2]81-85在我國,自1982年國務院學位委員會頒布《中華人民共和國學位條例暫行實施辦法》以來,國家圖書館一直認真履行全面入藏學位論文的責任,截止到2010年,已入藏博士學位論文36萬多種,碩士學位論文63余萬種;其中博士學位論文收繳率達到95%以上[3]6-9。此外,中國社會科學院文獻中心、中國科學技術信息研究所及全國各研究生培養單位,均對學位論文有不同程度的收藏與開發利用。對學位論文信息資源進行主題標引,則是對其數據加工、進而開發利用的必要環節;如何對主題標引進行規范,則是提高學位論文數據質量、充分發揮其文獻價值的重要途徑。
一、主題標引的基本規則
1.主題標引的含義
文獻標引工作,一般按使用檢索語言的類型分為分類標引和主題標引,文獻檢索用戶可以根據分類標識和主題標識,從檢索卡片、文本索引以及計算機系統的檢索提問查找所需的文獻資料。學位論文的主題標引,是指在對學位論文內容進行分析的基礎上,以一定的詞表或標引規則為依據,將學位論文中具有檢索識別意義的特征轉換成相應的主題概念,并將其組織成表達信息資源內容特征的標識(主題詞)的過程,通常包括敘詞法和關鍵詞法(自由詞)。
所謂敘詞,即正式主題詞,是指專門為文獻的標引或檢索而從自然語言中挑選出來、并加以規范處理的收入《漢語主題詞表》、《中國分類主題詞表》或其他專業詞表的詞或詞組。所謂關鍵詞,也稱自由詞,是指出現在文獻的標題(篇名、章節名)以及摘要、正文中對揭示文獻主題內容具有實質意義的詞匯,從文獻中直接抽取,一般不加規范或只作極少量的規范處理,加以標引,作為檢索的入口詞。
2.敘詞的標引與著錄
學位論文敘詞(正式主題詞)標引必須以文獻研究對象為主要依據,所選的主題詞應能直接、客觀地反映學位論文的核心內容,切忌摻雜標引人員的個人觀點,其書寫形式也必須與主題詞表中的形式一致。在選用主題詞時,要優先考慮選用最專指的主題詞,不能用上位主題詞或下位主題詞代替。如果沒有專指的主題詞,應選用直接相關的主題詞進行組配標引。如果組配仍無法滿足要求,可采用上位詞標引、靠詞(近義詞或反義詞)標引。同時,再采用關鍵詞(自由詞)標引,以增加主題標引的專指度。根據CNMARC的規定,學位論文的主題詞應填寫在6--主題分析塊的各相應字段。
3.關鍵詞的標引與著錄
關鍵詞標引有兩種形式:一是作為敘詞標引的補充,即在現有主題詞表無法滿足標引要求時,選用部分關鍵詞作為敘詞標引的補充和輔助手段,與敘詞共同揭示學位論文的內容;一是直接采用關鍵詞標引。目前國家圖書館學位論文收藏中心在進行學位論文數據加工時,即是直接采用關鍵詞標引。在關鍵詞的選用上,宜選用對揭示學位論文主題內容最專指、最通用的詞作為關鍵詞。一些泛指性的詞,應盡可能作規范處理,便于讀者檢索。根據CNMARC的規定,關鍵詞著錄在610字段。當關鍵詞多于一個時,本字段可重復[4]308-317。
例1:
2001#$a基于虛擬樣機的并聯機床若干關鍵技術的研究$f朱春霞著$g劉永賢,蔡光起指導。
6060#$a數控機床?$x機械設計$x計算機輔助設計$x機械動力學。
6100#$a并聯機床$a虛擬樣機。
此處將“并聯機床”、“虛擬樣機”兩個關鍵詞置于610字段,作為敘詞標引的補充。
例2:
2001#$a酪氨酸激酶抑制劑治療晚期非小細胞肺癌的療效預測及相關基礎研究$f、李鋇著$g陳子華指導。
6100#$a肺癌$a藥物療法$a酶抑制劑$a酪氨酸激酶。
此處將敘詞、關鍵詞均置于610字段,但關鍵詞“酪氨酸激酶”列于最后。
二、主題標引中關鍵詞的規范處理
在學位論文主題標引中,關鍵詞(自由詞)的使用是增強主題標引的專指度與深度、提高數據質量的一個重要途徑。但是,關鍵詞不能單獨使用,只能作為補充標引使用。一篇學位論文須先用正式主題詞作較泛指的組配標引、上位詞標引、靠詞標引,再用關鍵詞作較專指的標引。較泛指的正式主題詞提高了文獻的檢全率,關鍵詞在其中起著補充正式主題詞專指度不足的作用,能夠增加檢索入口,提高檢準率。同時,關鍵詞的選用,應盡可能詞形簡練、概念明確,必要時進行規范處理。
1.關鍵詞與組配標引
所謂組配標引,就是采用詞表中已有的相關泛指詞,通過概念交叉組配或概念限定組配,表達一個新的主題概念。學位論文特別是博士論文,由于研究的學科廣泛、內容專深,新學科、新主題大量涌現,在主題標引中,組配標引通常是標引這些新學科、新主題的基本方法。同時,為了增強標引的專指性,往往用關鍵詞作補充標引。
例1:
2001#$a通用可組合數字簽名模型及其關鍵問題研究$f洪璇著$g陳克非指導
6060#$a電子計算機$x密碼術$x.密碼體制$x信息安全
6100#$a數字簽名
數字簽名是近年來隨著計算機技術飛速發展而出現的新概念,就是通過某種密碼運算生成一系列符號及代碼,組成電子密碼進行簽名,來代替書寫簽名或印章。標引有關數字簽名的學位論文時,應先將主題內容組配標引為“電子計算機—密碼術”,再將“數字簽名”作為關鍵詞標引。
2.關鍵詞與上位詞標引
在學位論文主題標引中,如詞表中沒有相應的專指詞,也不能通過相應的主題詞組配,可選用最直接的上位詞標引。當詞表中有最直接的上位詞時,不得使用間接的上位詞標引。使用上位詞標引,可滿足檢全率的要求,但會增加誤檢率,因而須結合關鍵詞標引,以增加專指度。
例1:
2001#$a內質網應激-自噬反應在維生素K3誘導人宮頸癌細胞氧化應激損傷中的作用$f于春艷著$g孫連坤指導。
6060#$a子宮腫瘤$x藥物療法$x維生素K$x內質網$x生理應激。
6100#$a宮頸癌。
子宮腫瘤包含了子宮肌瘤、子宮腺瘤、子宮肉瘤、子宮頸癌、葡萄胎、絨毛膜上皮癌等多種病情,故此處在采用上位詞“子宮腫瘤”進行標引的同時,將“宮頸癌”作關鍵詞補充標引。
3.關鍵詞與靠詞標引
在學位論文主題標引中,如果既沒有專指詞可用,又不能組配標引和用直接上位詞標引,可采用靠詞標引,即選用與該主題概念關系最密切的詞(近義詞或反義詞)標引。靠詞標引應與關鍵詞標引相結合,以增加主題標引的專指度。
例1:
2001#$a自旋電子學中若干基本問題的研究$f包瑾著$g姜勇指導。
6060#$a電子學$x鐵磁體$x鐵磁材料。
6100#$a自旋電子學$a巨磁電阻$a自旋閥$a?自旋角動量轉矩。
自旋電子學(Spintronics or spin electronics),又稱磁電子學(Magneto-electronics),是一門結合磁學與微電子學的交叉學科,其研究對象包括電子的自旋極化、自旋相關散射、自旋弛豫以及與此相關的性質及其應用等[5]1488-1495。因詞表中無“自旋電子學”一詞,故采用“電子學”作靠詞標引,再將“自旋電子學”作關鍵詞標引。
4.專有名詞作為關鍵詞標引
在學位論文主題標引中,經常會遇到許多專有名詞(個人名稱、團體名稱、題名、地理名稱),正式主題詞表未予收錄,又由于受到主題詞增詞規則的限制,在采取上位詞標引、組配標引后,可將這些專有名詞作為關鍵詞標引,以增加文獻的檢準率。
(1)個人名稱
如果學位論文所研究的內容涉及某個人物,而詞表中又沒有此人的個人名稱主題詞,可先根據論文研究內容進行概括標引,同時酌情將此人的個人名稱作為關鍵詞標引,著錄于610(非控主題詞)字段。
例1:
2001#$a馮小剛電影$e社會、文本與批評$f余韜著$g王志敏指導。
6060#$a電影導演$x電影評論$x群眾文化。
6100#$a馮小剛(1958-)。
(2)團體名稱關鍵詞標引
如果學位論文所研究的內容涉及某團體,而詞表中又沒有此團體的團體名稱主題詞,可先按論文研究內容概括標引,同時酌情將此團體的團體名稱作關鍵詞標引,著錄于610(非控主題詞)字段。
例1:
2001#$a南方醫科大學學科建設的發展戰略$f胡光麗著$g周增桓指導。
6060#$a醫學教育$x高等教育$x學校管理$x學科建設$x發展戰略。
6100#$a南方醫科大學。
(3)題名關鍵詞標引
在學位論文主題標引中,如果詞表沒有所研究專著的題名主題詞,可將專著題名作為關鍵詞標引,著錄于610(非控主題詞)字段。
例1:
2001#$a《說文通訓定聲》的詞義研究$f何書著$g馬景侖指導。
6060#$a:說文解字$x漢語$x詞匯$x詞義。
6100#$a說文通訓定聲。
(4)地理名稱關鍵詞標引
在學位論文主題標引中,如有必要對非中央直轄市屬各區區名、鄉鎮名、村名,以及詞表中沒有收入的自然地理名稱、歷史地名進行標引,應將其作為關鍵詞標引,并著錄于610(非控主題詞)字段。
例1:
2001#$a郭店楚簡形聲字定量研究$f王波著$g劉志基指導
6060#$a竹簡文$x形聲字$x漢字$x楚國
6100#$a郭店
郭店位于湖北省荊門市,1993年在此發掘的一號楚墓中,共出土有字漢簡730枚。經研究,郭店楚簡的文字是典型的楚國文字。此處不以“荊門市”而改用“楚國”作為主題詞標引,系用歷史地名。
5.字母、符號、簡稱與縮寫的處理
在學位論文主題標引中,經常會遇到外文字母(如希臘字母)、數學符號、化學符號、中文簡稱、英文縮寫等,如對于揭示論文主題有較重要的意義,應將其作為關鍵詞標引,并進行規范處理,著錄于610(非控主題詞)字段。
例1:
2001#$a基于△-∑ A/D轉換器的智能溫度傳感芯片$f徐肯著$g馮勇建指導。
6060#$a溫度傳感器$x集成電路$x芯片$x模-數轉換器$x調制器。
6100#$a△-∑調制器。
△系希臘字母,音譯為“德爾塔”;∑亦系希臘字母,音譯為“西格瑪”(大寫Σ,小寫σ);兩者在數學、物理學中均作為符號使用。此處將文中“△-∑調制器”作為關鍵詞標引,以增強標引的專指度。又,“△-∑調制器”也寫作“∑-△調制器”。
例2:
2001#$a CVD/CVI制備自愈合SiC陶瓷基復合材料的反應熱力學研究$f鄧娟利著$g蘇克和指導。
6060#$a碳化硅陶瓷$x陶瓷復合材料$x化學反應$x熱力學。
6100#$a化學氣相沉積(CVD)$a化學氣相浸滲(CVI)。
此處將化學符號“SiC陶瓷”改寫成“碳化硅陶瓷”,作為主題詞標引;同時,對于英文縮寫CVD(Chemical Vapor Deposition)譯成“化學氣相沉積”,CVI(Chemical Vapor Infiltration)譯成“化學氣相浸滲”,加以標引,并將其縮寫附于中文關鍵詞之后。
例3:
2001#$a功能梯度材料相關的幾個動靜態問題分析及結構優化$f彭旭龍著$g李顯方指導。
6060#$a復合材料$x功能材料$x材料力學$x結構分析。
6100#$a功能梯度材料。
“功能梯度材料”(functionallygradedmaterials,簡稱FGM),又稱“梯度功能材料”,其概念由日本學者新野正之與平井敏雄等于1986年首先提出。現有文獻多用“功能梯度材料”一詞,故采用此詞作關鍵詞標引;此處“功能梯度材料”不宜省略為“功能材料”或“梯度材料”。
三、主題標引中的常見問題
目前學位論文主題標引中出現的問題,主要有以下幾個方面:
1.主題分析錯誤,主題詞誤標
主題標引建立在對標引文獻主題分析的基礎之上,如果對所標引的學位論文主題分析發生錯誤,那么其主題標引自然跟著出錯,從而影響文獻的檢準率。
例1:
2001#$a揚州學派研究$f馮乾著$g張宏生指導。
6100#$a清代$a樸學$a揚州學派$a焦循$a汪中。
揚州學派是指清代活躍于揚州一帶,以王懋■、王念孫、王引之、汪中、焦循、阮元等人為代表的、在徽派戴學(戴震)基礎之上發展起來一個重要學派。揚州學派的研究,屬于清代樸學范疇,因而主題標引將“樸學”標出,是正確的。然而,與“樸學”對應的正式主題詞應是“經學”和“考據學”,這里未能標出,應加以增補。
2.忽略隱性主題,造成主題詞遺漏
所謂隱性主題,就是隱藏在文獻主題之中沒有直接顯露出來的概念。在學位論文主題標引中,隱性主題較為常見;如果缺乏對所標引論文主題認真、細致的分析,未能發現隱性主題,則勢必造成主題詞的遺漏,從而影響文獻的檢全率、檢準率。
例1:
2001#$a不同形態磷對水華藍藻生長和藻類種間競爭的影響$f錢善勤著$g孔繁翔,史小麗指導。
6100#$a太湖$a湖泊污染$a藻類水華$a生存競爭$a磷。
本文的顯性主題是藍藻及藻類水華,其隱性主題則是水污染、富營養化。此處將隱性主題用“湖泊污染”、“磷”標出是正確的,若能將“水污染”、“富營養化”作為主題詞標引則更好。又,此處“生存競爭”是指藻類的生態系統而言,非本文所探討的主要內容,可以不標。
3.關鍵詞詞形不整,未作規范處理
在學位論文主題標引中,由于新學科、新主題層出不窮,因而關鍵詞標引是敘詞(正式主題詞)標引的必要補充。但是,在進行關鍵詞標引時,關鍵詞應盡可能書寫規范,以利于文獻檢索。
例1:
2001#$a話語功能性:“非典”話語與抗擊“非典”社會實踐之研究$f?田海龍著$g張邁曾指導。
6100#$a語用學$a語境特征$a非典時期$a社會實踐。
本文題名中“非典”一詞,非規范用詞;而標引者將“非典時期”作關鍵詞標引,缺乏對“非典”一詞的分析。嚴重急性呼吸道綜合征(SARS),又稱非典型性肺炎,是由冠狀病毒引起的一種呼吸系統傳染性疾病。在關鍵詞標引時,不宜未經規范處理,直接標引為“非典”或“非典時期”。
4.選用生僻詞,組詞隨意
由于學位論文所研究的學科廣泛、內容專深,因而在主題標引中,為了增加標引的專指度和深度,選用一些不常見的專業名詞作為關鍵詞標引,也是合乎情理的。但是,不能為了體現標引的深度,而故意選用那些生僻的詞作為關鍵詞標引,不利于文獻的檢全率與檢準率。
例1:
2001#$a《真誥》的養生思想初探$f李恩軍著$g宮哲兵指導。
6100#$a真誥$a偶景$a存思$a行氣。
《真誥》是道教洞玄部(《道藏》分3洞,即洞真、洞玄、洞神,各洞又分12部)經書,為南朝道士陶弘景(456-536)所著,今《道藏》收有《真誥》20卷。此處標引的關鍵詞,除“真誥”為書名外,其余“偶景”、“存思”、“行氣”均為生僻詞;而“道教”、“養生”、“陶弘景”等應標引的主題詞卻被遺漏。
5.選詞數量不規范,標引深度不恰當
在學位論文主題標引中,主題詞(包括敘詞、關鍵詞)的數量要求是3~8個。一般來說,單主題學位論文選用2~3個,多主題學位論文可多于5個,不宜超過8個[6]308-317。但是,在一些學位論文數據庫中,主題詞過少或過多的情況也時有發生。如主題詞過少,則會導致標引深度不夠;如主題詞過多,則容易出現標引過深的情況。兩者均會影響文獻的檢全率和檢準率。
例1:
2001#$a柴胡屬6種藥用植物結構與化學成分積累的比較和分泌道形態發生的研究$f周亞福著$g蔡霞指導。
6100#$a柴胡屬$a結構$a分泌道$a超微結構$a組織化學$a揮發油$a總皂苷$a總黃酮。
柴胡屬植物系傘形科多年生草本植物,《中華人民共和國藥典藥典》(2005版)收錄北柴胡和狹葉柴胡的干燥根,作為我國傳統的正品柴胡使用,按性狀不同分別習稱“北柴胡”和“南柴胡”[7]。本文對6種柴胡屬植物,即北柴胡、南柴胡、銀州柴胡、紫花大葉柴胡、小葉黑柴胡、秦嶺柴胡進行了研究。從標引的主題詞數量看,共8個,似乎并不過多;然而,除“柴胡屬”外,其余主題詞不是太泛指,就是太專指,對于文獻檢索價值不高。
以上對學位論文主題標引出現的一些主要問題進行了簡要的分析,在實際學位論文數據庫中,錯誤類型可能還有不少,錯誤的原因也各有不同,之所以舉出這些,是為了有利于數據質量的進一步提高,更好地為讀者服務。不妥之處,還請方家指正。
參考文獻:
[1]蔣宇弘.學位論文收藏現狀與保存方式[J].情報探索,2010,(6).
[2]陳淑云.美國學位論文開發利用的做法及對我國的啟示[J].圖書館建設,2008,(6).
[3]姚蓉,方怡.試論博碩士論文資源建設中的知識產權問題〔J〕.現代情報,2010,(7).
[4][6]姚蓉,方怡.學位論文編目實用指南[M].北京:北京圖書館出版社,2007.
[5]Wolf S. A., Awschalom D. D., Buhrman R. A., Daughton J. M., von Molnar S., Roukes M. L., Chtchelkanova A. Y., and Treger D. M., Spintronics: A Spin-Based Electronics Vision for the Future. Science, 2001,294,(16).
[7]國家藥典委員會編.中華人民共和國藥典:2005年版. 一部.北京:化學工業出版社,2005.