張紅林,程錦祥,曹 淼,歐陽海鷹*
(1.中國水產科學研究院長江水產研究所,湖北武漢 430223; 2. 中國水產科學研究院,北京 100141)
學科體系在科學研究、高等教育、科學評價以及信息資源管理中具有重要作用。目前國內常見的學科體系有四大類別:一是主要用于類分文獻資料、編制目錄、建立數據庫和進行文獻檢索的《中國圖書館分類法》體系[1];二是作為招生和授予學位的學科、專業范圍劃分依據的《授予博士、碩士學位和培養研究生的學科、專業目錄》[2-3];三是主要用于科技統計、學科建設和產業統計的《學科分類與代碼》(GB/T 13745-2009)[4];四是各科研院所用于梳理研究內容、明確學科方向和區分人才專長的知識體系,例如中國水產科學研究院十大學科體系[5]。在水產學的科研工作中,科研人員常發現自己所做的工作無法用中圖分類號或學科代碼準確標識,也無法在本學科既定的知識體系中找到準確的定位。例如,關于魚類遺傳育種、魚類生態環境、水產品質量安全等方面的研究工作,其研究內容在《中國圖書館分類法》等體系中無法準確體現;而關于魚類生理學、行為學、漁文化等方面的研究內容在中國水產科學研究院既定的十大學科體系中也無法準確歸納。因此,在學科建設與學術評價中,始終存在建立、健全學科體系的需要。
在中國工程知識中心漁業知識分中心建設過程中,為集全、集準中文期刊論文、學位論文、會議論文3類水產學文獻數據,課題組針對中國知網(China National Knowledge Infrastructure,CNKI)和萬方數據2個文獻資源庫設計了多種檢索策略,獲取了3類資源完整的元數據集,經檢驗,檢全率與檢準率均超過90%[6]。學位論文是3類文獻資源中數量最少,但元數據信息最齊全、標引最準確的一類文獻,而且其與成果產出機構在研課題的聯系最為緊密,比較全面地反映了水產學科的主題內容和研究熱點。因此,通過對學位論文進行系統的統計分析,可以更好地了解水產學學科的知識體系結構。
在獲取完整的元數據基礎上,課題組對采集到的學位論文按中國水產科學研究院十大學科[5]進行了標引和分類,對各學科的主題概念進行了歸納,提出了十大學科的二級類目建議,豐富和完善了水產學學科體系的內容。本研究采用的圖書情報學方法,可應用于其他學科及其子學科的學科體系分析與構建。
傳統上水產學是以漁業資源、水產養殖和捕撈為研究對象的學科,在《中國圖書館分類法》[1]中將水產學劃分為水產基礎科學、水產資源、水產保護學、水產工程、水產養殖技術等8類,而將漁業經濟、漁業生態環境、水產品貯藏與加工僅作為交叉學科列入其他類。近年來,關于水產動物遺傳育種、水產品質量安全的研究已非常普遍,有些研究如休閑漁業和漁文化甚至已經超出了傳統水產學定義的范疇。唐啟升[7]認為,漁業產業方式包括捕撈、養殖、增殖、加工流通、休閑服務以及裝備制造等,產業對象為水生動物、植物及微生物,漁業應定義為對水生生物資源進行開發利用及其相關經濟和科技活動的產業。因此,本文的水產學學位論文泛指以漁業、水產品和水產生物為研究對象的各類博士論文和碩士論文。
在CNKI、萬方數據的學位論文庫中,只有中圖分類號、學科專業兩種途徑適用于對學位論文的全面檢索,但兩者都不能概括完全。在研究過程中經反復試驗,確定了在CNKI庫中以中圖分類號檢索為主、部分結合主題檢索的策略,在萬方數據庫中以學科檢索為主、部分結合專業檢索的策略。
(1)CNKI庫中的水產學學位論文檢索策略
檢全水產學學位論文的檢索策略設定如下:
(CLC=S9?-TS9?+D922.65+F307.4+F316.4+F326.4+Q17?-TQ17?+Q959.4?+TQ914.2+TS225.24+TS254?+TS295.4+U674.4?+X503.225+X714) OR (CLC=X52? AND SU=養殖) OR SU=水產+漁業+魚類+海產品
用此式檢索到2006—2015年學位論文14 500篇。
(2)萬方庫中的水產學學位論文檢索策略
檢全水產學學位論文的檢索策略設定如下:
學科:(水產、漁業)+專業:水產品加工及貯藏工程+((學科:(水體污染及其防治+海洋污染及其防治))*主題:養殖)+主題:(漁業+水產+魚類+海產品)
用此式檢索到2006—2015年學位論文20 927篇。
按2個檢索式分別下載2006—2015年元數據,合并去重,再人工結合機器篩選(主要通過專業、分類號、題名判別),剔除明顯不相關論文,得到水產學學位論文完整記錄18 091條(其中含博士論文記錄2 968條,碩士論文記錄15 123條),作為課題研究的基礎素材。研究中用于統計、分析和標引的字段主要有題名、關鍵詞、中圖分類號、學位專業、畢業時間等5個字段。
2.1.1 按中圖分類號的類目分布
作者或文獻收錄機構根據《中國圖書館分類法》標注的代碼,每個代碼都有對應的學科類目,分別將博士、碩士論文記錄按中圖分類號二級類目分類統計,得出2006—2015年水產學學位論文分布的學科類目情況,結果見圖1。
圖1列出了水產學學位論文數量排名靠前的13個學科類目,這些類目所包含的學位論文數占學位論文總數的90.2%,可被認為是水產學的重點學科或交叉學科。相比較而言,傳統學科中的水產資源、捕撈學論文占比不高,而非傳統學科水產加工工業、漁業經濟的內容相對較多,尤其是水產生物學論文占比遙遙領先。
2.1.2 按學位專業分布
來源于《授予博士、碩士學位和培養研究生的學科、專業目錄》,由作者或招生單位標注分別將博士、碩士論文記錄按學位專業分類統計,得出2006—2015年學位論文的專業分布情況,結果見圖2。
樣本數據統計顯示,水產學學位論文產出涉及400多個專業(含衍生專業),學位論文的專業分布非常廣。圖2列出了學位論文分布排名靠前的11個專業名稱,這些專業所包含的學位論文數占學位論文總數的70.3%。圖2顯示,海洋生物學、水生生物學、分子生物學這3個生物類專業與水產學密切相關,環境科學專業與水產學交叉較深。此外,產出學位論文數在100~200篇的還有獸醫學、微生物學、產業經濟學等專業。
為了對水產學學位論文所屬的學科進行準確識別,進一步研究不同學科的主題內容,課題組針對檢出論文定制了從中圖分類號轉換到中國水產科學研究院十大學科[5]的對應關系,從而進行了論文的學科屬性標引。標引規則的設定及標引論文數見表1。
通過學科標引,將全部水產學學位論文劃分到十大學科進行分析研究,以便分析和了解各學科的論文產出量及主要研究內容。表1顯示,2006—2015年,關于水產生物技術(水產生物學)、水產養殖技術、生態環境評價與保護、水產品加工等方面的論文產出量相對較多,而在漁業資源保護利用、水產遺傳育種、水產品質量安全、漁業裝備與工程技術等方面的論文產出量相對較少。
對表1中標引的論文按學科逐個統計分類號詞頻和關鍵詞詞頻,分析高頻分類號和典型高頻關鍵詞的學科屬性,并歸納其主題概念,提出二級類目建議(見表2)。
由于關鍵詞數量太多,表2不能將高頻詞一一列舉,一般只選擇了語義獨立、具有學科屬性、能直觀體現主題概念的4~6個關鍵詞。實踐上,大多數關鍵詞學科屬性不是唯一的,論文分類或標引時,還需要分析題名中的名詞組配關系。二級類目建議是本研究的重要結果,高頻詞學科屬性歸納、類目編制與命名還參考了《漁業敘詞表》(編制中)《農業大百科全書—漁業卷》(未出版)等。
表2中,在對水產生物技術類主題分析時,發現本類摻雜了較多水產動物組織學、生物化學、分子生物學的內容,而且許多論文屬基礎研究,應用目的不明確,暫時難以歸屬到其他學科。另外,還有一些關于漁業政策、管理、漁文化、休閑漁業等方面的論文實際上也不屬于漁業信息與經濟范疇。
利用所設定的二級類目對2015年2 146篇漁業相關學位論文進行人工標引,借以檢驗二級類目的完整性與準確性,結果(表2第4列)表明,2 106篇論文可以準確歸入所設類目,僅40篇論文因與漁業相關性不強難以歸納,標引成功率98.14%,說明所設二級類目具有較強的科學性和實踐意義。

表1 標引規則的設定及標引論文數Tab.1 Setting of indexing rules and number of indexing papers

表2 十大學科論文主題分析及二級類目建議Tab.2 Topic analysis of dissertations of ten disciplines and suggestions for secondary categories

·續 表·
注:表中標注“*”的類目可以考慮歸并到其他類
Note: The categories marked with "*" in the table can be considered to be merged into other classes
國內關于學科體系建設的理論探討非常之多,在農業相關領域,可見若干篇關于動物遺傳育種[8]、農業經濟[9-10]、林業經濟[11]等分支學科的研究報道,在水產學相關領域,也有幾篇關于漁藥[12]、水產品質量安全[13]、漁業經濟[14]等分支學科體系的研究報道,其研究或基于科研或基于教學需要,且局限在某個分支學科內。用文獻計量學的方法全面剖析某個學科的體系結構的研究尚未見到。從文獻分布特征看,現代水產學與生物學、環境科學、食品科學、經濟學、管理學等學科交叉融合形成了許多新的研究領域,這也就形成了新的學科體系基礎。
水產學十大學科體系是中國水產科學研究院學術委員會基于科研計劃與管理的需要提出的劃分體系,在國內水產界被廣泛接受,但每個學科應包含哪些分支學科或研究內容,雖有一般性定義但未形成嚴格的標準,實踐應用時往往發現概括不準或不全。例如,水產生物學是水產學論文產出量最高的一類,《中國圖書館分類法》僅列了一個水產基礎科學,把大量的水產生物學文獻模糊聚集在一起,未起到分門別類的作用。由于在十大學科體系中未設置水產基礎科學類,本研究在二級類目設置時,暫且考慮將水產生物的細胞學、遺傳學、生理學分別歸入生物技術、遺傳育種、養殖技術等類目,避免了模糊分類。另外,生物技術與遺傳育種常常是密不可分的,甚至已經是現代遺傳育種的主要技術手段[15],在十大學科體系中,將生物技術與遺傳育種單列,也造成許多文獻歸類的混亂,這也是需要構建二級類目并準確定義的原因之一。如果水產生物技術設置為一級類目,必須有更準確的子類目定義,并使之與水產遺傳育種嚴格區別。此外,在十大學科體系中,將關于漁業的社會科學簡列為漁業信息與經濟,該名稱在概括漁業綜論、漁業管理、休閑漁業、漁文化等內容上顯得不夠準確。在2019年編制的《農業大百科全書—漁業卷》(未出版)書目中,一級條目設置了15條,其中包括了漁業綜論、漁業捕撈、漁業經濟與管理、飼料營養等條目,但生物技術未列入一級條目,僅將水產育種生物技術列為二級條目,信息管理也只列為二級條目。
本研究構建了較為完善的水產學十大學科二級類目體系,該體系基于水產學科研活動,理論上具有更方便水產學科研工作的劃分與定位、更方便本學科文獻信息與數據信息的系統管理的作用,相對于《中國圖書館分類法》S9類的設置更有針對性。本研究關鍵詞源自學位論文,其代表性不如期刊論文關鍵詞全面,可能有一些關于生產活動的內容被忽略。因此,關于二級類目概括是否準確、類目代表性是否完整等問題,還需要在今后的實踐中不斷檢驗和改進,希望本研究的結果有助于水產學學科研究體系標準的制定。
致謝:中國水產科學研究院長江水產研究所汪登強、范玉頂、茹輝軍、岳華梅四位博士在本研究的主題分析與類目設置過程中做了大量工作,中國水產科學研究院南海水產研究所周李梅助理研究員在本文寫作中提出了很好的修改意見,特此致謝。