劉 峰 楊 斐 解 榮
(常熟理工學院圖書館,江蘇常熟 215500)
在學術期刊和學術論文中,自動標引是“連接科技傳承與創新的一個重要環節”[1]。在論文撰寫時,論文的引用標準和精確性,直接體現了作者對論文的認真程度。在期刊評價、論文影響力評價、人才評價等方面,自動化文獻標引的功能越來越突出。2009 年,科技部發布了《科研活動誠信指南》,再次強調了對學術不誠實行為的“零容忍”[2]。文章的自動標引是我國高校科研工作的一個主要內容,探討其在我國高校圖書館開展的一些不符合標準的問題,對于指導高校科研工作具有一定的指導意義。
引用是一種科學的交流手段,是一篇文章的重要內容。引語是指在自己的著作中,由別人引用的觀點或資料,是由別人的文獻所引起的,是由自己在公認的學風觀念和準則的作用下產生的一種可以考察和分析的學術交流的一種形式[3]。“自動標引程序”指的是“自動標引程序”,是指按照學術發展的規則、學術發展的需要,自動標引(引用)的各項標準和要求,是衡量自動引用(引用)的標準(指南)[4]。當前,國內的文獻自動標引規范著重于文后引用的格式,1986 年,《文后參考文獻著錄規則》(GB/T7714-1987)頒布,并于2005 版進行了修改。
擬從《情報學報》《圖書情報工作》《中國圖書館學報》《圖書館建設》等CSSCI 來源的學術期刊(《大學圖書情報學刊》《情報探索》《圖書館學研究》《科技文獻信息管理》等)與8 個非 CSSCI 來源的學術期刊,共計50余篇。通過對256 個中文引文的溯源,得到230 個完整的引文,其中26 個不能溯源到原文。以武漢大學、北京大學、南京大學為例,選擇了24 個碩士、博士生的論文作為研究對象。其中,中文學術刊物有154 個引用文獻。在這些文獻中,可以檢索到128 條中文學報引文,26 條則無法檢索到。
2.2.1 文中自動標引方式的統計
參考朱大明歸納的4 種自動標引方法,分別采用摘錄式、復述式、報道式和指示式4 種自動標引表述方式進行數據統計分析。
研究結果顯示,410 份中文學術刊物的文章,其中13%沒有回溯到原始資料,而碩士學位和博士學位占18%和15%,核心刊物不能追蹤到原始資料。抽樣中的統計數據如表1、表2 所示。

表1 引用不規范現象統計

表2 不同文獻類型的引用方式
根據表1 和表2 的數據,可以得出以下結論。在所有可追溯文獻中,報道式自動標引是作者引述文獻的主要方式,共計147 篇,占比41.06%;其次是摘錄式,共計99 篇,占比27.65%;復述式為82 篇,占比22.91%;而指示式最少,僅有30 篇,占比8.38%。在報告型自動化檢索中,學報類文獻的非標準化檢索率(4%)比碩博士文獻的非標準化檢索率(2%)要高。與期刊文章相比,碩士和博士論文的不規范程度較高。其中,期刊文章不規范比例為12.61%,而碩士和博士論文不規范比例更高,達到了21.09%。
2.2.2 文中自動標引不規范現象的統計
朱大明調查發現,文獻中自動標引不規范現象主要包括4 種情況,即“濫引”“用而不引”“過度自動標引”和“模糊轉引”。其中,“用而不引”指論文使用了他人的研究成果,但未注明出處或未進行說明,“模糊轉引”是指作者在某“中介文獻”中看到了該中介文獻自動標引的文獻,而未親自閱讀和分析就將其轉引到自己的論著中,導致自動標引失真[5]。由于這兩種情況在追溯原始文獻過程中難以核實和統計,只對兩種非正規的情況,即“濫引”與“過量的自動索引”進行分析與統計。
“濫引”有兩種表現,一種是在撰寫文章時,忽略文章題目,引用與題目毫不相干的文章,甚至引用無法查找到原文信息的文獻作為參考文獻。例如,學位論文《利用引文分析圖書館學的相關學科》引用了一篇沒有自動標引的文獻《關于情報學相關學科的定量研究》。第二種是直接將原始文獻內容直接標引,但不加引號。例如,在《圖書館實名認證微博的話語責任探析》一文中,引用了《微博傳播的十大特點及對言論生態的影響》,但是直接將135個字進行了標引,并未使用引號區分,屬于“濫引”的行為。
“過度自動標引”是指作者沒有惡意地占有或侵害別人的版權,文中標引的文獻過多,但這些文獻都符合引文著錄規律并已在文后著錄[6]。過度自動標引有兩類,一是過度自動標引內容,二是過度自動標引觀點。比如,在一項調查中,根據當前大學圖書館對外公開的情況,運用計算機自動檢索系統,共檢索到136 次《高校圖書館社會開放的困惑與思考》。另一份調查報告是關于大學圖書館所收藏的專業“核心出版社”的評價,《基于組合權重的灰色關聯理想解法及其應用》的文章將大部分題目(被引用的主要內容)都標注到自己的論文中,屬于過度的自動標引,或者是學術抄襲。
在回溯的358 份文件中,有108 份出現問題。其中52 份無法找回原始文件,另外56 份能夠找回,但是存在一些自動索引不符合標準(見表3)。

表3 不規范引用現象的統計
由表3 分析可以發現,濫引是作者在自動標引過程中出現最多的不規范現象,占所有不規范自動標引的73.21%。學術論文與學術論文在引用不當上存在著一些差異,主要表現在以下兩點。(1)缺失引號20 次,占比35.71%;由于無法找到原作而造成的重復引用21 次,占比37.5%。(2)學報與碩博士兩篇文章被引用的非正規性比率差異較大,學報與碩博兩篇文章分別為26.79%與46.43%。但在非標準化檢索中,學報與碩士研究生的非標準化檢索詞的平均詞量差異并不顯著,僅為68%與69%。
在自動標引過程中,由于過度的自動標引內容導致出錯的比例是所有不規范現象的17.86%,而出錯較少的比例是所有不規范現象的8.93%。在核心期刊中,約有75%的文章存在“追溯不到引文”和“過度自動標引”的情況。而在非核心期刊中,約有53.85%的文章存在“追溯不到原文”的情況。在碩士論文中,約有40%的文章存在“不加引號”的情況。在博士論文中,“不加引號”的情況同樣占40%,過度自動標引的情況最少。
在自動搜索時,作者通常使用較廣泛的概念表示引用的內容。一方面,采用報道式自動標引方式能夠有效地防止因大量的論文被自動標引而導致的學術不端行為;另一方面,報道型的自動標引表達具有很大的用途,不管是研究性論文、綜述還是評論性論文,都能起到很好的效果。然而,這種報道型的自動標引方式也有不足。比如,對“高度概括的語言”的界定不夠精確,且沒有相關衡量標準,很可能會給作者可乘之機。
由于缺乏對文中引用的自動標引資料的理解,致使各種類型的文章在不同的著者之間產生了大量的自動標引,以及各種類型的自動標引誤差。比如,一些作家在引用他人的文章時,只會注明引用的編號,而不會用引用描述,很可能使讀者產生誤解,誤導其他作者。發生這種現象的原因之一可能是作者對直接引用時需要標注資料來源的規定不夠了解,作者在收集資料時可能沒有及時記錄出處頁碼,并且在后續查找時也沒有找到或者已經遺忘出處頁碼[7]。這些行為均可能導致自動標引的失真,在學術研究中是不負責任的行為。此外,一些作家對引用標準的理解不足,對參考文獻的認識不足,實際使用的引用標準也沒有足夠的關注,使論文中自動引表不規范問題多次出現。
調查結果表明,自動標引不規范的現象在論文中普遍存在,尤其是在學位論文中更為嚴重,有些論文甚至出現了多處不規范的現象,出現這種情況的原因有兩方面。第一,碩博士論文審核標準不如期刊審稿標準高,可能導師只審核內容和科學性,忽略了參考文獻規范這一點。第二,學位論文答辯評委可能由于時間關系沒有仔細審讀論文,只關注論文的結構和邏輯,文中自動標引不規范的問題則被忽略,導致自動標引不規范的現象較為普遍。
作者對標引規范模糊以及缺乏足夠的關注,造成文章編著者在不科學的情況下進行自動標引。因此,應該從目前使用最為普遍的中文文獻自動標引技術入手,制定一套統一的中文文本標引標準,本規范參照國內外大多數雜志出版后的參考文獻文本自動標引規范,以我國圖情領域知名的高校和科學院為主導制定,進行試點推廣。
研究生是剛剛進入學術領域的人,對其進行監督,對促進學術標準的更新大有裨益。中國的碩士教育采用了“導師責任制”,即由導師組成的導師團隊,采取“單獨輔導”與“五至七人”的“團隊輔導”的方式。但是,我國研究生教育更注重招生考試,而忽視了后續教育,導致學生在入學后缺乏學術督促,出現學術不規范的現象。為了改變這種情況,可以學習美國的高淘汰制度,從教學內容、學術報告等多個環節對學員提出較高的標準。
在畢業論文的答辯和編輯審稿過程中,對引用的文獻進行嚴密審核。在投稿過程中,評稿人需要在投稿時,將參考文獻的全文連同投稿一起遞交,防止作者為了提高論文的質量,而對知名學者的論文進行濫引,從而造成無法追蹤到原著的問題。同時,也能促進著者對引用書目進行標準化,降低誤注的發生。與此同時,指導教師和編者應按要求嚴格對待不符合標準的文章,存在錯誤自動標注以及不標準引證等問題的文章,要及時退回。