999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

中文學術期刊數據庫檢索效果調查分析

2023-12-22 12:38:54郭碧玉范艷芬張羽
江蘇科技信息 2023年31期
關鍵詞:數據庫

郭碧玉 范艷芬 張羽

摘要:文章以中國知網、維普、萬方3個中文學術期刊數據庫為例,對三大數據庫期刊檢索平臺進行訪問并實施檢索,從檢索項和檢索結果兩方面分析,發現中文學術期刊數據庫檢索效果并不理想,提出應從完善檢索項、加深聚類層次、優化關聯推薦、用戶檢索過程控制與幫助、豐富可視化展現等方面做出改進,提升數據庫檢索效果。

關鍵詞:學術期刊;數據庫;檢索效果

中圖分類號:G250.7文獻標志碼:A0引言學術期刊具有及時性、新穎性、延續性等特點,能反映學科領域最新研究動態、研究成果和研究方向。因此,學術期刊數據庫成為國內外學者從事科學研究、進行資料查找的重要工具,而數據庫的檢索效果直接影響著科研人員的研究效率。影響數據庫檢索效果的主要因素一方面是用戶檢索策略的選擇,另一方面是數據庫系統本身的檢索性能。目前,我國對用戶檢索策略的研究較多,探究數據庫本身檢索效果的研究卻寥寥無幾。在中國知網中以“篇關摘=數據庫 AND 篇名=檢索策略”進行精確檢索,檢出結果450條,近5年內都有論文發表,但以“篇關摘=數據庫 AND 篇名=檢索效果”進行檢索,檢出結果僅有21條,且國內截至目前最新的一篇論文還停留在2014年,可見數據庫本身的檢索效果應該引起重視。

1中文學術期刊數據庫檢索效果調查與分析1.1調查對象及調查方法目前,中國知網、萬方、維普已成為三大中文學術期刊數庫,在資源收錄、數據加工、系統功能和數據質量方面具有較高水平,選取這3個數據庫為調查對象探究當前中文學術期刊數據庫檢索效果具有可行性與代表性。運用網絡調查方法,對三大數據庫的期刊檢索平臺進行訪問并實施檢索,客觀記錄數據并進行分類處理。調查時間截至2023年3月。

1.2調查現狀說明檢索項是用戶選擇檢索策略實施檢索的重要入口,檢索結果的組織則直接體現出數據庫的檢索效果,因此從檢索項、檢索結果兩方面探究中文學術期刊數據庫檢索效果。

將檢索涉及的文獻信息內容分為基本信息和輔助信息兩類:基本信息是與文獻內容直接相關的信息,包括論文信息、作者信息、期刊信息、時間信息及其他信息;輔助信息是與文獻內容間接相關的信息,包括關聯信息、特色信息、檢索歷史、結果排序。

檢索項方面,三大數據庫主要提供論文信息、作者信息、期刊信息、時間信息和其他信息五方面基本信息,如表1中標有“√”的部分所示。

檢索結果方面,三大數據庫除基本信息外,還有關聯信息、特色信息等輔助信息,基本信息見表1中標有“■”的部分,輔助信息如表2所示。

1.3調查結果分析1.3.1檢索項分析由表1可知,中國知網、萬方、維普三大數據庫的檢索項分別為28項、18項、20項,普遍設置的檢索字段有題名、關鍵詞、摘要、基金、作者、期刊和時間等,其區別如下。

論文信息:除題名、作者等基本字段外,還有題名或關鍵詞、篇關摘等組合式字段,并提供全文檢索、任意字段檢索,中國知網有小標題檢索。文獻標識方面,都提供中圖分類號檢索,知網和萬方設了DOI(Digital Object Identifier)檢索。維普和知網可進行參考文獻檢索。

作者信息:三者設置的檢索項基本相同,都重視第一作者,為了提高查準率,維普設了作者簡介字段,中國知網設了通訊作者和第一單位,沒有數據庫提供ORCID(Open Researcher and Contributor ID)檢索。

期刊信息:中國知網和萬方設置了國際標準連續出版物編號ISSN和國內統一刊號CN字段。知網和維普設置了來源期刊類別選項,如北大核心期刊、EI來源期刊、SCI來源期刊、CAS來源期刊等,并提供期刊欄目信息檢索。知網在2021年有出版者和主辦單位字段,現已撤銷。

時間信息:三者都設置了收錄/發表時間檢索項,可對被檢文獻的時間范圍進行限定。維普和中國知網設置了更新時間檢索項,可以檢索近一個月、近半年或近一年等時間段的論文更新動態。

其他信息:三者都設了檢索詞的中英文擴展、同義詞擴展或主題詞擴展,并支持基金信息檢索。中國知網和維普提供學科限定檢索。中國知網有出版信息檢索,如網絡首發、增強出版等。

1.3.2檢索結果分析結合表1與表2,三大數據庫都對檢索結果做了詳細處理。

基本信息:維普和中國知網都可對論文進行引文追蹤與可視化引文網絡,包括參考文獻、共引文獻、引證文獻等。萬方對不同機構的同名作者作了區分,中國知網可查看作者機構、關注領域、發表文獻、合作作者、指導的學生、主講視頻等信息。另外,中國知網有主要主題和次要主題區分,萬方設置了文獻出版狀態和來源數據庫。

關聯信息:都重視文獻信息的關聯推薦,設置了相關作者、相關機構、相關主題等。中國知網的相關視頻可直接跳轉到知網在線教學界面查看相關學術會議或論壇視頻。萬方的相關熱詞相對于主題詞更能夠及時反映某一領域的研究熱點。萬方提供每一篇文獻的關鍵詞、作者和機構等聚類信息,還可鏈接到萬方分析查看其可視化圖譜和相關推薦。維普在2019年未改版之前設有相關期刊,新版改為期刊導航與評價報告。

特色信息:中國知網提供檢索結果計量可視化分析,包括總體趨勢分析、關系網絡、主題及作者分布等。在每一篇文獻之后,中國知網設置了核心文獻推薦,有研究起點、研究來源、研究分支和研究去脈。萬方提供檢索語詞的智能擴展圖譜,包括同義詞、上位術語、下位術語、優選術語等,還可選擇文獻獲取范圍(僅全文、僅免費全文、僅原文傳遞、僅國外出版物)。維普提供參考文獻和引證文獻的引用分析,包括學術成果產出、主要發文人物、主要發文機構和主要學科

表2三大中文學術期刊數據庫輔助信息輔助信息中國知網萬方維普關聯信息關聯作者、相似文獻、相關基金文獻、讀者推薦、相關視頻、相關搜索相關主題、相關機構、相關學者、相關文獻、相關視頻、相關熱詞相關作者、相關機構、相關主題、相關文獻、相關期刊特色信息計量可視化分析、核心文獻推薦智能擴展、文獻獲取范圍、研究趨勢引用分析、統計分析檢索歷史檢索歷史、瀏覽歷史、下載歷史檢索歷史檢索歷史、瀏覽歷史結果排序相關度、發表時間、被引、下載、綜合相關度、出版時間、被引頻次、下載量相關度、被引量、時效性統計等。

檢索歷史:三大數據庫基本設置了檢索歷史、瀏覽歷史和下載歷史,用戶可查看具體的檢索詞列表或文獻列表。中國知網可查看檢索條件、檢索范圍和檢索時間,萬方可查看檢索列表、文獻類型、檢索式、檢索結果和檢索時間,維普可查看檢索結果和檢索表達式。三大數據庫都可對檢索歷史進行刪除操作。

結果排序:三大數據庫對檢索結果的排序主要有相關度、發表時間、被引量、下載量4種類型,中國知網設有綜合排序。這些排序代表不同的相似度算法,檢索系統每次排序都會打亂原有順序重新排列,操作簡單卻存在缺陷,如會出現有關“某雜志被數據庫和期刊檢索機構收錄”的通知類文獻等與主題內容無關的干擾項。

2中文學術期刊數據庫檢索效果存在的問題2.1檢索項缺乏,影響檢索效果對一些對于學術研究極為重要且在國際社會較為關注的文獻信息標識有所忽略,如DOI、ISSN/CN、通訊作者、ORCID等。維普在其檢索項里沒有設置DOI和ISSN/CN。近年來越來越多的期刊要求署名通信作者,而三大數據庫中只有中國知網提供通信作者檢索項。在ORCID方面,雖然萬方是ORCID系統的合作機構,但是三大數據庫都沒有提供ORCID檢索項。

2.2檢索結果聚類層次較淺,效果不突出檢索結果聚類大多是簡單的初始聚類,與檢索項多有重復,且沒有加強聚類層次及對數據的深度分析與關系揭示。如維普對于“數字圖書館”的關鍵詞檢索,結果中以“數字圖書館”為主要主題的結果多達1.8萬條。這樣的簡單歸類對用戶選擇文獻來說并沒有很大作用。檢索結果排序并沒有有效排除與文獻主題無關的干擾項,導致聚類效果不突出。此外,三大數據庫也沒有提供基于文獻內容的附加信息聚類,如圖、表格或其他材料等。

2.3關聯推薦質量參差不一關聯推薦是指“挖掘分析文獻數據資源中文獻之間、作者之間、機構之間、關鍵詞之間的關系,進行關聯文獻、相關作者或機構、相關詞語等數據資源的推薦”[1]。三大數據庫都提供關聯推薦,如相關作者、相關機構、相關主題、相關文獻等,但在推薦的項目數量及內容的數據分析層次方面存在較大差異,如相關文獻只是一系列相似文獻的簡單羅列,并沒有進一步分析它們之間深層次的共現關系。

2.4用戶可選擇的檢索項少與檢索詞的多義性干擾提供給用戶的可選擇檢索項少,且用戶無法自由選擇檢索深度與展現方式,只能被動查看系統自動給出的檢索結果。在檢索項上,用戶只能選擇要不要進行檢索詞的中英文擴展、同義詞擴展,數據庫并不提供相關詞匯列表,維普和萬方不支持用戶根據需求自主選擇一個或多個擴展詞或同義詞,致使檢出結果數量龐大,同時包含多個相似主題,檢索效果受到影響。萬方在實施檢索的檢索詞智能擴展雖然對用戶調整檢索式有一定作用,但是無法在用戶實施檢索之前起到輔助作用。

2.5檢索結果展現方式單一,可視化程度不足檢索結果的展現方式過于單調,主要是文摘、列表,屬于原始圖展現方式[2],將檢索結果簡單地羅列在顯示區域內。一些數據庫雖使用了目錄型或樹形展現方式,但只提供類目列表或二級到三級類目。同時,檢索結果可視化程度也不高,中國知網和維普可生成簡單的可視化分析圖譜,萬方的可視化分析主要在語詞方面,包括檢索詞的關系圖與主題詞的知識脈絡圖譜。

3中文學術期刊數據庫檢索效果提升策略3.1完善檢索項,與國際接軌(1)完善DOI檢索項。DOI符合數字融合和多媒體應用發展趨勢,是管理數字網絡內容識別的通用框架,對數字環境下的信息管理極為重要。重視通信作者,增加“通信作者”檢索項,與“第一作者”做出區分,更好地體現科研論文的作者分工協作關系,還可設“第一作者單位”,適應未來科研評價與學術發展要求。(2)增加ORCID檢索項。ORCID作為目前使用最廣的“科研人員全球學術身份證”,在全世界備受關注,它不僅可以區分同名研究者,確保其學術活動可以被識別,還可以追蹤該研究者在不同階段學術思想的發展與變化。(3)增加ISSN/CN等國際標準出版物編號,促進學術規范。隨著國內外開放獲取運動的發展,OA(Open Access)資源越來越受到學界關注,三大數據庫也收錄了OA期刊,可增加OA資源文獻標識,如arXiv作者ID、URL等。

3.2增加檢索結果聚類深度,豐富篩選方式科學設計檢索結果聚類體系,對數據庫中的文檔進行預處理和分類。改進聚類算法,對于二級類目以下的各類目層次,采用層次聚類算法,如基于貝葉斯和諧度的聚類算法、基于層次和密度的任意形狀聚類算法,或非層次聚類算法如高階聯合聚類算法等,由系統自動根據文獻對象的屬性特征和數據均密來確定聚類個數和聚類終止點,從而發現任意形狀的聚類。兩者結合,既保證類目設置的科學性,又根據本數據庫實際收錄的期刊范圍來增加聚類深度。豐富檢索結果的篩選方式,如增加影響因子分值來過濾論文,增加圖片、表格等附加信息模塊來直觀地查閱文章中文字以外的附加材料,設置分支學科細化學科大類等。在檢索結果排序上應確保聚類算法的優先級,在此基礎上按相關性、被引量等輔助排序方式顯示,排除干擾項。

3.3優化關聯推薦,對關聯數據進行深層次分析提供關聯推薦,實現知識重組與發現。一是提供基于內容的推薦,如相關文獻、關聯作者、相關基金、相關博文、相關媒體資源推薦(圖像、音頻、視頻等)等;二是提供基于協同過濾的推薦,如讀者推薦、相似文獻等,如圖1所示。在提供關聯推薦的基礎上,利用各種關聯數據挖掘方法,如以關聯數據挖掘模型Liddm為代表的直接挖掘法,以事務構建為代表的間接挖掘法和以啟發式關聯遍歷挖掘、深度學習為代表的鏈接挖掘法等[3],對數據的動態分布、語義聯系、范圍和規模等做出詳細描述與深層次分析,形成文檔分析報告或可視化圖譜,實現檢索系統的個性化推薦服務以及知識決策服務。

3.4加強對用戶檢索過程的控制與幫助建立全面的語料庫系統,避免檢索詞的多義性干擾,將用戶輸入的自然語言轉換成相應的規范語言(敘詞),并提供語詞列表讓用戶根據需要自主選擇檢索詞。如PubMed數據庫[4]在檢索詞方面提供了MeSH詞表詞、MeSH詞確立日期、MeSH主要主題詞、MeSH副主題詞、文本詞等供用戶選擇。EBSCO數據庫[5]為了防止漏檢和誤檢,提供專業的主題詞索引,根據用戶輸入的檢索詞自動推薦相關規范詞匯,使用戶可以優先選擇主題詞來進行檢索。提供用戶可選擇的檢索項,如信息類型、類目精確度、學科、網站、地域、資源類型、結果顯示方式等。如MDPI(Multidisciplinary Digital Publishing Institute)期刊檢索[6]設置了論文類型檢索項,作者在檢索時可選擇review、case report、commentary、concept paper、data descriptor、guidelines、study protocol、project report等多種論文類型。中國知網在檢索之前就提供包含資訊選項來區分學術研究文獻與資訊文獻。數據庫檢索系統應該建立用戶反饋機制,使用戶在檢索過程中遇到的問題能得到及時反饋與有效解決。

3.5豐富檢索結果展現內容與形式積極探索和嘗試多種可視化技術,如基于幾何的技術、基于圖標的技術、基于圖形的技術、面向像素的技術等[7],結合交互技術與扭曲技術[8],使用戶在可視化的基礎上能夠對可視化過程進行干預,對自定義的局部數據進行多樣性操作。在內容展現方面提供宏觀分析與微觀分析可視化,如圖2所示。宏觀分析應提供對檢索結果的總體分析,包括某主題研究趨勢圖、資源類型分布、學科分布、作者及機構分布、基金分布等;微觀分析應以某篇文獻為對象進行分析,如該文章的引文網絡、作者合作關系、關鍵詞共現等。通過各種方法對文獻進行整合與分析,生成可視化文件,并在保護知識產權的前提下支持下載與利用。

4結語數據庫檢索水平的高低會直接影響科研人員研究的進展與效率。隨著人工智能、云計算、大數據等信息技術的發展,特別是 ChatGPT的出現,一定程度上沖擊了以往搜索引擎式的檢索與數據庫檢索,引起了新一輪信息檢索與服務方式的變革與轉型。應加大對中文學術期刊數據庫檢索效果的理論與實踐研究,逐步升級現有數據庫檢索系統,優化檢索性能,促進知識重組和知識發現,滿足用戶對深層次復雜信息的需求,從而提高信息檢索效率和資源利用效率,帶給用戶更好的檢索體驗。

參考文獻

[1]吉雍慧.數字圖書館中的檢索結果聚類和關聯推薦研究[J].現代圖書情報技術,2008(2):69-75.

[2]鄭海燕.關系數據庫對象級別檢索結果的聚類展現方法研究[D].大連:大連海事大學,2013.

[3]崔家旺,李春旺.基于關聯數據的知識發現技術述評[J].圖書與情報,2016(5):119-125.

[4]NCBI.PubMed[DB/OL].[2023-02-09].https://www.ncbi.nlm.nih.gov/pubmed/advanced.html.

[5]EBSCOhost.ASP&BSP[DB/OL].[2023-02-09].http://search.ebscohost.com/.

[6]MDPI.Advanced search[DB/OL].[2023-03-01].https://www.mdpi.com/.

[7]吳靜.基于站點地圖的可視化研究及交互設計應用[D].長沙:湖南大學,2012.

[8]任永功,于戈.數據可視化技術的研究與進展[J].計算機科學,2004(12):92-96.

(編輯李春燕編輯)

Investigation and analysis of retrieval effect of Chinese academic journal databaseGuo? Biyu Fan? YanfenZhang? Yu

(1.Library, Sichuan Institute of Arts and Science, Dazhou 635002, China;

2.Library, Liaoning University, Shenyang 110036, China)Abstract:? The article takes three Chinese academic journal databases, namely CNKI, VIP, and Wanfang, as examples to access and implement searches on the three major database journal retrieval platforms. From the perspectives of search items and search results, it is found that the retrieval effect of Chinese academic journal databases is not ideal. It is proposed to improve search items, deepen clustering levels, optimize association recommendations, control and assist users in the retrieval process, improve the visual presentation and other aspects to enhance the effectiveness of database retrieval.

Key words: academic journal; database; retrieval effect

猜你喜歡
數據庫
數據庫
財經(2017年15期)2017-07-03 22:40:49
數據庫
財經(2017年2期)2017-03-10 14:35:35
兩種新的非確定數據庫上的Top-K查詢
數據庫
財經(2016年15期)2016-06-03 07:38:02
數據庫
財經(2016年3期)2016-03-07 07:44:46
數據庫
財經(2016年6期)2016-02-24 07:41:51
數據庫
財經(2015年3期)2015-06-09 17:41:31
數據庫
財經(2014年21期)2014-08-18 01:50:18
數據庫
財經(2014年6期)2014-03-12 08:28:19
數據庫
財經(2013年6期)2013-04-29 17:59:30
主站蜘蛛池模板: 精品无码国产自产野外拍在线| 成人欧美在线观看| 天天摸夜夜操| 秘书高跟黑色丝袜国产91在线| 99久久人妻精品免费二区| 久久久精品久久久久三级| 欧美天天干| 毛片最新网址| 九九九精品视频| 亚洲无码免费黄色网址| 日本欧美一二三区色视频| 精品国产免费观看| 99无码中文字幕视频| 四虎永久免费网站| 欧美一区福利| 男人天堂伊人网| 99精品在线看| 亚洲成a人片7777| 欧美亚洲欧美| 国内精品久久人妻无码大片高| 四虎影视国产精品| 国产在线一区二区视频| 亚洲人成电影在线播放| 91综合色区亚洲熟妇p| 日韩福利在线观看| 精品国产香蕉在线播出| 特级精品毛片免费观看| 国产精品毛片一区| 亚洲中文精品人人永久免费| 欧美在线中文字幕| 精品福利视频网| 91无码视频在线观看| 亚洲无码精彩视频在线观看| 久精品色妇丰满人妻| 在线欧美a| 亚洲国产综合第一精品小说| 亚洲综合中文字幕国产精品欧美| 国产第八页| 国产全黄a一级毛片| 久久久久青草线综合超碰| AV无码无在线观看免费| 欧美成人影院亚洲综合图| 成人一区专区在线观看| 2021国产在线视频| 亚洲欧美人成电影在线观看| 欧美一级爱操视频| 亚洲中文字幕av无码区| 久操中文在线| 99热最新网址| 久久综合五月| 国产视频自拍一区| 亚洲成人精品| 国产日韩久久久久无码精品| 波多野结衣亚洲一区| 国产九九精品视频| 欧美午夜视频在线| 亚洲精品国产首次亮相| 国产高清免费午夜在线视频| 精品伊人久久久香线蕉| 97无码免费人妻超级碰碰碰| 久爱午夜精品免费视频| 亚洲午夜福利在线| 欧美www在线观看| 国产伦精品一区二区三区视频优播 | 亚洲VA中文字幕| 国产chinese男男gay视频网| 久久网综合| 国产福利小视频在线播放观看| 亚洲另类国产欧美一区二区| 夜夜高潮夜夜爽国产伦精品| 国产无码精品在线播放| 欧美成人影院亚洲综合图| 自拍欧美亚洲| 在线免费观看a视频| 欧美精品1区2区| 亚洲男人的天堂久久香蕉网| 国产精品刺激对白在线| 国产经典在线观看一区| a级毛片免费看| 日本欧美一二三区色视频| 欧美一区二区啪啪| 国产真实自在自线免费精品|