摘要:本文通過對網絡時代醫學信息檢索的特點分析調查,介紹了國內外多個搜索引擎和醫學數據庫,并總結了網絡信息檢索的發展趨勢。可見掌握正確的醫學信息檢索方法和步驟,對提高醫務工作者的具有重要的現實意義。
關鍵詞:信息檢索;數據庫;搜索引擎;網絡
Abstract:By investigating and analyzing the features of medical information retrieval in network times, this study introduces the major search engines and databases of medical science and summarizes the trend of the development of network information retrieval. It is important for the medical workers to master correct medical information retrieval methods and steps in practical.
Key words:Information retrieval;Database;Search engine;Internet
隨著計算機技術和通訊技術的飛速發展,信息檢索由手工檢索發展到了計算機檢索。計算機檢索,是指人們根據特定的信息需求,利用計算機從相關的數據庫中識別并獲取所需信息的過程。它主要經歷了四個階段:脫機檢索;聯機檢索;光盤檢索和網絡檢索。網絡檢索已經成為如今最簡便最高效的檢索方式,然而面對因特網上眾多的檢索工具及海量的醫學信息,常常使醫務工作者不知從何入手。眾多的醫學信息用戶由于不熟悉各種醫學信息檢索系統的收錄范圍,沒有針對性地選取相應的檢索工具進行檢索,同時沒有掌握必要的檢索技術,導致他們在查找信息的時候出現了事倍功半的情況。
1醫學搜索引擎簡介
由于不同通用搜索引擎的專業及檢索機制不同,使得不同搜索引擎之間的檢索會有不同的結果。現簡要介紹一些主要國外醫學搜索引擎。
1.1Medical Matrix (醫源,http://www.medmatrix.org/Index.asp) Medical Matrix 是一種由概念驅動的免費全文智能檢索工具,包括5000多個醫學網址,1994年由堪薩斯大學創建,現由美國Medical Matrix LLC主持,是目前最重要的醫學專業搜索引擎。它是一個可免費進入的網絡臨床醫學數據庫,提供了關鍵詞搜索和分類目錄搜索,最適合臨床醫師使用。分類目錄搜索是它的主要特色,按各種醫學信息分為疾病種類、臨床實踐、文獻、教育、健康和職業、醫學計算機和Internet技術、市場等八大類。大類下再根據內容的性質分為120多個小類,每個小類再根據資源的組織形式劃分為三級類目,并按此分類會記網頁和站點。
1.2Medscape(醫景,http://www.medscape.com) 美國公司Medscape公司1994年研制,1995年6月投入使用,由功能強大的通用搜索引擎AltaVista支持,可檢索圖像、聲頻、視頻資料,是Web上最大的免費提供臨床醫學全文文獻和繼續醫學教育資源(CME)的網點,可選擇Fulltext、Medline、DrugInfo、AIDSLine、Toxline、Whole、Web、News、Medical Images、Dictionary、Bookstore、等10多種數據庫進行檢索,同時還可瀏覽每日醫學新聞,免費獲取CME各種資源,免費獲取“Medpulse”。該網站可查找醫學詞典和回答用戶咨詢,提供根據疾病名稱、所屬學科和內容性質的英文按26個字母順序進行分類檢索(The Medscape Index)。
1.3Health Web(衛生網http://healthweb.org) Health Web 是由美國中西部各醫學中心的醫學信息專家管理的一個免費全文搜索引擎,始建于是1994年,是一個基于分類目錄的醫學專業搜索引擎,所提供的主題分類類目較為詳細,目的是為健康工作者和健康消費者提供各種醫學信息資源。它根據疾病所屬學科的首字母進行排列,同時提供了各種醫學專業搜索引擎如MedExporer、MedFinder、MedHunt、MedicalWorld Search和各種通用搜索引擎如AltaVista、 Excite 、HotBot 、Infoseek、 Lycos的鏈接,以及對Internet上的醫學信息進行評估的網址。Health Web提供了網絡信息資源評價方法和評選標準,確保信息的新穎、網站的有效鏈接,使提供的信息準確、質量高。關鍵詞檢索時大小寫無別,可精細檢索,檢索結果按相關性排序。
1.4CliniWeb International(國際臨床網,http://www.ohsu.edu/cliniweb) 由美國Oregon health sciences university(OHSU)1995年研制開發,這是一個基于分類目錄的臨床醫學引擎,分為解剖學、微生物學、疾病、化學和藥理學、診斷和治療技術及儀器、心理學、生物科學等七大類。可以同時用英語、法語、德語、西班牙語和葡萄牙語進行檢索,內含的Saphire Intemational 98是一個用于查找UMLS術語的搜索引擎,為從主題分類途徑檢索提供較合適的入口。還可以直接鏈接到美國國立醫學圖書館Pubmed系統的免費Medoine檢索.由于國際臨床網是一個實驗性搜索引擎,數據庫收集的臨床信息不夠完整和全面,故還提供了Medical Matrix、Yahoo Health、MedWeb的檢索連接。
2網上醫學數據庫系統
2.1 PubMed(http://www.ncbi.nlm.nih.gov/PubMed) PubMed是由美國國立醫學圖書館(NLM)生物技術信息中心(NCBI),于1997年6月26日在網上以WWW方式向用戶提供的一項免費檢索網上生物醫學文獻信息的檢索軟件。PubMed數據的主要來源于MEDLINE、PreMedline、出版商提供的書目信息和基因文庫記錄。MEDLINE是美國國立醫學圖書館MEDLARS系統中最大的生物醫學數據庫,收錄1996年至今70多個國家4500多種生物醫學期刊的書目信息和著者文摘,每周更新。PreMedline收集未正式給予出版類型等深度標引信息的一個臨時庫。NLM每天把最新記錄加入到PreMedline庫中,每條記錄均帶有[Medline Record in Process]標志。工作人員一周內將這些記錄標引,然后轉入MEDLINE,同時從PreMedline中刪去。出版商提供的書目信息是整本期刊的信息,若有部分沒有被MEDLINE收錄,PubMed仍保存,在記錄中作[Record as supplied by publisher]的標記。出版商提供的記錄若有全文,PubMed則建立了與此期刊節點的鏈接,可免費或交一定費用直接聯機獲取原文。基因文庫記錄是PubMed建立了與NCBI其他數據庫之間聯系,通過Medline記錄鏈接獲取相關的基因文庫記錄,也可以通過基因文庫記錄鏈接獲取相關的Medline記錄。
2.2美國基因數據庫——GenBank(http://www.ncbi.nlm.nih.gov/genbank/index.html) GenBank是美國國立研究院(NIH)、美國國立圖書館(NLM)、美國國家生物技術中心(NCBI)于1982年建立的核酸序列數據庫,免費提供所有公開發表的核酸和蛋白質序列及其生物學注釋和書目文獻等信息。它與日本DNA數據庫(DDBJ)、歐洲分子生物實驗室(EMBL)合作,形成國際核酸序列數據庫協作體,每天交換數據,實現數據共享。基因庫的數據來源有:從科學出版物中搜集核酸序列;科學家直接發送數據;測序中心以ESTs成批發送的數據;與其他核酸序列數據庫之間的數據交換。GenBank提供了Entrez瀏覽器(Entrez Browser),用戶可以檢索GenBank、EMBL、PIR、SWISS-PORT、PDB等數據庫的序列信息以及Medline中與序列有關的文獻信息。
3因特網上查找醫學信息的其他途徑
目前常用的中文通用搜索引擎有:①百度搜索(http://www.baidu.com)它是目前全球最優秀、更新時間最快、數據量最大的中文搜索引擎。它擁有目前世界上最大的中文信息庫,總量超過8億頁以上,并且還在以每天幾十萬頁的速度快速增長。②Google搜索(http://www.google.com)它是目前最優秀的支持多語種的搜索引擎之一,也是萬維網上最大的搜索引擎,現能搜索80多億網頁,課用多種語言進行搜索。③搜狐公司搜狗搜索(http://www.sogou.com)到目前為止,搜狗搜索收錄的中文網頁近20億,并且實現了4~5d全部網頁更新,重要網站和鏈接每日更新,大大降低了死鏈接,空鏈接。④雅虎中國(http://www.yahoo.com.cn)曾是純粹的分類列表時搜索引擎的代表。目前已經實現搜索全球38種語言網頁并抓取10億中文網頁。
通用搜索引擎提供的是包羅萬象的查詢,為了快速、準備的獲得所需的醫學信息,需要選擇適當的檢索策略。如選擇合適的關鍵詞,縮小或擴大檢索范圍等。
網絡信息的多樣性、分散和無序,影響了網絡信息的檢索質量。2001年出臺的MPEG-7國際標準解決了多媒體信息描述的標準問題,實現了快速有效的搜索。標準化是網絡信息檢索的根本性技術保證。[1]智能檢索是基于自然語言的檢索形式,它把現代人工智能的技術與方法引入信息檢索系統,機器根據用戶提供的以自然語言表述的檢索要求進行分析,而后形成檢索策略進行搜索,使信息檢索系統具有一定程度的智能特征,在更高的層次上完成其功能。[2]因此,網絡醫學信息檢索將向著規范化、智能化的方向發展。
網絡與數據庫的應用與發展,為醫學的快速發展提供了條件。在網絡時代,充分利用信息資源是實現醫學事業快速發展,提高醫療水平的關鍵因素之一。了解現存的信息獲得途徑,并掌握合適的醫學信息檢索方法,對醫務工作者具有重要意義。
參考文獻:
[1]劉宏偉.現代信息檢索在網絡環境下的發展趨勢[J].現代情報,2006,(10)
[2]畢維峰,劉劍鋒.網絡環境下數字圖書館信息檢索發展趨勢 [J].現代情報,2007,(6)
編輯/馮焱