李文林++曾莉++楊斕
摘要 基于文獻資源開展知識發(fā)現服務已成為大學圖書館的發(fā)展趨勢。南京中醫(yī)藥大學圖書館作為國內較早實施基于文獻的知識發(fā)現服務實踐的機構,以Web of Science、Pubmed及中醫(yī)藥類專業(yè)文獻數據庫為信息源,結合不同文本挖掘工具自建數據挖掘平臺,面向學科開展了多項有助于啟發(fā)科研思路的知識發(fā)現服務。實踐成果表明圖書館與學科之間實現了協同發(fā)展,但在現實中也遇到了一些影響?zhàn)^員積極性的因素,尤其是知識服務專業(yè)成果的認定、館員與教師身份認同方面的差異,已成為高校圖書館推進學科化知識服務工作必須要認真面對的問題。
關鍵詞 高校圖書館 文獻資源 知識發(fā)現 案例研究
以啟發(fā)科研思路、輔助科研決策為目的的基于文獻的知識發(fā)現服務因能揭示大量公開發(fā)表的文獻中隱含的科學知識,有助于研究人員從繁重的文獻閱讀工作中解脫出來,因此正越來越受到科研工作者的青睞與認可。
與其他學科相比,生物醫(yī)學領域基于文獻的知識發(fā)現服務經過多年的探索已進入全面發(fā)展階段,國內外多種基于文獻內容的知識發(fā)現方法或工具受到領域專家的認可,尤其是一些免費的專業(yè)知識發(fā)現平臺為醫(yī)藥院校圖書館開展知識服務創(chuàng)造了條件。
南京中醫(yī)藥大學圖書館作為國內較早實施基于文獻的知識發(fā)現服務的圖書館之一,自從2008年利用非相關文獻知識發(fā)現工具Arrowsmith為校內中藥學科研究團隊提供知識服務以來,一直注重依賴專業(yè)館員隊伍對領域知識發(fā)現方法與工具的跟蹤與應用,持續(xù)為學校承擔的十五、十一五科技攻關、973項目及多個國家自然基金項目團隊開展面向問題的服務,在相關學科的研究團隊中取得了廣泛認可,有效實現了知識服務與科研團隊的協同發(fā)展。現結合案例研究,將近年來知識服務的做法、體驗及遇到的問題進行總結,以期拋磚引玉,為推動高校圖書館深層次學科化知識服務的發(fā)展提供參考。
l 基于文獻數據庫的知識發(fā)現服務
1.1 以web of Science為文獻信息源進行共詞分析服務
高校圖書館文獻利用的高峰是每年國家自然科學基金或社會科學基金項目申報的前期。這個時段,盡管許多科研工作者對文獻的檢索、分析都有自己的訣竅,但在有限的時間內逐篇閱讀密切相關文獻仍是一件耗時、費力的事情。總有一些專家希望有專業(yè)背景的館員針對其具體問題能在大量文獻中篩選出有助于啟發(fā)思路的關聯知識,供其取舍參考。我館的做法是,針對前沿性研究問題,組織人員對web of science進行文獻檢索,從相關的第一篇文獻開始,結合文獻量隨時間的變化情況理出領域問題的總體發(fā)展態(tài)勢,然后在總體趨勢圖上選取處于轉折點上的高被引及高影響因子的文獻進行深度閱讀,從這些具有里程碑式的關鍵文獻中梳理出知識聚合或分散的演進路徑,再結合共詞分析工具,對研究者關注的信息點進行深度解析。
以糖尿病腎病的中藥治療靶點篩選為例。研究者從大量中藥復方中篩選出了若干個對糖尿病腎病有防治作用的單味中藥,為進一步對這些中藥的臨床藥效進行研究,需要了解這些中藥對糖尿病腎病(Diabetic Nephropathy,DN)的可能作用機制,希望圖書館能提供研究切入點的參考信息。針對這一需求,我們首先檢索出關于糖尿病腎病藥物治療的最新文獻綜述,閱讀后發(fā)現當前治療DN的藥物主要為血管緊張素轉換酶抑制劑(Angiotensin——Converting Enzyme Inhibitors,ACEI)、抗高血壓藥(Antihypertensive Agents)、胰島素(Insulin)、降糖藥(Hypoglycemic Agents)、血管緊張素Ⅱ型受體拮抗劑(Angiotensin II Type Receptor Blockers,ARB)等,這些藥物都與糖尿病腎病已知的發(fā)病機制有關。從發(fā)文量來看,1965年就有了關于胰島素的報道,1987年出現了第一篇關于ACEI的報道,2002年出現了第一篇關于ARB的報道。從文獻的時間趨勢來看,醫(yī)學領域對胰島素的研究與報道一直處于持續(xù)上升狀態(tài),而ACEI在2005年發(fā)文量大幅下降之時,正是ARB發(fā)文量大幅增長之時,對這些文獻的進一步檢索、分析發(fā)現,為最大限度地減輕現有藥物的副作用,有少量文獻認為ARB在糖尿病腎病的已知發(fā)病機制之外,還可能通過另一條可能的信號路徑對糖尿病腎病發(fā)揮療效。順著這一提示,我們利用濟南泉方公司開發(fā)的“指紋共詞”分析平臺,對文獻中提到的與新的信號路徑相關的全部文獻進行共詞分析,從中過濾出與該信號路徑相關的全部細胞因子后,選擇其中影響因子較高的文獻提供給研究團隊,研究者結合自己的研究進行專業(yè)解析,確定以血管緊張素Ⅱ1型受體拮抗劑為主,以調整腎素血管緊張素系統(tǒng)相關的兩條信號通路的相互平衡為目的有可能成為DM治療的新理念。基于這樣的流程,不僅為研究者篩選出了高水平的研究論文,也為研究者獲取研究思路提供了參考。
1.2 以Pubmed為文獻信息源進行知識發(fā)現服務
繼美國芝加哥大學情報學家斯旺森( Swanson)教授研制非相關文獻分析工具Arrowsimth并從Pubmed數據庫中進行知識關聯發(fā)現研究以來,一大批集成有共詞分析、醫(yī)學實體關系抽取或聚類分析的生物醫(yī)學知識發(fā)現工具相繼被報道并在相關研究中予以應用。如希臘克里特大學醫(yī)學院和塞浦路斯大學生物信息研究實驗室的專家開發(fā)的BioTextQuest+文本挖掘工具,集文本聚類、共詞分析、高通量分析于一體,可以對美國國立醫(yī)學圖書館的Pubmed與Go(基因)數據庫中蘊含的疾病、基因、蛋白之間的關聯關系進行分析挖掘;德國米格爾安德拉德的計算生物學和數據挖掘研究中心研發(fā)的Alkemio文本挖掘工具,可對Pubmed數據庫中的大量疾病與藥物信息進行關聯分析;希臘塞薩洛尼基生物技術研究中心提供的MeSHy主題詞關聯關系分析挖掘工具,可對Pubmed數據中的某一類文獻的全部主題詞之間的關系進行關聯分析。加利福尼亞大學圣地亞哥分校提供的IntegromeDB[8],可對蛋白——基因——疾病——化學物質之間的多重關聯關系進行分析并予以圖形化展示,等等。利用上述工具對文獻進行分析挖掘,可為研究假說的確定提供線索與參考。我們通過對這些免費文獻挖掘工具的跟蹤,一方面將其及時推薦給校內相關科研團隊予以應用,另一方面也結合館員的專業(yè)背景進行文獻分析服務。endprint
以中藥防治術后腹腔粘連的知識發(fā)現研究為例。研究者從最新綜述開始,將基于Pubmed、Embase、Cochrane等醫(yī)學數據庫中3912篇經系統(tǒng)評價認可的有效文獻進行了詳細閱讀,歸納了大量與手術后腹腔粘連發(fā)病機制相關的多種細胞因子,試圖對腹膜損傷后粘連形成過程中多種病理環(huán)節(jié)的共同觸發(fā)因素進行推理分析,但鑒于細胞因子眾多,發(fā)現僅從文獻閱讀的角度將各種細胞因子之間的先后關系梳理清楚實在困難,于是希望圖書館館員給與幫助,以便為通過中藥進行病因干預提供試驗方向。認真分析研究者的需求后,我們結合專業(yè)背景,通過對最新文獻的閱讀,根據項目研究專家的提示,先以“術后腹腔粘連”與“腹膜間皮細胞”為檢索詞,用IntegromeDB知識發(fā)現工具檢索,在挖掘工具對文獻過濾出的162個基因、蛋白及其氨基酸序列位點中,發(fā)現有三個腫瘤壞死因子受體超家族的細胞分化抗原信息是研究者歸納的諸多信息點及我們基于系列文獻閱讀所從未關注的,結合對與挖掘平臺關聯的文獻摘要的閱讀,發(fā)現這些細胞分化抗原作為炎癥介質與炎癥反應鏈的形成有密切關聯,而炎癥反應是手術導致腹膜問皮細胞損傷后腹腔微環(huán)境的首發(fā)反應,順著這樣的關聯線索,我們又回到數據庫中,用細胞分化抗原與腹膜間皮細胞進行檢索、分析,結果發(fā)現3篇被web of science收錄的文獻與研究者尋找腹腔粘連觸發(fā)因素的問題關系密切,將這些信息提供給研究者,經其團隊成員進一步文獻分析,不僅很快確定了研究思路,且利用中藥復方于炎癥反應防治術后腹腔粘連的課題在2013年的國家自然基金申報中獲得了資助。
1.3 利用自建數據挖掘平臺進行中醫(yī)方劑配伍規(guī)律知識發(fā)現服務
以往中藥新藥的開發(fā)基本上是一種經驗開發(fā)模式,即臨床醫(yī)生利用自己的知識和經驗進行組方,并將其用于臨床進行驗證,獲得較好療效后,再進行藥理學、中藥化學等方面的研究。近年來,以英文文獻為信息源的知識發(fā)現工具的大量應用,也給越來越多的中醫(yī)藥研究者從中醫(yī)藥文獻中發(fā)現具有隱含邏輯關系的知識帶來了希望。然而由于中醫(yī)藥學是極具特色的一門傳統(tǒng)醫(yī)學學科,其高度哲學性、修辭性、個體性、主觀性的文本特征,使得現有的知識發(fā)現工具都不能完全適用,如利用SPSS的Clemen-tine工具進行中藥復方中藥物之間關聯關系的挖掘,會產生大量諸如甘草、大棗、生姜等調和藥與其他藥物關聯應用的規(guī)則,從專業(yè)角度看,這種規(guī)則是沒有意義的。因此,中醫(yī)藥領域有必要開發(fā)自己的挖掘工具。為此,我們在與南京理工大學的計算機專家進行科研項目合作的基礎上,利用關聯規(guī)則與頻繁模式方法,引入相關度、信息熵等指標,開發(fā)出針對中醫(yī)方劑信息分析的數據挖掘平臺,從大量中醫(yī)古籍及現代期刊數據庫中的中醫(yī)方藥信息中提取出有價值的模式和知識。該平臺在學校多位博碩士研究生針對周仲瑛、朱良春、干祖望等知名老中醫(yī)的經驗分析中得到認可,對學校相關學科承擔的國家十五、十一五課題及973項目研究起到了支撐作用,相關論文已發(fā)表在中醫(yī)藥類刊物上,不再一一列出。
2 開展基于文獻的知識發(fā)現服務的經驗
2.1 依托專業(yè)館員,以項目為中心形成團隊化知識服務小組
近年來,隨著人員準人資格的提升,各高校圖書館都富集了一批不同專業(yè)背景的博碩士館員隊伍。這些館員在博碩士學習階段都形成了一定的科研素養(yǎng),他們是圖書館基于專業(yè)文獻進行深層次知識服務的主要力量。南京中醫(yī)藥大學圖書館作為中醫(yī)藥類專業(yè)圖書館,同時也是全國醫(yī)藥類圖書館中最早開展科技查新工作的專業(yè)館之一,一直比較注重對中醫(yī)藥、化學、藥理毒理、醫(yī)學信息、計算機等專業(yè)背景的博碩士的引進與在職培養(yǎng)。館內當前有在職館員50名,其中具有博碩士學位的為26名,這些高學歷館員分布在科技查新、古籍與民國文獻資源開發(fā)、數字技術支持等不同崗位上。在面向學科的知識服務實踐中,館內主要是以項目需求結合專業(yè)背景對學科館員進行分組組合,每組3——5人不等,在負責科研的副館長帶領下,每組指定一名館員做組長,根據項目需求靈活開展知識服務工作。
2.2 整合不同發(fā)現工具,建立面向應用的知識發(fā)現框架
俗話說,工欲善其事,必先利其器。開發(fā)針對性的數據挖掘工具或知識服務平臺并不是圖書館員的強項,但是利用近水樓臺先得月的資源優(yōu)勢,及時跟蹤各種數據挖掘工具卻是學科館員必備的職業(yè)素養(yǎng)。我館的做法是,從事知識服務的專業(yè)館員既要了解通用型數據挖掘工具如IBM Inteligent Miner、SPSS的Clementine、SAS的Enterpise Miner等產品的特點與實用性,也要從Pubmed、Embase、Science Direcr等數據庫中通過檢測策略的RSS定制保持對生物醫(yī)學領域各種知識發(fā)現工具更新與應用的了解。一旦發(fā)現功能相對完備的免費挖掘工具,團隊成員要結合專業(yè)背景,從問題出發(fā)進行應用測試。大家結合各自的應用體驗,對應用流程、參數設置、結果解釋等進行充分討論,對綜合評價較好的工具,可調試好合適的操作流程及相關參數,以形成較成熟的知識發(fā)現實驗,當有用戶需要進行類似的知識發(fā)現時,可方便地導入這些實驗,并在這些已有的實驗上根據自己的需求作一些參數或修改。實踐證明,以這種方式指導科研人員應用或接受科研人員的委托進行問題分析,能實現常見知識發(fā)現任務的快速解決。
2.3 采用多種溝通方式,集思廣益解決問題
知識發(fā)現的主要目的之一是從數據中抽取有意義的知識,以明確科研思路與聚焦研究方向。在很多情況下,數據挖掘方法與工具的選擇固然重要,但往往花費時間和精力更多的是問題需求的分析、檢索策略或檢索范圍的確定、文獻摘要或主題詞中有效信息的過濾、挖掘結果的解析與評估等。生物醫(yī)學領域的知識發(fā)現涉及基因、蛋白、化學物質、疾病等多個信息點之間的關聯,很多知識發(fā)現工具往往集成不同的參數條件和多種挖掘算法,同一個檢索策略,選擇文獻聚類或關聯分析的參數不同,輸出結果也大不相同。為了得到一個相對滿意的結果,知識發(fā)現過程往往不是一輪就能完成,需要對實驗方案(即操作流和參數)進行反復嘗試和調整,因此熟悉信息檢索的館員、熟悉挖掘算法的館員、熟悉領域知識的館員以及項目委托的科研人員之間需要反反復復溝通。我們的做法是,需要當面溝通的直接當面溝通,否則就充分利用已經建立的中醫(yī)藥信息qq群、微信平臺,讓館員與科研工作者在項目進展中隨時溝通,項目組長負責對不同的參與者進行協調,并對各種方式的溝通結果進行收集、整理、匯總、反饋。通過這種方式,挖掘過程中每一個信息的提供者和采納者都會留下痕跡,通過集思廣益促進問題的解決。endprint
3 在知識服務工作中遇到的問題
3.1 專業(yè)成果在圖情系列職稱評審中不被認可
眾所周知,在缺乏明確獎懲機制的高校圖書館,職稱是大部分具有博碩士學位的館員追求的終極職業(yè)目標。近年來,高校圖書館一直鼓勵館員開展面向學科的深層次知識服務。一個不可否認的事實是,深入到項目團隊的知識服務必須依賴館員專業(yè)知識的支撐,而越是含金量高的知識服務,越需要以專深的專業(yè)知識墊底。當從事學科服務的館員既能長期保持對某一專業(yè)領域歷史與前沿信息的密切關注,又能利用合適的知識發(fā)現工具或方法結合專業(yè)興趣對其中的敏感信息進行關聯性分析,隨著經驗的積累,館員就很容易超越工具與方法而沉浸到專業(yè)視角對知識發(fā)現的結果游刃有余地予以解析。相應地,在側重結果解析與應用的專業(yè)領域而不是在側重方法或過程的圖情領域申報課題、發(fā)表論文就是一件順理成章的事。然而在職稱評審中,圖情界對館員深入到圖情專業(yè)領域之外的科研成果卻不予認可。以我館為例,2007年以來,我館主持或參與的與知識發(fā)現有關的廳局級及以上中醫(yī)藥類相關項目32項,發(fā)表關于中醫(yī)藥知識發(fā)現研究的相關論文48篇(其中被SCI收錄10篇),對學校十五、十一五科研項目“名老中醫(yī)臨證經驗分析挖掘研究”、國家973項目“基于十八反的中藥配伍禁忌基礎理論研究”及部分國家自然科學基金項目的研究團隊形成了有力支撐,與校內中藥藥理、中藥化學、中醫(yī)外科、中醫(yī)文獻等學科在文獻分析與應用方面形成了緊密的合作研究關系。然而遺憾的是,這些發(fā)表在中醫(yī)藥類核心期刊上的論文,在館員申請高級職稱評審時,都因為不在圖情領域中而不被認可。與從事學科化知識服務的同行的交流發(fā)現,這種情況在安徽、遼寧、山東等省份的高校圖情系列高級職稱評審中同樣存在。
3.2 圖書館缺乏長效激勵機制保護館員的積極性
目前國內高校在學科館員績效考評方面尚沒有完善的標準。由于學科服務不能像科技查新一樣有明確的時間或量化要求,因此服務的成效只能靠科研人員認可。對高校圖書館而言,由于沒有自主的薪酬分配權,鼓勵館員參與知識服務項目更多的是靠館員自我能力提升的內在驅動以及培育創(chuàng)新服務文化的柔性機制。以我館為例,館內對于參與知識服務的專業(yè)館員沒有固定的經費支持與獎勵方式,現有的激勵或促進措施也與杭州師范大學圖書館大同小異[9]:即建立不定期知識服務案例交流學習制度,高學歷館員之間結合知識服務的新方法、新理念進行集中學習研討;表現優(yōu)秀的館員可優(yōu)先獲得參加專業(yè)學術會議、到其他圖書館參觀訪問和學習的機會;館員為校內科研團隊開展知識服務獲得的勞務費或科研經費均由個人支配;館員發(fā)表在學科相關核心期刊上的學術論文由相關學科在年終予以獎勵等。在這樣的氛圍下,館員的整體知識服務水平以及對相關學科的支撐能力得到了明顯的提升,但由于知識服務的溝通環(huán)節(jié)多、專業(yè)知識尤其是外文專業(yè)知識的要求高,大部分工作要靠業(yè)余時間來完成,加上專業(yè)論文與項目在職稱評審中受到質疑,因此館員的積極性一直無法得到長效的保障。
3.3 專業(yè)館員的繼續(xù)教育培訓得不到政策支持
作為知識服務的中堅力量,專業(yè)館員對知識發(fā)現理論與技術與時俱進地予以學習與提升,是保障其服務成效的重要途徑。館員根據工作需求和職業(yè)素養(yǎng)自覺提升是一個途徑,但這種方式與經常參與交流培訓的效果肯定不同。當前高校圖書館員進行服務技能拓展學習的形勢比以往任何時候都更為強烈,然而遺憾的是,與專業(yè)教師相比,圖書館員參與跨界的高層次進修培訓的機會少之又少。以我校為例,學校每年都推出相關政策鼓勵教師參與國內外研修與培訓,甚至境外研修已成為晉升高級職稱的一個必備條件,但這些政策均明確表示不適用于教學、科研之外的其他人員。這種典型的身份歧視對圖書館員的職業(yè)發(fā)展及高水平服務工作的開展無疑是一道藩籬。endprint