[摘要]誘導多能干細胞是近年來干細胞研究的焦點,本文基于pubmed數據庫,通過對誘導多能干細胞的文獻檢索,利用TDA及spass軟件,對誘導多能干細胞的文獻進行年代分布、重要來源期刊、多產作者及研究熱點的統計分析,旨在探討ips的研究現狀及其發展態勢。
[關鍵詞]誘導多能干細胞;ipsCell;文獻計量;共詞;因子分析;聚類分析;多維分析
[中圖分類號]G350 [文獻標識碼]A [文章編號]1008-0821(2011)02-0070-04
近幾十年來,干細胞一直是生物醫學領域研究的熱點,自2006年日本科學家Yamanaka等人發表《Induction ofpluripotent stem cells from mouse embryonic and adult fibroblastcultures by defined factors》一文,取得了細胞重編程研究中重大的突破,成功獲得了具有胚胎干細胞特性的誘導多能干細胞(induced pluripotent stem cell,iPScell)。隨著iPScell的研究進展,進一步將干細胞研究推向了生物醫藥領域的前沿,其學術論文也快速持續增長。2008年iPS技術入選《科學》雜志年度十大科技突破,并名列榜首。iPS技術無疑是最近兩年干細胞研究所取得的最為突出的成果。
筆者利用文獻計量學的方法,即基于數學和統計學的定量分析方法,對2006年至今發表的誘導多能干細胞的文獻進行統計分析,旨在探討ips的研究現狀及其發展態勢。
1. 材料與方法
本文分析數據來源于Pubmed數據庫,檢索式:(“In-dueed Pluripotent Stem cell”OR ips cell OR iPSCs),檢索時間2006年——至今,檢索結果1301條記錄,采用湯姆森數據分析器(TDA),將獲得的文獻按發表時間、國別、來源期刊、多產作者進行統計分析,并且利用社會科學統計軟件包(spss)對其關鍵詞作共詞分析,分析其代表的學科主題的結構或變化。
2. 結果與分析
2.1 多產作者及其國家\機構分布
共有14位作者發表10篇以上的iPSCell相關文獻,他們是該領域的多產作者,也是最活躍的研究者。這些作者來自日本、美國、德國、中國4個國家和地區(圖1),共發表文獻230篇,占全部文獻的18%。其中日本3位作者都來自日本誘導多能干細胞研究應用中心(GiRA),是iPS-Cell的研究主力軍,美國在此研究領域也取得了不可小覷的成果,發文量遠超日本。中國也有兩位研究者在此領域有所研究突破。
2.2 主題詞共詞矩陣分析
對抽取的1301篇文獻的關鍵詞,按出現頻次由高至低排序,本文將頻次達到30的前76個關鍵詞作為表征當前誘導多能干細胞研究熱點的標志,并按照共詞分析統計它們在同一篇文獻中出現的次數,形成一個76×76的共詞矩陣。
在共詞分析中,以SPSS軟件作為統計分析的工具,首先,需要驗證樣本數據類型,通過驗證,相關矩陣數據不符合正態分布和均勻分布。基于此,接下來采用與數據類型相適應的多元統計分析——因子分析、聚類分析和多維尺度分析。


2.2.1 因子分析
因子分析的目標是用盡可能少的因子去描述眾多的指標或因素之間的聯系,因子分析中,需要先根據相關性將共詞矩陣轉化為相似系數矩陣,由此消除由共詞頻次差異所帶來的影響。在相似系數矩陣的基礎上,利用主成分法(Principal Components)、斜交旋轉進行因子分析。
結果顯示有4個因子(表1)被提取,其累計方差解釋貢獻率為96.254%,也就是說,將76個關鍵詞分為4個類別,就可以解釋國際iPS Cell研究領域96.254%的信息。其中,前2個因子解釋的方差比例較高,分別達到81.007%、11.339%,累計方差解釋貢獻率約為92.346%,這是國內外iPS Cell研究的兩個重要領域。
2.2.2 聚類分析
聚類分析是根據研究對象的多個變量指標,具體找出一些能夠測度這些變量指標之間相似程度的統計量,以這些統計量為劃分依據,把相似程度較高的變量聚合為一類。聚類分析中,采用系統聚類(HierarchicalCluster)方法。
聚類樹狀圖(圖2)結果顯示,總共把這76個主題類分為4大類,結合因子分析,因子提取結果產生4個公共因子,根據因子載荷系數大于0.5對命名才有幫助的原則,4個主題大類可命名為(1)體細胞重編程;(2)篩選和鑒定;(3)轉錄因子;(4)應用。


2.2.3 多維尺度分析
多維尺度分析試圖通過測定事物或觀測量之間的距離來發現數據結構,其顯示結果更加直觀和形象,同時對數據的信息要求較低。鑒于此,利用spss軟件的多維尺度分析功能(multidimensional scale,proxcal),對共詞相似性矩陣進行分析,得到可視化分布圖。
結果中對關鍵詞的特點及分布進行分析比較,可以發現76個關鍵詞大體集中在了兩個區域,多維尺度分析結果比較客觀、清晰地反映出iPSCell研究主要是沿著體細胞重編程及篩選和鑒定兩個維度發展,這一結果與因子分析和聚類分析的結果也是基本吻合的(圖3)。
3. 討論
3.1 iPS細胞成為干細胞領域的熱點研究
iPS細胞的研究論文最早發表于2006年,近三年來該領域的研究論文數量增長明顯。從各年度文獻量的分布上看,2007年開始進入極速增長期,并且在日本及歐美發達國家研究成果居多,如日本研究組的Yamanaka s和Taka-hashi K,美國哈佛大學的Hochedlinger K。
3.2 iPS細胞文獻期刊的分布相對集中
IPS細胞文獻在10種期刊中發表的文獻占了總量的30%以上,載文量居前的期刊影響因子都比較高,主要集中在nature cell等高影響因子的期刊,此類期刊都是干細胞研究文獻的重要核心期刊,刊載iPS細胞文獻的多少客觀上反映了該期刊對某一學科或領域發展的關注程度,比如其中最早刊登ips Cell一文的期刊就是《CELL》。
3.3 中國研究iPS細胞成果累累
從文獻發文,近年中國在此領域的研究成果斐然,通過高產作者文獻分析,中國出現了中科院廣州生物醫藥與健康研究院裴端卿帶領的研究小組、上海生命科學研究院生化細胞所的肖磊研究團隊。裴端清最早做出了mouse的ips,而上海生科院的肖磊最早做出了人的iPS,兩個課題組的研究成果均發表在國內的cell Research上。2009年12月24日發表在世界干細胞權威雜志《Cell Stem Cell》上一文,顯示裴端卿帶領的研究小組發現,在培養過程中添加維生素C可使iPS誘導效率提高10倍,此發現推動體細胞進入重編程狀態。
3.4 ips細胞研究的持續發展
從主題分析可以清楚了解到,iPs細胞所使用的轉錄因子正是來源于ES細胞長期研究的積淀,并且在此研究中呈現四大方面:一是體細胞重編程,包括體細胞核移植、細胞融合、體外培養和轉錄因子誘導;二是iPS細胞相關轉錄因子,即利用不同轉錄因子的排列組合來生成ips細胞;三是iPS細胞的篩選和鑒定,如篩選iPS細胞的研究工具,以及如何提高篩選的效率等;四是iPs細胞的應用,除了在大鼠小鼠上試驗成功外,目前已應用到人類,如應用人類iPS細胞成功培養出血小板等。從聚類分析圖中顯示2007年以來,對iPS細胞的研究內容更加豐富,研究主題間的交叉、融合的趨勢比較明顯,這表明iPs細胞研究的內容不斷深化,涉及到的主題更加全面,研究和關注度呈爆炸式增長。體細胞重編程、去分化和多潛能干細胞來源等一系列熱點問題成為干細胞和發育生物學等研究的熱點和焦點。
通過上述統計分析可知自iPS細胞成功發現以來,其相關文獻量不斷增加,以美國為首的歐美國家在該領域的研究較多。通過googel趨勢搜索也能印證,2007年以來,iPS Cell成為各國研究者關注和研究的熱點,本文提出的重要來源期刊、多產作者、相關研究機構、研究熱點等將對研究人員全局性了解國內外相關研究態勢有一定幫助和參考。
參考文獻
[1]張勤,等,國內知識管理研究結構探討——以共詞分析為方法[J],情報學報,2008,27(1):93-101.
[2]張曉娟,等,我國信息資源整合的研究熱點分析[J],情報學報,2009,28(5):791-800.
[3]馬贊成,等,我國數字信息資源研究的熱點領域:共詞分析透視[J],情報理論與實踐,2007,30(4):438-443.
[4]鐘偉金,等,共詞聚類分析法研究(三)——共詞聚類分析法的原理與特點[J],情報雜志,2008,(1):118-120.
[5]Miguel Angel Esteban et al,Vitamin C Enhances the Generation of Mouse and Human Induced Pluripotent Stem Cells[J].Cell Stem Cell,2010,(6):1-9.
[6]申紅芬,等,誘導性多潛能干細胞(iPS cells)——現狀及前景展望[J].生物化學與生物物理進展,2009,36(8):950-960.