王媛媛秦 剛汪徐林張 建何 書沈 毅△
?
GetData Graph Digitizer軟件在生存分析中的應用*
王媛媛1秦 剛2汪徐林1張 建1何 書1沈 毅1△
1.南通大學公共衛生學院流行病與衛生統計學教研室(226001)
2.南通市南通大學附屬第三人民醫院
在生存資料的meta分析中,個體原始資料的提取一直以來都是異常棘手卻備受關注的問題。本研究以某篇生存分析為例,介紹GetData Graph Digitizer軟件(以下簡稱GetData軟件)的基本功能及其在生存分析曲線圖中獲取數據的方法。
1.從網址http:/ / getdata-graph-digitizer.com/ download.php下載GetData軟件,安裝后雙擊圖標即可打開軟件主界面。
2.以Chen等[1]發表在BMC Cancer上的文獻中關于口腔癌患者3年生存率亞組分析的數據提取過程為例,詳細說明GetData軟件的使用步驟和數據提取過程。
1.圖像的生成與導入:先將要獲取數據的圖片利用截圖軟件截出,并保存為GetData軟件支持的格式,如JPEG、TIFF、BMC和PCX格式。本例截取文獻[2]中的figure 3B,打開GetData軟件,點擊“File->Open Image”,選擇要處理的圖像文件。
2.選定坐標:選擇軟件左上方按鈕Set the scale分別設定X最小值=0、最大值=300,Y最小值=0、最大值=1。
3.獲取數據:在“Operations”菜單下有三種提取數據的方法,本例采用“Digitize area”過程。點擊“Operations->Digitize area”啟動“Digitize area”,進一步選擇“Rectangular area”,界面中的dx值控制曲線上提取點的密度,dx值越大,所提取到的點越稀疏,本例設置為3。設置好“Rectangular area”后鼠標變為黑色箭頭,用之拖出一個矩形區域,區域內部的曲線就會被自動提取,因本例要提取36個月的生存率,故拖出的矩形區域在36附近。這種方法的好處是簡單的一次操作即可提取出所有的數據點。
4.數據的輸出與保存:按照以上步驟提取的數據在軟件右側會以表格的形式自動顯示出來,直接選擇File菜單下的“Export data”即可輸出數據,輸出格式包括TXT、XLS、DXF、EPS四種。數據保存可以選擇File菜單下的“Save Workspace”。本例中提取的兩組數據是(36,0.5467)和(36,0.7867)。
5.GetData軟件的準確性檢驗:由于meta分析中的這篇文獻沒有提供原始數據,無法對GetData軟件提取數據的準確性進行驗證,因此我們選擇了Qin等[3]發表在Medicine(Baltimore)上的文獻對GetData軟件所提取的數據與真實數據進行比較。采用Get-Data軟件提取到該文獻圖figure 2B中第一年和第二年ALSS組的生存率分別為50%和45.10%,對照組的生存率分別為37.75%和32.84%;而通過該文獻提供的原始數據計算第一、二年ALSS組生存率分別為50%、46.15%,對照組的為38.46%、33.85%,與Get-Data軟件提取的生存率數據近似程度均在95%以上,說明GetData軟件提取數據的準確性較高。
在Chen等人的meta分析實例中,由于亞組分析的文獻只提供了總生存曲線圖,沒有提及3年生存率,無法進行亞組分析。通過GetData軟件在生存曲線中提取相關數據,最終完成了口腔癌3年生存率的亞組分析。因此,GetData軟件可以提取基于時間點的數據,數據提取準確性高。
與有些研究使用過的提取生存數據的Engauge Digitizer軟件相比,GetData軟件有很多優勢。首先,提取數據的方法多種多樣,既有簡單易學的“抓點法”(point capture mode),又有一次提取多個數據的“數字化區域法”(digitize area);其次,GetData還可以設定生存曲線的顏色,如果生存曲線圖中存在多條曲線,而研究只需提取其中一條曲線的數據,則可以將其他曲線的顏色設置為底色而不受干擾,而Engauge Digitizer軟件只能識別灰度圖,彩色線條的生存曲線圖必須經過圖片處理軟件調整為黑白圖片才可以進一步提取數據;GetData軟件還可在“Settings→language”中更改界面的語言,適合不同語種人的使用,所以GetData軟件比Engauge Digitizer軟件的應用更加普遍。
總之,GetData軟件可以補充不同時點的生存數據,提取過程簡單,所得結果準確,但目前應用還不是特別廣泛,其主要原因是該軟件在國內缺乏推廣,很多人甚至都沒有聽說過這個軟件,本研究旨在為研究者提供一個簡單實用的軟件進行生存曲線中獨立患者數據(individual patient data,IPD)的提取,從而使沒有提供IPD的亞組生存資料meta分析成為可能。
參考文獻
[1]Chen J,Zhou J,Lu J,et al.Significance of CD44 expression in head and neck cancer:a systemic review and meta-analysis.BMC Cancer,2014,14(15):2-9.
[2]Kosunen A,Pirinen R,Ropponen K,et al.CD44 expression and its relationship with MMP-9,clinicopathological factors and survival in oral squamous cell carcinoma.Oral Oncol,2007,43(1):51-59.
[3]Qin G,Shao JG,Wang B,et al.Artificial liver support system improves short-and long-term outcomes of patients with HBV-associated acute-on-chronic liver failure:a single-center experience.Medicine (Baltimore),2014,93(28):e338.
(責任編輯:郭海強)
·專題研究·
*基金項目:國家自然科學基金面上項目(81370520),江蘇省自然科學基金面上項目(BK2012653);南通市科技計劃項目(MS12015004)
通信作者:△沈毅,E-mail address:sunny@ ntu.edu.cn