段 鋒 陳本超 朱珍真 陳 貞 孫 斌 張 麗 畢京峰 魏振滿
解放軍第三〇二醫院新藥臨床試驗中心,北京 100039
藥物臨床試驗中的數據管理與統計分析,是保證研究結果科學、可靠的重要環節之一。既往統計報表過程主要采取手工方式,即將統計軟件所生成的統計分析結果,應用“復制”、“粘貼”的方法導入到報表之中。由于臨床試驗往往產生海量的數據,該過程費時費力,且需要耗費大量的時間進行校對,即便如此,仍極易出現錯誤。近年來隨著臨床試驗的發展,產生了海量的試驗數據,這種簡單的統計分析方法更無法滿足數據統計的需求?;诖?,本研究組應用SAS統計分析軟件,借助SAS宏語言進行了計算機編程,實現了藥物Ⅰ期臨床試驗分類資料統計分析自動報表,全面提高了臨床試驗的統計效率,保證了統計分析結果的科學性及可靠性。
以某Ⅰ期藥物臨床試驗的部分性別、民族兩個人口學數據為例。本數據選取試驗中的兩個劑量組進行統計分析,其中1~4號為第一組,5-8號為第二組,具體信息見表1。目的為借助SAS軟件實現對試驗數據中的性別、民族資料自動生成報表(Excel報表)。見表2。

表1 某Ⅰ期藥物臨床試驗人口學數據

表2 某Ⅰ期臨床試驗人口學數據統計結果[n(%)]
統計之前,首先將“表1”導入SAS軟件,并生成名為SASUSER.SHUJV文件。其基本過程為文件→導入數據→選擇數據類型(如Excel)→NEXT→選擇表格→OK→NEXT→在Library中選擇SASUSER→給文件命名→Finish。
第一步:按劑量組拆分表格
①選擇第一組:
data Y1;/*建立表Y1*/
set sasuser.SHUJV(firstobs=1 obs=4);/*選擇表SHUJV(即表 1)中的 1~4 行 */run;
②選擇第二組:
data Y2;/*建立表 Y2*/
set sasuser.SHUJV(firstobs=5 obs=8);/*選擇表SHUJV(即表 1)中的 5~8 行 */run;
第二步:對表中的性別組成進行頻數統計
①生成第一組中試驗組的性別百分比data A11;/*建立表Y11*/set Y1;/*調用Y1表格*/if GROUP='1';/*如果 GROUP='1',即:選擇GROUP='1'的受試者數據*/
if sex=1 then m='男';else m='女';/*如果sex=1,那么令m='男',另外的m='女'*/
proc freq;/*求頻數,即:頻數統計COUNT和總頻數百分比PERCENT*/
tables m/out=B11;/*利用sexm數據建立表B11(即表 3)*/run;
結果為:

表3 第一組中試驗組性別統計結果
對所獲得的數值保留2位小數,并且定義數據輸出的表達格式
data C11;/* 建立表 C11(即表 4)*/
set B11;/*調用表B11*/
percent=round(percent,0.01);/* 定義百分數的長度,0.01是小數點后2位*/
percent11=count||'('||percent||'%)';/*定義百分數的格式*/
drop sex COUNT PERCENT;/*刪除 sex COUNT PERCENT列,只保留別定義格式的列percent11*/
在這一步驟中需要注意的是百分數的格式定義,即“count||'('||percent||'%)'”步。 兩單引號之間只引符號,“||”的作用是連接編碼與符號,這樣才會得出所期望的表達結果,即“1(25%)”。
結果為:

表4 第一組中試驗組性別定義小數點及數據格式的結果
②生成第一組中對照組的性別百分比
data A12;
set Y1;
if GROUP='2';
if sex=1 then m='男 ';else m='女 ';
proc freq;
tables m/out=B12;
run;
data C12;/*建立表 C12(即表 5)*/
set B12;
percent=round(percent,0.01);
percent12=count||'('||percent||'%)';
drop sex COUNT PERCENT;
結果為:

表5 第二組中對照組性別定義小數點及數據格式的結果
第三步:將試驗組、對照組的表格進行橫向合并
應用以上兩組程序最后統計出的劑量1、2組中的性別表格分別為:C11、C12、C21、C22, 再將 4 個表格進行橫向合并,添加統計量標簽并定義字段長度。data e1;
e='性別';/*表e1中只有性別,其目的是說明該部分內容是性別部分*/
length e$30;/*$是定義長度的意思,即30個字段*/
data f;/* 建立表 f(即表 6)*/
merge e1 C11 C12 C21 C22;/*表格進行橫向合并,e1為變量名*/
rename percent11=shi11 percent12=dui11
percent21=shi12 percent22=dui12;
e=put(e,30.);m=put(m,30.);/* 定義字段長度 */
shi1=put(shi11,30.);dui1=put(dui11,30.);/* 定義字段長度*/
shi2=put(shi12,30.);dui2=put(dui12,30.);/* 定義字段長度*/
run;
此步驟須注意的是定義字段長度和屬性,其目的是告訴 SAS 所有的 e、m、shi1、shi1、dui1、dui1 的屬性理完全一樣的,因為執行SAS的縱向合并命令時,要求縱向合并的內容不光變量名相同,其屬性也必須完全一樣。如不進行定義,那么當下面兩表格縱向合并時結果將會不能全部表達出來,出現遺漏的情況。
結果為:

表6 性別統計結果
同理,民族的統計結果應用以上兩組程序最后統計出的劑量1、2組中的性別表格分別為:D11、D12、D21、D22,4個表格進行橫向合并,添加統計量標簽并定義字段長度。由以上步驟推出,見表7。

表7 民族統計結果
步驟四:對已橫向合并后的性別、年齡表格再縱向合并
data j;/* 建立表 j(即表 8)*/
set f g;/* 調用表 f、表 g(即表 6、表 7)*/run;
結果為:

表8 人口學數據統計結果
proc export data=work.h/*輸出表格 work.h(表 h即表2)*/
outlife="C:h.xls"/*輸出的文件地址及文件名*/
dbms=excel replace;
sheet="h";
run;
在SAS程序中,所設定的變量字段過長,下輸出表格“j.xls”多不能完整地表達數據,而在Excel中被多設置出來的字段均由“空格”代替,所以使用“菜單-編輯-替換”這一操作,將“空格”全部替換掉,此法用于批量刪除空格。
使用以上操作后即得出所有數據,實現SAS統計分析分類數據的自動報表。
在我國,由于近年臨床試驗的蓬勃發展,每年有近800多種新藥進行藥物Ⅰ期臨床試驗,速度增長達40%[1],并有超過60家跨國企業開展臨床試驗,涉及人群50萬[2]。但是,由于我國藥物臨床試驗起步晚,在數據管理、質量控制、質量保證體系及計算機信息技術的應用方面與國際先進標準仍有較大的差距[3]。因此,必須通過采取嚴格過程監管、充分保護受試者權益,保證數據可靠等一系列質量提升措施,全面提高藥物臨床試驗質量[4-5]。
科學的統計分析是對試驗驗藥物進行科學評價的關鍵內容之一。目前統計分析過程多借助軟件來完成,如SAS、SPSS、STATA等,而在得到統計分析結果后,如何實現準確無誤的統計報表,將研究結果客觀、真實地展現研究者及相關評審專家面前,則是臨床試驗的核心內容。
隨著臨床試驗越來越多的開展,試驗數據的增多,應用相關軟件實現統計分析自動報表逐漸成為數據管理與統計分析的新方法和新手段。其最大的優點是,省時省力,錯誤率低,在效率上大大超過了手工操作[6];缺點是編程過程較為復雜,需要一定的編程技巧。如:戎氏借助report、data_null_過程步和宏變量自動生成了統計表格[7];鄒建東[8]和許林勇等[9]通過調用相關SAS函數,SAS語句及SAS過程編寫宏程序,實現統計分析報告自動報表;童新元等[10]通過調用SAS宏程序,構建了協方差分析的自動報表;薛鈞等[11]借助SAS宏程序實現了臨床試驗數據盲態核查等。
雖然SAS宏程序因具有程序較短、操作簡便的巨大優勢而為統計專業人士所常用,但對于非專業或初學者來說理解起來比較困難,基于此,本研究從SAS自動報表的基本原理出發,對SAS自動報表過程進行分解講述,具有淺顯易懂、逐步深入的優點,特別適合非統計學專業的臨床科研人員或初學者。
[1]楊釗,李春瀟,武志昂.關于加強臨床試驗中受試者權益保護的探討[J].中國藥師,2013,16(4):610-613.
[2]李軒,洪亮,邵蓉.完善我國藥物臨床試驗受試者管理分析[J].現代商貿工業,2013,6:140-142.
[3]彭朋,元唯安,胡薏慧,等.我國藥物臨床試驗質量管理規范實施過程中存在的問題及其對策[J].中國醫院藥學雜志,2012,32(24):2006-2007.
[4]耿琳,陳云飛,劉華.藥物臨床試驗機構在藥物臨床試驗質量保證體系中的重要作用[J].中國新藥與臨床雜志,2009,28(10):794-796.
[5]陳舒茵,梁春才,韋斌,等.談藥物臨床試驗的質量控制[J].中國醫藥導報,2011,8(31):154-156.
[6]殷紅.臨床試驗中統計分析報告自動化生成的研究與應用[D].上海:復旦大學:殷紅,2009:1.
[7]戎芬,賈彬.用SAS的兩種不同語句自動生成相同的統計表格[J].現代預防醫學,2008,35(24):2-4.
[8]鄒建東.四格表指標統計分析報表的SAS宏程序[J].中國臨床藥理學與治療學,2005,10(3):357-360.
[9]許林勇,張偉.動態血壓監測評價降壓藥物療效的谷峰比率的SAS統計自動報表[J].中國臨床藥理學與治療學,2010,15(7):798-802.
[10]童新元,張高魁,姚晨.新藥臨床試驗中協方差分析的SAS 統計報表[J].中國臨床藥理學與治療學,2004,9(8):958-960.
[11]薛鈞,鄒建東,熊寧寧.臨床研究盲態數據核查常用的SAS 宏程序[J].中國臨床藥理學與治療學,2008,13(5):535-540.