999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

一種可簡化臨床試驗數據分析的SAS數據結構轉換方法*

2016-06-24 02:48:28東南大學公共衛生學院流行病與衛生統計學系210009承曉華王詩遠
中國衛生統計 2016年2期
關鍵詞:程序

東南大學公共衛生學院流行病與衛生統計學系(210009) 承曉華 王詩遠 劉 沛

?

一種可簡化臨床試驗數據分析的SAS數據結構轉換方法*

東南大學公共衛生學院流行病與衛生統計學系(210009) 承曉華 王詩遠 劉 沛△

數據管理標準臨床數據交換標準協會(the clinical data interchange standards consortium,CDISC)建立了一系列標準來規范藥物臨床試驗中的數據結構和分庫方式以支持數據采集、交換、遞交和儲存臨床試驗數據[1]。數據結構的標準化是臨床試驗數據管理的規范化和自動化的前提,在CDISC標準的支持下根據臨床試驗數據采集特點進行規范化的數據管理為大勢所趨。現今臨床試驗原始數據收集過程中,為方便病例報告表(case report form,CRF)的錄入常常將同一受試者的各種觀察結果,如基本信息、各階段訪視信息、實驗室檢查數據、不良反應和合并用藥等列于同一行中,得到同一條記錄內具有多個觀察指標(變量)的數據結構。這種結構因其與CRF的順序一致而具有錄入速度快和符合人們閱讀習慣,方便研究者觀察等諸多優點,但給不良事件、合并用藥以及不同時間段實驗室數據的SAS編程造成了較大困難。基于原數據結構編寫分析程序需要將涉及到的變量全部寫入程序中,過程繁復易出錯。目前對此問題的解決方法常常是采用數據結構轉換,將這種橫向結構的數據轉換為縱向結構,本文基于此提出一種可簡化臨床試驗數據分析的SAS數據結構轉換方法,可大大簡化臨床試驗數據集預處理過程,并為后續的統計分析提供方便。

方法介紹

從實現數據結構轉換、盡可能減少人工操作成分和擴大程序通用性角度出發,利用SAS宏的字符運算功能,實現僅修改個別宏參數達到不同域的原始橫向數據向縱向數據結構的轉換。編程的基本思想為:通過對規則化命名的變量識別,從原始數據集提取所需變量信息并處理成各功能列表,將其應用于列表處理和數組提取。具體編程的各個步驟思路介紹如下。

1.定義宏參數,這些宏參數是本程序應用過程中唯一需要手工添加的部分。主要包含原始數據集、提取的變量和輸出數據集等。各個宏參數的名稱和含義見表1。

表1 程序中使用的宏參數

2.有效性驗證,驗證數據集參數是否合法,是否存在對應數據集,操作變量是否存在于數據集中,外部路徑是否有效,并獲取變量信息。提取原始數據集每個變量的變量名,標簽,長度和格式等信息并將其保存到新的數據集中。篩查非數據集變量并剔除。

3.通過Scan函數[2]提取原始數據集中前綴符合Targetlist的全部變量,并通過截取尾墜相同的變量組,循環賦值獲得儲存目標變量的宏變量。在此步驟中讀取目標變量的順序即為Targetlist中宏參數的順序,因此最后輸出的數據集中的變量順序可以按照要求和目的不同而改動,且不用考慮變量的具體屬性。

4.通過SAS Proc SQL過程[3-4]提取變量的類型(Type)、標簽(Label)、縱向維數,以及日期變量,并將各個變量名儲存至列表型宏變量中。這一步是后續實現自動化的關鍵,提取出的變量屬性用于之后變量的分類和定義,正是因為這一步使得定義宏參數時可以不再需要對數據進行預處理以分別列出字符型和數值型兩個組。

5.定義AddValueList,添加原始數據集中未包含的行信息。

6.對整理好的變量按順序分別整理至字符型和數值型兩個數組,并保留變量原本的屬性,使用Compbl函數[2]將之前步驟中多余的空格去除。

7.最后將之前制作好的數組和變量組合起來完成行×列的對應賦值,形成縱向結構的新數據集,見表2。表2程序先判斷是否存在字符型變量,若存在則進行排列,數值型變量同理。然后再將原始數據集中的值賦值進去,并使用自定義標簽變量Tag判斷每條記錄是否為空,見程序第16行,以此輸出到兩個不同的數據集,分別為包含記錄的數據集和不包含記錄的數據集,方便之后的統計分析。

表2 數據結構轉換數組讀取宏程序

應用實例

以某乙肝疫苗合并用藥數據結構變換為例,說明程序應用結果,原始數據集結構如表3。

為了直觀展示宏程序功能,表3省略了一些中間變量,僅保留NA(藥物名稱)、FO(藥物劑量)和RO(給藥途徑)的前三條信息。由表3可知,原數據結構將每個受試者合并用藥的信息列于不同的列中,形成眾多變量,這使得后續合并用藥率等的統計分析編程較為復雜。執行如下程序:

%TableFormTransform(DataIn =CRF,TargetList =%bquote(CM1NA,CM1FO,CM1RO),DataOut =CM,DataBlank =CM_Blank,Keeplist =,AddValueList=)

這里原始數據集為CRF,目標變量為字符型的CM1NA,和數值型的CM1FO和CM1RO,輸出的轉換后包含記錄的數據集為合并用藥數據集(concomitant medications,CM),不包含記錄的為CM_Blank,并保留原始數據集中記錄編號。這里這個數據集要做的是合并用藥的內容,因而AddValueList沒有需要拼接的癥狀名稱,所以為空。運行程序后則得到轉換后的數據集CM,如表4。

比較表4和表3的數據結構可知,本文給出的方法將位于不同列中的同屬性變量轉化為位于同列的一個變量,同時結構轉換后的數據集中變量的排列順序即為TargetList中目標變量的順序,這為后續合并用藥率等統計分析提供了方便。

表3 某乙肝疫苗合并用藥原始數據結構

討 論

將同一受試者的不同觀察指標(多個變量)作為一條記錄列于同一行上的橫向數據結構廣泛存在于臨床試驗的數據庫中。誠然,這種數據結構有利于數據管理者的數據錄入、數據核查和研究者對數據的認識和觀察。但必須指出的是,這種“通用”的“標準”數據結構常常給后續的統計分析帶來困難。使用這種數據結構進行統計分析,編寫的程序在不同的臨床試驗中很難重復利用。縱向數據結構在統計分析時具有很高的效率,有著工作量小、能減少多變量編程過程中可能引起的失誤,并且有著程序更普遍適用性等優點。在CDSIC標準中,研究數據表格模型(study data tabulation model,STDM)提交的數據格式也為縱向數據;分析數據庫模型(analysis data model,ADam)模塊中基本數據結構(basic data structure,DBS),每例受試者不同時點、不同分析指標有一條或多條記錄,支持參數和非參數分析,這里的數據同樣也是縱向數據格式。藥物臨床試驗中的數據管理方法多樣,實現數據結構轉換,通常有兩種思路,一是通過循環運算,二是通過數組排列。這個過程往往需要對變量進行一個個判斷,將其歸類或者重新定義屬性,若處理多個數據集,則需要較長時間,且易發生錯誤。因而,尋找一種高效方法對原始橫向數據結構進行轉換具有實際意義。

本文所介紹的方法通過識別變量屬于字符型還是數值型后,直接將其原本的屬性即標簽、格式、長度,通過SQL過程繼承下來,一步到位,不需要人為地對其進行定義和選取。通常在數據結構變換過程中,對字符型數據和數值型數據需要分別列出兩個數組,而本文介紹的程序通過創建宏變量進行預處理識別變量的類型并將其歸入數值型和字符型兩個列表(List)中,為之后提出變量組成數組做預處理。最后得到的輸出數據集縱標目的順序即為調用宏語句“TargetList =% Bquote(Parameter1,Parameter2…)”中宏參數的排列順序,在應用時可以隨意調換參數位置并且不考慮這些變量是屬于數值還是字符型,為批量處理提供方便。

表4 某乙肝疫苗合并用藥變換后的數據結構

臨床試驗中數據采集、數據管理的規范化對保證臨床試驗質量十分重要,而目前國內在這些方面和國外相比尚有較大差距。CDSIC標準給臨床試驗數據標準化提供了基礎。本文以數據管理自動化為目標,編寫可以廣泛應用于CDISC標準化命名變量的宏程序,實現數據結構轉換的規范化。需要注意的是,在實際工作中若臨床試驗電子CRF數據設計的變量名不規范,則可采用本課題組先前提出的《流行病學調查報告數據標準化入口的SAS實現》[5]進行變量命名的標準化,再配合本文方法,即可實現能廣泛應用于臨床試驗和/或流行病學現場調查的數據結構轉換。

參考文獻

[1]Team,C.S.D.S.Study Data Tabulation Model(SDTM).2008.http:/ / www.cdisc.org/ sdtm.

[2]SAS Institute Inc.Sas9.1.3 Help and Documentation.Cary Nc:Sas Institute Inc,2003.

[3]SAS Institute Inc.Sas Institute Inc .Sas9.1.3 Sql Procedure Users Guide.Cary,Nc,2006.

[4]SAS Institute Inc.Sas Institute Inc .Base Sas9.1.3 Sql Procedure Guide:Statistical Procedures.Cary,Nc,2006.

[5]王詩遠,劉沛.流行病學調查報告數據標準化入口的SAS實現.中國衛生統計,2013,30(1):114-118.

(責任編輯:劉 壯)

*基金項目:國家科技重大專項“艾滋病和病毒性肝炎等重大傳染病防治”(2011ZX10004-902)

通信作者:△劉沛,E-mail:liupeiseu@126.com

猜你喜歡
程序
給Windows添加程序快速切換欄
電腦愛好者(2020年6期)2020-05-26 09:27:33
試論我國未決羈押程序的立法完善
人大建設(2019年12期)2019-05-21 02:55:44
失能的信仰——走向衰亡的民事訴訟程序
“程序猿”的生活什么樣
英國與歐盟正式啟動“離婚”程序程序
環球時報(2017-03-30)2017-03-30 06:44:45
基于VMM的程序行為異常檢測
偵查實驗批準程序初探
我國刑事速裁程序的構建
創衛暗訪程序有待改進
中國衛生(2015年3期)2015-11-19 02:53:32
恐怖犯罪刑事訴訟程序的完善
主站蜘蛛池模板: 欧美日在线观看| 最新日本中文字幕| 中日韩一区二区三区中文免费视频| 国产一区二区三区视频| 日本一区二区三区精品视频| 久久久久国色AV免费观看性色| 99热最新网址| 九九免费观看全部免费视频| 91麻豆久久久| 四虎精品国产AV二区| 久久狠狠色噜噜狠狠狠狠97视色| 国产精品高清国产三级囯产AV| 中文字幕首页系列人妻| 亚洲色图欧美在线| 免费jjzz在在线播放国产| 毛片网站观看| 美女被操黄色视频网站| 思思热精品在线8| 亚洲天堂日韩在线| 亚洲人成亚洲精品| 一级看片免费视频| 欧美成人aⅴ| 国产成人亚洲无吗淙合青草| 国内黄色精品| 国模私拍一区二区| 国产人妖视频一区在线观看| 国产精品亚洲专区一区| 久久91精品牛牛| a欧美在线| 在线观看国产精品日本不卡网| 亚洲永久精品ww47国产| yjizz视频最新网站在线| 成人午夜亚洲影视在线观看| 免费xxxxx在线观看网站| 亚洲精品在线影院| 日韩麻豆小视频| 久久久久久久97| 欧美日韩一区二区三区在线视频| 国产成人久久综合一区| 福利片91| 亚洲性视频网站| 白丝美女办公室高潮喷水视频| 国产本道久久一区二区三区| 亚洲一级毛片免费观看| 99热这里都是国产精品| 久久久久无码国产精品不卡 | 中文字幕乱妇无码AV在线| 国产情精品嫩草影院88av| 老司机aⅴ在线精品导航| 国产精品国产主播在线观看| 国产视频资源在线观看| 91在线播放国产| 国产精品播放| 国产91线观看| 又污又黄又无遮挡网站| 日本高清在线看免费观看| 情侣午夜国产在线一区无码| 女人毛片a级大学毛片免费| 精品无码一区二区三区电影| 欧美成一级| 欧美日韩第二页| 精品福利视频导航| 国产精品真实对白精彩久久| 亚洲天堂网在线观看视频| 成人一级免费视频| 亚洲午夜天堂| 国产AV无码专区亚洲精品网站| 国产不卡在线看| 视频国产精品丝袜第一页| 98超碰在线观看| 不卡无码h在线观看| 亚洲免费三区| 中国黄色一级视频| 九月婷婷亚洲综合在线| 熟女成人国产精品视频| 91一级片| 精品国产美女福到在线不卡f| 91精品国产综合久久不国产大片| 久久久噜噜噜久久中文字幕色伊伊 | a在线亚洲男人的天堂试看| 久久精品视频一| 777午夜精品电影免费看|