喬若靜/編譯
移動數據與定制測量
喬若靜/編譯

智能手機健身應用程序可以從人群中收集大量健康數據
幾十年來,世界各地的醫生們一直在使用一種簡單的方法來測量患者的心血管健康程度,即讓人們在堅硬平坦的路面上行走,看在6分鐘里可以走多長距離。這種測試方法還一直被用來預測即將進行肺移植患者的生存率、評估肌肉萎縮癥的患病程度,以及評估心血管總體健康程度等。
行走測試法被應用于許多試驗和研究中,但即使是最大規模的研究也很少有超過1 000人參與。然而,在尤安·阿什利(Euan Ashley)于2015年3月啟動的一項心血管研究項目中,短短的兩周內他就收集到6 000人的測試結果。“這是很不同尋常的。”斯坦福大學心血管疾病中心負責人、遺傳學家阿什利說道,“在過去,如果幸運的話,參與數據測試的病人通常只有數幾百人而已。”
阿什利希望,如此規模的統計數字,能夠告訴他關于身體活動和心臟健康之間關系的很多信息。能夠實現如此大規模數據研究的原因是因為:如今數以百萬計的人們都配備有智能手機和健身追蹤器或傳感器,可以記錄下人們的各種健身活動數據資料。通過醫療衛生保健研究人員的研究,試問從這類設備中可以得到哪些有收集價值的數據?數據的可靠性又如何?通過對成千上萬人在各種日常活動中所收集數據的分析,他們還可以學到些什么呢?以及如何運用大數據算法來解讀這些追蹤器和傳感器上的讀數?
到7月份為止,美國已有超過40 000人報名參加了阿什利的研究,實驗所用工具是一款針對心血管疾病而設計的iPhone應用程序MyHeart Counts。阿什利預計,隨著這款應用程序在全國各地的推廣和普及,參加人數還將繼續大幅增加。這項由科學家設計、由研究所審查委員會批準、并要求知情同意的研究,要求參與者回答關于他們健康和風險因素的一些問題,并通過手機內的運動傳感器收集參加者七天內活動情況的數據信息。還要求他們做6分鐘步行試驗,通過手機測量步行6分鐘通過的距離。如果參與者已做過血檢,可將相關數據信息輸入,如膽固醇和葡萄糖水平等。每隔三個月,應用程序會重新測試并更新相關數據。
醫生們都知道,身體活動是長期心臟健康的一個強有力的預測指標,阿什利說道。但目前還不甚清楚的是,什么樣的運動才是最好的,還是不同的人群有著適合于自己的不同類型的鍛煉形式。My-Heart Counts應用軟件也許打開了回答這個問題的窗戶。“我們可以通過分組實驗來找到這種差異。”他說,“數據也許很多很嘈雜,但如果我們有足夠多的數據,就可以從中發現相關蛛絲馬跡。”
龐大的數據量,使得這樣的研究成為可能。傳統的研究可能沒有足夠的數據量通過分組分群來獲得具有統計學上顯著意義的結果。比較罕見的事件可能不會發生在較小群體的樣本中,或可能只能產生一個微弱的信號,最終消失在雜亂的統計噪聲中。大數據可以克服這一不足,在足夠大的數據集中,一些小錯誤可以輕易被消除掉。“你獲得的數據可能很嘈雜,但如果數據足夠多,你就可以找到代表某種意義的某個信號。”阿什利說。
收集如此龐大的數據完全是有可能的,因為有一款稱為研究工具箱(ResearchKit)的蘋果軟件可以用來開發用于這類研究的iPhone應用軟件。My-Heart Counts就是ResearchKit開發并在同一天發布的5個應用軟件之一,另幾款軟件正在試圖通過對大數據的開發利用,展開對帕金森病、乳腺癌、糖尿病和哮喘的研究。
帕金森病研究到7月共招募了約16 000名自愿者,這個實驗用的也是行走測試,因為帕金森病的主要表現為運動障礙。測試實驗中,讓自愿者直線行走20步,通過手機的速度計和陀螺儀測量行走者的步態,評估他們的運動控制能力。同時要求他們每隔10秒鐘對著手機叫一聲“啊”,醫生通過對他們發聲震顫程度的測量,了解他們肌肉的緊張度。“使用移動設備上的傳感器是一個很合適的辦法。”總部設在華盛頓西雅圖的一家非盈利生物醫學研究咨詢公司的數據開放倡導者約翰·威爾班克斯(John Wilbanks)說道。帕金森病應用程序mPower就是這家公司與紐約羅徹斯特大學的醫生共同研發的,這個應用程序同時還使用調查問卷,通過與健身追蹤器的連接收集更多數據。
智能手機和智能手表的操作系統(如Windows系統和Android系統)編寫有類似的應用程序。同樣裝有類似應用程序的還有不同公司開發的包括Basis、Fitbit和Jawbone在內的大量可穿戴健身設備。另外,研究人員還在開發可隨時收集數據的其他類型的可穿戴傳感器,包括臨時性紋身和通過淚水測量血糖水平的隱形眼鏡等。與此同時研究人員還加快了對現有設備的改裝開發,如改造糖尿病患者使用的連續性葡萄糖監測儀,并將獲得的數據添加到智能手機的綜合數據資料庫中。
智能手機不僅僅能測量身體健康指標,研究人員如今正在嘗試利用它來做更多的事情,例如,跟蹤人的心理狀態和情緒健康,通過傾聽某人的聲音來辨別壓力程度,或通過追蹤身體活動確定其社會互動情況,以發現是否有抑郁狀況出現。

當今便攜式設備越來越多地用于測量一系列人類活動,而如今的電腦計算機能力也強大到可輕松處理海量的數據,研究人員希望這些都將有助于對人類健康問題取得前所未有的深刻了解。
面對越來越多令人眼花繚亂的各種各樣的測量設備,研究人員既興奮又發愁。“這是一種令人興奮的混亂狀況。”加州大學舊金山分校生物醫學信息學系的系主任艾達·西姆(Ida Sim)說道。
西姆是開放型移動醫療的創始人之一,移動醫療是一個開發處理和存儲來自各種設備和應用程序的數據并研發數據標準化軟件以解決目前測量設備和數據混亂現狀的非盈利的公司。“大家都討厭標準化,但如果沒有它,很難準確地將數據整合在一起。”她說。對于一個需要正確解讀一份葡萄糖水平檢測報告讀數的醫生來說,重要的是要知道患者是否已經餓了很長時間。
任何標準的建立都必須解決兩個關鍵問題:一是來自某些設備的數據準確度有多高;二是測量目的是什么。如今的許多健康追蹤器是為了告訴用戶,他們今天走的步數是否比上周多一些,而不是為了收集符合實驗室要求的測量數據。“這些健康追蹤器所記錄的只是一般性的運動狀態,然后轉換為步數計算,以了解今天行走的步數是否比昨天更多一些,如此而已。”波士頓東北大學研究個人健康信息的斯蒂芬·因蒂勒(Stephen Intille)說道。
為更好地了解設備實際上的測量目的究竟是什么,因蒂勒帶著一些自愿者進入他的實驗室里,將各種各樣的傳感器連接到他們的雙臂和雙腿上,其中不僅有商業化的設備,還有其他實現室專用傳感器,來記錄他們的運動、心率、呼吸和其他數據。2至3小時之后,他讀取了這些志愿者們行走、做家務和騎自行車等類似活動的測量數據。然后因蒂勒拿掉與自愿者連接的其中一些傳感器,讓他們回家,在之后的幾天里,他們身上戴著的其余一些設備繼續收集他們真實生活中的數據。在接下來的三個月里,他再次切斷了與其中一兩種設備的連接。
通過這種方式,因蒂勒可以精確地發現商業化設備在某個特定活動中究竟記錄的是什么。例如,某人熨衣服時,Fitbit監測器會產生一系列數據,而實驗室設備記錄的只是這人的心率和呼吸。如果計算機可以被訓練用來在實驗室里識別不同活動產生的不同的Fitbit讀數,那么也可以用來識別人們在真實生活環境中的活動,并分析這些活動對人們身體健康的影響。
“就我個人而言,我不認為如果沒有與用戶的交互活動,會有更好的效果。”因蒂勒說道。他的想法是,是否可以通過某種通話裝置與健身跟蹤器取得聯系以獲得數據,例如,在了解了某人的習慣之后,可以向他提出一些問題,比如:“您現在正在遛狗嗎?”他還認為,為了獲得更全面的數據,人們可能需要穿戴不止一種設備,也許一個戴在手腕上,另一個套在腳踝上。
研究人員要獲得對人們健康狀況更多的了解,就需要更詳細的數據信息。知道人們走了多少步,或行走速度的快慢,或在健身房里的活動強度,了解這些可能很容易,但要理解這些日常活動對人們健康的影響有多大,可能就不那么容易了,斯坦福大學長壽研究中心名譽教授、醫學生理學家威廉·哈斯卡爾(William Haskell)說道。他亦是和因蒂勒一起驗證商業追蹤器測量的合作人。
“對于低強度范圍的活動,從站立到隨意走動,我們所知甚少。”哈斯卡爾說道,“一天坐在辦公桌前,只是隨便立起來走動一下,或是繞著辦公室好好地走幾圈,哪個效果更好,我們并不知道。”
早在40年前,哈斯卡爾就開始使用速度計跟蹤運動,對于通過可穿戴設備獲得數據他感到非常興奮。“這樣的技術已經來到我們面前,”他說,“我們要做的只是驗證它,用它24小時觀察人們的活動情況。”
大量數據的獲得可以提高對健康研究的力度,同時可穿戴技術的出現也拓展了數據收集的途徑,通過24小時長期不間斷地監測人們的日常活動,可以收集到之前難以獲得的各種不同類型的數據。
“大數據的意義不僅僅在于我們能夠獲得大量的數據,而且還在于這些數據來自于許多不同的來源。”西姆說道。
病人來看病時,她可以和他們交流20分鐘左右。但是,“他們不可能一直呆在我這里,對于他們其余時間里的活動情況,我一無所知。”她說,“我不知道在他們的日常生活中發生了些什么。”而不間斷的數據收集可能最終改變這種狀況,幫助醫生更好地為患者定制個性化的治療方案。西姆說道,但現在還有一個至關重要的缺失環節:還沒有人設計出一種將有意義的數據從商業設備傳送給醫生的方法。“這類設備的設計完全不符合醫生們的工作流程。”她說。
但這種普遍收集的健康信息可以產生更廣泛的社會效益。悄然出現且無處不在的各種新技術從成千上萬個人身上收集到的大量數據,將產生對群體健康有重大意義的大量研究成果。阿什利已有了一個移動健康版的長達數十年的心臟病研究計劃,以確定影響心臟病的各種危險因素。目前他已經開始對iphone收集到的數據和曾在斯坦福大學醫學中心就醫的iphone用戶的基因組數據進行整合。
因蒂勒相信,隨著大數據集的創建,醫療衛生保健研究人員將能夠回答一系列產生的新問題。“我們無法獲得個人層面上的任何信息,”他說,“在能夠檢測到人們移動設備上的數據之前,這是根本不可能的,這是與我們以往處理醫療保健問題完全不同的一種方式。”
[資料來源:Nature][責任編輯:遙醒]