梁家政
?
基于智能手表的健康數(shù)據(jù)挖掘與分析
梁家政
湖北工業(yè)大學,湖北 武漢 433000
隨著老齡化人口數(shù)量與慢性疾病發(fā)病率的快速增長,越來越多的人群需要得到實時監(jiān)護,傳統(tǒng)的醫(yī)療技術(shù)已經(jīng)無法滿足人們的需求。對智能手表里健康監(jiān)控護系統(tǒng)的用戶數(shù)據(jù)進行了簡單挖掘、分析和統(tǒng)計,提出的相應(yīng)的設(shè)計理念和分析方法,得出相應(yīng)結(jié)論,給可穿著戴設(shè)備的發(fā)展提供了借鑒。基于此,創(chuàng)新點如下:(1)將統(tǒng)計思想用于Android應(yīng)用程序的開發(fā),同時利用數(shù)據(jù)分析和統(tǒng)計方法對用戶的行為進行了統(tǒng)計和分析。
智能穿戴設(shè)備;大數(shù)據(jù);挖掘;分析
在基于智能手表的健康監(jiān)護系統(tǒng)中,我們可以通過統(tǒng)計用戶查看手表的次數(shù)、時間的次數(shù),測量體溫、體重的次數(shù)以及對應(yīng)的時間,喜歡使用的軟件、習慣等對用戶的行為數(shù)據(jù)進行過濾、采樣、分析,從而找到之間潛在的規(guī)律和商機。根據(jù)系統(tǒng)的結(jié)構(gòu),可構(gòu)建數(shù)據(jù)挖掘環(huán)境如圖1所示。

圖1 數(shù)據(jù)挖掘基本環(huán)境
目前,數(shù)據(jù)挖掘技術(shù)多用于后端開發(fā),將算法嵌入數(shù)據(jù)庫或是云平臺的理念,這種理念會導(dǎo)致前端采集到的數(shù)據(jù)源顯得雜亂無章,導(dǎo)致數(shù)據(jù)庫或云平臺缺乏對采集的數(shù)據(jù)進行有效地分析和利用,降低健康監(jiān)護系統(tǒng)使用的體驗感,從而使用品失去對用戶吸引力,導(dǎo)致產(chǎn)品難以推廣。而根據(jù)本人研究實驗說明,若將數(shù)據(jù)挖掘、統(tǒng)計與分析同樣同時用于Android App的開發(fā),前端與后臺統(tǒng)一數(shù)據(jù)源的采集設(shè)計,更能最大限度的利用和分析數(shù)據(jù)源,并產(chǎn)生良好的分析結(jié)果,對用戶的吸引力將無限增大。
2.1 關(guān)聯(lián)規(guī)則
關(guān)聯(lián)規(guī)則是描述數(shù)據(jù)庫中數(shù)據(jù)項之間存在的潛在關(guān)系的規(guī)則,形式為“A1^A2^…Am=>B1^B2…Bn”,At(i=1,2,…,m),Bj(j=1,2,...,n)是數(shù)據(jù)庫總的數(shù)據(jù)。A與B之間的關(guān)聯(lián)規(guī)則是一個事務(wù)中出現(xiàn),可導(dǎo)致B]出現(xiàn)在該事務(wù)中,其中關(guān)聯(lián)符號為=>,即由A導(dǎo)致B結(jié)果。關(guān)聯(lián)規(guī)則流程的如圖3所示,圖中L-S為L中減去子集S的項集。
(2)置信度(C):C=P(B|A)=P(AB)/P(A)C=P(BA)=P(AB)/P(A),A事件中同時發(fā)生B事件的概率,即在規(guī)則中出現(xiàn)的強度[1]。
例如在基于智能手表的健康監(jiān)護系統(tǒng)中,身高=>體重,如果兩者的S=51%,表明51%的客戶同時測量身高和體重,通過測量身高和體重來評估自己是否達到標準體重;另一方面C=28%,則表明測量身高的用戶會測量體重的可能性為28%[2]。
(3)強規(guī)則:同時滿足最小S和C閾值。
(4)頻繁k項集:如果事件A包含k個元素,則稱該事件A為k項集事件A滿足最小支持度閾值。

圖2 產(chǎn)生關(guān)聯(lián)規(guī)則流程
2.2 Apriori算法
Apriori算法主要使用迭代法思想進行逐層搜索,利用“k-1項集”來搜索“k項集”,直到頻繁項集的置信度大于最小置信度4°,算法流程如圖3所示。
2.3 數(shù)據(jù)分析結(jié)果
對測量次數(shù)與用戶的關(guān)系進行簡單分析后,再分析用戶行為與時間段的關(guān)系,方法是利用Apriori算法對用戶行為時間分片處理。具體思路如下,首先將時間進行不均勻分片,對其大致分為上午、中午、下午、晚上、凌晨或更細的時間段,然后在這些時間段內(nèi)分別對用戶行為的進行統(tǒng)計,最后將結(jié)果整合。同時,結(jié)合用戶對界面控件的點擊次數(shù)、界面駐留時間與時間點,可對系統(tǒng)進行較完整的分析,非常客觀的反映出用戶對該軟件的使用頻度。
而對于用戶體重測量與時間的關(guān)系,時間初步分為以下時間段[6:00~11:00,11:00~13:00,13:00~16:00,16:00~20:00,20:00~22:00,22:00~1:00,1:00~6:00],分別對每一區(qū)域的用戶行為進行統(tǒng)計分析,然后對時間段進一步提取找出頻繁項集,如此反復(fù)操作,直到找出最大頻繁項集。這種思想類似于一種基于時間序列的RFID供應(yīng)鏈數(shù)據(jù)分析方法[3]。
基于智能手表的健康監(jiān)護系統(tǒng),是隨人們對移動健康應(yīng)用的需求迅速增加而提出的。本文對系統(tǒng)的數(shù)據(jù)進行分析,結(jié)合數(shù)據(jù)挖掘思想,本文提出了將Apriori算法用于Android App的開發(fā),同時,簡單構(gòu)思了Apriori算法在基于智能手表的健康監(jiān)護系統(tǒng)中的實現(xiàn)步驟和原理,得出相應(yīng)的統(tǒng)計結(jié)果。并為可穿戴設(shè)備的設(shè)計規(guī)劃、理念和數(shù)據(jù)采集、分析方法,提供了借鑒。

圖3 Apriori算法流程
[1]郝先臣,張德干,尹國成,趙海.用于電子商務(wù)中的數(shù)據(jù)挖掘技術(shù)研究[J].小型微型計算機系統(tǒng),2001(7):785-788.
[2]吳紹函.關(guān)聯(lián)規(guī)則挖掘算法的研究[D].鄭州:解放軍信息工程大學,2008.
[3]屈正庚,唐曉琴.基于電子商務(wù)中的數(shù)據(jù)挖掘技術(shù)研究[J].電子設(shè)計工程,2009(3):37-39.
Based on the Smart Watch Health Data Mining and Analysis
Liang Jiazheng
Hubei university of technology, Hubei Wuhan 433000
With the aging of population and the rapid growth of the incidence of chronic diseases, more and more people need to be real-time monitoring, the traditional medical technology has been unable to meet the needs of people.Health monitoring protection system in this article how to smart watch simple user data mining, analysis and statistics, puts forward the corresponding design concept and analysis method, the corresponding conclusion, provides the reference to the development of equipment can be worn in.This paper innovation points are as follows:(1)use statistical thinking for Android application development, at the same time, using the method of data analysis and statistics of user behavior to carry on the statistics and analysis.
intelligent wear equipment; Big data; Mining; Analysis
F426.6
A
1009-6434(2016)10-0135-02