陳萬志,林澍,王麗,李冬梅
(1.遼寧工程技術大學 電子與信息工程學院,遼寧 葫蘆島 125105; 2. 渤海裝備遼河重工有限公司,遼寧 盤錦 124010)
?
基于用戶移動軌跡的個性化健康建議推薦方法
陳萬志1,林澍1,王麗2,李冬梅2
(1.遼寧工程技術大學 電子與信息工程學院,遼寧 葫蘆島 125105; 2. 渤海裝備遼河重工有限公司,遼寧 盤錦 124010)
摘要:隨著移動智能終端的普及,移動醫療應用已成為當前研究的熱點。針對移動醫療環境下個性化健康建議推薦問題,依據用戶移動軌跡與職業類型間相似性特點,提出一種基于駐點區域特征向量與用戶職業特征向量相結合的相似度計算方法,通過構建相似用戶組的方式完成組內用戶健康建議信息的共享,最終實現在節約醫療資源的基礎上為海量用戶提供個性化健康推薦服務的功能。算法測試與分析結果表明了方法的有效性和可實施性,在移動醫療大數據分析應用方面具有廣闊的前景和實用價值。
關鍵詞:移動醫療;大數據分析;移動軌跡;特征向量;個性化推薦
中文引用格式:陳萬志,林澍,王麗,等. 基于用戶移動軌跡的個性化健康建議推薦方法[J]. 智能系統學報, 2016, 11(2): 264-271.
英文引用格式:CHEN Wanzhi,LIN Shu,WANG Li, et al. Personalized recommendation algorithm of health advice based on the user’s mobile trajectory[J]. CAAI transactions on intelligent systems, 2016, 11(2): 264-271.
隨著GPS、移動基站、室內等定位技術與方法的發展和普及,越來越多的用戶將其移動記錄分享到朋友圈中實現社交行為,同時各種基于位置的服務已逐漸成為人們日常生產生活中不可或缺的要素。因此,對用戶移動軌跡的分析與挖掘已成為當前行為分析與挖掘方面的研究熱點。
用戶的GPS軌跡序列記錄的是其在真實物理世界中移動路線,在一定程度上蘊含著用戶的個人意圖、喜好以及行為模式。如何挖掘軌跡中的知識,實現從個體數據中挖掘出用戶行為、意圖、經驗和生活模式[1-6],融合群體數據來發現熱點地區和經典線路[7],甚至挖掘人和人之間的相關性[8-9]及個體在地域之間的活動模式[10-11]等等都具有十分重要的現實意義。特別是在云計算和大數據分析背景下,以海量用戶軌跡數據分布式云存儲為基礎,對用戶移動軌跡數據進行深度的分析和挖掘,完成“數據-信息-知識-智能”的計算過程,實現更深層次、更人性化、更有效的為用戶提供基于位置的增值延伸性服務[12]。
現代社會人類復雜的社會交際和遷移活動使得人與社會、人與自然環境的關聯復雜性突顯,自然和社會環境均可影響人體健康,因此關注用戶的身體和心理健康是同等重要的。通過用戶移動行為軌跡及周邊區域特征等組成的用戶社會行為相關信息,研究如何在用戶移動軌跡數據與健康體征信息密切關聯的海量空間數據分布式云存儲和計算架構的基礎上實現為用戶提供個性化的心理健康建議推薦信息服務是大數據分析領域性應用中心理疾病防治與個性化健康指導方面的主要難點問題。
GPS采集的數據是用戶移動行為軌跡數據的主要來源,其中采樣精度與采樣頻率對后續的分析有較大影響,存在干擾因素的數據直接用于用戶數據挖掘時往往得到的不是預期的效果。對于采樣誤差的問題而言,一般地,民用GPS定位精度在米級,在某些道路稠密的地段的誤差將使用戶的當前位置映射到錯誤的道路上導致影響用戶的定位與導航功能,比較成熟的地圖匹配(map matching)的方法是將帶有位置偏差的GPS軌跡映射到正確的道路上,從而實現導航質量的提高,但是如何實現采樣誤差GPS數據的用戶社會行為分析與挖掘尚無相關的研究和方法。而對于采樣頻率低的問題而言,直接簡單的提高采樣率方法來處理由于實時獲取GPS設備位置信息的通信和存儲代價限制而無法實施。文獻[2]針對這種低采樣率的GPS軌跡提出了一種基于全局信息的匹配方法,通過分析“存疑點”周圍“確定點”的位置信息與關系信息,從而確定“存疑點”可能出現的大致位置,這種處理方案可以實現各采樣點關聯的過渡性軌跡平滑和底圖匹配,但如何在用戶移動速度不穩或POI(point of interest)信息點稠密等情況下有效地動態描述用戶移動軌跡,進而挖掘其所處駐點區域的社會行為特性還無法得到解決。
采集用戶移動軌跡時用戶的交通出行方式可能是不同的,因此,若能夠從用戶的移動軌跡信息中挖掘出軌跡采集時用戶的出行模式,則對用戶的分類和信息推薦是有輔助意義的。當前基于GPS軌跡的交通工具判別主要依據軌跡序列中時間序列與位移距離計算得到的平均速度來實現,但在交通工具的速度不均衡,特別是城市交通狀況的影響導致這種判斷方法的識別精度小于50%。另外用戶在兩次軌跡采集點的區間如變換交通方式,則使得同一段移動軌跡可能會由多種交通方式所構成,若不能每個位移區間的交通方式原子化,必然導致判斷結果也會包含不可避免的錯誤。
文獻[4-6]針對上述問題提出的解決方法是:采用一種有效的路線分割方法,其主要的思想是利用步行路段來分割軌跡;通過發現一些受交通狀況影響不大的特征,如方向改變率等,并結合監督學習的方法來訓練一個分類模型;采用一種后處理方法,從大量的線路中挖掘出一個隱含的地圖,并分析了不同路段上各種交通工具的使用概率和交通工具之間的轉移概率。因此,巧妙地利用了自然常識、地理限制和地圖信息來修正錯誤的判別。
用戶歷史軌跡中出現的頻繁模式反映了個人的生活習慣和行為規律,若能夠從軌跡中推理挖掘出這些知識,服務提供商將會為用戶提供更深入、更個性化的位置服務[3]。而要從軌跡中挖掘這些頻繁模式首先要解決的問題是如何對個人的歷史軌跡進行建模。可以通過算法檢測出該用戶停留過的有效位置,一個用戶的歷史軌跡就可以基于這些位置表達為一個停留位置序列,這樣既可以挖掘出用戶行為的重點,同時也大大減輕了數據處理量。更進一步講,由于用戶多次訪問同一地點所產生的停留點由于GPS數據偏差原因可能不一定是完全一致的,因此直接對停留點進行對比并是不可行的,這就需要對從軌跡中提取出來的停留點進行聚類分析。將相近的停留點分配到同一個聚類中,此后再用各個停留點所歸屬的聚類來替換該停留點,進而將停留點序列進一步轉化為相應的聚類序列,最終使得用戶在不同時間段的歷史軌跡可以進行對比。在用戶歷史軌跡的模型基礎上,可采用FP-growth、Closet+等算法來挖掘其中的頻繁項集,并且這些頻繁模式是可以相互組合和連接的,從而可進一步挖掘出一些表征了用戶生活、行為規律的順序模型。
綜上所述,現有基于位置的服務一般都是直接通過用戶提供的位置數據進行處理,缺乏對這些數據的進一步分析和挖掘,忽略了這些位置數據中蘊含的信息和知識。因此,研究以云存儲和計算技術為基礎,通過位置信息與地圖POI 興趣點數據的融合實現對用戶軌跡數據更深入的分析和挖掘得到更豐富的知識,最終達到更智能的為用戶推送個性化健康建議信息服務的目的。
1用戶社會行為數據的相似分組算法
算法的主要思路是通過對采集得到的用戶每日上下班GPS軌跡數據進行分析,按照用戶工作時間、城市、地點、交通工具等用戶特征進行個性化建模,并對此模型進行量化分析處理,計算用戶在社會工作方面的相似程度,最終將具有相似工作環境和工作壓力的用戶構建為基于用戶社會行為數據的相似用戶組,進而實現相似用戶組內的職場心理與健康指導信息共享,達到個性化推薦的目的。其工作流程如圖1所示,首先通過用戶的多條GPS軌跡數據結合地區POI數據庫確定用戶的工作類型,然后根據GPS軌跡的時間序列和用戶使用交通工具情況折算出用戶工作壓力并分組。為了獲得用戶的工作類型并使得用戶的歷史位置具有可比較性,擬利用用戶駐點區域特征向量描述POI數據與用戶空間位置的語義聯系。此外,還通過有限的GPS數據信息推斷用戶可能的收入和工作時間特征,并形成可表示用戶工作壓力的向量,最終通過用戶工作類型和向量夾角實現對用戶的分類。

圖1 算法的工作流程Fig.1 Algorithm of workflow
1.1用戶軌跡處理
用戶的移動軌跡信息通常是GPS移動終端采集并處理得到,其中包含采樣點的坐標信息、采集時間以及位移速度等,屬于瞬時離散型數據,在每次采集后采集設備均有一段靜默期;在實際采集過程中由于環境復雜導致所采集的時間和坐標具有一定的不準確性,數據往往有一定的時間和坐標偏差。因此用戶移動軌跡數據用于判斷用戶駐點區域特征是要充分考慮定位偏差與精度對結果的影響,移動終端采集的用戶日常上下班的GPS軌跡數據采用下述方法處理得到用戶的工作軌跡信息。其中重要的定義包括:



圖2 一組GPS軌跡Fig.2 A GPS track

通過以上定義可知,從用戶移動終端采集的GPS數據中提取到一些關鍵信息,通過計算用戶從一個駐點到另一個駐點的時間差得知用戶的行程時間(如上班時間),也可以通過計算用戶在駐點內的駐留時間差得知用戶駐留時間(如工作時間)。當然用戶駐點與現實生活中具體地點的關系仍需要進一步確認。
1.2用戶在駐點區域的行為建模
用戶駐點可以粗略地表明用戶每次移動的起止地點以及移動的起止時間,結合POI數據可以進一步得到用戶移動起止地點的詳細信息,為駐留區域語義提取提供數據基礎。每條POI數據內容包含信息點名稱、類別、經度和緯度及其他說明等相關地理信息。
用戶駐點與POI數據往往不能簡單地通過距離計算的方式建立關系。由于駐留區域直徑和駐留區域時長的不當選取或實際生活中突發的事件,導致用戶在移動過程中的某些位置上停留了一段時間,產生了非目的地或出發地的駐點,如十字路口或車站等;考慮到GPS定位誤差和城市中密集分布的信息點,通過POI數據識別用戶在駐點處訪問的確切地點成了不可能完成的任務。一個GPS采集點數據可以具有10 m或以上的位置偏差,而在其周圍可以有多種的POI數據,而距離用戶駐點最近的POI數據所代表的信息點可能不是用戶真實訪問的地方,如在有些地方餐廳、商場和電影院重疊在同一建筑物內,實際應用如圖3所示。

圖3 用戶駐點與POI信息點Fig.3 Users stagnation and POI information point
為了解決用戶駐點與POI數據的內容的關聯問題,將用戶駐點所代表的POI數據的駐點區域表示為

式中:γ是一個與GPS相關的參數定位誤差,則可采用TF-IDF的統計方法構建了一組特征向量表示每個駐點區域所代表的興趣點內容,用以評估字詞對于一個文件集或一個語料庫中的其中一份文件的重要程度。字詞的重要性隨著它在文件中出現的次數成正比增加,但同時會隨著它在語料庫中出現的頻率成反比下降。同理,應用TF-IDF算法時把詞的類別和用戶駐點區域中興趣點作為文檔處理。直觀地說,如果同一類興趣點發生在同一個地區的頻率較高,這該種類是該地區的典型代表。此外,有些POI類型(如“博物館”和“公園”)由于在城市建設的數量較少且分散,因此此種類型的興趣點在城市中出現的概率很少,而一些常見功能的興趣點(如“餐館”)可以遍布在城市的任何角落。對于個人而言,由于存在一定的生活規律和做事目的,在一定的生活規律條件下,每日訪問的地點可能有所不同但目的應該相近或相同,因此在判斷哪些興趣點是用戶真正的移動目的地時應重點分析那些經常存在于用戶駐點區域的POI類型。綜上,需要考慮一個POI類別在一個區域發生頻率和其逆向文件頻率兩種因素,故引入特征向量的定義
特征向量:用一組向量fr=(w1,w2,…,wn)表示用戶駐點區域中興趣點內容的集合,有
(1)
式中:ni是該區域屬于第i種類別的POI的數量和,N是位于該區域的POI的總量,R為用戶駐點區域總數,r表示出現第i種POI類別的用戶駐點區域數量。式(1)的第1部分表示一個類別i發生頻率,第2部分表示一個類別i在該用戶整個駐點區域中POI類型總數|R|的逆向文件頻率。
根據式(1)用一個特征向量代表一個駐點區域,雖然還不能確切地確定用戶訪問的地點,但此特征向量在一定程度上可以代表用戶位置的語義含義,即該區域中具有哪些突出的POI類別,進而可以推斷該區域的功能類別。
為了進一步推斷出用戶在駐留區域中的動作行為(如工作、用餐、訪友、居住等),還需要將該區域的功能類別與用戶在該區域的駐留時間相結合,并以24h為周期,對每天用戶的駐點區域進行比較,即可篩選出用戶日常工作的區域和用戶臨時停留的區域。考慮到目前存在著一些在非固定地點工作的用戶,對于其中大多數用戶來說,其所從事的工作性質往往相同,因此在對用戶工作地點的查找方法上,使用基于特征向量的比較方式要比使用基于坐標位置的比較方式更具說服力。
利用余弦相似性原理可以對前述TF-IDF計算方法產生的特征向量進行相似度比較,其原理為計算求得兩組向量的夾角,并得出夾角對應的余弦值,用來表征這兩個向量的相似性。夾角越小,余弦值越接近于1,它們的方向更加吻合,特征越相似。其計算式為
(2)
由式(2)可以從用戶駐點含義層面對同一用戶出現的地區進行比較判斷哪些區域可能是用戶的工作區域,同時也需要從時間層面對同一用戶的上班規律進行比較,進一步確定哪些區域是用戶的工作區域。國內采用的標準工作時間制度是指職工每日工作8h,每周工作40h的工時制度,不同地區、不同職業會導致工作時間有所變化,但大部分工作每日的作息時間相差不大,尤其是上班時間。與此同時也應考慮到采用輪休或倒班制度的工作,因此在計算時間相似性時法定工作日與節假日是不區分的。在判斷某些相似駐點區域是否為用戶工作區域的主要依據是用戶進入到達該駐點的時間序列是否可以收斂到一個或幾個時間點上,若可以找到進入駐點時間一定或偏差不大且駐點特征向量相似的駐點,則此駐點區域可認為是用戶工作區域,此駐點特征向量包含用戶的工作信息。
2用戶社會行為數據的相似度比較
基于用戶社會行為數據的相似度用于衡量用戶工作職業和工作環境等與用戶職場活動相關的信息,包含用戶工作時間、城市、工作類型、通勤工具使用情況等,通過對這些信息的處理從用戶經濟條件、工作類型、工作壓力等方面對用戶進行建模,進而通過相似度比較方法實現相似用戶聚類。
1)用戶經濟條件
用戶經濟條件主要依賴于用戶的收入和支出,可以間接通過用戶所在城市和用戶乘坐通勤工具的情況進行分析,通過城市的平均收入可以簡單區分用戶的收入等級;文獻[13-14]指出在城市中若弱化用戶住所與用單位間距離影響,用戶的平均收入情況與用戶通勤所選用的交通工具情況服從線性分布,因此考察用戶乘坐通勤工具可以進一步地劃分用戶收入的等級,使得用戶收入等級明確化。通過國內近5年的國內城市收入排名統計,將用戶按照所在城市的不同進行收入的劃分,進而使得不同城市間用戶的收入情況得以比較。通過城市中乘坐不同通勤工具的人口比例進一步對收入進行劃分,并最終計算出用戶的經濟條件指數。其計算公式為
(3)
式中:Ai為平均收入, 通勤工具比例系數Vrtypei根據用戶乘坐通勤工具可分為以下3種類型:
①私家車或公務轎車:
(4)
②單位通勤車:
(5)
③公共交通工具或步行:
(6)
通過式(3)~(6)可線性的將用戶所在城市和所選通勤工具映射為用戶經濟條件指數,依據通勤工具類型可將用戶的收入分為3個等級并核算成數值,并采用各地平均收入作為區域計算的因子更恰當地表明不同城市間的收入差。用戶經濟條件指數相關信息的實例關系如表1所示。

表1 城市收入與通勤工具
2)用戶工作類型
用戶工作類型可由用戶工作區域駐點的特征向量中處理得到。由于城市建設規劃時常將功能相近的建筑建于相近區域中,如商業區、居民區、工業區等,因此實際處理而得的特征向量所包含的具有信息點較多的POI類型,其功能類型往往是相同或相互輔助的關系,其反映到現實生活中的結果就是在此工作的人群具有相似的工作習慣和作息時間,即同一工作類型。用戶駐點區域特征向量的趨勢向量POI類型總體概括如表2所示。

表2 工作類型與平均工作時長
3)用戶加班時長
用戶加班時長等于平均工作時長除以城市平均工作時長,將用戶的工作時長與該城市的平均工作時長或該用戶所在工作類型的平均工作時長作比較,可計算出用戶每天加班情況,這在一定程度上反映出用戶的工作壓力。用戶加班時長與用戶加班指數Uoti之間的對應關系如表3所示。
4)基于用戶社會行為數據的相似度比較
綜合上述3個方面分析,由于在工作類型相同時用戶的工作壓力和工作時間具有可比性并能反映用戶在其行業中的壓力情況,首先將用戶按照工作類型進行分類,并根據利用余弦相似性原理計算各分類中通過經濟條件指數和加班指數形成的向量之間的夾角,最終確定哪些同類工作的用戶相似,進而形成相似用戶組。即
(7)
式中:cosω可描述用戶的工作壓力情況,當用戶收入較高且加班時間較少時該值會趨近于1,即表示用戶工作壓力較小;而當用戶收入較低且加班時間較長時該值會趨近于0,表示用戶工作壓力較大。

表3 用戶加班時長與Uoti的對應關系
3算法測試與結果分析
基于用戶社會行為數據的相似分組算法測試采用微軟亞洲研究院的Geolife Data v1.3[15]用戶軌跡數據集,其涵蓋182個用戶在2007年4月—2012年8月間的部分出行軌跡記錄,其中不但包括GPS軌跡信息,如標記點時間序列、采集點緯度、經度和高度的信息序列,而且數據集中還包括73個用戶由不同的GPS采集設備記錄并有多種采樣頻率的17 621條軌跡記錄,其中91.5%的軌跡記錄的采集頻率比較密集,采集時間間隔每1~5 s或每行進5~10 m一次,并標記了出行交通工具,如駕車、乘公共汽車、騎自行車和步行。為了能夠與POI底圖數據相對應,選取Geolife數據集中北京地區的軌跡信息,與百度地圖API導出北京地區的POI數據相對應。由于Geolife數據集中沒有包含用戶實際的工作壓力情況,因此無法對算法得出的分組結果進行量化分析,但其中的有些部分可與現有文獻資料中的算法對比實現量化分析,因此算法的測試與結果分析分成兩部分進行。
3.1用戶工作類型分組測試與分析
首先在進行算法測試前將標記有出行交通工具的相關用戶軌跡進行整理,利用人工判別的方式根據每個用戶的出行軌跡起點與終點判斷出用戶可能的大致職業類型,并記錄此職業信息為用戶屬性;其次對這些標記有出行交通工具的軌跡進行基于用戶社會行為數據的相似分組計算,計算時根據文獻[16-17]的研究結論并考慮到所在城市的特點將算法中的相關系數分別設置為:駐留區域直徑θd=200m,駐留區域時長θt=30min,GPS定位誤差參數γ=200m,依據用戶駐點區域相似度cosθ的閾值進行用戶駐點區域相似度的用戶分組;最后將分組結果與人工判別標記的職業類型相比較,通過分類的準確率來評價此部分算法的優劣程度。算法的處理流程如圖4所示。

圖4 用戶工作類型分組流程圖Fig.4 The user type grouping flow chart
為測出用戶駐點區域相似度cosθ閾值的最佳值,在其他條件不變的情況下僅改變cosθ閾值,最終得出的用戶工作類型分組準確率如圖5。由結果可知對于本次使用的測試數據而言,當cosθ=0.85時所得到的用戶工作類型分組準確率達到最高。

圖5 cos θ與分組準確率的關系Fig.5 Relations between the packet accuracy rate and cos θ
在此基礎上,令cosθ=0.85時通過文獻[18]的HGSM算法、文獻[19]的SLH-MTM-L2算法(2ndlayer)與本文方法在分類準確度和運行時間兩方面進行比較,結果如表4所示。由結果可知本文提出的用戶工作類型分組方法基本可以保證準確的用戶分組,且運算耗時較少,在用戶記錄項繁多且需要實時計算的情況下優勢明顯。
Mini2440嵌入式開發板只有1個USB host接口,而系統中3個外設是通過USB與開發板相連的,因此使用USB hub進行擴展。

表4 對比實驗結果
3.2用戶社會行為數據的相似度分組測試與分析
首先利用前節的用戶工作類型分組數據及最優化的cosθ值計算出各工作類型分組中經濟條件指數和壓力指數,其次計算出基于不同的用戶社會行為數據的相似度cosω值,并根據ω角度將用戶分為三大類,即處于0≤ω<30°的用戶工作壓力較輕;處于30°≤ω<60°的用戶工作壓力適中;處于60°≤ω<90°的用戶工作壓力較重。算法的處理流程如圖6所示。表5給出了測試中6種工作類型用戶的工作壓力分布情況。

圖6 用戶工作壓力分組流程圖Fig.6 User working pressure grouping flow chart

工作類型用戶人數工作壓力較輕人數工作壓力適中人數工作壓力較大人數應急服務業13832普通服務業10631政府機關8710企業271368工廠6240教育5500
在對上述用戶進行分類時可采用兩種分類粒度:一是無視工作類型分類,適合在形成相似用戶組后組內推送與用戶工作類型無關的信息;二是參考工作類型分類,適合在形成相似用戶組后組內推送與用戶工作類型有關的信息。
以無視工作類型的分類粒度為例,在3類用戶中隨機選取5個用戶,由專家結合實際情況給出的工作心理建議,對于不同用戶最終的推送信息是:
工作壓力較輕用戶的健康建議分別為:
1)需要不斷樹立新的目標,讓自己再拼搏一次;
2)輕松工作之余可開辟“第二戰場”,讓時間變得有意義;
3)您還可以做得更好,賺更多的鈔票。
工作壓力適中的3位用戶的健康建議分別為:
1)請您保持健康的心態,保持現在的工作步調;
2)車間工作會枯燥,建議休息時看看書調節心情;
3)你可以選擇默默無聞,也可以選擇驚天動地。
工作壓力較重的用戶的健康建議分別為:
1)請正確地認識自己,不要讓辦不到的事壓垮你;
2)學會休息,學會說“不”,學會滿足,避免成為一個完美主義者;
3)工作狂,請多陪陪家人,順便放松自己。
通過以上推薦建議內容可知本分組算法的效果良好,適當地將工作壓力程度相似的用戶分組,相似分組用戶間對于工作壓力輔導健康建議具有可相互推送性,從而在功能性和可實施性的角度完成了用戶分組的測試。
4結束語
基于位置信息的服務已融入到人們的生產生活中,各種健康養生推薦服務已成為研究熱點。針對有限醫療資源條件下如何實現用戶的個性化健康建議推薦服務問題,本文提出了一種利用已記錄的用戶移動軌跡數據信息實現移動醫療環境下的個性化推薦算法,將已有的心理健康建議推薦給具有相似工作環境與工作壓力的用戶,提高了推薦效率,大幅縮減了由人工填寫心理健康建議的代價。算法測試與分析結果表明技術方案的有效性和可實施性。但原型系統實際應用過程中諸多亟待解決的問題還需進一步深入研究,如用戶工作類型如何更精確化地定位;如何引入用戶其他行為信息因素優化推送對象等。
參考文獻:
[1]謝幸, 鄭宇. 基于地理信息的用戶行為理解[J]. 計算機學會通訊, 2008, 4(10): 13-21.
XIE Xing, ZHENG Yu. User behavior understanding based on geographic information[J]. Computer society news-letter, 2008, 4(10): 13-21.
[2]ZHANG Chengyang, ZHENG Yu, XIE Xing. Map-matching for low-sampling-rate GPS trajectories[C]//Proceedings of ACM SIGSPATIAL Conference on Geographical Information Systems. Seattle, Washington, USA, 2009: 213-221.
[3]YE Yang, ZHENG Yu, CHEN Yukun, et al. Mining individual life pattern based on location history[C]//Proceedings of the International Conference on Mobile Data Management. Taipei, China, 2009: 36-39.
[4]LOU Yin, ZHANG Chengyang, ZHENG Yu, et al. Map- matching for low-sampling-rate GPS trajectories[C]//Proceedings of ACM SIGSPATIAL Conference on Geographical Information Systems. Seattle, Washington, USA, 2009: 69-102.
[5]YE Yang, ZHENG Yu, CHEN Yukun, et al. Mining individual life pattern based on location history[C]//Proceedings of the International Conference on Mobile Data Management. Taipei, China, 2009: 46-50.
[6]ZHENG Yu, LIU Like, WANG Longhao, et al. Learning transportation modes from raw GPS data for geographic application on the web[C]//Proceedings of the 17th International Conference on World Wide Web. Beijing, China, 2008: 45-49.
[7]ZHENG Yu, LI Quannan, CHEN Yukun, et al. Understanding mobility based on GPS data[C]//Proceedings of ACM Conference on Ubiquitous Computing. Seoul, Korea, 2008: 26-31.
[8]ZHENG Yu, CHEN Yukun, LI Quannan, et al. Understanding transportation modes based on GPS data for Web applications[J]. ACM transactions on the Web, 2010, 4(1): 1-36.
[9]ZHENG Yu, ZHANG Lizhu, XIE Xing, et al. Mining interesting locations and travel sequences from GPS trajectories[C]//Proceedings of International Conference on World Wild Web. Madrid, Spain, 2009: 121-125.
[10]LI Quannan, ZHENG Yu, CHEN Yukun, et al. Mining user similarity based on location history[C]//Proceedings of ACM SIGSPATIAL Conference on Geographical Information Systems. Irvine, CA, USA, 2008: 127-131.
[11]ZHENG Yu, ZHANG Lizhu, XIE Xing. Recommending friends and locations based on individual location history[J]. ACM transactions on the Web, 2009, 3(2): 16-21.
[12]ZHENG Yu, ZHANG Lizhu, XIE Xing. Mining correlation between locations using human location history[C]//Proceedings of ACM SIGSPATIAL Conference on Geographical Information Systems. Seattle, Washington, USA, 2009: 145-151.
[13]王德起, 許菲菲. 基于問卷調查的北京市居民通勤狀況分析[J]. 城市發展研究, 2010, 17(12): 98-105.
WANG Deqi, XU Feifei. A study on the commuting problems in Beijing-based on the investigation to the citizens of Beijing[J]. Urban development studies, 2010, 17(12): 98-105.
[14]賈曉朋, 孟斌, 張媛媛. 北京市不同社區居民通勤行為分析[J]. 地域研究與開發, 2015, 34(1): 55-59.
JIA Xiaopeng, MENG Bin, ZHANG Yuanyuan. Analysis of the residents commuting behavior in different communities in Beijing city[J]. Areal research and development, 2015, 34(1): 55-59.
[15]Microsoft Research Asia. GeoLife data set[DB/OL]. Beijing: Microsoft Research Asia, 2012. (2012-08-09)[2015]. http://research.microsoft.com/en-us/downloads/b16d359d-d164-469e-9fd4-daa38f2b2e13/default.aspx.
[16]LI Quannan, ZHENG Yu, XIE Xing, et al. Mining user similarity based on location history[C]//Proceeding of the 16th ACM SIGSPATIAL International Conference on Advances in Geographic Information Systems. New York, NY, USA, 2008: 1-10.
[17]ZHENG Yu, ZHANG Lizhu, MA Zhengxin, et al. Recommending friends and locations based on individual location history[J]. ACM transactions on the Web, 2008, 5(1): 5-44.
[18]XIAO Xiangye, ZHENG Yu, LUO Qiong, et al. Inferring social ties between users with human location history[J]. Journal of ambient intelligence and humanized computing, 2014, 5(1): 3-19.
[19]GIANNOTTI F, NANNI M, PEDRESCHI D, et al. Trajectory pattern mining[C]//Proceedings of the 13rd ACM SIGKDD Conference on Knowledge Discovery and Data Mining. San Jose, CA, USA, 2007: 330-339.

陳萬志,男,1977年生,副教授,博士計算機學會會員,主要研究方向為人工智能、計算機過程控制、物聯網應用、WebGIS等。

林澍,男,1990年生,碩士研究生,主要研究方向為人工智能、物聯網應用。
Personalized recommendation algorithm of health advice based on the user’s mobile trajectory
CHEN Wanzhi1, LIN Shu1, WANG Li2, LI Dongmei2
(1. School Electronics and Information Engineering, Liaoning Technical University, Huludao 125105, China; 2. China Petroleum Liaohe Equipment Company, Panjin 124010, China)
Abstract:Mobile medical applications have become a hotspot in research with the popularization of mobile intelligent terminals. In response to the problem of personalized recommendation of health advice in the mobile medical environment, a similarity calculation method based on stagnation region eigenvector and user occupation eigenvector was proposed according to the similarity characteristics of users' mobile trajectory and occupation. The sharing of information about the suggestion of health in a group was completed by constructing similar user groups. Thus, personalized health recommendation services were provided for users with limited medical resources. Results showed the effectiveness and implementation of the algorithm, which has a broad application prospect and practical value in large data analysis and mobile medical application.
Keywords:mobile medical; large data analysis; mobile trajectory; feature vector; personalized recommendation
作者簡介:
中圖分類號:TP311
文獻標志碼:A
文章編號:1673-4785(2016)02-0264-08
通信作者:陳萬志. E-mail:chenwanzhi@lntu.edu.cn.
基金項目:遼寧省高等學校杰出青年學者成長計劃(LJQ2013038);遼寧工程技術大學博士基金項目(2015-1147).
收稿日期:2015-11-25. 網絡出版日期:2016-03-15.
DOI:10.11992/tis.201511026
網絡出版地址:http://www.cnki.net/kcms/detail/23.1538.TP.20160315.1239.010.html