999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于旅客社交網絡中的家庭出行預測

2016-03-24 02:43:51張玉桃
現代計算機 2016年8期
關鍵詞:分類特征

張玉桃

(北京交通大學計算機與信息技術學院,北京 100044)

基于旅客社交網絡中的家庭出行預測

張玉桃

(北京交通大學計算機與信息技術學院,北京 100044)

家庭是客運市場最常見的消費單元之一。如果能夠對家庭單元在未來一段時間是否出行做出準確的預測,將有助于客運、旅游等相關行業為家庭旅客提供個性化的服務和相關產品推薦。預測一個家庭在未來一段時間是否會出行是一個分類問題。構建家庭的人口統計學特征、歷史行為特征以及預測時間窗口特征作為分類屬性,使用多種分類算法進行家庭出行的預測。還構建基于共同出行關系的旅客社交網絡,通過構建家庭成員的社交網絡屬性來進一步描述家庭特征。在一個旅客歷史數據集上進行實驗,取得了較好的效果。

旅客社交網絡;家庭出行;行為預測

0 引言

家庭是社會的基本單位,也是客運領域中最常見的出行消費單元之一。由于家庭出行受到時間、經濟等多種因素的影響,因此家庭出行呈現出不確定。如果能夠準確地預測出家庭在一個時間段內是否出行,將有助于客運、旅行社、酒店等服務行業為家庭提供個性化的出行服務或產品推薦[1]。例如客運公司可以為家庭預留相鄰座位以提高旅客的滿意度;旅行社可以根據家庭的出行習慣為家庭推薦適合的旅行線路等。此外,本研究還可以為相關組織或者政府提供決策支持。例如當地政府可以參考前來旅游的家庭模式(夫妻旅游、親子旅游)來開發相應的旅游產品,完善基礎設施[2]和調整目的地意象(Destination Image)[3]等以促進當地經濟發展。

與此同時,客運企業信息化水平的提高使得其積累的海量旅客信息和歷史出行信息得以有效利用,為我們從中發現家庭的出行特征提供了有效地途徑,為預測家庭出行提供了充分的條件。我們從旅客的歷史出行記錄中提取了旅客間的共同出行關系,構建了旅客社交網絡。圖1給出一個簡單的旅客社交網絡及家庭團體示例,括號中的文字分別代表對應旅客的性別(F代表女、M代表男)、年齡和出行總次數,邊上數字代表旅客間共同出行次數,紅色實線代表家庭關系,藍色點線代表同事關系,綠色虛線代表朋友關系。該圖反映了旅客社交網絡中的旅客間關系以及家庭內部關系。

圖1 一個簡單的旅客社交網絡及家庭團體示例

1 基本思想

Smart和Neale[4]認為家庭旅游就是屬于家庭行為的一種,而家庭旅游行為是為了創造一種家庭觀念,也就是說擁有一種作為統一的、穩定的和有愛的家庭的共同認知。Nick Johns和Szilvia Gyimóthy[5]以后現代家庭旅游經歷為研究對象,將家庭旅游定義為由家庭成員共同參與,并在度假過程中相互影響的活動。Peercy和McCleary[6]則認為,近年來由于家庭結構的變化,部分家庭旅游是由(外)祖父母與孫子(女)同行,有部分家庭旅游是由一對夫婦與孩子及(外)祖父母三代同行,有的是父母雙方帶孩子出游或父母單方(單親父母)與孩子同行。綜合以上研究,本文設定,家庭出行是指由全部或部分家庭成員參與的,從出發地向目的地移動的交通行為。

只有預測一個時間段內的家庭出行才有實際意義。因此,要預測家庭出行,首先要確定預測時間窗口。本研究將選取一個月為預測時間窗口。即給定一個當前日期,利用當前日期之前一年的歷史出行記錄來預測未來一個月內家庭是否會出行。

把家庭出行預測問題定義為一個傳統的分類問題。我們構造了一系列的特征屬性來描述家庭,包括家庭人口統計學特征(例如家庭人口數、不同年齡段的小孩個數等)、家庭歷史出行特征(例如家庭出行次數、累計出行里程等)、家庭成員歷史出行特征(例如家庭成員出行次數、家庭成員節假日出行次數等)、預測時間窗口特征(例如是否有節假日、節假日長度等)等,然后利用這些特征訓練分類器。然而,僅僅利用以上這些特征屬性對家庭出行進行預測是遠遠不夠的。因為不同的家庭在一些特征上的表現是相似的。

因此,我們從旅客歷史出行信息中提取旅客間的共同出行關系,構建一種特定類型的大規模旅客社交網絡。該網絡可以在某種程度上反映旅客之間的社會關系。我們利用旅客間的社會關系來設計描述不同家庭的特征屬性。一個家庭的出行在一定程度上可能會受到在周圍社會關系的影響,而且關系強度不同,影響效果也不同。

2 問題定義

本節中,我們將給出一些必要的定義,并對要研究的問題形式化。

定義1:旅客社交網絡旅客社交網絡用于表示旅客間的關系和強度。可以符號化為G={V,E},其中,V表示所有節點的集合,pi表示一個旅客,且pi∈V;E表示網絡中所有的邊的集合,每條邊代表旅客間的社會關系。

定義2:家庭旅客網絡中的家庭是指同屬于一個社會家庭的部分或者全部旅客集合。可以定義如下:CF=(VF,EF),其中VF是家庭成員集合,且VF∈V;EF家庭成員間關系的集合,且EF∈E。

定義3:旅客個體屬性及出行記錄集合家庭旅客出行記錄集合是家庭旅客出行信息總和。可以符號化為RP={V,AV,AVH},其中,V表示所有旅客個體的集合;AV表示旅客個體自身屬性的集合,例如年齡、性別等;AVH表示旅客歷史出行記錄的結合,例如歷史出行次數、累計出行里程等。

定義4:家庭屬性及出行記錄集合家庭出行記錄集合是指家庭中兩個或兩個以上的旅客出行的家庭出行信息總和。可以符號化為RF={CF,AC,ACH},其中,CF表示家庭的集合;AC表示家庭自身屬性的集合,例如家庭人口數,各年齡段小孩的個數等;ACH表示家庭歷史出行記錄的結合,例如家庭歷史出行次數,累計出行里程等。

與德國漢斯-賽德爾基金會等國外機構就土地整理與空間規劃問題進行國際研討,達成青州市南張樓區域發展項目執行協議。圖為德國專家為南張樓村題詞。

問題1:如何預測家庭在未來的一個時間窗口是否出行:在構建了旅客社交網絡G={V,E}之后,可以獲得家庭出行特征屬性集A={AB,AG,W},其中AB表示家庭的基本屬性集合,包括家庭人口數、各個年齡階段的小孩個數等的自然屬性,也包括飛行次數,飛行里程等的歷史行為屬性等;AG表示家庭中旅客網絡關系屬性集合,包括家庭旅客與其他旅客間關系、家庭旅客所在社交網絡結構等。W表示預測時間窗口的屬性,包括是否有節假日,節假日的長度等。根據特征屬性值,我們可以設計預測家庭是否出行的函數,通過計算函數值來預測家庭是否會出行(函數結果只有兩種取值,0為不出行,1為出行),其預測函數如下:

為了方便后續描述,表1列出了本文所用的相關記號。

3 方法

要解決家庭出行預測這個分類問題,需要構建家庭的特征屬性來描述家庭。首先構造家庭的基本屬性,包括人口統計學特征,家庭人口單人出行特征,家庭出行特征和預測時間窗口特征。由于基本屬性不能全面準確描述不同類型的家庭,我們構造了旅客社交網絡,來構建家庭的網絡屬性,更加全面地對旅客團體進行描述。

表1 本文用到的記號

民客運商的旅客信息系統中記錄了旅客的所有歷史出行記錄。每條記錄記載了一個旅客組g一起購票和出行事實。我們根據出行記錄中的旅客共同購票和出行行為,構建旅客社交網絡,該網絡從某個側面反映了旅客之間的真實社會關系。

給定一個出行記錄集合S={gn},我們通過從每個旅客組gn中抽取共同出行關系來得到旅客社交網絡G=(V,E),如算法1所示。

算法1:構建旅客社交網絡

(1)基本屬性

基本屬性集的特征屬性屬于實際存在的事實,我們通過分析不同性質的家庭可能存在的客觀差異,結合社會學相關方面的知識,構造出家庭人口統計學特征、家庭成員歷史行為特征、家庭歷史行為特征以及時間窗口特征四個方面的特征屬性。

人口統計學特征是基于旅客的靜態屬性(比如年齡、性別、籍貫、姓氏等)的統計特征,表2列出了影響家庭出行的部分人口統計學特征。

表2 部分人口統計學特征

我們構造了一系列家庭成員歷史出行行為特征,如表3所示。

對于家庭整體的歷史出行行為,構造了如表4所示的特征。

表3 部分家庭成員旅行特征

表4 家庭整體旅行特征

時間窗口特征用來反映要預測的時間段的特點,如是否有節假日,節假日的天數以及旺季淡季等,如表5所示。

表5 部分預測時間窗口特征

(2)網絡屬性

本文中考慮了幾種常見的邊的網絡結構特征,其形式化描述如表6所示。

表6 基于網絡的特征

分類算法是解決分類問題的方法,通過對已知類別訓練集的分析,從中發現分類規則,以此預測新數據的類別。單一的分類方法主要包括:決策樹、貝葉斯、決策表等;另外還有用于組合單一分類方法的集成學習算法,如Bagging算法等。

本文我們將使用C4.5決策樹、隨機森林、貝葉斯網絡、DecisionTable和Bagging五種傳統分類算法進行家庭在預測時間窗口內的出行預測。

4 實驗

家庭的出行預測可以應用于多種交通領域。我們從某客運商采集一個旅客歷史出行數據集對家庭出行進行預測。

我們采集的數據集包含家庭旅客信息和家庭信息兩個部分。其中家庭旅客信息包括家庭旅客匿名ID、性別和年齡等;家庭信息包括家庭ID、家庭人口數、家庭出行時間等。其中含有4510名旅客,1510個家庭。

給定一個當前日期和一個預測時間窗口,我們使用前一年的出行記錄,預測家庭在預測時間窗口內是否會出行。我們標注了16832個樣本,其中正樣本14739個,負樣本2093個。

在實驗中,我們采用邏輯回歸和隨機森林的分類方法。分類過程中進行十重交叉驗證。分別用準確率、召回率指標對兩種方法進行評測。設TP、TN、FP和FN分別表示正確預測家庭出行的家庭數量、正確預測家庭不出行的家庭數量、錯誤預測家庭出行的家庭數量以及錯誤預測家庭不出行的家庭數量,則:

實驗結果列舉如下:

表7 各種分類方法分類結果

由以上的實驗結果可以看出,使用貝葉斯網絡分類準確率為78.4%,使用決策表分類的準確率為88.7%(提高了10.3%),為了更好地比較幾種方法的分類效果,圖2分別給出了它們的ROC曲線,從圖中可以明顯看出在預測家庭出行問題上,決策表分類算法要優于其他幾種分類方法。

5 結語

本文提出了一種依靠數據挖掘中分類手段來預測家庭是否出行的方法。通過旅客出行記錄中家庭旅客出行信息以及家庭出行歷史數據,構建分類的特征屬性。為了更加全面的描述家庭,本文還通過旅客歷史記錄,構建了旅客社交網絡,利用該網絡反映的旅客間關系,構建了反映旅客出行關系的網絡屬性。基于這些屬性,在一個旅客歷史數據集上做了實驗。實驗結果表明,我們所提出的方法可以有效地預測旅客社交網絡中的家庭是否出行。

圖2 分類方法ROC曲線

[1]R.Nicole,J.Carlson,P.J.Rosenberger.Factors Affecting Group-Oriented Travel Intention to Major Events[J].Journal of Travel Tourism Marking,2012,29(2):185-204.

[2]S.I.So,X.Y.Lehto.The Situation Influence of Travel Group Composition:Contrasting Japanese Family Travelers with Other Travel Parties[J].Journal of Travel Tourism Marketing,2007,20:79-91

[3]S.Pike,C.Ryan.Destination Positioning Analysis Through a Comparison Of Cognitive,Affective,Conative Perceptions[J].Journal of Travel Research,2004,42:333-342.

[4]Neale B,Smart C.Agents or Dependants:Struggling to Listen to Children in Family Law and Family Research[M].Centre for Research on Family,Kinship&Childhood,Department of Sociology and Social Policy,University of Leeds,1998.

[5]Johns N,Gyimóthy S.Postmodern Family Tourism at Legoland[J].Scandinavian Journal of Hospitality and Tourism,2003,3(1):3-23.

[6]Peercy M A,Mccleary K W.The Impact of the Year-Round School Calendar on the Family Vacation:An Exploratory Case Study[J]. Journal of Hospitality&Tourism Research,2011,35(2):147-170.

[7]Zalatan A.Wives Involvement in Tourism Decision Processes[J].Annals of Tourism Research,1998,25(4):890-903.

[8]Iso-Ahola S E.Toward A Social Psychological Theory Of Tourism Motivation:A Rejoinder[J].Annals of tourism research,1982,9(2): 256-262.

[9]X.Y.Lehto,Y.-C.Lin,Y.Chen.Family Vacation Activities and Family Cohesion[J].Journal of Travel&Tourism Marketing,2012,29: 835-850.

[10]María José Barlés-Arizón,Elena Fraj-Andrés,Eva Martínez-Salinas.Family Vacation Decision Making:The Role of Woman[J].Journal of Travel&Tourism Marketing,2013,30:873-890.

[11]Y.Lin,H.Wan,R.Jiang,Z.Wu,X Jia.Inferring the Travel Purposes of Passenger Groups for Better Understanding of Passengers[J]. IEEE Transactions on Intelligent Transportation System,2014.DOI:10.1109/TITS.2014.2329422.

[12]D.Jensen,J.Neville,and B.Gallagher.Why Collective Inference Improves Relational Classification[J].Proc.10th SIGKDD,2004,pp. 593-598

[13]S.A.Macskassy and F.Provost.Classification in Networked Data:A Toolkit and a Univariate Case Study[J].Mach.Learn.Res.vol.8. pp.935-983,2007.

[14]R.Kumar,J.Novak,and A.Tomkins.Structure and Evolution of Online Social Networks[J].Proc.12th SIGKDD,2006,pp.611-617.

[15]A.Mislove,M.Marcon,K.P.Gummadi,P.Druschel,and B.Bhattacharjee.Measurement and Analysis of Online Social Networks[J]. Proc.in 7th IMC,2007,pp.29-42.

Predicting the Family Travels Based on Passenger Social Networks

ZHANG Yu-tao

(School of Computer and Information Technology,Beijing Jiaotong University,Beijing 100044)

Family passenger groups are one of the most popular travel consumption units in the passenger transportation market.If we can make an accurate forecast that if a family will travel over the next period of time,it will help the passenger transportation,tourism and other related industries to provide personalized products or services for families.Family travel prediction is defined as a classification problem. The solution is constructing family’s demographic characteristics,historical behavior characteristics and predicting time window features for a classifier to forecast family travels.We also construct passenger social networks by extracting co-travel relations between passengers from their historical travel records and generate the social network features of family members to further describe the family characteristics.Experiments on a historical passenger travel data set show the efficiency of our method.

Passenger Social Networks;Family Travel;Travel Prediction

1007-1423(2016)08-0025-06

10.3969/j.issn.1007-1423.2016.08.005

張玉桃(1990-),女,山東泰安人,碩士,研究方向為數據挖掘、機器學習

2015-12-30

2016-02-28

猜你喜歡
分類特征
抓住特征巧觀察
分類算一算
垃圾分類的困惑你有嗎
大眾健康(2021年6期)2021-06-08 19:30:06
新型冠狀病毒及其流行病學特征認識
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
分類討論求坐標
數據分析中的分類討論
教你一招:數的分類
抓住特征巧觀察
主站蜘蛛池模板: 丁香六月激情综合| 欧洲精品视频在线观看| 在线观看免费国产| 综合色亚洲| 中文字幕第4页| 国产高潮流白浆视频| 亚洲国产精品无码AV| 亚洲无码37.| 免费三A级毛片视频| 无码免费视频| 天堂av综合网| 美女高潮全身流白浆福利区| 在线精品自拍| 久久黄色毛片| 国产精品亚洲综合久久小说| 国产波多野结衣中文在线播放| 99精品影院| 久久频这里精品99香蕉久网址| 亚洲手机在线| 亚洲国产系列| 成年人午夜免费视频| 国产一二三区在线| 久久综合五月| 97国产在线观看| 伊人久久婷婷| 99无码中文字幕视频| 亚洲天堂成人在线观看| 亚洲精品免费网站| 精品综合久久久久久97超人该| 午夜人性色福利无码视频在线观看| 天堂在线www网亚洲| 色综合热无码热国产| 亚洲av无码片一区二区三区| 国产91无码福利在线| 亚洲天堂网视频| 一级毛片a女人刺激视频免费| 国产成人综合日韩精品无码首页| 国产乱子伦视频三区| 国产精品免费福利久久播放| 另类欧美日韩| 天堂亚洲网| 精品人妻无码中字系列| 欧美成人精品高清在线下载| 波多野结衣一二三| 日韩精品高清自在线| 亚洲va精品中文字幕| 国产95在线 | 亚洲区一区| 亚洲欧洲天堂色AV| 72种姿势欧美久久久大黄蕉| 国产一区二区三区视频| 九九热视频在线免费观看| 日韩无码白| 国产精品成人一区二区不卡| 2024av在线无码中文最新| 亚洲第一区欧美国产综合| 天堂av高清一区二区三区| 国产99视频精品免费视频7| 欧美无专区| 亚洲有码在线播放| 国产午夜福利片在线观看| 一级毛片在线播放免费观看| 国产成人亚洲精品色欲AV| 国产激情无码一区二区APP| 国产jizzjizz视频| 亚洲一区二区视频在线观看| 亚洲香蕉久久| 亚洲综合专区| 日韩毛片免费视频| 国产视频一二三区| 真实国产乱子伦高清| 特黄日韩免费一区二区三区| 欧美三级不卡在线观看视频| 久久人人爽人人爽人人片aV东京热| 亚洲人成网站日本片| 22sihu国产精品视频影视资讯| 中文字幕在线观看日本| 午夜欧美理论2019理论| 欧美不卡视频在线| 国产97公开成人免费视频| 亚洲高清在线天堂精品| 成人毛片在线播放|