俞昊辰
隨著來華人數日益增多,為了更好地服務外來入境人員和最大化自身利益,中國相關產業部門對獲得外來人群的特征信息的訴求愈加強烈。本文依托對2015年來華外國游客的統計數據,利用數理統計方法,獲取甄別外來入境人員的特征信息,從而為我國相關產業部門的人士分析行情提供參考。
在經濟全球化的大環境下,每年來到中國的外國人群數以萬計,外來人員的年齡層也日趨多元化,由單一的中青年人群,發展到如今各年齡段并存的狀態。隨著中國與周邊國家的合作日趨增多,雙方簽訂的貿易工程逐漸落實,我國現今已與包括荷蘭在內的多個國家互通鐵路,坐火車來到中國已成為了一種新的出國方式。與此同時,年輕人熱衷于輕旅行,旅行“輕”文化掀起了全球范圍內背包游的熱潮,人們開始廣泛涉足徒步旅游與自駕旅游領域,出行的交通方式已不再是從前普遍的航空水運體系的單一向壟斷。出行方式的新奇多樣,給我國交通部門以及旅游局帶來了難題。在大數據的時代下,如何從海量的出行方式信息里,甄別各國游客的旅游特征亟待解決。
一、直觀評價入境外國游客特征
1.年齡段上,25~64歲這個人群段的外國游客最多。由于這個年齡段的人群大多是處于事業期,我們可以粗略地認為2015年大部分外來游客都屬于工作人士,來華很有可能是拓展業務的需要,或者是簽訂相應的外事合同。
2.性別上,男女比例近乎2:1。然而這是全球男女比例以及就業男女比例等因素共同作用的結果,是一個宏觀上已經成型的結果,并非我們所希望的由于旅游因素而所導致的差異,諸如男女人數相近、女多男少此類。因此,本文在此推測,性別因素對特征化入境外國游客信息的影響不顯著。
3.出行方式上,徒步所占比例尤為高。然而,傳統的船舶和飛機這兩種方式卻占有率極低,一來對于外國的擁有國際航行許可的輪渡企業與航空企業造成了不小的挑戰,二來也對我國擁有國際航行許可的輪渡企業與航空企業帶來了極大的威脅。
4.來華目的上,“其他”所占比例很高,國家旅游局數據中心并未給出我們其他中包括的具體內容,再此我們不妨假設其為教育和來華務工。出于會議和商務目的來華的人數僅次于“其他”,雖然占有量不如觀光休閑的人數,但是這也印證了我們之前在按年齡段總計的統計分析中的猜想,即工作人士來華比例高。
二、多元方差分析比較差異
基于之前的直觀分析,得到了事業型人士在總成分中占有率大的結果。通過將各洲各年齡段人群數據匯總(以萬人為單位),用樣本均值分別估計四個大洲的期望。假定這四個洲的數據總體均為多元正態總體,并且它們的協方差矩陣相同,根據的估計公式,可以得到改組的威爾克斯統計量= 0.3159573,其分布格式的值為3.895202。由于,所以拒絕原假設,認為各大洲各年齡段均有顯著差異。為了了解這個四個大洲的顯著差異究竟是由哪些年齡段人數引起的,在此對這五類年齡段分別用一元方差分析方法進行檢驗分析。結果顯示單獨對五類人群而言,并無顯著差異。我們只能暫時認為14歲以下、25~44歲與65歲以上這三段人群的數量對整個的顯著差異有一定的影響,其中14歲以下人群的影響最大。
按照上述多元方差分析的方法,分析有:性別上,發現各大洲男女人數所占比例無顯著差異;出行方式上,徒步與其他方式相比而言,差異變動較大;目的上,各大洲來華目的有顯著差異,其中經過一元方差分析再檢驗后,探親訪友的差異性較為顯著。亞洲與歐洲來華探親的少,而美洲與大洋洲來華探親的多,可以認為是移民因素作用的結果。美洲與大洋洲一直是移民熱土,這兩個大洲的人口組成中,移民帶來的人群所占比重不容小覷,尤其是中國,這個人口密度即大的國家,在外國移民人群中,光是在亞洲這個范圍內,就已經占據足夠大的分量。相反地,亞洲與歐洲因服務員工來華的比例相對較少,而美洲與大洋洲因此來華的比例相對較多。

三、主成分分析提取特征成分
用人數所占比例來替換相應的人數,并對此進行主成分分析。
1.年齡段上,根據累積貢獻率,選定主成分。其中只與25-44歲的人群數量成負相關,認為其與青壯年事業人群數成負相關,可以反映青壯年來華的排斥性;反映了本科以上來華留學生的比例。
2.出行方式上,選定主成分反映距離的影響,居住在相對較近的國家的人民會通過水路和自駕來到中國,而相對較遠的則會通過飛機來到中國;反映了徒步旅行在各大洲的推崇度。
3.來華目的上,選定主成分。與會議/商務和服務員工成正相關,而與探親訪友成負相關,我們認為這是個用來鑒別來華旅客身份的主成分。若是屬于會議/商務與服務員工這些含有事業因素的人群,則我們將其認定為無直接親緣關系的外國人,若是屬于探親訪友這一類,則我們認為其是有親緣關系的移民。再上升一個層次,對于商務來華的人員,我們可以認為其是受工作被動而來的。同樣服務員工我們也認為是受指派而來的,是個被動的過程。而探親訪友很明顯是一個主動的過程,所以,我們也將這個主成分判定為表現來華被動性與否的主成分;反映了來華人群的休閑指向,與其成正相關的是觀光休閑和服務員工,與其成負相關的主要是事務類型的目的。
四、特征信息評估與行業發展建議
結合主成分分析內容,得到表1數據,從而可以得到2015年度各洲人群的特征信息如下所示。
1.非洲:多因工作原因來華,部分來華旅游和留學的人崇尚徒步;
2.美洲:非青壯年比例多,多來華探親與旅游;
3.大洋洲:非青壯年比例多,多來華探親與旅游;
4.歐洲:多為來華留學,相對而言事務較多;
5.亞洲:多為來華留學和旅游。
針對不同大洲的人群,給出相關產業發展上的不同的建議,建議如表2所示。
(作者單位:中國石油大學(華東)理學院)