王瑩霞 ,陳 珂 ,劉 滋 ,尚 曉 *
(1.玉林師范學(xué)院 數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,廣西 玉林 537000;2.山東省滕州市第二中學(xué),山東 滕州 277500)
地點(diǎn)是組織地理空間數(shù)據(jù)和人類認(rèn)知的地理環(huán)境表達(dá)方式的重要元素。日常生活中人們習(xí)慣用地名來交流和傳遞信息,但這些信息通常是不精確的。因此,地點(diǎn)的定量表示在地理信息科學(xué)中是一個(gè)重要的問題。以數(shù)字形式記錄的地點(diǎn)空間足跡會(huì)提供顯著的識(shí)別信息,說明空間足跡的定量表示在推斷空間關(guān)系中是有價(jià)值的。在本文中,通過空間部分——整體關(guān)系連接多個(gè)地點(diǎn)來構(gòu)建地點(diǎn)之間的空間層次結(jié)構(gòu),以等級(jí)方式組織空間結(jié)構(gòu)知識(shí)。與此同時(shí)運(yùn)用空間層次對(duì)關(guān)聯(lián)分析和定性空間的推理方法及模糊集理論來揭示地方之間的空間等級(jí)的兩大問題進(jìn)行研究[1,2]。借助FFCA數(shù)據(jù)分析方法來處理不確定信息并自動(dòng)推斷出位置之間的層次關(guān)系,完善以往對(duì)空間層次結(jié)構(gòu)模糊性的忽略和彌補(bǔ)在空間層次結(jié)構(gòu)定量表征形式化的欠缺。我們使用標(biāo)記用戶生成數(shù)據(jù)生成模糊集的足跡,通過用戶原創(chuàng)內(nèi)容中對(duì)興趣點(diǎn)的統(tǒng)計(jì)分析和簽到數(shù)據(jù)的分析來檢測(cè)到該地點(diǎn)的空間層次結(jié)構(gòu)關(guān)系。面對(duì)地方間沒有清晰的邊界問題,模糊集能夠表示空間模糊隸屬度的不規(guī)則變化,使之成為一種有效的模糊空間足跡定量建模方法。下面介紹本文所需要的基本概念,沒有涉及的請(qǐng)參考文獻(xiàn)[4-10]。


在本文研究中主要運(yùn)用模糊集,借助FFCA和數(shù)據(jù)預(yù)處理形成POI點(diǎn)構(gòu)成用戶數(shù)據(jù)生成系統(tǒng),然后運(yùn)用模糊集進(jìn)行空間層次結(jié)構(gòu)分析,最后實(shí)現(xiàn)對(duì)空間層次結(jié)構(gòu)簡(jiǎn)化的目標(biāo),處理地方間模糊的邊界問題。具體可參照文獻(xiàn)[3],可分為三個(gè)步驟:
數(shù)據(jù)預(yù)處理:在本研究中,我們選擇了一種廣泛使用的插值方法——核密度估計(jì),來計(jì)算每個(gè)模糊位置的連續(xù)隸屬函數(shù)。
場(chǎng)所的模糊形式概念分析:重點(diǎn)研究了場(chǎng)所空間背景的定義和表示場(chǎng)所的模糊形式概念的生成。一組由特定的場(chǎng)所的模糊形式語境所組成的空間概念集合,是場(chǎng)所的模糊概念格,即場(chǎng)所空間層次結(jié)構(gòu)。
空間層次簡(jiǎn)化:在FFCA中,由于概念是以數(shù)學(xué)方式生成的,因此屬性稍有差異的對(duì)象將被分類為不同的概念,而格中的概念數(shù)將成倍增長(zhǎng)。由于模糊形式概念格的大尺寸,使得所得到的概念和層次難以在實(shí)際應(yīng)用中使用。因此,將格中相似的空間概念聚為概念簇,并在這些概念的基礎(chǔ)上生成簡(jiǎn)化的空間層次結(jié)構(gòu)。

圖1 江山市仙霞古道區(qū)域圖

圖2 地點(diǎn)的空間層次結(jié)構(gòu)
現(xiàn)今,微信在中國(guó)的廣泛使用,本案例中使用微信的登錄數(shù)據(jù)作為數(shù)據(jù)來源。我們收集了2018年在浙江省江山市仙霞古道發(fā)布的朋友圈。仙霞古道中有14個(gè)點(diǎn)名被我們選為我們的名勝古跡,總共有21753條朋友圈和與此相關(guān)的1085個(gè)POI點(diǎn)。(POI可以由專業(yè)組織和用戶創(chuàng)建,并包含詳細(xì)的地點(diǎn)信息。值得注意的是,一個(gè)POI可以與多個(gè)地名相關(guān)聯(lián),因?yàn)槠渲性S多都是使用多個(gè)地名來描述的;一個(gè)地名通常也與一個(gè)或者一個(gè)以上的POI相關(guān)聯(lián)。)
在這個(gè)案例研究中,我們從登記數(shù)據(jù)中生成了一個(gè)特定的模糊形式背景。通過均勻采樣獲得上下文的點(diǎn)集,地名集是由14個(gè)選擇的地名構(gòu)成的。對(duì)于給定的地名,成員值應(yīng)與相關(guān)的POI相符合,從而成員值更高。我們應(yīng)用基于FFCA的方法來揭示場(chǎng)所的層次結(jié)構(gòu)并且進(jìn)行問卷調(diào)查以驗(yàn)證結(jié)果,相應(yīng)地提出方法。
該方法引入了用于模糊形式概念分析的置信閾值Tp和用于簡(jiǎn)化空間層次結(jié)構(gòu)的相似閾值Ts。在案例研究中,我們?cè)O(shè)置Tp=0.1和Ts=3.2,簡(jiǎn)化的結(jié)果空間層次結(jié)構(gòu)如圖2所示。
理論上,這兩個(gè)閾值可以設(shè)置為[0,1]之間的任何值。隨著閾值的變化,相應(yīng)的格點(diǎn)和簡(jiǎn)化的層次結(jié)構(gòu)也會(huì)發(fā)生變化。格點(diǎn)結(jié)構(gòu)的一些基本指標(biāo)有著不同的Tp點(diǎn)如表1所示。Num(I)、Num(C)和Num(≤)分別為采樣點(diǎn)個(gè)數(shù)、位置概念個(gè)數(shù)和主要位置關(guān)系分別在晶格個(gè)數(shù);Avg(Sim)是地點(diǎn)概念與其較低鄰域概念相似性的平均值;IR稱為繼承豐富度,在這里,它是每個(gè)位置概念的子位置的平均數(shù)量。隨著Tp的增加,由于在構(gòu)造格的過程中忽略了采樣點(diǎn)與拓?fù)涞年P(guān)系,相應(yīng)的格的結(jié)構(gòu)將變得非常簡(jiǎn)單。我們需要選擇一個(gè)閾值Tp從R中去除一些隸屬度較低的關(guān)系,因?yàn)檫@些關(guān)系不那么重要,會(huì)增加計(jì)算量。與此同時(shí),我們應(yīng)該保留足夠的樣本來捕捉這些地方成員值的變化。因此,一個(gè)相對(duì)較低的閾值將是可取的,我們選擇了Tp=0∶1根據(jù)表1。
一些基本指標(biāo)的簡(jiǎn)化層次與不同的Ts(Tp=0∶1)被表示在表3中。同樣,Num(C)、Num(I)分別是概念集群的數(shù)量和集群之間近似層次關(guān)系的數(shù)量。IR表示表3中每個(gè)簇的近似層次關(guān)系的平均數(shù)量。隨著Ts的增加,模糊區(qū)域的簡(jiǎn)化層次結(jié)構(gòu)將更接近于原始網(wǎng)絡(luò),概念聚類的條件將變得更加嚴(yán)格。為了選擇一個(gè)閾值Ts,使簡(jiǎn)化結(jié)果更加合理,我們既考慮了不同Ts下簡(jiǎn)化結(jié)構(gòu)的變化,又考慮了位置概念之間相似性的分布。基于實(shí)驗(yàn)和經(jīng)驗(yàn)知識(shí),選取非零相似度值0.32的第三個(gè)四分位數(shù)作為Ts。

表1 模糊形式格的幾個(gè)基本指標(biāo)具有不同的閾值
選定的14個(gè)地名是廿八都古鎮(zhèn),浮蓋山,戴笠故居,仙霞森林公園,仙霞關(guān),石鼓香溪,松風(fēng)亭,“東南鎖鑰”石碑,浣霞池,天雨庵,霞嶺亭,率性齋遺址,古碉堡遺址,福口亭。地方間簡(jiǎn)化的等級(jí)制度的驗(yàn)證需要豐富的研究場(chǎng)所的本土知識(shí)。圖2顯示了基于FFCA的方法生成的這些地方之間的簡(jiǎn)化空間層次結(jié)構(gòu)。白色的節(jié)點(diǎn)表示案例研究中的研究區(qū)域(即包括本案例研究中所有位置的地方)。在深灰色中的節(jié)點(diǎn)代表要調(diào)查的地方。淺灰色的節(jié)點(diǎn)表示位于所選地點(diǎn)重疊區(qū)域的位置。重疊區(qū)域可以借助它的上級(jí)鄰域的地名,并且可能有自己的地名。
為了驗(yàn)證簡(jiǎn)化的空間層次結(jié)構(gòu)的合理性,我們采用問卷調(diào)查的方法對(duì)這些場(chǎng)所之間的空間關(guān)系進(jìn)行了研究。一百位熟悉仙古道和廿八都古鎮(zhèn)周邊環(huán)境的參加者,要求用確定的一個(gè)空間關(guān)系來描述他們對(duì)任何兩個(gè)地方的看法。要選擇的空間關(guān)系包括根據(jù)RCC-5,五個(gè)基本空間在不考慮區(qū)域間拓?fù)潢P(guān)系的情況下,兩區(qū)域間的拓?fù)潢P(guān)系得到了廣泛的應(yīng)用區(qū)域邊界。它們斷開(DC),部分重疊(PO),相等(EQ),適當(dāng)?shù)牟糠?PP)和適當(dāng)?shù)牟糠帜?PPI)和選項(xiàng)“我不知道”。我們發(fā)現(xiàn)顯然存在著共同的觀點(diǎn),并且地方的簡(jiǎn)化等級(jí)與主要的部分-整體關(guān)系很好的匹配,除少數(shù)幾個(gè)地方外。通過問卷調(diào)查知道,我們的方法將戴笠故居和仙霞古道聚集在一起,而在調(diào)查問卷中有30個(gè)參與者將戴笠故居視為仙霞古道的一部分。有32人認(rèn)為這兩個(gè)地方相鄰,只有5人認(rèn)為戴笠故居和仙霞古道處于同一位置。地圖上這兩個(gè)地方的中心位置不在同一位置。同時(shí),我們注意到仙霞古道與戴笠故居是相互關(guān)聯(lián)的。這就是為什么我們的方法產(chǎn)生的這兩個(gè)地方的概念有很高的相似性。因?yàn)閰⑴c者主要是游客及當(dāng)?shù)鼐用瘢?dāng)?shù)鼐用裰饕≡诠示痈浇谝恍﹨⑴c者對(duì)戴笠故居的看法存在著認(rèn)知偏差。有25人認(rèn)為浮蓋山屬于仙霞古道的一部分,這顯然是錯(cuò)誤的。實(shí)際上,浮蓋山在仙霞古道外圍,與廿八都古鎮(zhèn)毗鄰。在本案例研究的大多數(shù)地方,基于FFCA的方法的結(jié)果與問卷調(diào)查的結(jié)果相當(dāng)一致,從而驗(yàn)證了該方法。
此外,我們還發(fā)現(xiàn),當(dāng)被問及浮蓋山與廿八都古鎮(zhèn)之間的關(guān)系時(shí),超過80%的人不確定。然而,85%的參與者認(rèn)為浮蓋山屬于廿八都古鎮(zhèn),96%的人認(rèn)為廿八都古鎮(zhèn)屬于仙霞古道的一部分。這個(gè)有趣的現(xiàn)象意味著許多人可能不善于表達(dá)多層次的空間知識(shí)關(guān)系。因此,從UGC中揭示地方間的空間層次是對(duì)經(jīng)驗(yàn)認(rèn)知實(shí)驗(yàn)的一種有價(jià)值的補(bǔ)充。
基于FFCA,構(gòu)建我們所調(diào)查的地方之間的次地超級(jí)關(guān)系,并在概念集群中利用這些概念,生成更易讀的地方的簡(jiǎn)化空間層次結(jié)構(gòu)。獲得的場(chǎng)所空間層次結(jié)構(gòu)IDE是一種在不同規(guī)模上組織多個(gè)場(chǎng)所的有效辦法,并能進(jìn)一步討論場(chǎng)所可供性與不同空間層次之間的聯(lián)系。對(duì)于地名的模糊形式概念分析的輸入是抽樣點(diǎn)及其對(duì)應(yīng)的不同地名的隸屬值,我們還可以使用其他用戶生成的數(shù)據(jù)和其他插值方法進(jìn)行認(rèn)知實(shí)驗(yàn)。同時(shí),通過問卷調(diào)查,我們發(fā)現(xiàn)我們構(gòu)建的地方的簡(jiǎn)化空間等級(jí)與參與者的認(rèn)知相對(duì)應(yīng)。為了提取其中包含的空間層次結(jié)構(gòu),地理標(biāo)記的UGC更能夠作為合適的數(shù)據(jù)源進(jìn)行實(shí)驗(yàn),其數(shù)據(jù)內(nèi)容涵蓋了不同的地方、地方間的空間等級(jí)、各地方的集體意識(shí),從而更貼近日常生活,且購(gòu)置成本較低,數(shù)據(jù)的處理更快。
顯然,UGC不可避免的存在弊端。不同地方的人對(duì)于不同地方的看法也不同。因此,在除去用戶隱私保護(hù)限制的前提下,我們將使用不同類型的UGC,結(jié)合其不同的特征,對(duì)異構(gòu)數(shù)據(jù)進(jìn)行匯集與分析,從而減少偏差。