牛成英 張穎 閆新宇



摘要:結合人口統計數據、POI數據、土地利用數據以及遙感影像數據,對公共醫療服務設施選址問題進行分析,提出通過熵權法綜合空間可達性水平和隨機森林選址推薦度計算空間區域選址推薦得分的計算方法。研究結果表明:兼顧設施供給能力、常住與流動人口醫療需求,兼顧資源分布與公共設施公平性,融合空間可達性和選址推薦度計算醫療設施推薦指數更能表現現有醫療資源的覆蓋與缺失情況。最后以該方法分析蘭州市主城區域內醫療資源配置合理性作為實證。該方法可為其他區域和其他類公共設施選址相關研究提供參考依據和理論基礎。
關鍵詞:多源數據;空間可達性;隨機森林;熵權法;選址推薦;醫療設施布局優化
中圖分類號:TU984文獻標志碼:A文章編號:1673-5072(2024)03-0302-09
醫療設施作為基本公共服務設施的重要主體,其布局既要滿足公平性,使得居民能夠均衡、平等地享受醫療服務,又要保證設施有較高利用率,不浪費公共資源。基于多源數據的醫療設施布局優化,意圖在融合地理信息數據、政府統計數據、反映居民生產生活的各類居民行為數據基礎上,從多視角更準確地探索醫療設施分布規律,更科學地分析其配置合理性并提出針對性解決方案,更好地平衡居民醫療需求與設施資源利用率。
可達性是衡量醫療設施公平性的重要指標,均衡的可達性水平是實現空間公正的基礎。設施可達性根據設施服務能力和用戶潛在需求刻畫設施的服務潛力[1]。常用的可達性測量方法根據網絡特征的差異分為兩類:(1)拓撲網絡,有基于矩陣的拓撲法,通過整體可達性矩陣與最短距離矩陣運算來獲取節點和網絡的可達性水平[2];(2)幾何網絡,主要有距離法、累積機會法、等值線法、引力模型法、概率法、頻率法、平衡系數法、時空法、效用法等[3]。距離法使用“距離越小”作為可達性越好的唯一指標,在距離法基礎上發展的累積機會法和等值線法,通過交通出行便捷程度來衡量可達性水平,均未考慮各點間的相互作用及空間效應隨距離衰減等因素。引力模型及其延伸出的概率法和頻率法,較全面地考慮了影響可達性的多種因素,但在參數定義上存在主觀性,并且對不同需求點之間的相互競爭以及閾值設置等方面考慮不足[4]。兩步移動搜索法(2SFCA)在引力模型中加入“空間閾值”的概念,從公共空間獲得機會累計值來衡量其可達性,能更好地識別出可達性低值區,并且在實際使用過程中可以根據需求引入基尼系數[5]、高斯衰減函數[67]、多元交通模式[8]等進行改進。總結已有文獻發現,現有研究大多數仍是基于地理對象間的歐式距離來度量是否空間可達,且較少考慮人口規模產生的影響。
醫療設施的利用率由于數據限制難以直接量化,但得益于互聯網技術的發展,研究者可以從居民行為數據以及周邊其他類設施布局中對其進行挖掘。早期的設施布局優化問題與Weber問題類似,都是從選址的角度通過構建最優化模型來解決。城市高速發展期內,醫療設施布局策略處在“保量”階段,主要通過新建設施滿足城市擴張人口涌入帶來的醫療需求。但近年來,醫療設施布局已從“保量”過渡到“保質”階段,逐步進入精細化研究,布局策略轉向關注資源分配合理性,醫院等級帶來的可達性差異或醫療資源強弱帶來的吸引力差異以及不同地理條件下居民所處的空間位置等因素進入研究視野,研究者逐漸關注總量達標但局部“供不應求”或“供過于求”的現象,醫療設施優化策略轉向如何最大化現有醫療資源的服務能力[6,910]。隨著大數據與機器學習算法被廣泛應用于最優化問題,研究者也將它們引入了選址規劃研究中[8,1112]。但總結當前研究,基于空間可達性的醫療設施選址和布局優化,大多只基于居民居住區數據和醫療設施數據,單一考慮醫療設施與需求點間的空間距離和供需關系,不關注醫療設施外的其他各類設施與醫療設施間的相互影響以及暗含的流動人口和醫療設施利用率信息[1314],一定程度上無法契合城市現狀。
考慮融合普查數據中的常住人口信息和人文活動相關的全類別POI數據信息,綜合人與設施間的供需關系、設施間的相互影響以及人口活動暗含的設施利用情況,并在空間上將研究區域網格化處理,縮小研究單元人口規模差異帶來的影響,結合“空間可達性水平”和“隨機森林推薦度”分析醫療資源配置合理性,一方面可以融合多源數據,由數據驅動減少人為干涉,另一方面綜合多方因素進行判斷并設計優化方案,能在滿足居民醫療需求的同時最大化醫療資源利用率。
1研究方法
醫療設施布局以人為本,本文基于各類建筑物位置及人流量進行研究,融合遙感影像數據、POI數據、土地利用數據以及人口統計數據,將研究區統一劃定為邊長500 m的網格對公共醫療服務設施選址問題進行分析,并結合土地利用情況給出優化建議。具體運用以下方法。
1.1 空間可達性水平測度2SFCA從供需關系變動的角度對設施空間可達性進行評價,操作過程可以概括為同時考慮“供給”和“需求”進行兩次搜索的過程。為了體現空間距離增加導致的供需能力下降,選用高斯混合函數改進2SFCA來描述該衰減現象,輸出所有網格在空間距離上的可達性水平。
第一步,以供給為中心,服務極限距離d0為半徑建立搜索域,計算供需比Rj。
式中:G(dkj)為考慮空間摩擦問題的高斯衰減函數,G(dkj)=e-0.5×(dkjd0)2-e-0.51-e-0.5, j∈(1,2,…,m)為供給點,k∈(1,2,…,n)為需求點, dkj為供需距離,且dkj<d0,Sj為設施供給水平總量,Dk為每個人口柵格中的人口數量。
第二步,以需求為中心,服務極限距離d0為半徑建立搜索域,將域內供給設施的供求比加和得到基于距離關系的空間可達性水平SAk:
1.2 隨機森林選址推薦度隨機森林是基于決策樹構建得到的集成學習方法,適用于解決高維非線性分類問題,能處理大量輸入數據并有效避免過擬合,利用此方法基于全類別POI數據,輸出所有網格醫療設施選址推薦度[15]。
研究區內POI數據集U={U1,U2,…,Un},對應分類標簽集X={T;O1,O2,…,Oj},其中T為目標設施。設定屬性A={A1,A2,…,Ak},通過遍歷樣本信息熵h(X)和各類標簽信息增益g(X,A),實現信息增益最大化。通過遞歸、迭代構建決策樹模型hi(X),利用Bootstrap重抽樣方法抽取多個樣本,l輪訓練后得到分類模型序列{h1(X),h2(X),…,hl(X)},對分類結果采用簡單多數投票法,最終得到隨機森林選址推薦度SRk。
式中:H(X)=argmaxT∑li=1I(hi(X)=T),Ck(H(X))為全部分類器個數,Ck(Hh(X)=T(X))為T標簽下分類器個數。
1.3 醫療設施選址推薦指數SAk來源于人口數據,代表常住人口的醫療需求滿足程度,其數值越高表明現有醫療資源越充足,相應網格的選址推薦指數越低。SRk來源于POI數據,代表著流動人口的醫療需求,其數值越高表明當前醫療資源需求越高,相應網格推薦指數越高。
兩類數值從不同角度描述了同一網格的醫療資源現況。本文對同一網格同時考慮SAk和SRk,利用熵權法根據數據離散程度計算兩者的指標權重ω1、ω2,對標準化后的SAk*和SRk*線性加權,計算最終選址推薦指數。
式中:k∈(1,2,…,n)為網格點,Zk表示同時考慮“需求”和“需求滿足度”后,每個網格建議擁有醫療設施的可能性大小,其值越高表明該網格內應該配備更多的醫療資源。
2實證分析——以蘭州市主城區為例
2.1 研究區域與數據處理
2.1.1研究區域
本文關注蘭州市的醫療設施資源分配情況,考慮數據可獲得性和人口密度,選取城關、七里河、西固和安寧4個行政區代表的主城區作為研究區域(圖1)。研究區域行政邊界矢量數據從全國地理信息資源目錄服務系統中下載分割得到,以街道為最小行政區域單位。
由圖1可以看出,研究區域地形整體呈現依山傍水態勢,黃河自西向東穿城而過,呈現出“南北兩山夾一河”的山谷地形。市區東西狹長,約30 km,南北較窄,最窄處僅5 km左右,具有帶狀盆地城市特征。蘭州市主城區依河而建、依河而生,七里河區和西固區分別位于主城區南部和西部,路網密度相對較低;城關區地處東北部,區域內道路密度高,經濟相對發達,是蘭州市的政治、經濟及文化中心。
2.1.2數據來源調用高德地圖API,使用計算機技術爬取2023年1月蘭州市城關、七里河、西固、安寧4個區的全類別POI數據,共計125 753條,分為購物服務、餐飲服務、商務住宅等24個大類(一級類別)。每條POI數據均包含WGS1984坐標系下的經緯度、點位名稱及具體地址等信息。
人口分布柵格數據(2020)從World Pop網站(https://hub.worldpop.org/)爬取,柵格分辨率為1 000 m,地理坐標系為WGS1984。人口普查數據來源于2021年蘭州市統計局發布的《蘭州市第七次人口普查公報》,以街道為最小行政區域單位。遙感影像數據從BIGEMAP(http://www.bigemap.com/)爬取,以WGS1984為坐標系,經過行政區域矢量數據裁剪修正,行列柵格數分別為5 825、2 883個。
2.1.3數據預處理為了可達性測算更精確,以人口普查數據對人口分布柵格數據進行修正,制作蘭州市主城區實際人口柵格數據。首先以區內63個街道為最小單位構建數表,第七次普查各街道人口數量記為Bi,對人口數表、人口柵格數據、街道矢量數據進行區域分析,計算人口分布柵格數據中各街道人口總數(Wi),得到人口修正系數:? Ii=Bi/Wi, (i=1,2,…,63)。將Ii與街道矢量圖連接轉換為柵格,并與爬取到的人口分布柵格數據相乘得到5個城區實際人口柵格數據。修正后平均誤差由27.3%降為0.01%,說明修正后的數據能準確反映人口空間分布情況。
我國醫療服務設施有以下4類:醫院、基礎醫療服務設施、特殊公共健康設施以及其他醫療設施。其中,醫院分為一級、二級和三級;基礎醫療服務設施包括城市、鄉鎮兩個部分,城市系統由門診診所和社區衛生服務中心組成,鄉鎮系統由村衛生站和鄉鎮衛生院組成。研究中對 “醫療保健服務”POI數據修剪降重,刪除動物醫療場所、醫療保健用品銷售店等無法直接對居民提供醫療服務的設施點,并根據《甘肅省醫療年鑒》對比剩余1 221條數據,將所有醫療設施分為三個等級。其中,一級包含大型三甲醫院和綜合醫院,二級包含中小型專科醫院和大型社區醫療服務站,三級為衛生院、診所等小型醫療服務機構。
蘭州市位于北緯36°03′、東經103°40′,為減少投影坐標系不同帶來的偏差,測算得到研究區的中央經度為東經103°66′,并以WGS1984為基礎設定中央經度,構建蘭州市主城區投影坐標系。
2.2研究結果與分析
2.2.1 基于改進2SFCA的醫療設施空間可達性測度
參考蘭州市交通情況和“城區15分鐘步行健康圈”目標,分別將一、二、三級醫療設施的極限服務半徑d0設定為40、20、5 km,以此將研究區劃分網格后根據醫療設施POI數據和修正后的人口柵格數據計算緩沖區。采用改進的2SFCA方法計算人均Rj和居民在空間距離成本下的醫療設施SAk。為分類研究醫療設施在蘭州市不同區域之間可達性的相對情況,基于平均分配原則對可達性情況分級如表1,空間連接后可視化展示如圖2。
結合可達性指數與網格地理位置可知,城關區西部、七里河北部以及安寧區東部核心街區可達性最好,是蘭州市的經濟文化中心,人口密度大,一級醫療設施個數最多。可達性較好的區域大部分是城郊,人口密度較大,有12個一級醫療設施。可達性中等的區域空間上分布在城鄉結合處,主要位于城關區東北部、七里河區中部及西固區東部,有三級醫療設施33個。可達性較差的區域位于西固區中部、城關區東北部和七里河區中南部,主要是距離城市較近的鄉鎮,雖然區域內有3個一級醫療設施,但醫療設施總數較少,為15個。可達性最差的區域位于七里河區南部和西固區西部高海拔山地鄉鎮,屬于研究區邊緣位置,僅有1個二級醫療設施和7個三級醫療設施。
由圖2來看,研究區醫療設施可達性水平由中心城區向外衰減,中心城區整體較好,城郊及鄉鎮地區可達性較差,現有醫療資源確實存在分布不均衡現象,需要根據居民實際需求進行布局優化以最大化“醫療需求滿足度”和“設施利用率”。
2.2.2基于隨機森林算法的醫療設施選址推薦度測算醫療需求與區域內人口活動信息密切相關。鑒于流動人口可以由購物、餐飲、公司企業等社會活動軌跡綜合反映,并且流動人口分布情況一定程度上可以反映醫療設施實際使用情況,因此考慮引入醫療設施以外的其他類設施參與分析,用全類別POI數據挖掘城市內人口信息。調用高德地圖API,爬取2023年1月蘭州市城關、七里河、西固、安寧4個區內的全類別POI數據。目標設施T(即醫療設施)修剪后剩余1 221個樣本。為避免信息重疊,剔除POI數據中地名地址信息、室內設施、通行設施3類,隨后將數據歸為6大類,具體劃分情況見表2。
按表2分類后,將其他類POI數據與醫療設施POI數據合并構成全樣本POI數據集。按邊長500 m將研究區域劃分為3 883個網格后,通過構建掩膜排除黃河等無法建設設施的水體。將POI數據與網格進行空間連接,確定每個POI數據所處網格以及網格內包含的各類設施數量。結果表明3 883個網格中,空白網格占2 559個,384個網格內含有醫療設施,940個網格內只存有其他類設施。
使用Python軟件構建隨機森林,生成的每個決策樹隨機抽取30%樣本作為訓練集,70%作為測試集,設定生成樹上限為400個。訓練生成決策樹321棵,此時分類評價指標ROC得分(即測試得到數據和標簽分類的平均精確度)為0846 1。為進一步提高分類精度和算法效率,通過固定變量交叉驗證方式實現參數優化,得出隨機森林模型最佳分類計算方法為基尼指數,最佳決策樹個數為215棵。為防止過擬合,最大深度為3層,剪枝處最小樣本為10個,分支節點最小樣本為120個。優化參數后最終ROC得分為0897 7,表明模型有較好的分類精度與預測能力。各類標簽對構建的隨機森林模型特征貢獻度見表3。
貢獻度排名第一、二位的分別是“住宅與科教設施”“日常服務與娛樂設施”,都是城市中的常住人口密集地,符合醫療設施分布與常住人口密集度呈正相關的客觀規律。特征貢獻度排名三、四的“銷售與購物場所”“餐飲服務場所”都是流動人口密集地,主要建立在商圈和交通便利地區,代表著流動人口與交通要素在醫療設施選址中的重要地位。
基于全樣本POI數據集,利用所得隨機森林模型計算預測結果,各網格的推薦指數以概率形式呈現,概率越大,推薦指數越高。在應用隨機森林算法進行分類時,一般認為推薦指數低于50%即不建議推薦。但公共設施布局需要考慮公平性,擴大推薦指數范圍可以擴大公共設施的區域覆蓋率,進而提高公平性。不同推薦指數范圍下,研究區網格推薦結果如表4。
表4顯示,推薦指數最高的網格(第一類)共有325個,空間上此類網格密集分布在市區經濟繁華且人口密度高的區域,這與已有醫療設施的分布點高度重合。推薦指數較高的網格(第二類)共31個,其中已有醫療設施網格占45%,分布在城區內相對偏遠區域以及鄉鎮中心。推薦指數適中的網格(第三類)共42個,其中已有醫療設施網格占31%,空間上此類網格分布在各區分界處,距城中心較遠,但人口密度相對較高。推薦指數較低的網格(第四類)共25個,其中已有醫療設施網格占24%,空間上此類網格多分布在城市邊緣工業區以及鄉鎮周邊。推薦指數最低的網格(第五類)共57個,大多分布在城鄉結合處及鄉鎮中心,還有部分在海拔較高的山區。
2.2.3 融合空間可達性和選址推薦度的醫療設施選址推薦指數為了設計醫療設施布局的最佳優化方案,考慮結合醫療設施空間可達性水平和隨機森林預測選址推薦情況,綜合判斷網格的醫療資源合理性。利用熵權法確定空間可達性水平和隨機森林推薦度權重分別為ω1=0.114 7和ω2=0.885 3,由式(4)得到每個網格的最終選址推薦指數Zk。采用自然間斷點分級法識別Zk的分類間隔,最終將其分為5類,具體分類區間及各區間內網格數量、醫療設施、可達性水平、隨機森林推薦度如表5,各類網格空間分布如圖3。
表5中,SRk來源于全類別POI數據,SAk來源于人口統計數據和醫療設施POI數據,而Zk則由兩者結合得到。醫療需求越高且現有醫療設施可達性相對越差的網格,推薦指數越高。從Zk的分類區間來看,其與SRk分布趨勢一致,說明該方法確定的推薦指數契合流動人口的醫療需求。而SAk的分布則出現多數重疊,結合圖2和圖3來看,左上(西固區西側)及右下(七里河區南側)邊緣山區區域可達性指數在0.68以上,但采用融合方法計算后醫療設施推薦指數較低(0.065至0.190),符合該區域常住人口較少且分散的現狀,說明以往僅根據可達性判斷醫療需求是有局限的,融合空間可達性和選址推薦度的方法更符合實際人口醫療資源缺失情況。
Zk從固定人口和流動人口、醫療需求滿足度和利用率兩個緯度,直觀說明了網格內醫療資源分配情況。結合圖1中的地形和路網分析,圖3中紅色、紫色網格集中在右上側黃河兩岸中心城區,零散點為鄉鎮中心區域,人口密度高導致醫療需求較高,是設計優化方案時重點關注的地區。黃色、綠色和藍色網格Zk得分在0.37以下,該部分區域主要為高海拔山地,人口密度很低,數值差異主要由空間可達性差異引起。
2.3醫療設施優化方案
結合網格推薦指數與各級醫療設施POI點數量分析研究區醫療資源配置合理性。如表5所示,第一、二類網格是推薦指數最高的區域,共計352個,但其中有55個網格目前沒有醫療設施。該區域內人口密集,推薦指數在0.38以上,建議盡快新增三級醫療設施應急,然后逐步增加醫療資源投入提升設施等級,擴大設施服務能力。第三、四、五類網格推薦指數較低,尤其第四、五類3 460個網格覆蓋了絕大部分山區(圖3綠色、藍色區域)。研究區內共有59個一級醫療設施,資源有限,但第四類網格人口密度較低卻占有4個一級醫療設施,建議將其逐步轉移至上述第一、二類待優化區域,最大化一級醫療設施的服務能力。
結合圖3、表5與遙感影像數據,依次對比醫療設施推薦指數和醫療資源分布現狀,考慮到城區、鄉鎮由于地理位置不同導致人口分布、土地類型差異明顯,分別以城鄉分類輔以可達性水平和土地利用情況為4個行政區內的醫療設施設計具體優化方案。
2.3.1 中心城區優化方案蘭州市中心城區為城關區中部、七里河區北部和安寧區的東部,整體處在東北方向,即圖3中紅色、紫色網格所在位置。對該區域而言,選址推薦指數與人口密度最高,基本不涉及耕地、農田,若規劃合理,該區域內不應存在推薦得分很低的區域。但結合醫療設施POI點發現,該區域有部分網格醫療資源不足且推薦得分很低,將這些異常網格按常住、流動人口數量分為3類,以每一類中的一個具體案例結合遙感影像數據進行分析(圖4)并給出優化建議。
第一類網格處于空間位置擁擠的老舊小區,常住人口多,流動人口少。以網格“1445、1446”為例,其處于城關區拱星墩街道,區域內僅有1個三級診所,但其可達性指數分別為0.88、0.84,旁邊是城關區主干道東崗路,交通便捷。這類區域無法新建較大的醫療設施,但居民去往一、二級醫療點較方便,建議新增三級醫療設施以滿足日常醫療需求。
第二類網格為大型流動人口活動區域。以網格“1603、1604、1605、1606”為例,其緊鄰蘭州西站,小區屬于舊廠房翻新在建,同時也是地鐵二號線在建路段,目前沒有醫療服務點。針對這類在建區域,建議新增二級醫療設施以滿足現有大量流動人口和今后新增常住居民的醫療需求。
第三類網格為企業廠房,常住與流動人口數量均較大。以網格“2993、2774、2715、2716”代表的蘭州石化公司為例,其處于陳坪街道北部,廠房內無醫療服務點,但周圍網格醫療條件較好,可達性指數在0.83以上。針對該類區域,建議新增三級醫療服務點,或安排固定頻次班車去往周邊醫療設施,保障日常性醫療服務和突發性醫療需求。
2.3.2 鄉鎮優化方案
相比可達性水平較好、流動人口較多的城區,鄉鎮人口穩定,布局更看重固定醫療服務點。結合現有遙感影像分析,研究區域內網格“809”(七里河區西果園鎮)和“2838”(西固區達川鄉)(圖5)的推薦指數分別為0.42、0.51,醫療資源需要優化。
西果園鎮屬于農業鎮,常住居民年齡較大,但鎮上僅有3個小型診所;達川鄉沒有醫療服務點,且可達性指數僅為0.22,僅隔壁區內有1個三級衛生院,醫療配置不合理。以醫療配置較為合理的網格“2920”(西固區東川鎮)為例,東川鎮為典型工業鎮,人流量大且工作種類導致人員易受傷,因而轄區內設有一級醫療點來滿足居民需求。因此,建議西果園鎮和達川鄉避開耕地、農田位置,新增二級醫療服務設施。
4總結
結合公共設施空間可達性和隨機森林選址推薦度,同時考慮了常住人口、流動人口的醫療需求和醫院實際的使用情況,融合人口普查數據、全類別POI數據、遙感影像數據挖掘人流量及醫療設施分布特征,并用劃分網格和對城區、鄉鎮分開處理的方式減小人口分布差異帶來的影響,設計醫療設施布局優化方案。以蘭州市主城區內4個行政區為例,驗證了該方法計算出的推薦指數更能代表區域內的醫療資源覆蓋和缺失情況,據此設計的優化方案更貼合實際;并且在優化方案中,對不同特征的區域以典型案例結合分析,設計方案更具實踐參考性。
本文圍繞供需點的空間距離測度可達性,路網因素的影響考慮較少,與現實可達性情況可能會存在偏差。另外,通過隨機森林進行選址推薦對數據量要求較大,POI數據量充足的網格預測精度表現較好,但還存在少數網格內POI數據不足的情況。未來研究將關注多源數據融合方法,充分考慮路網數據、人類活動軌跡數據等,提高醫療設施選址優化能力。
參考文獻:
[1]張亞,劉紀平,王勇,等.顧及就醫出行行為的醫療設施潛在與實際可達性對比研究[J/OL].武漢大學學報(信息科學版),2023.(2023-04-20)[2023-06-14].https://doi.org/10.13203/j.whugis20220269.
[2]OKELLY M E,GRUBESIC T H.Backbone topology,access,and the commercial Internet,1997-2000[J].Environment and Planning B Planning and Design,2002,29(4):533-552.
[3]陳潔,陸鋒,程昌秀.可達性度量方法及應用研究進展評述[J].地理科學進展,2007,26(5):100-110.
[4]楊新剛,夏斌,王子帥.縣域鄉村地區義務教育設施空間分布及可達性分析:以安徽省壽縣為例[J].西華師范大學學報(自然科學版),2024,45(3):284-292.
[5]楊莉,任海洋,王敏.南京市醫療資源空間分布均衡性與可達性研究[J].信陽師范學院學報(自然科學版),2022,35(1):63-71.
[6]任家懌,王云.基于改進兩步移動搜索法的上海市黃浦區公園綠地空間可達性分析[J].地理科學進展,2021,40(5):774-783.
[7]劉丹丹,陳延輝,葉杰豪,等.基于改進高斯兩步移動搜索法的醫療設施可達性評價[J].河南科技,2022,41(22):12-16.
[8]覃事婭,郄苗苗,尤昊宇,等.基于改進兩步移動搜索法的長沙市醫療服務設施可達性研究[J].重慶建筑,2023,22(4):44-48.
[9]高巖輝,楊晴青,李繼園.城市醫療機構分級可達性與空間公正研究:以西安市為例[J].地域研究與開發,2023,42(1):68-74.
[10]田玲玲,張晉,王法輝,等.公平與效率導向下農村公共醫療資源的空間優化研究:以湖北省仙桃市為例[J].地理科學,2019,39(9):1455-1463.
[11]戈好雨.基于機器學習的無人零售商店選址及其銷量預測研究[D].南京:南京大學,2020.
[12]張嘉琪,杜開虎,任書良,等.多源空間大數據場景下的家裝品牌線下廣告選址布局研究[J].武漢大學學報(信息科學版),2022,47(9):1406-1415.
[13]汪曉春,熊峰,王振偉,等.基于POI大數據與機器學習的養老設施規劃布局:以武漢市為例[J].經濟地理,2021,41(6):49-56.
[14]趙卓文,吳勤書,張時智.面向基本醫療服務的空間可達性城鄉差異分析[J].江蘇科技信息,2023,40(13):71-74.
[15]黃欽,楊波,徐新創,等.基于多源空間數據和隨機森林模型的長沙市茶顏悅色門店選址與預測研究[J].地球信息科學學報,2022,24(4):723-737.
Layout Optimization of Urban Medical Facilities Based on Multisource Data:
A Case Study of the Main Urban Area of Lanzhou
NIU Chengying,ZHANG Ying,YAN Xinyu
(School of Statistics,Lanzhou University of Finance and Economics,Lanzhou Gansu 730020,China)
Abstract: In accordance with the demographic data,POI data,land use data and remote sensing image data,this paper analyzes the location problem of public medical service facilities and proposes a calculation method of recommendation score for site selection that combines the spatial accessibility index and random forest recommendation index by entropy weight method.The research results show that this method has better performance in reflecting the coverage and lack of existing medical resources by combining the spatial accessibility and location recommendation because it takes into account the supply capacity of facilities and the medical needs of permanent residents and floating population,and gives consideration to the distribution of resources and the equity of public facilities.Finally,this method is employed to analyze the rationality of medical resources allocation in the main urban area of Lanzhou as an example.This method can provide references and a theoretical basis for the site selection research of other areas and other types of public facilities.
Keywords:multisource data;spatial accessibility;random forest;entropy weight method;location recommendation;layout optimization of medical facilities