謝杰航 李冰鈳 翁殊斐
華南農業大學林學與風景園林學院 廣州 510642
隨著經濟水平的不斷提高, 人民群眾對環境和精神文化的需求也在不斷增長, 兼具生態功能、歷史文化展現、 旅游經濟、 體育休閑等社會功能的文化景觀型綠道成為自然資源保護和文化傳承的重要載體與形式[1]。 近年來 “驛道網+綠道網”兩張網[2]的提出, 將南粵古驛道蘊含的豐富文化內涵融入綠道建設中, 將綠道與歷史文化線路、沿線城鎮鄉村的經濟振興相結合, 豐富了綠道的內涵, 是我國文化景觀型綠道建設的創新實踐。
近年來, 大數據被逐步應用于景觀評價領域,社交媒體[3]、 網絡點評[4]、 運動 APP[5]等網絡公開數據在一定程度上彌補了傳統場地調研工作在時空和數據量上的不足, 但傳統大數據分析以結構化、 半結構化數據為主, 缺乏對文本、 圖像、視頻、 語音等非結構化數據的挖掘和處理能力[6]。機器學習是人工智能最重要的分支, 也是大數據分析的重要方法之一[7]。 機器學習算法為大數據挖掘和分析工作提供了非結構化數據的處理能力,可以幫助我們從海量非結構化高維數據中分析出有價值的結論[8], 極大地豐富了大數據在風景園林專業的應用場景, 如景觀視覺質量評價[9]、 城市街景感知[10]和智慧城市建設[11]等。 如能科學利用數據, 結合云計算、 人工智能等技術進行分析運算, 將為規劃師提供遠勝于傳統基于理論、經驗和局部樣本數據的判斷[12]。
本文結合案例及現場調研, 嘗試探索機器學習技術在文化景觀型綠道空間評價的應用, 拓展大尺度空間評價技術方法, 彌補傳統調研和大數據分析方法的不足; 通過對數據結果進行分析和總結, 為文化景觀型綠道建設提出合理建議, 以期為其他同類型綠道規劃建設提供參考。
珠海香山古驛道是南粵古驛道11 條重點線路之一, 以長南逕古道遺址為基礎, 連通城市綠道、鄉道、 巷道, 跨越珠海香洲區和高新區, 串聯起從古到今、 從人文歷史到自然景觀的城市精華片段。 考慮到網絡數據的可獲取性及數據量的龐大,本文選取了綠道沿線6 個熱門景點 (梅溪牌坊旅游區、 會同古村、 普陀寺、 情侶路片區、 唐家灣古鎮和九洲城) 作為主要研究對象。
社交媒體和地圖APP 等數據能夠反映空間使用者對場所的偏好和感知, 可獲得的評價樣本量大, 時間跨度長, 因此能有效回避傳統評價研究方法的不足。 本文以綠道沿線的6 個景點名稱為關鍵詞分別在新浪微博、 攜程旅行和高德地圖APP 搜索, 通過網絡爬蟲程序獲取2015 年 1 月10 號至 2020 年 1 月 13 日前的游客評論數據, 并將數據中的文本和圖片保存到本地數據庫。 在機器學習和預測實驗過程中, 數據中存在的噪聲數據會導致模型預測準確率下降, 對實驗結果產生直接的負面影響[13]。 為降低數據噪聲對分析結果的干擾, 在數據預處理階段對不同類型的數據采用了不同的清洗方法: 1) 通過關鍵字匹配和文本長度判斷刪除無意義文本數據; 2) 通過圖片分辨率判斷和人工識別縮略圖刪除無意義圖片;3) 刪除相同或相似的圖片數據, 以避免數據重復計算。 經過數據清洗后, 評論數據總數為8916條, 其中包含文本 693977 字, 圖片 24426 張, 數據體積合計約30 GB。
自動化機器學習 (Auto Machine Learning) 包含數據預處理、 模型選擇、 變量選擇、 模型調參和模型評估等流程, 開發者可使用高質量預訓練模型 (或預訓練規則), 克服傳統機器學習過程中建模流程復雜、 耗時長等問題, 高效完成機器學習模型的建模及部署應用[14]。 本文基于百度和華為的AutoML 開發平臺, 文本類型數據利用機器學習模塊對應的API 接口以HTTPS 請求方式傳輸待預測數據, 圖像數據經過OpenCV[15]轉換和Base64[16]轉碼后通過軟件開發工程包 (Software Development Kit, SDK) 調用機器學習圖像處理模塊, 經云端情感分析、 評論觀點提取和圖像識別模型預測后得到JSON 數據格式的返回結果。 為了解決文本預訓練模型存在的領域分布異構問題,在文本數據預測步驟前使用Fine-tune API 增加240 條經人工標注處理后的旅游評價數據完成模型遷移學習以改善模型[17]。
數據預測完成后, 首先利用Python 從 JSON格式預測數據中提取結果標簽字段 (圖1), 并使用MYSQL 對數據結果進行轉換與分表存儲, 然后對數據執行分類、 篩選、 排序等統計分析并繪制成詞云圖形式展示。

圖1 數據處理與結果返回示例
文本情感分析是對帶有情感色彩的主觀性文本進行分析、 處理、 歸納和推理的過程[18]。 對游客文本進行情感傾向分析, 能夠從整體上把握游客對綠道沿線景點的喜好程度, 其中正面評價率指網絡游客評論文本中包含積極情緒的文本數量占數據文本總量的比值。 從圖2 可以看出, 正面評價率最高的是普陀寺 (96.85%), 其次是唐家灣古鎮 (92.06%); 最低為梅溪牌坊 (68.69%),其數值遠低于其余5 個區域。 圖3 顯示, 普陀寺的正面評價率保持在90%以上的高水平區間; 而梅溪牌坊旅游區的正面評價率則波動較大, 除2018 年外, 其余年份均在80%以下水平; 其余4 個景區的數據則位于85%~95%, 保持良好偏優水平。

圖2 游客正面評價率

圖3 2015—2019 年游客正面評價率
評論觀點提取指從帶有情感傾向的文本中提取實質內容, 包括評價對象 (如 “景色” “環境”“交通” ) 和情感詞 (如 “好看” “一般” ), 以此更精準地了解影響游客喜好程度的具體因素。把所有的評論通過機器學習模型處理提取, 對提取結果按出現頻數進行降序排列, 每個景區取出頻數較高的10 個觀點 (表1)。

表1 評論觀點提取及排序后結果
會同古村的積極評論觀點包含 “景色美”“歷史悠久” “空氣清新” 等, 反映了會同古村在歷史文化保護和生態文明建設方面取得的成就,獲得游客好評, 但其負面評價中卻反映了 “設計一般” “沒特色” 等問題。
梅溪牌坊旅游區雖然獲得 “環境好” “景色美” 和 “交通方便” 等積極評價, 但由于 “門票貴” “性價比低” “景點少” “沒特色” 等負面評價, 該景區的整體評價較差, 其中, “門票貴”是該景區評分低的主要原因, 占該景區負面評價的22.2%。 調研還發現, 景區內構筑物與植物、構筑物與構筑物間的組合關系較為松散, 景觀整體性較弱, 展品內容拼湊感較強、 形式單一, 因而未能較好地滿足部分游客的期望值。
普陀寺的積極評價有 “環境好” “景色美”“清凈” 和 “氣勢恢宏” 等, 負面評價偏少, 因此, 普陀寺是6 個樣本中最受游客好評的景區。
九洲城是一座仿古典式皇家園林風格的現代建筑群, 目前為珠海市博物館。 在游客對九洲城的積極評價中, “環境好” “感覺不錯” 反映了九洲城建筑內部園林景觀營造效果, “氣勢恢宏”體現了游客對其建筑設計的贊賞態度。 “展品少”“沒特色” 等負面評價則反映了博物館展覽功能的不足。
與文字數據相比, 圖像所包含的信息更為豐富。 游客在旅游過程中通常會用手機攝影功能記錄對自己形成視覺沖擊的景觀, 其中隱含著游客對景觀要素的偏好, 通過對圖像的識別和解讀,可以獲得游客對景觀的感知信息和印象。 首先經過模型預測, 將圖像內容轉換成物體標簽, 然后依據標簽頻率排序, 選取每處景區數據樣本中出現頻率較高的20 個物體標簽, 最后根據出現頻率確定文字相對大小, 對統計結果以詞云形式展示。結果 (圖 4) 顯示, “人” “建筑” “植物” “自行車” 和 “雕像” 是游客圖像數據中出現較多的內容: “人” 的照片中, 1633 張屬于游客的自拍或合照。 “建筑” 作為重要的景觀元素之一, 以其規模、 造型、 歷史等因素吸引游客的注意力, 如普陀寺宏大的寺廟建筑群、 情侶路 “貝殼” 造型的珠海大劇院、 會同古村歷史悠久的宗祠。 出現頻率排在第3 位的是 “植物”, 不同植物種類在不同景點對游客的吸引程度也不同, 如會同古村、唐家灣古鎮、 普陀寺等規模較小的景點, “花”比 “樹” 的出現頻率更高, 經過數據翻查后發現, 觀花植物和插花藝術的照片數量較多, 說明此類中小型植物造景較受游客喜愛; 在情侶路、梅溪牌坊旅游區等環境開闊的景點則相反, 喬木在照片中出現的頻率較高。 “自行車” 則反映游客對游覽交通工具的選擇, 也從側面體現了珠海騎行綠道系統的完善。 “雕像” 作為景觀小品以各種主題內容呈現, 有知名度較高的珠海漁女,也有兒童喜歡的卡通雕像, 這些雕像均以其獨特的造型或背后的文化含義吸引了不少游客。

圖4 圖像識別結果詞云展示
作為珠海近代歷史文化遺產的代表之一, 梅溪牌坊旅游區識別結果中的 “門口/室外” “家具” “公墓”, 對應的實體分別是陳芳家宅的入口、 室內場景和陳芳墓園。 家宅主人陳芳先生由于生前早年長期在海外受西方文化影響, 故其家宅設計既延續了嶺南傳統建筑的格調, 又融入了夏威夷別墅風格, 其中, 較受游客喜愛的 “門口” 實為入口的花崗巖碉樓, 體現了游客對中西交融建筑風格的喜愛。 會同古村和唐家灣古鎮識別結果中的 “胡同” 反映了傳統的空間布局特色, 如會同古村的 “三街八巷” 體系[19]給予游客深刻的感知印象。 情侶路片區識別結果中的 “博物館/室外” “燈塔” “小島”, 對應的實體分別是珠海大劇院、 燈塔及海濱泳場。
珠海市博物館的識別結果反映了館內的展覽內容, 如出現頻率較高的 “相框” “書” 和 “標識”, 對應的是圖片類展品及其簡介, “雕像” 對應 “紫檀雕刻展”, “恐龍” 對應 “走進恐龍科普展”, “大炮” “地圖” “武器” 和 “船” 對應“珠海海防史跡展”。 紫檀展和恐龍展的展品較有特色, 吸引不少游客駐足觀賞, 但海防史跡展則只有寥寥可數的展板和展品, 因此, 在識別結果中, 海防史跡展相關照片數量明顯少于紫檀展和恐龍展。
1) 綠道沿線景觀風貌是影響游客體驗的重要因素。 古宗祠、 古街巷、 古民居、 寺廟等特色景觀風貌可吸引游客的視覺注意力和觸發拍照等互動行為。 因此文化景觀型綠道沿線的構筑物設計、藝術裝置和公共設施等既要遵循經濟實用原則,也要充分融合本土化特色, 營造本土風貌, 給予游客沉浸式的場景體驗, 增強景觀的可讀性和可識別性。
2) 在不同的空間環境下, 游客對植物景觀的偏好有所不同。 在小規模的場地空間中游客更偏愛花卉, 而在開闊的場地空間則偏愛遮蔭納涼的喬木, 這體現了植物在景觀營造中兼具觀賞性和實用性的特點。 因此, 植物景觀營造應遵循 “適地適樹” 原則, 根據空間尺度、 功能、 主題的差異選擇適當的本土植物, 如在紫外線較強的戶外開敞空間, 運用高大喬木塑造起伏的天際線起到遮陰降溫作用; 對于中小型尺度的空間, 則綜合運用小喬木、 灌木和草本營造多層次、 精致的植物景觀, 在重要景觀節點還可應用色彩艷麗的草花吸引游客視線。
3) 九州城、 梅溪牌坊的游客負面評價數據主要反映出門票性價比低、 展覽內容枯燥、 缺乏特色等問題。 因此, 針對展示空間的營造, 一是要充分挖掘和展示本土的特色文化, 如香山地區的海洋文化、 商業文化、 特區文化等[20], 同時避免追求內容數量而忽視質量問題; 二是創新展示形式, 采用微視頻、 全息投影、 互動藝術裝置等新形式, 讓游客獲得物超所值的游覽體驗。