陳怡帆,許偉攀,李郇*
2022 年5 月,國家發布的《鄉村建設行動實施方案》中提出:“實施鄉村建設評價,查找和解決鄉村建設中的短板和問題。”建立科學有效的“實施鄉村建設行動”的評價方法,是發現和縮小城鄉差距、順應鄉村發展規律開展有序建設的重要基礎[1]。當前全國約有2,450,000 個自然村,村莊的數量眾多且空間分布極其分散,這就使得鄉村社會經濟信息主要為宏觀抽樣統計數據,小尺度、寬覆蓋、動態的鄉村人居環境調查數據仍然缺乏。傳統的微觀社會統計調查方式雖然能夠獲取小尺度數據,但也往往面臨著 “從特殊到一般,從局部到整體” 難以有效銜接的困境[2];而大規模的調查則將耗費巨大的人力和時間。
目前,我們正處在一個圖文信息大爆發的時代。隨著智能手機的普及,互聯網平臺上匯集了眾多有關鄉村的房屋、環境、生活等多方面的圖文素材。這些動態大數據為我們研究鄉村提供了新的途徑。借助人工智能(Artificial Intelligence,AI)圖像解譯技術,我們可以通過識別和分割圖像中包含的對象,將圖像大數據轉換為指標數據,進而對區域的發展情況進行評價。例如,通過識別城市街景圖像中包含的汽車數量,進而對經濟發展指標進行估計,研究結果發現汽車數量與家庭收入呈現較高的相關性[3]。此外還有研究利用AI 模型和街景圖片,對道路開闊度和舒適度進行衡量[4]。但類似的研究多集中在城市區域,鄉村相關的研究仍較為缺乏。因此,我們將借助AI 圖像解譯技術探索鄉村建設評價的有效方法。
為更好地收集鄉村圖片和視頻數據,我們開發了“村景拍拍”鄉村建設協作平臺。這是一個面向鄉村建設評價的圖文眾包平臺,也是中國迄今為止村景圖片數量最多的平臺。用戶可以在程序中選擇所在的村莊,上傳相關的圖片和視頻,并搭配介紹文字進行發布。“村景拍拍”中匯總了全國各地居民拍攝分享的村景圖片近20 萬張,覆蓋全國近4/5 的縣域鄉村地區。圖片內容涵蓋房屋、農田、水塘、菜園、公共建筑、道路等多種村莊要素,較為全面地展現全國不同地區的村莊風貌以及鄉村生活。對程序中發布的文案進行詞云分析(圖1)發現,用戶更多關注于“村民”“發展”“鄉村振興”等關鍵詞。“村景拍拍”程序同時開發了眾包評分功能,用戶可以對圖片中呈現出的農房品質、村莊整潔度或風貌協調度等按照提供的參考指標進行評分,形成鄉村建設主觀評價數據。

1 熱點詞匯
另外,通過深度學習的方法對圖片內容進行檢測和識別,可實現對圖片更為詳細的定量描述。在自主構建AI 模型庫中,利用Yolo、Deeplab、ResNet 等深度學習神經網絡,構建適用于農村地區的多個目標識別和語義分割模型。模型實現了對圖片中所包含農房的外立面材質、房屋層數、門窗數量、是否存在破損等與農房品質相關的要素進行較為精準的識別,檢測結果如圖2;檢測村景圖片中包含的汽車、空調外機和熱水器等與財富相關的要素;識別村莊的垃圾點、小廣場、公廁、學校等與村莊基礎設施建設相關的要素,圖3 展示了垃圾桶的識別結果。此外,也實現了對道路類型和道路整潔度等與道路質量相關要素的提取與評價。圖4 展示了道路分割的結果。

2 房屋要素檢測結果

3 垃圾分類檢測結果

4 道路分割結果
在農房品質方面,從專家評價的分數結合對農房品質相關要素的識別結果來看,層數較高、外立面有鋪裝、包含空調、熱水器等要素的農房圖片往往會獲得更高的分數,擁有相對較高的品質;從區域差異上看,農房品質存在“南高北低”“東高西低”的分異特征,且南北差距大于東西差距。另外,將眾包評分數據轉化為深度學習模型的訓練標簽,構建了一套智能化評測農房品質的評估框架,實現對農房品質進行機器評分。
在道路質量方面,研究中采用路面類型和道路整潔度對道路質量進行衡量。經過訓練的道路屬性提取框架表現出良好的性能,在檢測路面類型和道路整潔度方面的平均準確率分別為91%和93%。對于主觀指標道路整潔度,模型也達到了90%以上的準確率。利用該模型對包含道路的村景圖片進行預測評分,全國村莊的道路硬化率為89%,而平均整潔度僅為2.9 分(滿分5 分)。將數值進行標準化后,發現整潔度整體低于硬化率(圖5),這說明了鄉村建設過程中存在道路管護不足的問題。

5 道路硬化率與整潔度對比
“村景拍拍”鄉村建設協作平臺作為村莊大數據收集平臺,解決了鄉村數據難以獲取的問題,其中眾多圖文數據為度量和描繪鄉村特征提供了基礎。借助AI 圖像解譯技術,研究初步實現了通過對村莊多維特征的刻畫,進而評價村莊的建設情況。經過與問卷調查數據的交叉驗證,證實了AI 圖像解譯技術在鄉村建設評價中的可行性。在未來的研究中,仍需增加新的指標對鄉村建設情況進行更全面的衡量,以及探索通過多個指標組合的方式構建新的評價指標的方法,以實現對中國鄉村更為精準的刻畫。□