孟祥環,羅素云
(上海工程技術大學 機械與汽車工程學院,上海201620)
圖像中的天空像素檢測一直以來都是計算機視覺技術的挑戰,并且具有廣泛的應用,例如:自主車輛或無人機導航、實時天氣分類、圖像編輯、天空替換和場景解析。在城市氣候研究方面也發揮著重要作用,如:使用魚眼攝影計算天空視角因子(SVF),用于城市的氣象監測[1]。
在計算機視覺的相關研究中,天空檢測技術大體上可以分為以下幾種,一種是遍歷圖片中的所有像素點,逐像素地尋找與天空相關的像素點。這種方法側重于尋找與天空相關聯的單個像素,如采用一種基于物理的方法,利用圖片中的顏色變化來識別天空[2];基于顏色值和每個顏色通道的二維多項式生成天空像素概率圖,進而進行天空的識別[3];另一種方法則側重于尋找天空和地面邊界,利用改進的能量函數優化和圖像的梯度信息來優化提取天空邊界線[4],然而實際的城市場景中,天空部分容易被建筑物、旗幟或其他障礙物隔開,造成天空區域不連續,使天空區域的識別變得十分困難[5]。隨著深度學習的快速發展,多層卷積網絡被廣泛的應用于各種場景之中,它通過使用訓練好的語義分割卷積神經網絡(CNN)模型,對室外圖像中的不同類別(如天空、建筑物、樹木和汽車)進行分類,例如SegNet和模型框架,但是它并不是專門為天空像素識別而設計的,這種方法需要大量的數據集和高性能的計算機做支撐。……