王 超,張明宇,王錫銘,吳傳德
(天津大學天津市建筑物理環境與生態技術重點實驗室,天津 300072)
現階段我國城市智慧照明規劃尚處在摸索階段,各地區基礎建設與智慧化發展程度均不盡相同,判斷出一個非樣本城市(或者城市片區)的智慧照明發展基礎的分級尤為重要[1]。隨著大數據的發展及計算機優化算法的利用技術成熟,龐大的城市數據更依賴于一個成熟的算法優化方案,而BP神經網絡在處理城市數據方面的優勢十分顯著,城市智慧照明分級作為一個非線性分類問題,契合BP神經網絡的工作特點。
本文選取的評價對象來自三部分:
1)基于國家前三批智慧城市試點:2012年12月,國務院發布了《關于開展國家智慧城市試點工作的通知》[2],選擇了90個城市作為國家首批智慧城市試點。2013年8月至2014年4月,我國陸續公布了國家智慧城市第二批、第三批試點,隨后更多的城市(區、縣)陸續開展智慧城市建設;
2)基于中國信息化研究與促進網發布,由互聯網權威機構太昊國際互聯網大數據評級機構(簡稱Tahaoo指數)給出的“2018-2019中國新型智慧城市建設與發展綜合影響力”評估結果中各個分值段的代表性城市[3];
3)基于杭州G20峰會后,全國各個主要城市均相繼開始編制新一版本的城市照明規劃導則,其中大多數導則均在不同程度上對智慧城市予以了配合與輔助,在研究城市中有比例地加入一部分完成了新一版城市照明規劃導則的城市,有助于增加整個指標評價體系的全面性。具體城市名單詳見表1。
表1 智慧照明規劃基礎指標分級神經網絡數據分組表
為了數據的均勻度與驗證的準確性,每六組數據中隨機抽取一個數據作為評價組,共取10組數據,并且這10組數據全程不參與神經網絡的學習過程,其余50組作為實驗數據。為了防止神經網絡發生過擬合,本文將這50組數據分為training(訓練)、validation(驗證)、test(測試)三組,其比例以70%、15%、15%為宜。
在從城市智慧照明指標體系中選擇用以確定照明分級的基礎類指標時,有以下幾類原則:
1)指標的基礎性
考慮到基礎類指標取值主體差異較大,有城市有地區,發展情況行政建制,以及是否有編制城市照明規劃均有所差異。同時基礎指標主要考察的是研究主體的綜合發展水平,以便有針對性地確定城市智慧照明規劃的編制基礎以及編制目標。
2)指標的可操作性
可操作性體現在三方面:一是指標的代表性和簡潔性,首先基礎類指標本身不宜過多,從指標體系中篩選具有代表性的指標,選取的指標務必要展示評價內容的整體,其次基礎類指標系要不繁雜,選取的指標要簡潔明了,應選取與研究內容最貼合的指標;二是要求該指標易得且準確,可從國家或國家主管當局或官方統計數據中獲得。三是可對比性,指標的選取應基于相同維度,如盡量選取人均指標或者占比情況作為基本指標[4]。
3)指標的全面性
目前城市智慧照明指標體系包含八個方面:網絡與信息能力、綜合創新能力、行政管理能力、基礎設施評價、惠民服務評價、城市夜經濟、交通輔助類評價、照明空間結構優化。這八個方面均需要有指標被選擇為基礎性指標,才能使得BP神經網絡模型具有足夠的全面性和代表性。根據以上三點原則在城市智慧照明指標體系中進行篩選,得到城市智慧照明分級指標體系表(表2)。
本文數據大部分來自于《2019年中國信息社會發展報告》(國家信息中心發布)、各市的《2019年信息化發展報告》、各市的《2019年信息化年鑒》、各市的《2019年統計年鑒》、各市的《2019年國民經濟和社會發展統計公報》、各市政府通過官網發布的政務信息公共年度報告、各市路燈管理局公布的相關統計數據等,其中也有部分數據來源于網絡或其他途徑搜集,在查詢大量前述數據基礎上得到原始數據。將部分數據展示于表3。
考慮到我國現階段的城市智慧照明規劃尚處在摸索階段,各地區基礎設施建設基礎與智慧度均不盡相同,所以在現有條件下,所有的城市均使用同一套評價指標體系是不合理的,因此本文提出的城市智慧照明評價指標體系在構建之初便根據智慧城市基礎指標發展程度的不同,將子指標分為了三類,即:基礎類指標、提升類指標、優選類指標,對應評價智慧城市建設基礎較差的城市(一星級城市)、智慧城市建設基礎一般的城市(二星級城市)與智慧城市建設基礎較好的城市(三星級城市)。其具體對應關系見表4。
表2 城市智慧照明分級指標體系表
表3 城市智慧照明分級指標數據表(樣表)
表4 城市評級與適用指標對應表
BP神經網絡,就是其在模擬人的大腦,把每一個節點當作一個神經元,這些“神經元”組成的網絡就是神經網絡。由于計算機出色的計算能力和細節把握能力,在城市數據統計這樣的大數據的基礎上,神經網絡往往有比人更出色的表現[5]。只需明確輸入、輸出,系統即可學到輸入與輸出的函數關系。神經網絡的理論基礎之一是三層的神經網絡,可以逼近任意的函數,所以理論上,只要數據量夠大,“箱子容量”夠大(神經元數量),便可以對任何和歸類性數學問題進行分析[6]。城市數據的統計分析紛繁復雜,利用機器學習進行城市照明的分區與分級,可以極大節約規劃設計師分析理解數據的時間成本。城市智慧照明分級作為一個非線性分類問題,契合BP神經網絡的工作特點。完成學習訓練后的系統就可以快速判斷出一個非樣本城市(或者城市片區)的智慧照明發展基礎的分級,從而提供一套在智慧城市背景下的城市照明分區以及分級的方法。
1)數據歸一化處理
選擇2019年北京、沈陽、大連、哈爾濱、石家莊等60個城市的互聯網普及率、寬帶互聯網用戶占比、信息產業GDP占比等15個指標的具體數據進行歸一化處理,預測數據再根據反歸一化處理得出與實際輸出值比較。
2)設計網絡的拓撲結構
根據城市智慧照明分級的問題特點,選用具有隱含層的LM-BP神經網絡。在這個網絡中,顯示參數的輸入數15,可以根據colmogorov定律定義的隱藏層數,一般設置為輸入層的2n+1,即31;輸出層數對應于分類一星級城市、二星級城市、三星級城市,因此輸出層數為3。
3)網絡主要參數的確定
網絡的初始權闊值設范圍在(-1,1)之間,LM學習方法作為網絡學習方法的代表方式,網絡訓練誤差不設下限,以梯度指標作為訓練限定,設為1e-7,學習率取0.001。網絡訓練結果采用均方誤差(MSE)進行衡量,即網絡訓練誤差。
圖1 LM-BP神經網絡工作流程Fig.1 LM-BP neural network workflow
4)數據分組及防止過擬合
為了使訓練數據與訓練標簽一致,而對模型過度訓練,從而使得模型出現過擬合(over-fitting)現象。具體表現為,訓練后的模型在訓練集中正確率很高,但是在測試集中的變現與訓練集相差懸殊,也可以叫做模型的泛化能力差。
如前文所述本研究將實驗組數據分為三組,training、validation、test,其比例分別為70%、15%、15%,以此方法對應MATLAB防止過擬合的方法。只有training數據參加訓練,其他兩組數據不參加訓練,用于檢驗[7]。
對神經網絡進行訓練,各參數設定如圖2所示,對設定各個參數進行解析:
圖2 LM-BP神經網絡參數設定圖Fig.2 LM-BP neural network parameter setting diagram
1)Neural Network神經網絡
圖2顯示了神經網絡的結構圖,神經網絡有一層隱含的輸出架構,前文有述,此處不詳細展開。
2)Algorithms訓練算法
第二部分顯示的是訓練算法,這里為LM-BP算法;誤差指標為mse即采用均方誤差計算法計算誤差。
3)Progress訓練進度
Epoch:數量的訓練;右邊顯示可以設置的最大訓練量,圖2顯示了實際訓練的數量,實際上是6。
Time:訓練時間,也就是本次訓練中使用的時間。
Gradient:該網絡的最大梯度為1.91,閾值梯度為1e-71e^{-7}1e-7,實際梯度為0.033。可在Plots中的Training State中詳細查看。
Mu:該網絡所使用Levenberg-Marquardt算法中的阻尼因子最小值為0.001,閾值為1e101e^{10}1e10,實際值為1e-61e^{-6}1e-6,Mu值越大意味著算法收斂效果越好。可在Plots中的Training State中詳細查看。
Validation Checks:該網絡的泛化能力檢查標準,實際值為0表示在訓練過程中誤差在持續降低,若連續6次訓練誤差無法降低,則結束訓練任務。可在Plots中的Training State中詳細查看。
4)Plots看板
Performance:該網絡訓練過程中的誤差變換可視化。
Training State:該網絡訓練過程中的梯度、Mu因子和泛化能力變換等信息的可視化。
Regression:該網絡訓練集、驗證集、測試集的回歸能力可視化。
Plot Interval:圖中橫坐標的刻度[8]。
以上參數對城市智慧照明基礎指標分級BP神經網絡進行6次訓練,其結果如下:
圖3 城市智慧照明基礎指標分級BP神經網絡性能圖Fig.3 Classification of BP neural network performance graph of basic indicators of urban smart lighting
圖3中給出了城市智慧照明基礎指分級BP神經網絡性能,圖中Train表示網絡訓練的性能狀態,Validation表示用于驗證樣本的性能狀態,Test表示用于測試樣本的性能狀態,BEST表示網絡實際達到的性能,使用網絡的均方誤差(Mean Squared Error,MSE)來衡量網絡的性能水平。由圖3可得訓練曲線的誤差已經降至10-19以下。受筆者精力有限,導致城市基礎指標總樣本量有限,以至于用于驗證組與測試組的樣本量不足,紅線與綠線未顯示出明顯的誤差下降,但考慮到這兩條曲線亦沒有明顯上升,同時影響神經網絡真實準確度的是網絡訓練時表現出的性能,故而系統整體表現出的性能是在研究可接受范圍內的。
圖4為LM-BP的網絡訓練狀態圖,由圖可見取得了較好的訓練效果Gradient為梯度下降法的函數,Mu指的是LM算法中的調整參數,二者均在6次訓練后取得了較低的誤差。
圖4 城市智慧照明基礎指標分級網絡訓練狀態圖Fig.4 Network training status diagram of urban smart lighting basic indicators classification
圖5為LM-BP算法的網絡線性回歸圖,其中左上方是訓練,右上方是驗證,左下方為測試,右下方為總體,該圖表示期望輸出和實際輸出的擬合同時顯示了兩者的相關系數[9],觀察圖像可得訓練部分的相關系數為1,擬合結果為輸出=輸入+2.1e-11。為避免發生過擬合,訓練時系統將全部數據分為三個部分,即訓練、驗證及測試,其中僅訓練部分進行訓練,其他用以對網絡性能進行評估。訓練時訓練部分與目標的誤差會降低,測試和驗證兩部分與目標的誤差也會降低。隨著訓練的進行,測試部分與目標的誤差降低,但驗證部分與目標的誤差反而會提高。當驗證部分誤差連續增大指定次數時,網絡訓練中止,因此時可能擬合不正確,發生過擬合問題,從而提前終止訓練。線性回歸可判斷是否發生過擬合,并可分析神經網絡的擬合情況[10]。相關系數越接近于1,網絡訓練結果擬合越好。由圖可知訓練組的相關系數接近于1,而驗證和測試由于前文提過的樣布量不足的關系面板數值不夠理想,但鑒于其向1收斂的趨勢隨著訓練的進行一直沒有變化,可得沒有發生過擬合現象,同時也表明隨著今后智慧照明數據統計工作的開展,訓練與驗證的樣本量增加后,系統誤差有進一步降低的趨勢。
圖5 城市智慧照明基礎指標分級網絡線型回歸圖Fig.5 Linear regression graph of urban smart lighting basic indicators classification network
訓練完成后需要進行實證測試,本文選取從未參與測試的十個城市:天津、青島、無錫、西安、昆明、蘇州、泉州、溫州、呼和浩特、中山,將這十個城市的15項指標輸入系統中,由于本文是間隔六個城市取得一個城市作為評價組,這十組數據也同時涵蓋了一星級、二星級、三星級這三個評級,保證了數據的隨機性與代表性,將系統通過之前的學習積累的經驗值評級與本文預先對這些城市進行的評級進行對應,結果如圖6所示。
圖6 BP神經網絡預測輸出結果Fig.6 BP neural network prediction output results
從圖6看出,預測數據結果與期望輸出結果完全對應,就這10組數據而言,預測準確性達到100%,符合預先神經網絡的設計要求,該結果表明此次城市智慧照明分級體神經網絡構建基本完成。由此將其他城市或地區的15項基礎指標輸入城市智慧照明分析BP神經網絡后,可以快速準確地得到與此前分級要求一致的預測輸出值。
本文通過梳理城市智慧照明指標,利用BP神經網絡對指標的數據及其評級結果進行機器學習,對10組未進行學習的數據進行預測,準確率達到100%。完成訓練后的神經網絡系統便可以進行城市智慧照明等級的劃分,便于快速匹配與城市基礎現狀特點相對應的評價體系進行指導建設。
研究成果對于城市智慧照明基礎分級理論研究方法具有重大意義,本系統可具備對城市智慧照明建設進行基礎信息判斷和發展階段預判,可實現與待研究城市當前階段城市的發展階段進行匹配,為進一步提出城市智慧照明規劃的發展目標與實現途徑提供基礎研究手段。如在將來對于基礎指標或者分級的顆粒度進行調整,仍可利用本文的數據分析以及神經網絡構建的方法進行推導。