李廣瑋 吳 鳴 王昕揚 徐 毅
1(上海電力大學 上海 200082) 2(中國電力科學研究院 北京 100192)
隨著我國經濟的快速發展,城市汽車數量逐漸增加[1-2],在面臨能源緊張和環境污染問題的前提下,新能源汽車的發展成為了未來交通出行的趨勢。針對電動汽車的實際行駛工況進行研究,對確定電動汽車負荷的耗電量、新能源汽車技術開發[3]、充電站規劃配置[4]、電動汽車充電導航具有重要意義。目前我國汽車行駛工況參照的是歐洲ECE城市工況,與實際行駛狀態差距較大[5],已不能滿足我國車輛開發測試的需求。針對這一問題,我國學者已經先后建立了區域性汽車工況,但主要是針傳統汽車工況,所使用的方法是K-均值聚類(K-Means Cluster)分析法[6-8]。由于電動汽車與傳統汽車的驅動方式不同,二者在速度響應、加速度和扭矩響應等各方面有較大的差異[9],采用傳統汽車工況評價電動汽車續航、能耗等特性缺乏一定的合理性。除此之外,K-Means方法聚類需要人為選定類的數量,人為判斷聚類結果是否合理,會對聚類效果合理性產生影響。
因此,本文選用迭代自組織數據分析算法(Iterative Self Organizing Data Analysis Techniques Algorithm,ISODATA)[10]構建電動汽車代表性工況,因為ISODATA具有歸并和分裂等機制,是一種非監督的算法,有效避免人為判斷聚類效果的不合理性。本文使用ISODATA、PCA[11]和運動學片段分析法[12]等方法,對電動汽車行駛數據進行分析和聚類,利用Silhouette函數對ISODATA聚類結果的合理性進行評估。根據聚類結果篩選運動學片段,構建電動汽車的代表性工況,通過測試數據集,計算了代表性工況與測試數據的差異率,并對合理性進行驗證。在代表性工況的基礎上,分析了電動汽車的耗電特性與剩余電量的實時評估方法。
本文對電動汽車代表工況與耗電估算的研究基于電動汽車的實時采集數據。由于采集設備、外界因素和人為駕駛等原因,原始數據存在不良數據或缺失信息,因此首先需要進行數據預處理。在對數據進行預處理后,采用PCA進行特征降維以便達到更好的聚類效果。ISODATA能夠自主的調節聚類的類別個數,屬于無監督算法,能夠減少人為判斷分類個數的誤差。根據ISODATA得到分類結果,構建電動汽車的道路行駛工況曲線,并實現電動汽車耗電的實時估算。
由于建筑物覆蓋、隧道遮掩等,采集信號丟失,造成數據時間不連續,需要采用牛頓插值法補全數據[13]。首先對日期數據進行轉換,轉換成時間序列,檢測時間序列異常的點,對于采集信號問題產生的短間隔時間不連續數據區間,插值節點為等距節點,使用牛頓等距插值法進行數據填充,插值節點為:
xk=x0+tht=0,1,…,n
(1)
式中:h代表步長,本文步長為1。在x處的牛頓等距插入值f(x)表達式為:
f(x)=P(x0+th)+Rn(s)
(2)
式中:Rn(s)是函數f(x)在x0+th處的插值余項,代表插值誤差。
(3)
(4)
式中:ΔnF0代表f(x)在tk-m+j處的m階前向差分,j=0,1,…,m。
(5)
由于采集設備和駕駛人員的原因,常會產生一些不良數據。因此需要對原始數據進行甄別,不良數據類型包括:
(1) 加減速異常數據(電動汽車0~100 km/h加速時間大于7 s,剎車最大減速度不超過8 m·s-2)[14]。
(2) 長期停車異常數據(停車不熄火、汽車熄火采集設備仍運行)。
(3) 堵車、斷斷續續低速狀態,視為怠速狀態。
(4) 怠速超過180 s,視為異常狀態。
不良記錄數據處理步驟:
步驟一由時間序列和GPS速度已知,可得到汽車加速度的數據,剔除超出閾值的數據。
步驟二斷斷續續低速行駛情況,重新賦值GPS速度為0。
步驟三將補充完整的數據進行異常怠速和長期停車檢測,檢測GPS速度連續為0或者怠速時間大于180 s,剔除以上異常數據。具體流程如圖1所示。

圖1 預處理流程
經過數據預處理后的數據速度-時間關系和加速度-時間關系如圖2和圖3所示。

圖2 部分速度-時間關系

圖3 部分加速度-時間關系
運動學片段指的是汽車行駛過程中,兩次怠速狀態之間的時間速度分布片段[15]。本文采集數據所提取的部分數據運動學片段如圖4所示。

圖4 部分運動學片段
在汽車行駛過程中,需要選用一些基本的特征參數反映每個運動學片段的行駛特征。將采集數據源分割成297個運動學片段并計算各運動學片段的15個參數。原始數據轉換后,通過15個參數計算得到用于描述運動學片段的7個特征參數,如表1所示。

表1 用于描述運動學片段的7個特征參數
主成分分析是一種特征降維方法[16-17]。將原有的X1,X2,…,XP(比如P個指標)的特征轉換為新的特征組Fm來表征[18]。相比之下,Fm維數低且不關聯。
F1表示原特征參數進行線性組合得到的第一個主成分,F1=?11X1+?21X2+…+?p1Xp。方差越大,F1能夠表征的信息越多[19]。
如果F1無法表征原來P個指標的信息,考慮選取第二個主成分指標F2。F2與F1要保持獨立、不相關,協方差Cov(F1,F2)=0,F1,F2,…,Fm為原變量指標X1,X2,…,XP第1、第2、…、第m個主成分。
F1=a11X+a12X2+…+a1pXp
F2=a21X+a22X2+…+a2pXp
?
Fm=am1X+am2X2+…+ampXp
(6)
通過對297個運動學片段的特征參數進行主成分分析,得到如表2所列的主成分貢獻率及累積貢獻率。

表2 主成分貢獻率
由表2可知,前4個主成分的累積貢獻率97.24%,其中前3個主成分的累積貢獻率已經達到91.229 3%,且特征值都大于1。因此,選取前3個主成分足以反映出7個特征參數的大部分信息[2]。
ISODATA是一種改進型的非監督聚類算法。通過設置初始參數K0和每類最小樣本數Nmin,引入合并和分裂機制。該算法具備自動判別類別個數是否合理并合并或分裂族群的功能。
當兩類的中心過小,可以合并為一類。當樣本數目過多或距離某類標準差過大,就會將該類分裂。
根據初始類簇中心和類的初始參數K0迭代計算,最終確定分類結果和最終結果的類別數K[20]。
通過ISODATA將數據分類到不同的類,同一類中的對象有很大的相似性,而不同的類之間的對象有很大的相異性。對于樣本數據集S={S1,S2,…,Sn}。ISODATA最終將其劃分成K類,表達式為P={P1,P2,…,PK},1≤K≤n。
ISODATA的基本步驟描述如下:
步驟1隨機選取K0個樣本,作為初始中心。
步驟2針對每個數據,計算它到中心的距離,將其分到距離最小的類中。此時類的數量為K1。
步驟3判斷上述每個類中的元素數目是否小于Nmin,如果小于Nmin則丟棄該類。令K1=K1-1,該類中的樣本按照距離最小原則,重新分配到剩下的類中[21]。
步驟4按照每一類的數據,重新計算該類的聚類中心。
步驟5如果K1 步驟6如果K1>2K0,說明當前類太多,前往合并操作。 步驟7達到最大迭代次數則終止,K=K1,否則返回步驟2。 ISODATA通過計算數據和類中心的歐氏距離進行分類。數值越小,相似度越大。計算公式為[22]: (7) 式中:Si為樣本數據集中的第i個數據對象;uj則為第j個聚類中[14]。 運用PCA分析法和ISODATA分析方法對所有的運動學片段進行分析,得到聚類分析結果。運用Silhouette函數繪制輪廓圖,判斷每個運動學片段的分類是否合理。Silhouette函數表達式為: (8) 式中:a(i)表示樣本i與同類樣本的差異度,用該樣本與當前類別內各點的平均歐氏距離表示;b(i)表示樣本i與其他類別樣本的差異度,用該樣本與其余類別內各點的平均歐氏距離表示。 Silhouette函數的函數值s(i)的取值范圍為[-1,1]。s(i)越接近于1,表示樣本i更傾向于屬于當前樣本。s(i)越接近于-1,表示樣本i更傾向于屬于其他樣本?;贗SODATA自動得到的類別個數為2,采用人為定義類別個數為3和4,繪制對應的Silhouette函數如圖5所示。 (a) 分2類 (b) 分3類 (c) 分4類圖5 不同分類Silhouette函數值的輪廓 由圖5(a)可看出,分2類時,Silhouette函數值均大于0,類與類之間區別明顯。由圖5(b)和5(c)看出,出現少量負值,說明分為3類和4類時,存在未被很好區分的片段。根據分析,ISODATA能夠作為聚類分析的依據,且具有理想的聚類效果。 對分為2類時,各類型行駛狀態和時間比例進行統計,結果如圖6所示。由圖6可看出,加速度時間比所占比例較高;類型1和類型2的平均速度和平均行駛速度較均勻。與類型2相比,類型1的加速時間短,平均加速度、平均速度與平均行駛速度較大,可見,類型1的行駛狀態和駕駛操作較為順暢。而類型2加速時間比例大,平均加速度、平均速度和平均行駛速度卻較小,因此可能處于較為擁堵或跟車的行駛狀態。 圖6 各類型行駛狀態 電動汽車實行工況的構建步驟: 步驟一根據聚類中心的大小,按照從小到大的順序分別篩選20個候選運動學片段。 步驟二篩選備用運動學片段,如果某個類型中所包含的運動學片段不足20個。 步驟三以篩選的20個運動片段為基礎集合,從中隨機篩選并組合成大于等于1 200 s的代表工況。 具體流程如圖7所示。 圖7 工況構建流程 根據前述的聚類分析法的工況構建過程,按照分類結果的時間比例,合成如圖8所示的1 200 s的汽車代表行駛工況。 圖8 電動汽車代表工況 對比代表工況和測試數據的特征參數,結果如表3所示。可以看出,構建的代表工況可以反映試驗電動汽車汽車的整體行駛特征。 表3 代表行駛工況和實際采集數據源特征參數 基于前述電動汽車行駛工況,首先按照最小距離原則確定電動汽車運行狀態的類別: (9) 確定電動汽車在某一路段行駛時的類別為1,2,…,n后,計算電動汽車在該類別工況下的行駛距離dn。則該路段消耗電量E為: E=Eq1×d1+Eq2×d2+…+Eqn×dn (10) 式中:Eqn代表第n類工況每公里消耗的電量。通過該路段后,剩余電量Es為: Es=E0Ssoc-E (11) 式中:E0、Ssoc代表了初始電量與荷電狀態。 在每個類別中隨機抽取了部分運動學片段,并合成了模擬的行駛情況。繪制出本段模擬行駛片段的實際耗電量與采用耗電評估方法計算所得的耗電量曲線對比圖,如圖9所示,虛線為所記錄的實際耗電曲線。可以看出基于本文提出的基于道路行駛工況的研究,可以實現對電動汽車耗電量和道路行駛耗電特性的有效追蹤。 圖9 耗電量曲線 目前,國內外針對汽車工況的研究主要以傳統汽車為主,對電動汽車工況研究較少。工況提取和聚類結果的判斷方法也存在一定不足,在電動汽車能耗特性分析方面也沒有與實際工況緊密結合。本文采用無監督式聚類算法ISODATA進行電動汽車的工況合成與構建,并對合成的代表性工況進行了合理性驗證,誤差均在±5.2%的范圍內。在運動片段聚類和代表性工況的基礎上,進行了電動汽車道路耗電特性分析和電量實時估算分析,驗證了所構建的行駛工況模型與耗電量估算方法具有合理性。本文對電動汽車的能耗分析、基礎充電站設施配置、充電策略等方向的研究具有一定的參考價值。3.4 Silhouette函數輪廓圖篩選聚類結果




4 構建行駛工況和耗電實時估算方法
4.1 合成方法

4.2 電動汽車工況合成結果

4.3 電動汽車工況合理性驗證

4.4 實際道路耗電估算

5 結 語