李保龍,王曉峰
(上海海事大學(xué)信息工程學(xué)院,上海201306)
公路運(yùn)輸在國(guó)民經(jīng)濟(jì)發(fā)展中具有重要作用,相比于鐵道運(yùn)輸、空中運(yùn)輸、航海運(yùn)輸具有方便快捷、價(jià)格低廉、機(jī)動(dòng)性強(qiáng)、服務(wù)面廣等優(yōu)勢(shì),占據(jù)了運(yùn)輸方式的主導(dǎo)地位[1]。但受利益驅(qū)動(dòng),車輛運(yùn)輸中經(jīng)常出現(xiàn)超限超載現(xiàn)象。超載超限就是公路運(yùn)輸中出現(xiàn)貨運(yùn)車輛實(shí)際裝載量超過(guò)道路限定裝載量的現(xiàn)象[2]。超限超載會(huì)導(dǎo)致公路損壞,嚴(yán)重縮短公路使用壽命,容易引發(fā)安全事故,還會(huì)擾亂運(yùn)輸市場(chǎng)秩序,阻礙公路運(yùn)輸事業(yè)的發(fā)展[3]。因此,分析車輛超載超限的規(guī)律,進(jìn)一步降低車輛超載超限,能夠有效降低高速公路的維護(hù)費(fèi)用,減少由超限超載所引發(fā)的交通事故從而避免重大經(jīng)濟(jì)損失,有助于高速公路的健康發(fā)展。
目前高速公路超載超限治理多以車輛自動(dòng)識(shí)別管理系統(tǒng)的研究與聯(lián)網(wǎng)檢測(cè)的結(jié)合。例如美國(guó)使用傳感器技術(shù),全美約有1000多個(gè)動(dòng)態(tài)稱重站,采用視頻采集設(shè)備和路邊控制器技術(shù),通過(guò)計(jì)算機(jī)系統(tǒng)與高速公路巡警的電腦相連接,對(duì)貨車進(jìn)行撿測(cè),及時(shí)獲得檢測(cè)數(shù)據(jù)和鑒別超載車輛的身份[4]。日本多采用靜態(tài)固定的或移動(dòng)的稱重設(shè)備對(duì)超限車輛進(jìn)行檢測(cè),南非也很重視自動(dòng)稱重技術(shù)的研究和應(yīng)用,并且將電子稱重設(shè)備應(yīng)用于治理超限超載工作中。王鵬、劉震、劉強(qiáng)等人從高速公路車輛超限檢測(cè)聯(lián)網(wǎng)系統(tǒng)的應(yīng)用來(lái)檢測(cè)車輛超載超限[5]。我國(guó)采用設(shè)立固定檢查站和抽調(diào)人力在高速公路上抽查等方式檢查車輛超載超限情況。這種方式存在檢測(cè)范圍有限、車輛選擇輔路逃避檢測(cè)、耗費(fèi)人力物力較大、檢測(cè)過(guò)程時(shí)松時(shí)緊等問(wèn)題。因此分析車輛超載與時(shí)間、季節(jié)的關(guān)系是很有必要的,這樣能夠?yàn)榭茖W(xué)合理的分配人力物力、節(jié)約資源作出指導(dǎo)。
為了使檢測(cè)站科學(xué)合理地分配資源,本文從時(shí)間角度應(yīng)用系統(tǒng)聚類方法對(duì)車輛超限率問(wèn)題進(jìn)行分析,客觀反映了車輛超限率的現(xiàn)狀,為有效降低高速公路超載超限率提供理論依據(jù),解決成本過(guò)高和檢測(cè)站車輛通過(guò)效率的問(wèn)題,提高高速公路治理水平。
本文的原始數(shù)據(jù)源于某省高速公路聯(lián)網(wǎng)監(jiān)控系統(tǒng)2016年全年的實(shí)際監(jiān)測(cè)記錄,由于人工操作不規(guī)范和工作繁雜,實(shí)際記錄數(shù)據(jù)量龐大,存在很多無(wú)效的數(shù)據(jù),無(wú)法直接應(yīng)用。因此,在進(jìn)行數(shù)據(jù)聚類分析之前有必要對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,解決原始數(shù)據(jù)中不一致、重復(fù)、緯度高等噪聲問(wèn)題[6]。處理中應(yīng)選取合適的屬性,盡可能賦予屬性名和屬性值明確的含義,統(tǒng)一多數(shù)據(jù)源的屬性值編碼,去除惟一屬性,去除重復(fù)性,去除可忽略字段,合理選擇關(guān)聯(lián)字段為主要原則[7]。具體處理如下:
(1)數(shù)據(jù)存儲(chǔ)方式轉(zhuǎn)換。原始數(shù)據(jù)為2016年1月至2016年12月的CSV文件,文件存儲(chǔ)量巨大不易處理,所以需要把文件存儲(chǔ)到MySQL數(shù)據(jù)庫(kù)中。
(2)數(shù)據(jù)預(yù)處理。對(duì)以下不同情況采取的處理方式:
①數(shù)據(jù)缺失。數(shù)據(jù)元素缺失分兩種情況:第一種是無(wú)效屬性字段的缺失,這種情況下直接將該屬性丟棄;第二種是部分字段缺失,數(shù)據(jù)元素不能補(bǔ)全,這種情況應(yīng)忽略該記錄。例如:記錄中ETC車輛電子標(biāo)簽OBU編號(hào)、支付方式代碼屬性并未錄入,并且該屬性也使用不到,所以對(duì)其作丟棄處理。
②數(shù)據(jù)錯(cuò)誤。原始數(shù)據(jù)部分字段的數(shù)據(jù)是錯(cuò)誤的,不能達(dá)到本文數(shù)據(jù)處理要求,所以對(duì)這些數(shù)據(jù)進(jìn)行修復(fù)處理。修復(fù)分為三種情況:第一種情況:部分字段錯(cuò)誤的數(shù)據(jù),該記錄直接丟棄;第二種情況:部分字段缺失,需要手工填寫空缺值;第三種情況是字段的部分缺失,這時(shí)要進(jìn)行截取。例如:部分時(shí)間是1997年開始的,這些記錄是操作失誤或者儀器調(diào)試的無(wú)用數(shù)據(jù),應(yīng)丟棄;有些記錄的超限率為空值,可以根據(jù)載重和核重計(jì)算出來(lái)。
③數(shù)據(jù)過(guò)濾。一般來(lái)講,車輛超載之后才有超限率,所以對(duì)結(jié)果數(shù)據(jù)中超出該范圍的數(shù)據(jù)進(jìn)行過(guò)濾,降低錯(cuò)誤記錄對(duì)結(jié)果的影響。
車輛超限率能夠較好的反映出車輛超載超限的情況。降低車輛超限率就表示有效地治理了車輛超載超限現(xiàn)象,因車輛超限超載而造成的道路交通事故就會(huì)減少,道路運(yùn)輸市場(chǎng)秩序?qū)⒌玫矫黠@好轉(zhuǎn),公路通行率和運(yùn)輸效益就會(huì)得到提高。設(shè)車輛實(shí)際載重為w(單位:噸),車輛額定載重為u(單位:噸),車輛超限率為v,定義超限率如(1)式所示。

為了分析出不同時(shí)間段車輛超載情況,我們定義車輛平均超限率,表示在單位時(shí)間內(nèi)每輛車的超限率之和與通行車次的均值。平均超限率可以較好地體現(xiàn)車輛在不同時(shí)間段的超載情況。如果時(shí)間跨度大,就對(duì)車輛超限的作用減小。考慮到以月和季度劃分時(shí)間跨度大,對(duì)車輛超載超限影響太大,另外由于數(shù)據(jù)量龐大,數(shù)據(jù)不易處理,所以取車輛平均超限率的時(shí)間單位為每小時(shí)。以每天0-24小時(shí)為總的統(tǒng)計(jì)時(shí)間段,分析各個(gè)時(shí)間段車輛超載超限的變化規(guī)律。平均超限率為vˉ,單位時(shí)間內(nèi)通行車次為n,vi表示每輛車的超限率,,其中未超限車輛超限率為0,平均超限率定義為式(2)。

聚類分析就是按照某個(gè)特定標(biāo)準(zhǔn)把一個(gè)數(shù)據(jù)集劃分成不同的類或簇。通常劃分后同一簇內(nèi)的數(shù)據(jù)特征相近,不同簇間的差異很大。聚類的屬性語(yǔ)言描述為:
初始時(shí)將每小時(shí)的平均超限率作為一簇,然后計(jì)算各小時(shí)超限率之間的距離,選擇特征距離最小的一對(duì)合并成新簇,計(jì)算新簇與其他簇之間的特征距離,再將特征距離最近的兩個(gè)簇合并,循序漸進(jìn),直至所有小時(shí)的平均超限率歸并一簇為止。
設(shè) Ni表示小時(shí)特征,把 N1,N2,N3,…,Nn各自為一簇,Vi表示 Ni的平均超限率,dij表示Ni與Nj之間的特征距離:

聚類步驟:
(1)使用式(3)計(jì)算各個(gè)小時(shí)特征之間的距離,得到特征距離矩陣D0,各時(shí)間段集合自成一類。
(2)在矩陣D0非對(duì)角線的元素中找出最小元素,設(shè)為 dij,將 Ni和 Nj合并成新的簇 NM1,則{Ni,Nj}即NM1的全部樣本,使用式(2)計(jì)算出NM1的平均超限率。
(3)使用式⑶計(jì)算NM1與其他時(shí)間段特征的距離,得到距離矩陣D1。
(4)重復(fù)(2)(3)步驟,直到所有的小時(shí)特征歸為一個(gè)簇。
例如:N1,N2,N3,N4的平均超限率為2.2245,2.7173,3.1212,3.3530,第一步計(jì)算出D0矩陣(因?yàn)樘卣骶嚯x得出的為對(duì)稱矩陣,因此只展示上三角矩陣)如表1:

表1
第二步可以得出D0中計(jì)算將N3和 N4特征距離最近,合并成新的簇 NM1,接著計(jì)算NM1與其他屬性的特征距離矩陣D1,如表2:

表2
重復(fù)以上步驟,直到所有的特征分為一個(gè)簇為止。
2016年分為四個(gè)季度,可以分析出季節(jié)對(duì)超限率的影響,對(duì)超限車輛的時(shí)間屬性進(jìn)行分析,探討超限率分布規(guī)律。
把時(shí)間序列分成不同簇,對(duì)圖1中四個(gè)季度聚類譜系圖進(jìn)行對(duì)比分析,為了更清楚地描述車輛超載的嚴(yán)重程度,使用A、B、C三個(gè)等級(jí)來(lái)表示(A表示嚴(yán)重超限,B表示一般超限,C表示輕微超限),把每個(gè)季度的平均超限率以表格形式表現(xiàn),如表3所示。由表3可知,各個(gè)簇分別按照A、B、C各自的平均超限率依次降低,可以清晰的顯示四個(gè)季度車輛平均時(shí)間超限率的差異。同樣的對(duì)圖2的2016年全年譜系圖進(jìn)行分析,由表4顯示超限率在時(shí)間上的差異。

表4 2016年全年數(shù)據(jù)聚類結(jié)果

圖1 2016年各季度聚類譜系圖

圖2 2016年全年聚類譜系圖
系統(tǒng)聚類算法根據(jù)每個(gè)時(shí)間段的平均超限率把24個(gè)時(shí)間段對(duì)應(yīng)的數(shù)據(jù)分成了不同的簇,再根據(jù)不同超限率水平將簇分為高、中、低三類,分類結(jié)果如表3所示。從表3中可以看出,車輛在1-6h時(shí)間段內(nèi)的平均超限率在四個(gè)季度都比較嚴(yán)重;在19-24h時(shí)間段四個(gè)季度的平均超載率表現(xiàn)一般;在12-17時(shí)間段四個(gè)季度內(nèi)平均超限率都較低。在第一季度內(nèi)車輛超限程度分布的時(shí)間段也和其他季度差別較大,第一季度嚴(yán)重超限集中分布在1-11時(shí)間段之間,而其他幾個(gè)季度相差不大且集中分布在1-6時(shí)間段,說(shuō)明車輛受季節(jié)的影響較大。對(duì)比表3和表4車輛嚴(yán)重超載的高峰期在1-6時(shí)間段,這個(gè)時(shí)間段應(yīng)加大超限檢測(cè)和治理力度;在19-24時(shí)間段內(nèi)超載率一般,在這個(gè)時(shí)間段內(nèi)保持正常檢查力度即可;在12-17時(shí)間段內(nèi)平均超載率較低,說(shuō)明下午的超限平均水平較低,應(yīng)適當(dāng)減少交通檢測(cè)人力投入。根據(jù)不同時(shí)間段超限率的高低決定檢測(cè)及相關(guān)人員的投入力度,可以最大程度的節(jié)約人力等相關(guān)資源,提高交通部門的管理水平和治理效率。同時(shí)交通管理部門可以結(jié)合不同的季節(jié)合理調(diào)整工作人員的上班時(shí)間,有效提高工作效率。

表3 2016年各季度聚類結(jié)果
本文構(gòu)建了車輛超載超限模型,結(jié)合單位時(shí)間內(nèi)的平均超限率對(duì)24個(gè)時(shí)間段車輛平均超限率進(jìn)行了分析。以2016年全年高速公路通行流水?dāng)?shù)據(jù)為研究對(duì)象,運(yùn)用系統(tǒng)聚類方法對(duì)一天24小時(shí)時(shí)間段進(jìn)行了聚類分析,挖掘出車輛超載存在的時(shí)間特征和規(guī)律。高速公路檢測(cè)站可以在車輛超載超限嚴(yán)重的時(shí)間高峰期采取措施,例如加大力度檢查,上路抽查等手段去檢查過(guò)往車輛,以此來(lái)降低車輛超限率。在車輛超載超限較低的時(shí)間段內(nèi)減少人力物力投入,以此來(lái)節(jié)約成本。