999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于關聯規則挖掘的路面損壞狀況影響因素分析①

2021-01-22 05:43:10賈彭斐
計算機系統應用 2021年1期
關鍵詞:關聯規則因素

曹 磊,徐 磊,楊 菲,賈彭斐

(長安大學 信息工程學院,西安 710064)

隨著我國交通行業的發展,公路里程數和線網復雜度也在不斷提升,越來越多的道路出現裂縫、坑槽、車轍等各種損壞情況,同時高溫,降雨等各種惡劣天氣對路面的性能的影響也極其嚴重,路面的養護管理工作難度也在不斷提升,在這種情況下路面的科學養護和預防養護就顯得尤為重要.

目前關于路面損壞及其影響因素的研究主要集中于公路領域[1],而針對兩者之間綜合關系的研究則較少[2].傳統的路面損壞情況影響因素的研究的主要方法有經驗分析、實地調研、數據統計等.這些分析方法主要基于當前的路面狀況,分析過程簡單、直接,因此所得到的路面損壞及其影響因素之間的關系往往單一、獨立,所涉及的影響因素較少,分析維度較低,無法客觀全面地認識路面綜合損壞情況.

部分學者嘗試借鑒其他學科領域的方法,對路面損壞影響因素關系進行研究.數據挖掘關聯分析是數據挖掘的一個重要分支,關聯規則分析能夠找出數據之間的潛在聯系,在不同的維度對數據進行全方位的分析,從而能夠更好地做出更加理想的決策,能夠更加準確的預測事物未來的發展趨勢等[3].文獻[4] 采用關聯規則分析通過大量數據集中客觀地發現了路面病害成因.文獻[5]采用關聯分析技術對水泥混凝土路面病害關系進行了研究,得到了填縫料損壞、板底脫空、錯臺、斷板之間的關聯規則,并得出了它們之間的轉化關系.

在此基礎上,本文對關聯規則Apriori 算法進行了改進以提升速度和性能.基于大量的路面數據,通過挖掘環境因素、交通因素、路面因素和路面破損情況之間存在的內在聯系,分析不同環境下路面破損的主要影響因素,進而對路面養護提供科學可靠的支持,為路面養護部門提供合理的養護建議與數據支撐.

1 路面狀況影響因素及其評價指標

1.1 路面狀況的影響因素分析

路面狀況錯綜復雜,影響路面狀況的因素也是多方面的.路面在結構上可分為面層、基層和墊層.通常情況下,路面受損壞的情況會隨著路面深度的增加而逐漸減弱.面層直接受到降水、風雪、強光、高溫、行車荷載等的直接或間接反復作用,因此本文主要研究面層損壞情況與影響因素之間的關聯性.在諸多影響因素中,環境因素、路面因素和交通因素為主要影響因素.

環境因素主要包含溫度、濕度、降水量、蒸發量等氣候條件,當環境因素變化較大時,路表面的物理特性也會發生變化,如溫度變化會引發熱膨脹系數的變化而導致路面發生開裂或老化現象.

路面因素主要由路面的類型和材料來決定.由于路面的材料及特性差異,即使是相同環境因素的影響下,不同類型路面發生病害的類型和嚴重程度也不相同.

交通因素主要指路面的交通流量,城市和鄉村的交通流量差距很大,損壞程度也有很大差別,因此交通因素也是本文考慮的一個重要的影響因素.

1.2 路面狀況的評價指標

在諸多影響因素影響下,路面破損情況的衡量指標對這些影響因素關鍵與否起著至關重要的作用,依據交通運輸部發布的《公路技術狀況的評定標準》,路面質量指數(Pavement Quality Index,PQI)主要由路面損壞指數(PCI)、行駛質量指數(RQI)、路面車轍深度指數(RDI)、路面抗滑性能指數(SRI)來評價:

其中,wPCI、wRQI、wRDI和wSRI為各項指標的參數,對于瀝青路面,這4 個參數值分別為0.35,0.4,0.15,0.1.

式(1)的4 個參數中,路面損壞指數(PCI)和路面行駛質量指數(RQI)主要是通過路面平整度(IRI)來衡量,且IRI與PCI具有正相關的關系.而由于SRI的測量方式復雜且權重較小,本文將不作考慮.因此通過建立環境、路面、交通等影響因素與路面車轍RDI和平整度IRI之間的關聯規則即可得到這些影響因素與路面損壞情況之間的關聯性.

2 關聯規則及Apriori 算法改進

2.1 關聯規則相關概念

關聯規則的形式:兩個不相交的非空集合X、Y,如果有X?Y,那么X?Y就是一條關聯規則.以下是一些比較重要的概念:

項目:數據庫中的一個字段,以一次事務來看如{A,B,C},其中每一個事物A、B、C都分別是一個項目.

事務:事務本身也是一個項集,但是該項集包含了一次交易記錄中發生的所有項目的集合.

項集:指在一次事務中,由零個或多個項目組成的集合,一般會大于零個,通常我們將由m個項目組成的集合稱為m-項集,如{A,B}就是一個二項集.

支持度:項集{X,Y}在總項集中所占的百分比,即在總項集中項集{X,Y}出現的次數count(X∪Y)與整個數據集中的項集總數|D|之比support(X?Y)=count(X∪Y)/|D|,支持度能夠反映一個項集出現的概率.

頻繁項集:支持度大于或等于設定的最小支持度的項集.

置信度:在已知項集X存在并發生的條件下,項集Y發生的概率,即項集{X,Y}數量與項集{X}數量的比值confidence(X?Y)=support(X?Y)/support(X)

強關聯規則:支持度與置信度均大于或者等于設定的最小支持度和最小置信度的關聯規則就是強關聯規則.

關聯規則挖掘過程主要包含兩個階段:

第1 階段:在數據集中找出所有的頻繁項集;

第2 階段:由頻繁項集產生強關聯規則.

關聯規則挖掘的第1 階段要求產生項集的支持度必須大于設定的最小支持度,其中項集的個數可以從1 到K遞推,得到頻繁K項集;第2 階段中這些頻繁項集對應的關聯規則的置信度必須大于設定的最小置信度,才能形成強關聯規則.

2.2 Apriori 算法

Apriori 算法主要是通過掃描數據庫產生候選項集,然后通過對候選項集的剪枝、篩選等操作得到頻繁數據集最終得到強關聯規則的一種算法.該算法的主要關鍵點是產生頻繁項集即由k-1 項集到生成k項集.該算法的流程如圖1所示.

圖1 Apriori 算法流程圖

Apriori 算法根據自身定理性質,在產生候選項集時,減少了頻繁項集的個數,節約了一定的時間,取得了很好的性能.但還存在兩大缺點:

(1)會產生大量的候選項集;

(2)在產生頻繁項集時,都需要不斷的掃描事務數據庫,因此比較耗時.

如當頻繁一項集L1有1000 個時,候選二項集C2個數將會達到幾十萬.而在執行每一步時都需要不斷的掃描數據集,這樣會使得Apriori 算法的效率大大降低,針對這個問題,本文對該算法進行了改進.

2.3 改進的Apriori 算法

對于關聯規則挖掘來說,其目的就是在數據項目中挖掘出頻繁多項集,原Apriori 算法中通過對候選項集的操作得到頻繁項集.而當項目較多時,Apriori 算法在產生候選項集時需要耗費大量的時間,從而影響算法的效率,在產生候選二項集時這種情況尤為明顯,因此本文采用一種不生成候選二項集的方法來產生二項集,減少大量的候選集掃描時間[6],因此可以極大地提高算法的效率.

設初始數據集為D,包含Tk(k=1,2,···,n),Tk=(t1,t2,t3,···),即每條記錄Tk由很多項目ti構成.每個流程中事務集為TID(1,···,t),最小支持度設為min_sup=s%,且事務數不小于p(p=s%*n)次,Num為TID中的元素個數.

改進算法的具體步驟如算法1[7-10].

算法1.改進的Apriori 算法1)重新構造數據庫:對數據記錄進行掃描,搜索出包含t1 的事務,并生成a1;搜索出包含t2 的事務,生成a2;······搜索出包含tk 的事務,生成ak;2)生成新格式的數據庫為A(a1?ak),將Num 小于p 的項去掉以實現數據庫的簡化;3)計算a1 和a2 的交集,若交集中的項目數小于p則舍去.以此類推分別計算a1 和a3,a1 和a4,···,a1 和ak 的交集;a2 和a3,a2 和a4,···,a2 和ak 的交集;····ak?1 和ak 的交集,保留的事務生成新的事務集B(b1?bk);4)計算出與存儲的事務集對應的項目集Bi∪Bj,并存儲為新的項目集;5)將新項目集整理即可得頻繁二項集,重復3),4)兩步,再去掉重復的事務集和項目集,就可得到頻繁三項集與頻繁四項集.6)檢查結果,重復上述步驟,得到更多的頻繁項集.

2.4 改進的Apriori 算法與原算法對比實驗

(1)實驗1

對同一組數據分別用原算法和改進算法在不同的最小支持度下計算其算法用時,其中最小支持度分別為0.1、0.2、0.3,同時保持置信度為0.6.此次使用的數據規格是100 條記錄,4 個屬性.得到的結果如圖2所示.

圖2 原算法與改進算法不同支持度下用時對比圖

從這個實驗可以看出改進的算法在不同支持度下性能都比較穩定,而原算法只有在支持度比較高時性能才稍好;同時改進算法的每次用時都比原算法少一個數量級.

(2)實驗2

本實驗分別使用原算法和改進算法在不同數據量下計算其用時.此次使用的數據規格分別是:10 條記錄,4 個屬性;100 條記錄,4 個屬性;200 條記錄,4 個屬性,保證最小支持度為0.1,最小置信度為0.6;兩種算法用時如圖3所示.

圖3 原算法與改進算法不同數據量用時對比圖

從這個實驗可以看出,在數據量增加的情況下,原算法用時增加比較明顯,而改進算法的用時基本沒有變化;同時改進算法的每次用時都比原算法少一個數量級.

綜合兩個實驗可以看出,本文提出的改進Apriori算法在復雜度和用時上均優于原算法,在不同的支持度和數據量下均能保持良好性能.

3 數據及離散化處理

3.1 路面數據來源LTPP

路面長期使用性能研究計劃(LTPP)是北美知名的公路研究計劃之一,它對世界各國道路質量的提升和路面的研究提供的數據支持.研究人員使用各種路面類型的標準數據收集程序和協議來收集路面性能數據.本文數據就是來源于LTPP 數據庫.

在LTPP 數據庫中提取并進行清洗處理得到州代號為50 的州2019年的每日車轍深度、溫度和降水量的數據再以月份為單位進行平均得到月度數據,如表1所示.

在數據庫中提取并清洗得到同一地方2008年到2019年4380 天的車流量、平均溫度和降水量的數據,然后以年為單位對每年的數據進行平均得到路面平整度和其影響因素(年平均日交通量(AADTT)和年平均溫度以及年總降雨量)的數據如表2.

表1 車轍深度與影響因素數據

表2 路面平整度及其影響因素

3.2 數據離散化

由于本文使用的數據數據量較大且復雜,為了簡化數據結構通常需要使用數據離散化技術對數據進行離散化處理.連續數據的離散化就是將數據值域劃分為若干個離散的區間,之后用不同的符號代表落在每個子區間中的屬性值.數據挖掘中使用離散化后的數據得到的結果更加的簡便、緊湊、準確,也更加方便被我們使用和重用[11-13].本文使用K-means 算法對數據進行離散化處理,處理流程如圖4.

圖4 K-means 算法離散化數據流程

對于一個數據點Xi的輪廓系數計算方法:

其中,S(i)為輪廓系數,a(i)表示數據點Xi到同一簇內其他數據點不相似程度的平均值,b(i) 表示數據點Xi到其他簇的平均不相似程度的最小值,a(i)、b(i)的計算方法:

a(i)=average(數據點Xi到所有它屬于的簇中其它點的距離)

b(i)=min (數據點Xi到所有其他簇的點的平均距離)

輪廓系數越大表示數據聚類的效果越好.

以下以車轍深度數據以及其影響因素的離散化為例,對車轍深度數據以及影響因素計算輪廓系數結果如圖5.

圖5 不同K 值下車轍深度及其影響因素輪廓系數

通過對比可得,對于這3 種數據,在K=3 時輪廓系數均達到最大值,此時每種數據的聚類效果達到最佳.對車轍深度數據基于參數K=3 進行離散化處理結果如圖6.

圖6 車轍深度數據離散化結果圖

由車轍數據離散化結果圖可將車轍深度數據分為3 類.用L1、L2 和L3 表示第1 類、第2 類和第3 類.L1的聚類中心為[0.925,1],L2 的聚類中心為[4.45,1],L3 的聚類中心為[11.13,1],3 個等級的案例數分別為6,4,2.

對車轍深度數據基于參數K=3 進行離散化處理,結果如圖7.

由平均溫度數據離散化結果圖可將平均溫度數據分為3 類.用T1 和T2 和T3 分別表示第1 類、第2類和第3 類.T1 的聚類中心為[3.1,1],T2 的聚類中心為[13.76,1],T3 的聚類中心為[23.775,1],3 個等級的案例數分別為3,5,4.

圖7 平均溫度數據離散化結果圖

對降水量數據基于參數K=3 進行離散化處理,結果如圖8.

圖8 降水量數據離散化結果圖

由降水量離散化結果圖可將降水量數據分為3 類.用E1、E2、E3 分別表示第1 類、第2 類和第3 類.E1 的聚類中心為[67.93,1],E2 的聚類中心為[139.98,1],E3 的聚類中心為[198.08,1],3 個等級的案例數分別為4,4,4.

將以上3 種數據的離散化結果整理如表3.

表3 車轍深度數據及其影響因素離散化匯總表

同理使用同樣的方法分別對平整度及其影響因素進行K值確定和離散化處理.將年平均日交通量分為3 個等級M1、M2、M3,將路面平整度分為4 個等級N1、N2、N3、N4,將年平均溫度分為5 個等級P1、P2、P3、P4、P5,將年總降水量分為4 個等級O1、O2、O3、O4,其中等級越大表示程度越高或越嚴重,可以得到表4.

表4 平整度及其影響因素離散化匯總表

4 基于改進Apriori 算法的路面狀況影響因素關聯規則挖掘

4.1 環境因素與路面車轍深度關聯規則挖掘

利用改進的Apriori 算法取最小支持度min-sup為10%,最小置信度min-con為60%,首先進行環境因素數據和路面車轍深度數據的關聯規則挖掘[14].使用改進的Apriori 算法處理離散化數據可以得到各個頻繁項集和其對應的支持度和置信度如表5.

表5 各個頻繁項集和其對應的支持度

強關聯規則如表6.

將表6結果轉化成柱狀圖如圖9.

表6 置信度大于最小置信度的強關聯規則

圖9 強關聯規則支持度和置信度柱狀圖

針對上述實驗結果.在本文的研究中路面狀況是因變量,而影響因素則是對目標造成影響的自變量.所以在環境影響因素與路面車轍的關聯規則挖掘中,應該以車轍的深度作為分析的目標函數,在上述支持度和置信度都滿足條件的強關聯規則中篩選出以車轍深度作為目標的關聯規則如表7.

表7 強關聯規則

針對上述3 則強關聯規則,根據前文規定的車轍等級:等級1 為輕微的車轍問題,等級2 為一般的車轍問題,等級3 為嚴重的車轍問題.對于溫度等級1 為低溫,等級2 為溫度一般,等級3 為高溫情況;對于降水量等級一為降水量稀少,等級2 為降水量一般,等級3 為降水量嚴重.

分析以上強關聯規則,可以得出如下結論:

規則1.當某地降溫度為T2 等級即處于[11.6,15.8]范圍時相對容易出現L1 輕微情況的車轍問題.

規則2.當某地降水量為E3 等級即處于[179.6,218.9]時,路面容易也很出現輕微的車轍問題.

規則3.當某地降水量為E3 等級即處于[179.6,218.9]時,同時溫度為T2 等級即處于[11.6,15.8]時,更容易出現L1 等級的輕微車轍問題.也就是當降水量為E3 時,輕微的車轍問題更容易在溫度為[11.6,15.8]之間發生.或者當溫度為T2 等級即[11.6,15.8]時,輕微的車轍問題更容易在降水量為[179.6,218.9]的地方發生.

4.2 環境交通因素對路面平整度關聯規則挖掘

利用改進的Apriori 算法取最小支持度min-sup為20%,最小置信度min-con為60%,進行影響因素和路面平整度數據的關聯規則挖掘.得到各個頻繁項集和其對應的支持度和置信度如表8.

表8 頻繁多項集

其中的強關聯規則如表9.

將表9結果轉化成柱狀圖如圖10.

表9 滿足最小支持度的關聯規則及其置信度

圖10 強關聯規則支持度和置信度柱狀圖

根據因變量為N 可以篩選出強關聯規則如表10.

表10 強關聯規則及其置信度和支持度

規則1 和規則2 是關于N1 的強關聯規則.根據前文等級設定,規則1 說明當年平均日交通量為M1(輛)等級即處于[540,810]之間時容易出現N1 等級輕微情況的路面平整度問題.規則2 說明當年平均溫度(℃)為P3 等級即處于[16.8,17.4]相對較低的溫度時,路面易出現輕微的平整度問題.

規則3 和規則4 是關于兩條關于N2 的關聯規則,規則3 說明當年平均日交通量(輛)為M2 即處于[1300,1550]相對較高時,路面更容易出現N2 等級的一般的平整度問題.規則4 說明在年平均溫度(℃)為P3 等級即處于[16.8,17.4]相對較低的溫度時,在平均日交通量(輛)為M2 即處于[1300,1550]的路面更易出現一般的平整度問題.

4.3 道路養護管理建議

根據以上分析結果,結合我國現狀提出幾點合理的養護管理建議:

1)在對于不同氣候條件的地方可以采取不同的措施來預防養護路面的破損情況.如當氣溫較高時可以適當地灑水降溫來降低路面溫度,降水量較大時可以適當地去幫助排水.

2)加強對交通流量大的路段的日常保養,及時修復損壞部分,使公路及其沿線設施的各部分均保持完好、整潔、美觀,保障行車安全、舒適、暢通.

3)采取正確的工程技術措施,周期性地進行大中修,延長公路的服役年限,以節省資金.

4)對原標準過低或留有缺陷的路線、構造物、路面結構、沿線設施進行改善和補建,逐步提高公路的使用質量、服務水平和抗災能力.

5)無論是關于道路修補的原材料,還是施工的技術都應加強監督力度,同時對于路面的檢測驗收也要嚴格采用國際統一標準.

5 總結

本文首先探討了路線損壞情況的主要影響因素,針對Apriori 算法耗時及復雜度高的缺點,提出一種不產生候選集的方法來產生頻繁集的改進Apriori 算法,通過對比實驗證明,改進的算法在不同情況下都能保持良好的性能.之后使用改進的算法對路面損壞情況指標及其影響因素進行關聯分析,得到之間的強關聯規則,基于強關聯規則得出不同環境下路面損壞情況的主要影響因素.相比于傳統的分析方法,本文使用的關聯規則算法不僅能夠對路面狀況的影響因素進行定性分析而且能夠定量地指出在不同情況下路面出現不同損壞情況的可能性,能夠對路面養護提供科學可靠的支持,可為路面養護部門提供合理的養護建議與數據支撐.

猜你喜歡
關聯規則因素
腹部脹氣的飲食因素
中老年保健(2022年5期)2022-08-24 02:36:04
撐竿跳規則的制定
“苦”的關聯
當代陜西(2021年17期)2021-11-06 03:21:36
群眾路線是百年大黨成功之內核性制度因素的外在表達
當代陜西(2021年12期)2021-08-05 07:45:46
數獨的規則和演變
奇趣搭配
讓規則不規則
Coco薇(2017年11期)2018-01-03 20:59:57
智趣
讀者(2017年5期)2017-02-15 18:04:18
TPP反腐敗規則對我國的啟示
短道速滑運動員非智力因素的培養
冰雪運動(2016年4期)2016-04-16 05:54:56
主站蜘蛛池模板: 凹凸精品免费精品视频| 久久频这里精品99香蕉久网址| 国产性爱网站| 欧美一区精品| 奇米精品一区二区三区在线观看| 欧日韩在线不卡视频| 国产精品一区在线观看你懂的| 国产精品成| 一级片一区| 国产精品yjizz视频网一二区| 亚洲黄色网站视频| 国产99视频免费精品是看6| 亚洲福利一区二区三区| 日韩精品亚洲一区中文字幕| 在线人成精品免费视频| 在线观看免费AV网| 欧美翘臀一区二区三区| 天堂网亚洲系列亚洲系列| 亚洲欧美成人在线视频| 亚洲人成网站在线观看播放不卡| 亚洲高清中文字幕在线看不卡| 免费中文字幕一级毛片| 欧美亚洲日韩不卡在线在线观看| 日本精品中文字幕在线不卡 | 国产成人精品在线| 五月婷婷丁香综合| 香蕉eeww99国产在线观看| 一级毛片免费播放视频| 大乳丰满人妻中文字幕日本| 免费全部高H视频无码无遮掩| 成年人视频一区二区| 国内精品久久久久久久久久影视| 国产成a人片在线播放| 四虎国产永久在线观看| 呦女亚洲一区精品| 精品无码国产自产野外拍在线| 婷婷六月综合| 一区二区三区国产精品视频| 国产人碰人摸人爱免费视频| 99视频有精品视频免费观看| 亚洲国产精品日韩欧美一区| 欧美一级专区免费大片| 青青草原国产av福利网站| 亚洲午夜18| 中国精品久久| 国产最新无码专区在线| 亚洲一区二区在线无码| 国产欧美日韩va另类在线播放| AV无码国产在线看岛国岛| 亚洲天堂.com| 精品无码人妻一区二区| 国产日韩AV高潮在线| 在线高清亚洲精品二区| 亚洲天堂网视频| 国产色图在线观看| 国产美女精品人人做人人爽| 久久国产拍爱| 免费在线一区| 白丝美女办公室高潮喷水视频 | 国产福利小视频在线播放观看| 欧美午夜理伦三级在线观看| 天天干天天色综合网| 狠狠色综合网| 毛片网站在线播放| 久久久久国产精品熟女影院| 亚洲天堂免费| 国产乱肥老妇精品视频| 午夜免费小视频| 国产亚洲精品资源在线26u| 在线精品视频成人网| 成年av福利永久免费观看| 欧美日韩v| 国产区在线看| 五月天综合婷婷| 亚洲天堂网在线视频| 91成人免费观看| 九色在线观看视频| 亚洲综合天堂网| 综合久久五月天| 精品自窥自偷在线看| a级毛片免费网站| www.国产福利|