999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于機(jī)器學(xué)習(xí)的鐵路工程生態(tài)風(fēng)險(xiǎn)管理研究

2023-06-09 07:51:34宋瑞震陳宏權(quán)曾賽星
預(yù)測 2023年1期
關(guān)鍵詞:鐵路文本生態(tài)

宋瑞震, 高 鑫, 陳宏權(quán), 曾賽星

(1.上海交通大學(xué) 安泰經(jīng)濟(jì)與管理學(xué)院,上海 200030;2.上海交通大學(xué) 中美物流研究院,上海 200030)

1 引言

鐵路工程是我國基礎(chǔ)設(shè)施建設(shè)的重要組成部分,處于我國綜合交通運(yùn)輸體系中的骨干地位。截至2020年底,我國鐵路營業(yè)里程達(dá)14.6萬公里,其中高速鐵路3.8萬公里,極大地促進(jìn)了我國經(jīng)濟(jì)增長[1]。鐵路工程具有建設(shè)規(guī)模大、地區(qū)跨度大、生態(tài)環(huán)境影響顯著等特點(diǎn),極易對生態(tài)環(huán)境脆弱地區(qū)產(chǎn)生不可逆的生態(tài)影響。因此在工程設(shè)計(jì)階段,就必須充分考慮工程建設(shè)可能帶來的生態(tài)環(huán)境影響。例如,青藏鐵路橫貫青藏高原,工程建設(shè)會對動植物的生存環(huán)境以及生物多樣性產(chǎn)生顯著影響。為保護(hù)青藏高原的生態(tài)環(huán)境,我國政府投入了約15.4億元用于沿線的環(huán)境保護(hù)和生態(tài)恢復(fù)[2],在青藏鐵路沿線設(shè)計(jì)建設(shè)了33座“生態(tài)走廊”,解決了鐵路工程所引發(fā)的動物生存棲息地分割問題[3];采用48臺最先進(jìn)的旋挖式鉆機(jī)修建青藏鐵路清水河特大橋,避免了鉆孔產(chǎn)生泥沙所引發(fā)的水體污染[4];采用濕鉆法施工,降低隧道施工中粉塵帶來的大氣污染問題等[5]。

鐵路工程生態(tài)風(fēng)險(xiǎn)的復(fù)雜性早已備受關(guān)注,在鐵路建設(shè)期間可能會對沿線動植物、自然景觀和生態(tài)系統(tǒng)造成不同類型和程度上的影響,在不同鐵路工程特殊的施工條件和自然環(huán)境下,生態(tài)風(fēng)險(xiǎn)的復(fù)雜性將進(jìn)一步提高[6]。對鐵路工程具體生態(tài)風(fēng)險(xiǎn)類型的研究,國內(nèi)外學(xué)者主要從生態(tài)風(fēng)險(xiǎn)受體、生態(tài)影響范圍和影響程度等方面展開。生態(tài)風(fēng)險(xiǎn)受體主要包括鐵路工程沿途影響的動植物生活[7]、景觀格局[8]、人類活動[9]等方面,通過對風(fēng)險(xiǎn)受體的識別和分析能夠直接為鐵路建設(shè)的環(huán)境保護(hù)提供指導(dǎo)。對鐵路工程生態(tài)影響范圍和程度的研究,學(xué)者們主要將工程實(shí)踐與遙感圖像、GIS技術(shù)和生態(tài)學(xué)的理論方法相結(jié)合[10],確定鐵路工程生態(tài)影響的范圍和大小,及其隨時(shí)間和空間的變化情況,從宏觀的角度評估和預(yù)測生態(tài)風(fēng)險(xiǎn)[11]。整體來看,現(xiàn)有研究從多個(gè)角度探討了鐵路工程的主要生態(tài)風(fēng)險(xiǎn)受體和受影響程度,大多風(fēng)險(xiǎn)識別是基于某一確定視角下的主要風(fēng)險(xiǎn)類型,再結(jié)合過去相關(guān)的設(shè)計(jì)規(guī)范和主觀的經(jīng)驗(yàn)判定確定,能夠有重點(diǎn)地突出各種生態(tài)風(fēng)險(xiǎn)類型,但忽視了生態(tài)風(fēng)險(xiǎn)管理的客觀性和全面性。因此,需要使用更加客觀、系統(tǒng)的技術(shù)方法,全面地識別和梳理鐵路工程的生態(tài)風(fēng)險(xiǎn)類型。

機(jī)器學(xué)習(xí)(machine learning,ML)是一類算法的總稱,這類算法可以從大量的歷史數(shù)據(jù)推斷出數(shù)據(jù)隱含的規(guī)律,并利用這種規(guī)律進(jìn)行判斷或預(yù)測[12]。主題模型是無監(jiān)督機(jī)器學(xué)習(xí)模型中的一個(gè)重要分支,廣泛應(yīng)用于自然語言處理(natural language processing,NLP)中。主題模型的發(fā)展基于早期的向量空間模型(vector space model,VSM)中存在的“一詞多義”和“一義多詞”問題,先后有學(xué)者提出了潛在語義分析(latent semantic analysis,LSA)模型和概率潛在語義分析(probabilistic latent semantic analysis,PLSA)模型。在此基礎(chǔ)上,Blei等[13]提出著名的隱含狄利克雷分布(latent dirichlet allocation,LDA)模型,因其廣泛的適用性和良好的拓展性,國內(nèi)外學(xué)者將LDA模型應(yīng)用于潛在風(fēng)險(xiǎn)挖掘、計(jì)算機(jī)視覺和輿情監(jiān)控等領(lǐng)域[14,15]。LDA模型在訓(xùn)練時(shí)不需要人工標(biāo)注訓(xùn)練集,所以十分適合對未知類型的主題進(jìn)行識別和分類,如鐵路工程中存在的潛在生態(tài)風(fēng)險(xiǎn)類型。

然而,由于LDA是基于詞袋(bag of words)模型構(gòu)建的,使模型得到的每個(gè)主題之間的關(guān)鍵詞的關(guān)系割裂[16],而Word2Vec模型可以通過構(gòu)建三層神經(jīng)網(wǎng)絡(luò)用詞嵌入(word embedding)的方式將文本詞向量化,通過結(jié)構(gòu)化的詞向量分析關(guān)鍵詞間的語義關(guān)系[17]。Word2Vec模型包含兩種模型,分別是利用上下文預(yù)測中心詞的CBOW(continuous bag of words model)模型與通過中心詞預(yù)測上下文的Skip-Gram(continuous skip-gram model)模型。近年出現(xiàn)了將LDA與Word2Vec結(jié)合的研究[18],使主題和詞嵌入取得更準(zhǔn)確的結(jié)果。經(jīng)過Word2Vec模型處理后,將詞表示為低維空間上的語義向量,但仍然不夠直觀。所以可以進(jìn)一步利用主成分分析法(principal component analysis,PCA)提取詞向量中的重要特征并對特征降維,得到更加直觀的關(guān)鍵詞語義關(guān)系[19]。

基于以上分析,本文將LDA、Word2Vec和PCA三種無監(jiān)督機(jī)器學(xué)習(xí)模型整合使用,其優(yōu)勢在于利用LDA模型得到更加客觀、全面的風(fēng)險(xiǎn)主題詞的基礎(chǔ)上,借助Word2Vec解決LDA中主題詞的語義關(guān)系不明問題,再利用PCA解決Word2Vec中詞向量維度高不直觀問題,最終更加全面、系統(tǒng)和直觀地得到鐵路工程的生態(tài)風(fēng)險(xiǎn)類型和風(fēng)險(xiǎn)間的相關(guān)關(guān)系。

綜上,鐵路工程帶來的生態(tài)風(fēng)險(xiǎn)管理異常復(fù)雜,而現(xiàn)有的研究中,并沒有客觀、系統(tǒng)地對生態(tài)風(fēng)險(xiǎn)類型、風(fēng)險(xiǎn)源和應(yīng)對策略進(jìn)行梳理和歸納。為了建設(shè)環(huán)境友好的綠色鐵路工程并降低工程建設(shè)對生態(tài)環(huán)境的影響,首先,識別鐵路工程在建設(shè)期存在的主要生態(tài)風(fēng)險(xiǎn)類型,這為項(xiàng)目的生態(tài)風(fēng)險(xiǎn)管理指明了方向;其次,針對各類風(fēng)險(xiǎn),進(jìn)一步挖掘?qū)?yīng)的主要風(fēng)險(xiǎn)源,這為應(yīng)對生態(tài)風(fēng)險(xiǎn)提供了具體目標(biāo);最后,根據(jù)生態(tài)風(fēng)險(xiǎn)和風(fēng)險(xiǎn)源,匹配應(yīng)對策略,這為生態(tài)風(fēng)險(xiǎn)管理提供了具體的治理措施。基于此,本文基于三種機(jī)器學(xué)習(xí)模型,以鐵路工程建設(shè)階段存在的生態(tài)風(fēng)險(xiǎn)為研究對象,通過對大量歷史文本數(shù)據(jù)的分析,提出了基于機(jī)器學(xué)習(xí)的鐵路工程風(fēng)險(xiǎn)識別與應(yīng)對的模型方法,形成了“風(fēng)險(xiǎn)識別—風(fēng)險(xiǎn)溯源—風(fēng)險(xiǎn)應(yīng)對”的研究架構(gòu)。

本文的創(chuàng)新點(diǎn)在于:在理論上,形成鐵路工程生態(tài)環(huán)境“風(fēng)險(xiǎn)識別—風(fēng)險(xiǎn)溯源—風(fēng)險(xiǎn)應(yīng)對”的研究架構(gòu),豐富了鐵路工程生態(tài)風(fēng)險(xiǎn)管理和保護(hù)的理論內(nèi)涵,為研究和分析工程風(fēng)險(xiǎn)提供了新思路;在實(shí)踐上,提出了一種基于機(jī)器學(xué)習(xí)的鐵路工程生態(tài)風(fēng)險(xiǎn)管理的模型方法,補(bǔ)充了現(xiàn)有研究的方法體系,也為鐵路工程實(shí)踐中的生態(tài)風(fēng)險(xiǎn)識別、管理和修復(fù)提供決策參考。

2 理論框架與模型構(gòu)建

2.1 理論框架

本文以鐵路工程生態(tài)風(fēng)險(xiǎn)相關(guān)的歷史文本為數(shù)據(jù),利用三種機(jī)器學(xué)習(xí)模型的互補(bǔ)優(yōu)勢,提出基于機(jī)器學(xué)習(xí)的鐵路工程生態(tài)風(fēng)險(xiǎn)識別與應(yīng)對模型(如圖1)。該模型包括四個(gè)主要步驟:文本收集與預(yù)處理、樣本篩選、機(jī)器學(xué)習(xí)模型訓(xùn)練與可視化和生態(tài)風(fēng)險(xiǎn)、風(fēng)險(xiǎn)源及應(yīng)對策略提取,最終得到鐵路工程生態(tài)環(huán)境“風(fēng)險(xiǎn)識別—風(fēng)險(xiǎn)溯源—風(fēng)險(xiǎn)應(yīng)對”框架。該模型的優(yōu)勢在于:(1)針對大量的文本數(shù)據(jù),只需對機(jī)器學(xué)習(xí)模型輸出的主題相關(guān)詞進(jìn)行標(biāo)注即可得到系統(tǒng)且全面的鐵路工程生態(tài)風(fēng)險(xiǎn)類型。(2)使用的LDA、Word2Vec和PCA均屬于無監(jiān)督機(jī)器學(xué)習(xí)模型,有效地避免了人為梳理聚類的主觀性問題。(3)通過對生態(tài)風(fēng)險(xiǎn)關(guān)鍵詞表的調(diào)整,本文提出的模型方法還能被應(yīng)用于識別其他工程的各類風(fēng)險(xiǎn),具有一定的推廣價(jià)值。

圖1 基于機(jī)器學(xué)習(xí)的鐵路工程生態(tài)風(fēng)險(xiǎn)識別與應(yīng)對模型流程圖

2.2 模型構(gòu)建

2.2.1 文本收集與預(yù)處理

本文選擇提取WebofScience和Scopus兩個(gè)數(shù)據(jù)庫中已經(jīng)正式發(fā)表的鐵路工程生態(tài)環(huán)境風(fēng)險(xiǎn)相關(guān)文本全文數(shù)據(jù)。同時(shí),考慮到鐵路工程施工技術(shù)和裝備水平的不斷提升,部分過去存在的生態(tài)風(fēng)險(xiǎn)問題已經(jīng)在工程中得到解決,所以選擇數(shù)據(jù)庫中2010—2021年間的文本數(shù)據(jù)。根據(jù)關(guān)鍵詞使用:railwayAND(“environment*risk*”O(jiān)R“ecolog*risk*”O(jiān)R“environment*issues”O(jiān)R“ecolog*issues”O(jiān)R“environment*problem*”O(jiān)R“ecolog*problem*”)在文本的標(biāo)題、摘要或關(guān)鍵詞中搜索,各數(shù)據(jù)庫得到的文本結(jié)果如表1所示。

表1 數(shù)據(jù)收集與預(yù)處理結(jié)果

對文本預(yù)處理的步驟主要分為:全文PDF解碼、分詞、去停用詞和特殊符號。由于文本標(biāo)題、摘要和關(guān)鍵詞中信息有限,作為數(shù)據(jù)輸入主題模型訓(xùn)練可能無法得到詳盡的風(fēng)險(xiǎn)類型,所以提取全文構(gòu)建樣本數(shù)據(jù)。

2.2.2 樣本篩選

樣本得分的計(jì)算和篩選步驟如下:第1步,設(shè)定鐵路工程生態(tài)風(fēng)險(xiǎn)相關(guān)的關(guān)鍵詞KEYi(i=1,…,n),并根據(jù)關(guān)鍵詞在文本數(shù)據(jù)標(biāo)題中的詞頻分為高度相關(guān)、中度相關(guān)和低度相關(guān)三類。再根據(jù)相關(guān)程度對關(guān)鍵詞組賦權(quán),經(jīng)過多次取樣試驗(yàn)后調(diào)整賦值范圍,確定從低到高的關(guān)鍵詞賦權(quán)為[1,4]、[4,7]、[7,10]范圍內(nèi)的隨機(jī)整數(shù)WEIGHTj(j=1,…,m),如表2所示。第2步,分別統(tǒng)計(jì)上一步處理好的每個(gè)文本數(shù)據(jù)中相關(guān)關(guān)鍵詞表的各關(guān)鍵詞出現(xiàn)的頻次Ki(i=1,…,n)。第3步,運(yùn)用公式(1)計(jì)算每個(gè)文本的相關(guān)性得分,選擇得分排序前50%的文本作為后續(xù)機(jī)器學(xué)習(xí)模型的訓(xùn)練樣本。第4步,將各關(guān)鍵詞在權(quán)重范圍內(nèi)多次取值,重復(fù)計(jì)算文本相關(guān)性得分,并取每次得分前50%文本的并集作為初始樣本。

表2 鐵路工程生態(tài)風(fēng)險(xiǎn)關(guān)鍵詞優(yōu)先級及權(quán)重取值范圍

2.2.3 機(jī)器學(xué)習(xí)模型訓(xùn)練與結(jié)果提取

通過結(jié)合三種機(jī)器學(xué)習(xí)模型的互補(bǔ)優(yōu)勢,實(shí)現(xiàn)對鐵路工程生態(tài)風(fēng)險(xiǎn)系統(tǒng)性地識別,主要步驟為:(1)LDA與Word2Vec模型參數(shù)計(jì)算,包括:構(gòu)建語料庫和困惑度計(jì)算;(2)基于LDA“主題—單詞”分布的風(fēng)險(xiǎn)識別,包括:LDA模型建模與訓(xùn)練;(3)基于Word2Vec和PCA的鐵路工程生態(tài)風(fēng)險(xiǎn)溯源與應(yīng)對,包括:Word2Vec模型訓(xùn)練和PCA降維與可視化。

(1)LDA與Word2Vec模型參數(shù)計(jì)算

首先,為了將詞語中的語義處理為機(jī)器學(xué)習(xí)模型能夠識別和訓(xùn)練的信息,需要基于詞袋模型構(gòu)建語料庫。詞袋模型中利用詞頻表示詞向量,但詞頻多的詞并不一定是重要的風(fēng)險(xiǎn)分類詞,所以通過TF-IDF(term frequency-inverse document frequency)算法修正詞向量的特征權(quán)重。具體是通過公式(2)和(3)分別計(jì)算詞頻TF和逆向文本頻率指數(shù)IDF,再基于公式(4)得到TF-IDF權(quán)重值。

其 中xi,j表示詞 在文本dj中出 現(xiàn)的次 數(shù);∑kxk,j表 示文本dj中所有詞出現(xiàn)的次數(shù);|D|表示語料庫中文本總數(shù);|{j:ti∈dj}|表示包含詞ti的文本數(shù)。為了避免不在語料庫中的詞計(jì)算IDF值時(shí)|{j:ti∈dj}|為零的情況,所以使用|1+{j:ti∈dj}|。

此外,在進(jìn)行LDA模型訓(xùn)練之前,需要確定語料庫的隱含主題數(shù)作為模型的輸入?yún)?shù)。由于事先并不確定鐵路工程的生態(tài)風(fēng)險(xiǎn)類型數(shù),無法通過經(jīng)驗(yàn)確定主題數(shù),所以本文通過計(jì)算困惑度(perplexity)確定最優(yōu)的隱含主題數(shù)如(5)式。

(2)基于LDA“主題—單詞”分布的風(fēng)險(xiǎn)識別

鐵路工程生態(tài)風(fēng)險(xiǎn)識別的具體識別過程是:根據(jù)LDA輸出的“主題—單詞”分布,得到各類生態(tài)風(fēng)險(xiǎn)主題下相關(guān)系數(shù)最大的15個(gè)主題詞,再分別對不同主題下的15個(gè)主題詞進(jìn)行人工識別與標(biāo)注,得到鐵路工程生態(tài)風(fēng)險(xiǎn)分類結(jié)果。

在LDA模型中,每一篇文檔代表了一些主題所構(gòu)成的一個(gè)多項(xiàng)式分布,每一個(gè)主題又代表了很多單詞所構(gòu)成的一個(gè)多項(xiàng)式分布,而Dirichlet分布是這兩個(gè)多項(xiàng)式分布的共軛先驗(yàn)分布,因此可以通過多項(xiàng)式分布中的數(shù)據(jù)更新Dirichlet分布的參數(shù)(LDA模型中的α和β),從而獲得更準(zhǔn)確的估計(jì)。基于此,本文構(gòu)建了LDA模型求解中的損失函數(shù)如(6)式所示。

其中D表示語料庫,也就是M篇文章的集合;α表示生成每篇文章主題的多項(xiàng)式分布的Dirichlet分布的參數(shù);β表示生成文章中某個(gè)單詞的多項(xiàng)式分布的Dirichlet分布的參數(shù);θd表示第d篇文章的主題分布,也是多項(xiàng)式分布的參數(shù);zdn表示第d篇文章的第n個(gè)單詞的主題;wdn表示第d篇文章的第n個(gè)單詞。

根據(jù)TF-IDF算法得到的語料庫與困惑度計(jì)算得到的LDA模型的隱含主題數(shù),LDA主題模型訓(xùn)練求解基于變分推斷EM算法,該算法是將變分推斷和EM 算法(expectation-maximization algorithm)結(jié)合得到LDA模型中的“文檔—主題”和“主題—單詞”分布。

(3)基于Word2Vec和PCA的鐵路工程生態(tài)風(fēng)險(xiǎn)溯源與應(yīng)對

在LDA模型得到的“文檔—主題”分布的基礎(chǔ)上,結(jié)合上一步由“主題—單詞”分布識別的生態(tài)風(fēng)險(xiǎn)分類,得到每個(gè)文檔最大概率歸屬的生態(tài)風(fēng)險(xiǎn)類型。再將每類風(fēng)險(xiǎn)主題下的相關(guān)文本先后輸入到Word2Vec和PCA模型中,訓(xùn)練得到不同生態(tài)風(fēng)險(xiǎn)下的最大相關(guān)詞,并將相關(guān)詞標(biāo)注和歸納,最終確定各類生態(tài)風(fēng)險(xiǎn)的溯源與應(yīng)對策略。

運(yùn)用Word2Vec中的Skip-Gram模型計(jì)算各類風(fēng)險(xiǎn)主題詞的詞向量,來進(jìn)一步分析風(fēng)險(xiǎn)主題詞的相關(guān)關(guān)系。Skip-Gram模型每次選擇文中的一個(gè)詞作為中心詞,再通過計(jì)算該中心詞的上下文詞的準(zhǔn)確性來調(diào)節(jié)模型中的參數(shù),經(jīng)過多次迭代使模型的損失函數(shù)最小化如(7)式,求解得到風(fēng)險(xiǎn)主題相關(guān)詞的詞向量。從相關(guān)程度高的相關(guān)詞中進(jìn)行各類生態(tài)風(fēng)險(xiǎn)源頭和策略的標(biāo)注,匹配得到各類生態(tài)風(fēng)險(xiǎn)的源頭和策略。

其中T表示語料庫中的所有詞;t表示中心詞的位置;m表示中心詞上下文取詞范圍;p(xt+i│xt)表示中心詞取xt時(shí),在其上下文中的第i個(gè)詞xt+i出現(xiàn)的條件概率。

為了進(jìn)一步完善生態(tài)風(fēng)險(xiǎn)之間的相關(guān)關(guān)系,并且更加直觀地表示出各生態(tài)風(fēng)險(xiǎn)主題詞的語義關(guān)系,本文基于SVD分解協(xié)方差矩陣實(shí)現(xiàn)PCA模型,通過提取高維詞向量中的主要特征,實(shí)現(xiàn)對高維主題詞向量的降維,并作可視化處理,以驗(yàn)證LDA模型結(jié)果并進(jìn)一步發(fā)現(xiàn)各類生態(tài)風(fēng)險(xiǎn)的相關(guān)關(guān)系。

3 結(jié)果分析

3.1 模型訓(xùn)練結(jié)果與可視化

利用公式(1)進(jìn)行10次文本相關(guān)性得分計(jì)算后,篩選得到637個(gè)文本構(gòu)建語料庫。在進(jìn)行機(jī)器學(xué)習(xí)模型訓(xùn)練之前,通過計(jì)算困惑度選擇最優(yōu)隱含主題數(shù),得到不同主題數(shù)情況下的困惑度結(jié)果(圖2)。從圖中可以看出,LDA模型的困惑度值前期隨著主題數(shù)的增加明顯下降,說明模型能夠很好地將不同主題分類。隨著主題數(shù)的增加,困惑度下降的趨勢在主題數(shù)為35之后逐漸平緩,為了避免過模型擬合的情況,選擇隱含主題數(shù)為35。

圖2 不同主題數(shù)下的模型困惑度

隱含主題數(shù)確定后,通過變分推斷EM算法求解得到“主題—單詞”分布,設(shè)置EM 算法的最大迭代次數(shù)為100,得到每個(gè)主題輸出最相關(guān)的前15個(gè)單詞。然后對35個(gè)主題的主題詞進(jìn)人工標(biāo)注,抽象出各主題含義。排除主題中安全事故、自然災(zāi)害和工程主體建筑損壞等鐵路建設(shè)中的其他非生態(tài)風(fēng)險(xiǎn),得到與鐵路生態(tài)風(fēng)險(xiǎn)相關(guān)的主體模型聚類結(jié)果如表3所示,將生態(tài)風(fēng)險(xiǎn)相關(guān)的主題詞做詞云可視化,可以提取歸納出鐵路工程建設(shè)的生態(tài)風(fēng)險(xiǎn)主要有如下8類:棲息地分割(主題詞中包含:物種、列車、暴露、擾動、活動、空間、分布等);景觀破壞(主題詞中包含:地表、坡度、植被、腐蝕、景觀、土壤、保護(hù)、物種、生態(tài)、鐵路、植物、損失、覆蓋等);大氣污染(主題詞中包含:排放、溫室氣體、碳、灰塵、廢氣、化石等);噪聲污染(主題詞中包含:噪聲、交通、振動、聲音、生活、住宅、公共等);土壤污染(主題詞中包含:土壤、鉛、鎘、金屬、污染、元素、銅、鋅、風(fēng)險(xiǎn)、鉻、采樣、鎳、鉛、植物等);隧道涌水(主題詞中包含:破壞、洪水、排水、規(guī)模、地表、強(qiáng)度、暴露、風(fēng)險(xiǎn)、結(jié)構(gòu)、局部、空間、道路、地下水、損失、隧道等);廢水污染(主題詞中包含:離子、鹽分、硫酸鹽、排水、含量、濃度、沉降、液體等);水土平衡破壞(主題詞中包含:多年凍土、土壤、干燥、水分、密度、混合、化學(xué)、溫度、地層、地表、沉降、沙地、隧道、位移、巖石等)。

表3 LDA模型聚類結(jié)果

使用語料庫訓(xùn)練Word2Vec模型后,得到各風(fēng)險(xiǎn)主題詞的詞向量,再進(jìn)行PCA降維得到主題風(fēng)險(xiǎn)詞的分布情況,可以看出不同類型風(fēng)險(xiǎn)主題詞的空間分布差異,如土壤污染的相關(guān)主題詞基本分布在{(x,y)│x∈(-2,0),y∈(-1,1)}區(qū)域內(nèi),噪聲污染的相關(guān)主題詞基本分布在{(x,y)│x∈(1,2),y∈(-1,1)}區(qū)域內(nèi),空氣污染的相關(guān)主題詞基本分布在{(x,y)│x∈(-1,1),y∈(-2.5,-1)}區(qū)域內(nèi),說明主題模型對不同生態(tài)風(fēng)險(xiǎn)類型的主題詞進(jìn)行了合理地分類,且聚類效果好。同時(shí),根據(jù)主題關(guān)鍵詞的語義關(guān)系的二維分布,可以發(fā)現(xiàn):(1)景觀破壞、廢水污染和土壤污染三類生態(tài)風(fēng)險(xiǎn)存在相關(guān)關(guān)系,鐵路工程產(chǎn)生的廢水污染破壞自然水體后,可能會同時(shí)導(dǎo)致土壤污染,影響植被生長從而造成景觀破壞;(2)噪聲污染、棲息地分割和隧道涌水存在部分相關(guān)性,這部分主要在于類似的生態(tài)風(fēng)險(xiǎn)受體,尤其是對鐵路工程沿線野生動物生活和遷徙的影響;(3)水土平衡破壞與廢水污染的相關(guān)性較強(qiáng),同時(shí)也與土壤污染、隧道涌水等存在一定的相關(guān)關(guān)系;(4)大氣污染相對比較獨(dú)立,其中關(guān)于化石燃料、溫室氣體排放等關(guān)鍵詞空間集中分布。

3.2 鐵路工程生態(tài)環(huán)境“風(fēng)險(xiǎn)識別—風(fēng)險(xiǎn)溯源—風(fēng)險(xiǎn)應(yīng)對”框架

在提取得到生態(tài)風(fēng)險(xiǎn)的基礎(chǔ)上,根據(jù)LDA模型得到的“文本—主題”分布結(jié)果,將每類風(fēng)險(xiǎn)主題下的相關(guān)文本先后輸入到Word2Vec模型中,訓(xùn)練得到各類風(fēng)險(xiǎn)關(guān)鍵詞的相關(guān)詞。通過對相關(guān)詞的標(biāo)注和歸納,得到各類生態(tài)風(fēng)險(xiǎn)下的風(fēng)險(xiǎn)源和應(yīng)對策略,最終形成鐵路工程生態(tài)環(huán)境“風(fēng)險(xiǎn)識別—風(fēng)險(xiǎn)溯源—風(fēng)險(xiǎn)應(yīng)對”框架(圖3)。

圖3 鐵路工程生態(tài)環(huán)境“風(fēng)險(xiǎn)識別—風(fēng)險(xiǎn)溯源—風(fēng)險(xiǎn)應(yīng)對”框架

(1)棲息地分割風(fēng)險(xiǎn)。鐵路工程的建設(shè)中,鐵路主體工程會永久性占用土地,并對沿途地區(qū)強(qiáng)制性空間分割,這導(dǎo)致沿途動植物的活動和生長環(huán)境產(chǎn)生突變,將嚴(yán)重影響動物遷徙和繁衍。以青藏鐵路為例,青藏鐵路穿過可可西里自然保護(hù)區(qū),該保護(hù)區(qū)是藏羚羊、野牦牛等珍惜野生動物的重要棲息地,在鐵路建設(shè)期間藏羚羊的警戒和臥息行為明顯上升,覓食時(shí)間減少,對繁衍行為產(chǎn)生了明顯影響。對此,青藏鐵路在沿途設(shè)計(jì)多個(gè)橋梁、涵洞和圍欄等供野生動物穿越青藏鐵路,調(diào)查發(fā)現(xiàn)沿途藏羚羊、野牦牛、山地鼬鼠和亞洲獾等動物借助這些“生態(tài)走廊”能夠有效克服棲息地分割帶來的不利影響[20]。因此,鐵路工程建設(shè)帶來的棲息地永久性分割是一類重要的生態(tài)風(fēng)險(xiǎn)。

(2)景觀破壞風(fēng)險(xiǎn)。鐵路建設(shè)過程中,沿途會有大量的土石方工程,在橋隧口、臨時(shí)輔助道路和施工營地等區(qū)域的取、棄土?xí)斐墒┕龅刂脖缓偷乇硇螒B(tài)破壞,影響原有的景觀生態(tài)。在鐵路的運(yùn)營過程中,由于鐵路交通帶來了人類活動的擴(kuò)張,將會進(jìn)一步對景觀環(huán)境產(chǎn)生影響[21]。整體上看鐵路工程的建設(shè)使得沿途生態(tài)擾動區(qū)內(nèi)的歸一化植被指數(shù)(normalized difference vegetation index,NDVI)降低,以麗香鐵路為例,鐵路廊道破壞了沿線的自然景觀,產(chǎn)生了較大的正中切割作用[11],因此鐵路工程帶來的景觀破壞風(fēng)險(xiǎn)不能忽視。

(3)大氣污染風(fēng)險(xiǎn)。在工程建設(shè)階段產(chǎn)生的大氣污染主要有兩類:一是使用大型機(jī)械產(chǎn)生的各類溫室氣體,如COX、NOX和SO2等;二是在土石方運(yùn)輸、臨時(shí)道路建造和橋隧開挖中產(chǎn)生的粉塵污染,粉塵中可能含有施工過程中產(chǎn)生的有毒氣體和金屬顆粒污染大氣環(huán)境。大氣污染會對沿途的動植物生長產(chǎn)生不良影響,這種影響在含氧量低、空氣稀薄的高原高海拔地區(qū)更加嚴(yán)重。

(4)噪聲污染風(fēng)險(xiǎn)。現(xiàn)有的鐵路工程案例表明,鐵路的建設(shè)和運(yùn)營期都存在噪聲污染的情況。在工程建設(shè)期,包括山體爆破、大型機(jī)械的運(yùn)作以及施工營地的人類活動等都會產(chǎn)生噪聲污染,這些活動對沿途人類和野生動物的正常生活產(chǎn)生影響。類似的情況也出現(xiàn)在運(yùn)營期,比如成蘭鐵路運(yùn)行的噪聲和振動會減少大熊貓活動。相關(guān)研究建議火車應(yīng)該減少夜間運(yùn)行以保護(hù)大熊貓正常活動[22],對此現(xiàn)有鐵路設(shè)計(jì)了橋梁吸振器、聲屏障和吸音材料等一系列措施來降低噪聲污染。

(5)土壤污染風(fēng)險(xiǎn)。工程對土壤的污染主要包含施工中產(chǎn)生的棄渣、廢液,以及施工營地產(chǎn)生的生活廢料,如果不能合理地處理這類廢渣和廢液,將對工程沿線的土壤造成嚴(yán)重的污染。如青藏鐵路沿線土壤中的鉛、鎘和鋅等重金屬的濃度與鐵路干線的距離呈顯著負(fù)相關(guān)關(guān)系,說明鐵路工程使土壤中的重金屬濃度升高,在鐵路20米范圍內(nèi)這幾類重金屬的富集水平從無污染到顯著污染不等[23]。由于青藏高原的土壤中含有豐富的真菌和微生物,重金屬等污染物會對土壤中的微生物平衡產(chǎn)生影響,導(dǎo)致土壤肥力下降、高寒草甸退化[24]。因此,妥善處理生產(chǎn)生活的廢料,避免土壤污染是鐵路工程建設(shè)中一項(xiàng)十分重要的工作。

(6)隧道涌水風(fēng)險(xiǎn)。鐵路工程一般地理跨度大,時(shí)常要穿過山嶺重丘地區(qū),施工方式以隧道為主,隧道工程開挖過程中開挖、爆破、支護(hù)等極易破壞原有的地下水分布,致使大量的地下水涌出,這不僅改變了原始的自然水系,也給隧道中的施工人員帶來巨大的風(fēng)險(xiǎn)。在云南、河北等地區(qū)的鐵路工程建設(shè)中,部分隧道施工區(qū)的斷面日排水量達(dá)到2萬立方米,大量的涌水造成山體巖下水資源大量流失,使得施工后進(jìn)行生態(tài)恢復(fù)的成本高、難度大,山體中排出的水也對周邊的工農(nóng)業(yè)生產(chǎn)造成影響。針對涌水問題,我國的《鐵路隧道設(shè)計(jì)規(guī)范》中明確提出“防、排、截、堵結(jié)合,因地制宜,綜合治理”的防排水原則,可見隧道涌水帶來的生態(tài)影響在鐵路工程施工中需要格外重視。

(7)廢水污染風(fēng)險(xiǎn)。鐵路工程建設(shè)中產(chǎn)生的污染廢水主要有:施工營地的生活廢水、爆破后的降塵用水、使用混凝土澆筑時(shí)的廢水、施工設(shè)備工作時(shí)產(chǎn)生的廢水等。施工中的含污廢水會對地表水體和周邊水體產(chǎn)生影響,如隧道開挖過程中掘進(jìn)機(jī)產(chǎn)生的油污和重金屬顆粒會混在涌水中排出,破壞地下水環(huán)境的同時(shí)污染其他水體。一般鐵路工程時(shí)空跨度大,可能途經(jīng)多個(gè)自然保護(hù)區(qū)和水源保護(hù)區(qū),如天目山隧道工程靠近千島湖風(fēng)景區(qū),建設(shè)期產(chǎn)生的工程廢水中懸浮物、重金屬和酸堿度超標(biāo),必須經(jīng)過多項(xiàng)工藝處理后才能排放[25]。

(8)水土平衡破壞風(fēng)險(xiǎn)。工程建設(shè)中頻繁地取棄土可能會導(dǎo)致區(qū)域水土流失。取土一般會破壞土層上的植被,使得土壤保水能力減弱。如果對取土區(qū)的裸露地面不進(jìn)行生態(tài)修復(fù),會導(dǎo)致土壤水分流失。由于棄渣的力學(xué)性質(zhì)與原土不同,棄土難以與原有土壤融合,甚至可能導(dǎo)致山體滑坡、泥石流等地質(zhì)災(zāi)害,造成水土流失的惡性循環(huán)。這一風(fēng)險(xiǎn)在復(fù)雜艱險(xiǎn)的施工環(huán)境中尤為突出,比如青藏鐵路穿過多年凍土區(qū),若在施工后不及時(shí)采取水土保持措施,將加劇工程沿線的水土流失。因此,工程采用“繞、護(hù)、擋、防、攔、排、整、植”的模式進(jìn)行系統(tǒng)生態(tài)恢復(fù),制定了具有青藏高原特色的水土保持方案[26]。

4 結(jié)論與啟示

本文綜合使用LDA、Word2Vec和PCA三種機(jī)器學(xué)習(xí)模型,根據(jù)“生態(tài)風(fēng)險(xiǎn)識別—風(fēng)險(xiǎn)源挖掘—風(fēng)險(xiǎn)應(yīng)對策略”構(gòu)建的邏輯主線,提出“風(fēng)險(xiǎn)識別—風(fēng)險(xiǎn)溯源—風(fēng)險(xiǎn)應(yīng)對”的鐵路工程生態(tài)風(fēng)險(xiǎn)框架。利用LDA模型訓(xùn)練得到的“主題—單詞”分布得出鐵路工程存在的8類主要生態(tài)風(fēng)險(xiǎn),分別是:棲息地分割、景觀破壞、大氣污染、噪聲污染、土壤污染、隧道涌水、廢水污染和水土平衡破壞。進(jìn)一步,根據(jù)“文本—主題”分布,通過Word2Vec和PCA模型實(shí)現(xiàn)各類生態(tài)風(fēng)險(xiǎn)的溯源與應(yīng)對,并將各類生態(tài)風(fēng)險(xiǎn)主題詞的關(guān)系可視化。最后,結(jié)合青藏鐵路、麗香鐵路等工程生態(tài)風(fēng)險(xiǎn)識別與應(yīng)對的案例,對各類重大生態(tài)風(fēng)險(xiǎn)、風(fēng)險(xiǎn)源和應(yīng)對策略進(jìn)行討論,驗(yàn)證和完善了鐵路工程生態(tài)風(fēng)險(xiǎn)框架。通過研究得到如下啟示:

(1)“風(fēng)險(xiǎn)識別—風(fēng)險(xiǎn)溯源—風(fēng)險(xiǎn)應(yīng)對”的研究架構(gòu)對鐵路工程生態(tài)風(fēng)險(xiǎn)管理和保護(hù)具有重要意義。本文從主要生態(tài)風(fēng)險(xiǎn)的識別到風(fēng)險(xiǎn)源的追溯,再根據(jù)風(fēng)險(xiǎn)源匹配應(yīng)對策略,形成鐵路工程生態(tài)風(fēng)險(xiǎn)“識別—溯源—應(yīng)對”的閉環(huán)研究架構(gòu),這豐富了鐵路工程生態(tài)風(fēng)險(xiǎn)管理和保護(hù)的理論內(nèi)涵,也為研究和分析工程風(fēng)險(xiǎn)提供了新思路。

(2)有效地融合機(jī)器學(xué)習(xí)模型能夠客觀、系統(tǒng)、高效地解決鐵路工程生態(tài)風(fēng)險(xiǎn)識別等研究問題。本文在大量文本數(shù)據(jù)的基礎(chǔ)上,利用三種機(jī)器學(xué)習(xí)模型的互補(bǔ)優(yōu)勢,提出了一種鐵路工程生態(tài)風(fēng)險(xiǎn)識別與應(yīng)對的模型方法。這不僅保證了風(fēng)險(xiǎn)識別結(jié)果的客觀性和系統(tǒng)性,也顯著地縮減了分析時(shí)間,能為鐵路工程實(shí)踐中的生態(tài)風(fēng)險(xiǎn)識別、管理和修復(fù)提供及時(shí)可靠的決策參考。

本文基于大量文本數(shù)據(jù)研究鐵路工程生態(tài)風(fēng)險(xiǎn)問題,但并未考慮文本數(shù)據(jù)的時(shí)間因素。因此未來可以加入更加豐富的數(shù)據(jù),在時(shí)間維度上研究鐵路工程生態(tài)風(fēng)險(xiǎn)變化情況,進(jìn)而識別生態(tài)風(fēng)險(xiǎn)管理在不同建設(shè)階段的重難點(diǎn)領(lǐng)域。此外,本文提出了生態(tài)風(fēng)險(xiǎn)“識別—溯源—應(yīng)對”的研究架構(gòu),并利用鐵路工程相關(guān)數(shù)據(jù)進(jìn)行分析,但并未在其他類型的重大工程中進(jìn)行驗(yàn)證。所以未來的研究可以在此架構(gòu)的基礎(chǔ)上,通過考慮加入不同工程的特性,不斷豐富重大工程生態(tài)風(fēng)險(xiǎn)管理理論體系。

猜你喜歡
鐵路文本生態(tài)
“生態(tài)養(yǎng)生”娛晚年
沿著中老鐵路一路向南
住進(jìn)呆萌生態(tài)房
生態(tài)之旅
在808DA上文本顯示的改善
基于doc2vec和TF-IDF的相似文本識別
電子制作(2018年18期)2018-11-14 01:48:06
鐵路通信線路維護(hù)體制改革探索與實(shí)踐
無人機(jī)在鐵路工程建設(shè)中的應(yīng)用與思考
GSM-R在鐵路通信中的應(yīng)用
文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學(xué)隱喻
主站蜘蛛池模板: 久久国产高清视频| 色哟哟精品无码网站在线播放视频| 99精品在线看| 极品国产在线| 国产a v无码专区亚洲av| 狠狠综合久久| 在线免费看片a| 自拍偷拍一区| 亚洲av无码久久无遮挡| 国产一区二区网站| av在线5g无码天天| 人妻中文字幕无码久久一区| 91蝌蚪视频在线观看| 草草线在成年免费视频2| 成人中文字幕在线| 国内精品小视频福利网址| 亚洲精品人成网线在线 | 欧美日韩高清在线| 亚洲欧美另类久久久精品播放的| 亚洲成人77777| 欧美丝袜高跟鞋一区二区| 国产日韩丝袜一二三区| 中国黄色一级视频| a欧美在线| 国产女人综合久久精品视| 999福利激情视频| 亚洲伦理一区二区| 97色伦色在线综合视频| 国产成人精品免费视频大全五级| 在线视频精品一区| 欧美日韩国产在线观看一区二区三区 | 亚洲综合经典在线一区二区| 香蕉视频国产精品人| 免费高清毛片| 亚洲电影天堂在线国语对白| 色欲综合久久中文字幕网| 色婷婷狠狠干| 日韩一级二级三级| 99久久精品国产自免费| 日韩a级毛片| 国产乱肥老妇精品视频| 欧美日韩午夜| 亚洲丝袜第一页| 高h视频在线| 九九免费观看全部免费视频| 亚洲国产清纯| 国产一在线| 国产91九色在线播放| 亚洲人网站| 成人福利在线免费观看| 色婷婷亚洲十月十月色天| 国产精品无码一二三视频| 国产午夜无码专区喷水| 亚洲天堂色色人体| 性激烈欧美三级在线播放| 日韩一区二区在线电影| 国内精品久久人妻无码大片高| 中文字幕色站| 97国内精品久久久久不卡| 色综合五月婷婷| 国产亚洲精久久久久久久91| 9丨情侣偷在线精品国产| 国产成人禁片在线观看| 亚洲第一区精品日韩在线播放| 亚洲小视频网站| 欧美日韩午夜视频在线观看| 美女内射视频WWW网站午夜| 国产成人三级在线观看视频| 色成人综合| 亚洲狼网站狼狼鲁亚洲下载| 日韩精品中文字幕一区三区| 亚洲欧美日韩另类在线一| 国产精品成人AⅤ在线一二三四| 欧美三级视频在线播放| 亚洲精品视频免费| 高h视频在线| 色吊丝av中文字幕| 99这里精品| 国产白浆一区二区三区视频在线| 色综合狠狠操| 一本一道波多野结衣av黑人在线| 久久99精品久久久久久不卡|