李 棟,劉人杰
廣東司法警官職業(yè)學(xué)院, 廣東 廣州 510520
當(dāng)前,人們對(duì)消防安全的要求越來(lái)越高。這不僅需要進(jìn)一步研究消防工程技術(shù)和大力培養(yǎng)消防救援隊(duì)伍,更需要改進(jìn)現(xiàn)有消防安全管理模式。然而,目前消防安全管理存在一定不足。首先是民眾消防安全意識(shí)淡薄。在經(jīng)濟(jì)效益主導(dǎo)觀念影響下,消防安全管理工作一定程度上被忽視[1],部分民眾消防安全意識(shí)差,缺乏基本防火、滅火、逃生自救常識(shí)[2]。其次是專業(yè)人員不足,消防技術(shù)服務(wù)機(jī)構(gòu)部分從業(yè)人員未獲得執(zhí)業(yè)資格,專業(yè)技術(shù)能力不強(qiáng),難以勝任技術(shù)服務(wù)工作[3]。消防安全主體也缺乏消防安全管理人員,以住宅小區(qū)為例,部分住宅指派非專業(yè)人員兼職消防工作,消防設(shè)施、器材長(zhǎng)期無(wú)人管理,甚至消防控制室無(wú)人值班[4]。此外,日常消防安全管理通常只涉及消防設(shè)施和器材的維護(hù)和保養(yǎng),忽略了消防安全宣傳教育、消防演習(xí)等。綜上,如何加強(qiáng)消防安全管理成為當(dāng)前亟待解決的問(wèn)題。
而今隨著自然語(yǔ)言生成技術(shù)(Natural Language Generation,NLG)的日趨成熟,出現(xiàn)了以概率學(xué)為基礎(chǔ)的大語(yǔ)言模型(Large Language Model,LLM)和以圖數(shù)據(jù)庫(kù)為基礎(chǔ)的知識(shí)圖譜(knowledge graph)等典型應(yīng)用,為現(xiàn)有消防安全管理模式的改進(jìn)提供了解決方案。本文探討自然語(yǔ)言生成技術(shù)在消防安全管理領(lǐng)域中的應(yīng)用,為消防安全管理與自然語(yǔ)言生成技術(shù)的結(jié)合應(yīng)用提供借鑒。
自然語(yǔ)言生成是自然語(yǔ)言處理領(lǐng)域中的一個(gè)研究方向,通過(guò)對(duì)關(guān)鍵信息進(jìn)行規(guī)劃和表達(dá),使計(jì)算機(jī)能夠像人一樣生成高質(zhì)量的自然語(yǔ)言文本。在諸多應(yīng)用領(lǐng)域中,如智能客服、智能寫作、新聞自動(dòng)化等,都證明了其潛在的應(yīng)用價(jià)值。從整體消防安全管理應(yīng)用來(lái)看,自然語(yǔ)言生成系統(tǒng)可分為數(shù)據(jù)層、中間層和自然語(yǔ)言生成層,如圖1所示。

圖1 自然語(yǔ)言生成系統(tǒng)框架圖
1. 數(shù)據(jù)層
在數(shù)據(jù)層,系統(tǒng)需要獲取預(yù)先輸入的數(shù)據(jù)源。數(shù)據(jù)類型主要有文本、數(shù)據(jù)、圖片及視頻,根據(jù)標(biāo)注與否可分為原始數(shù)據(jù)和標(biāo)注數(shù)據(jù)。原始數(shù)據(jù)如現(xiàn)行消防安全管理制度中某一條文本身,可作為自然語(yǔ)言處理的語(yǔ)料;標(biāo)注數(shù)據(jù)如一張消防車道被車輛占用的照片,通過(guò)人工標(biāo)注為占用,則該照片的標(biāo)簽為“存在占用”,可用于圖像識(shí)別算法的訓(xùn)練。
2. 中間層
在中間層,系統(tǒng)將數(shù)據(jù)層中的數(shù)據(jù)解析存儲(chǔ)到數(shù)據(jù)庫(kù)或者訓(xùn)練成機(jī)器學(xué)習(xí)模型。針對(duì)不同數(shù)據(jù)格式,分別采用自然語(yǔ)言理解、數(shù)據(jù)處理、圖像識(shí)別和視頻分析的方法。
自然語(yǔ)言理解是將人類語(yǔ)言處理轉(zhuǎn)化為機(jī)器語(yǔ)言,處理流程大致分為獲取語(yǔ)料、語(yǔ)料預(yù)處理、特征化(把字和詞表示成向量)、模型訓(xùn)練,隨后對(duì)模型效果進(jìn)行評(píng)價(jià)。通過(guò)對(duì)語(yǔ)言模型的使用,可實(shí)現(xiàn)信息檢索、文本分類和自動(dòng)文摘等[5]。
數(shù)據(jù)處理是將數(shù)據(jù)源處理后,從中提取有益知識(shí),并用恰當(dāng)?shù)姆绞綄⒔Y(jié)果展現(xiàn)給終端用戶。其流程通常包括數(shù)據(jù)抽取與集成、數(shù)據(jù)分析、數(shù)據(jù)解釋[6]。數(shù)據(jù)處理結(jié)果存儲(chǔ)在數(shù)據(jù)庫(kù)中,根據(jù)數(shù)據(jù)層中數(shù)據(jù)的不同結(jié)構(gòu)可設(shè)計(jì)為圖數(shù)據(jù)庫(kù)、關(guān)系型數(shù)據(jù)庫(kù)等。如對(duì)應(yīng)急預(yù)案文本進(jìn)行信息抽取后的三元組信息(頭實(shí)體、尾實(shí)體、關(guān)系)可存儲(chǔ)至圖數(shù)據(jù)庫(kù)中,從而具有高效的圖遍歷和查詢能力,可通過(guò)查詢語(yǔ)句便捷獲取信息;對(duì)建筑信息模型IFC4 格式進(jìn)行消防設(shè)計(jì)信息提取,可將建筑內(nèi)部細(xì)節(jié)轉(zhuǎn)化為可用于消防合規(guī)性審查所需信息[7]。
圖像識(shí)別是利用計(jì)算機(jī)對(duì)圖像進(jìn)行處理、分析和理解,以識(shí)別各種不同模式的目標(biāo)和對(duì)象的技術(shù)[8],主要分為以特征提取為核心的傳統(tǒng)方法和以深度神經(jīng)網(wǎng)絡(luò)為核心的深度學(xué)習(xí)方法,可以實(shí)現(xiàn)圖像分類、目標(biāo)檢測(cè)、人臉識(shí)別等。
視頻分析的本質(zhì)是對(duì)連續(xù)圖像序列進(jìn)行處理,其實(shí)現(xiàn)方法與圖像識(shí)別的實(shí)現(xiàn)方法類似?;谏疃葘W(xué)習(xí)的視頻分析可實(shí)現(xiàn)對(duì)象分類、對(duì)象檢測(cè)、路徑跟蹤。其中,對(duì)象分類是獲取視頻中對(duì)象所屬的類別,對(duì)象檢測(cè)是獲取對(duì)象在視頻圖像中的位置,路徑跟蹤是獲取同一對(duì)象在連續(xù)時(shí)間內(nèi)的位置信息[9]。
3. 自然語(yǔ)言生成層
在自然語(yǔ)言生成層中,需要構(gòu)建一個(gè)系統(tǒng)來(lái)結(jié)合用戶的即時(shí)輸入和中間層組織生成輸出文本。根據(jù)用戶即時(shí)輸入的不同,自然語(yǔ)言生成可分為文本到文本的生成和數(shù)據(jù)到文本的生成[10]。
文本到文本的生成主要研究?jī)?nèi)容為輸入現(xiàn)有文本,對(duì)其進(jìn)行變換和處理,生成一個(gè)新文本,主要包括文本縮寫、文本擴(kuò)展、文本改寫和推理等。(1)文本縮寫是指提取長(zhǎng)文本的關(guān)鍵信息生成短文本,其應(yīng)用可分為文本摘要、問(wèn)題生成和干擾項(xiàng)生成。文本摘要是指根據(jù)原文生成新的文本以表達(dá)原文的核心含義;問(wèn)題生成是指根據(jù)給定的事實(shí)輸入和答案,生成自然語(yǔ)言表述的問(wèn)題;而干擾項(xiàng)生成是為給定的問(wèn)題回答組合自動(dòng)生成足夠的干擾選項(xiàng),以形成適當(dāng)?shù)倪x擇題[11]。如火災(zāi)應(yīng)急預(yù)案通常包含大量信息,但不是每個(gè)人都有時(shí)間和精力閱讀整個(gè)指南。文本摘要可以自動(dòng)從應(yīng)急預(yù)案中提取關(guān)鍵信息,生成針對(duì)個(gè)人的摘要,方便消防工作者和群眾掌握發(fā)生火災(zāi)時(shí)具體的行動(dòng)流程。(2)文本擴(kuò)展是指將短文本擴(kuò)展為包含更豐富信息的長(zhǎng)文本,其應(yīng)用可分為短文本擴(kuò)展和主題文章生成。短文本擴(kuò)展為基于一組長(zhǎng)文檔將短文本擴(kuò)展為類似的長(zhǎng)文本;主題文章生成是給定主題集合,生成主題相關(guān)的文本。如在應(yīng)急預(yù)案編寫過(guò)程中,文本擴(kuò)展可根據(jù)使用場(chǎng)所的性質(zhì)生成常見(jiàn)危險(xiǎn)源,或根據(jù)消防設(shè)施種類生成對(duì)應(yīng)的使用方法,減少應(yīng)急預(yù)案制定的工作量。(3)文本改寫和推理可分為文本風(fēng)格遷移和對(duì)話生成。文本風(fēng)格遷移是指在保留原文本內(nèi)容的基礎(chǔ)上,生成具有目標(biāo)風(fēng)格的文本[12]。如在消防安全宣傳中,由于不同受眾群體對(duì)消防安全知識(shí)的儲(chǔ)備量存在差異,可以使用文本風(fēng)格遷移技術(shù),將一篇消防安全知識(shí)宣傳文本轉(zhuǎn)換成適合不同知識(shí)背景的語(yǔ)言風(fēng)格,以便更好地理解和接受。對(duì)話生成是指自動(dòng)生成答案來(lái)回答給定問(wèn)題。如通過(guò)對(duì)話生成技術(shù)可以開(kāi)發(fā)出智能輔助系統(tǒng),該系統(tǒng)可在實(shí)時(shí)提供建議和指導(dǎo)的同時(shí)協(xié)助人們更好地應(yīng)對(duì)不同情況下的緊急救援任務(wù)。
數(shù)據(jù)到文本的生成主要研究使用恰當(dāng)而流暢的文本描述結(jié)構(gòu)化的數(shù)據(jù),分別采用基于規(guī)則和模板的方法與基于神經(jīng)網(wǎng)絡(luò)序列生成方法?;谝?guī)則和模板的方法通過(guò)將規(guī)范化或半規(guī)范化的數(shù)據(jù)經(jīng)過(guò)一系列處理后,模仿人類專家語(yǔ)言模式制作規(guī)則語(yǔ)句模板,生成專業(yè)性較強(qiáng)的文本。此方法通常適用于特定領(lǐng)域如生成醫(yī)學(xué)檢驗(yàn)報(bào)告?;谏窠?jīng)網(wǎng)絡(luò)序列生成方法根據(jù)數(shù)據(jù)庫(kù)的輸入記錄生成一個(gè)內(nèi)容計(jì)劃,指定哪些記錄將在文檔中及以何種順序進(jìn)行語(yǔ)言描述,隨后以給定數(shù)據(jù)作為輸入,按照內(nèi)容計(jì)劃生成文本[13]。如以某個(gè)地區(qū)既有生產(chǎn)安全事故總體情況作為訓(xùn)練材料生成內(nèi)容計(jì)劃,隨后將當(dāng)月該地區(qū)的事故數(shù)據(jù)輸入系統(tǒng),以生成月度生產(chǎn)安全事故總體情況。相比較基于規(guī)則的方法,基于神經(jīng)網(wǎng)絡(luò)序列生成方法對(duì)數(shù)據(jù)到文本生成的泛化能力更強(qiáng),但需要龐大的訓(xùn)練數(shù)據(jù)作為支撐。
視覺(jué)—語(yǔ)言生成屬于數(shù)據(jù)到文本,其目標(biāo)是生成給定圖像或視頻的解釋或摘要,包括圖像描述、視頻描述和視覺(jué)敘事[10]。圖像描述是對(duì)給定一幅自然圖像生成一句自然語(yǔ)言描述。視頻描述是對(duì)給定一段視頻(通常是幾十秒的短視頻)生成一句準(zhǔn)確、細(xì)致描述。視覺(jué)敘事要求模型對(duì)給定圖像序列,在深度理解圖像序列基礎(chǔ)上生成連貫的敘事故事[14]。
從對(duì)自然語(yǔ)言生成技術(shù)的研究中可以得知,要將其應(yīng)用在消防安全管理領(lǐng)域,必須收集大量消防信息,這些信息可從消防文本和消防數(shù)據(jù)中獲取。(1)可用的消防文本包括政府發(fā)布的消防文件,如各級(jí)消防法律、消防系統(tǒng)設(shè)計(jì)驗(yàn)收規(guī)范和消防政策文件;各單位已有的消防管理工作文本,如消防檔案、滅火與應(yīng)急疏散預(yù)案、消防安全隱患檢查報(bào)告、消防培訓(xùn)講稿、消防工作例會(huì)記錄等;消防知識(shí)文本,如消防行業(yè)教科書、網(wǎng)絡(luò)百科全書、科普文章、火災(zāi)事故案例等。(2)可用的消防數(shù)據(jù)包括既有智慧消防建設(shè)成果,如收集的消防設(shè)施數(shù)據(jù)、對(duì)應(yīng)的消防數(shù)據(jù)分析結(jié)果、消防監(jiān)控系統(tǒng)記錄的圖片視頻等;既有消防工作數(shù)據(jù),如各類消防設(shè)施的技術(shù)參數(shù)、防火檢查巡查記錄、建筑信息模型或情況表格等。
基于上述消防信息資源,可以利用自然語(yǔ)言生成技術(shù)來(lái)實(shí)現(xiàn)消防安全管理領(lǐng)域的自動(dòng)化和智能化。通過(guò)將這些信息資源輸入到自然語(yǔ)言生成系統(tǒng)中,可自動(dòng)生成或填充消防安全管理領(lǐng)域的自然語(yǔ)言文本,賦能消防安全管理工作,從而提高消防安全管理的效率和準(zhǔn)確性。
消防安全管理涉及預(yù)防火災(zāi)、減少火災(zāi)損失及保障人員生命和財(cái)產(chǎn)安全,涵蓋對(duì)消防安全責(zé)任的明晰、消防安全制度和管理措施的建立、滅火和應(yīng)急疏散預(yù)案的編制和演練等,均涉及大量文本的撰寫。下面結(jié)合現(xiàn)有技術(shù)具體分析自然語(yǔ)言生成技術(shù)在消防教育培訓(xùn)和完善消防安全管理制度方面潛在應(yīng)用,如圖2所示。

圖2 自然語(yǔ)言生成技術(shù)消防應(yīng)用
消防教育培訓(xùn)旨在提高人們對(duì)火災(zāi)的認(rèn)識(shí)和了解,培養(yǎng)人們火災(zāi)安全意識(shí)和自救互救能力,以減少火災(zāi)事故的發(fā)生和降低火災(zāi)事故的損失。自然語(yǔ)言生成技術(shù)在其中的應(yīng)用主要包括以下幾方面。
1. 火災(zāi)基礎(chǔ)理論講解
消防教育培訓(xùn)的目的是讓受眾掌握防火、滅火、疏散知識(shí)體系,只有熟練掌握火災(zāi)基礎(chǔ)理論,才能根據(jù)不同情況選擇合適的策略。當(dāng)前火災(zāi)基礎(chǔ)知識(shí)的講解主要基于教科書內(nèi)容,而在具體消防培訓(xùn)中,培訓(xùn)對(duì)象學(xué)歷層次和專業(yè)不同,對(duì)火災(zāi)相關(guān)名詞的了解程度不一,單一的課程內(nèi)容難以滿足需求。文獻(xiàn)[15]針對(duì)包含辱罵、侵犯等詞匯的攻擊性言論進(jìn)行了基于深度學(xué)習(xí)的短文本去攻擊性研究,提出替換攻擊性詞語(yǔ)和改寫全文文本風(fēng)格遷移方式。基于類似邏輯,可對(duì)火災(zāi)相關(guān)名詞不同解釋詳細(xì)程度進(jìn)行分級(jí),從而生成適合不同學(xué)歷層次的火災(zāi)基礎(chǔ)理論講解文本。如對(duì)未接受理工科教育受眾,可結(jié)合具體例子和實(shí)際應(yīng)用解釋火災(zāi)相關(guān)名詞,對(duì)涉及的化學(xué)物質(zhì),增加介紹性文字說(shuō)明;對(duì)低年級(jí)學(xué)生,則更多使用比喻形式文本,并通過(guò)其他文本風(fēng)格遷移模型生成偏口語(yǔ)化的文本,提升學(xué)生群體接受程度。
2. 消防法律法規(guī)知識(shí)普及
消防從業(yè)人員了解和掌握消防法律法規(guī)非常重要,但消防法律法規(guī)涉及司法、消防、住建多個(gè)部門,相關(guān)條文數(shù)量大且更新速度快,對(duì)消防從業(yè)人員的學(xué)習(xí)能力提出一定挑戰(zhàn)。對(duì)群眾而言,消防法律法規(guī)學(xué)習(xí)成本高,難以理解。文獻(xiàn)[16]提出基于自然語(yǔ)言處理技術(shù)構(gòu)建民法法律知識(shí)圖譜,利用知識(shí)圖譜結(jié)構(gòu),幫助法律工作人員對(duì)案件進(jìn)行分析、處理和判斷。因此,可對(duì)消防法律法規(guī)條文進(jìn)行語(yǔ)法解析生成知識(shí)圖譜,并設(shè)計(jì)若干查詢語(yǔ)句。在實(shí)際使用中,可根據(jù)教學(xué)目標(biāo)篩選出若干條文,如對(duì)商業(yè)綜合體員工進(jìn)行培訓(xùn),則可以通過(guò)查詢語(yǔ)句輸出本地適用的消防安全管理規(guī)定,以及針對(duì)商業(yè)綜合體具體部位的防火規(guī)范要求,從而提升人們對(duì)消防法律法規(guī)的認(rèn)知和理解。
3. 火災(zāi)應(yīng)急處置能力培訓(xùn)
火災(zāi)發(fā)生時(shí),正確的應(yīng)急處理措施可最大程度減少人員傷亡和財(cái)產(chǎn)損失。消防教育培訓(xùn)需要培養(yǎng)人們的應(yīng)急處置能力,從而根據(jù)不同場(chǎng)景,執(zhí)行正確的應(yīng)急處理方法。文獻(xiàn)[17]提出名為GPT-3的大語(yǔ)言模型,通過(guò)海量文本、問(wèn)答、范例作為訓(xùn)練樣本,可用于文本生成、自然語(yǔ)言理解、對(duì)話系統(tǒng)等領(lǐng)域。在大語(yǔ)言模型中,由于海量輸入信息中包括某種情形下火災(zāi)的處置方法,在對(duì)其系統(tǒng)進(jìn)行提問(wèn)時(shí),會(huì)基于多次出現(xiàn)的問(wèn)答模式輸出正確率最大的回答,同時(shí)隨著大語(yǔ)言模型高質(zhì)量訓(xùn)練樣本數(shù)量和大語(yǔ)言模型參數(shù)的增加,生成的回答將更加準(zhǔn)確。此種方法依賴于高質(zhì)量的語(yǔ)料,但由于大語(yǔ)言模型的黑箱特性,輸出的回答可能出現(xiàn)錯(cuò)誤,因此需要人工進(jìn)一步修改。因此也可對(duì)火災(zāi)應(yīng)急處置知識(shí)文本進(jìn)行語(yǔ)義分析生成知識(shí)圖譜,此種方法成本更高但結(jié)果可控。
4. 自動(dòng)生成問(wèn)題
在上述三種培訓(xùn)內(nèi)容里,為檢驗(yàn)學(xué)員知識(shí)掌握程度,培訓(xùn)教師往往會(huì)設(shè)計(jì)一系列問(wèn)題作為現(xiàn)場(chǎng)問(wèn)答或課外習(xí)題。文獻(xiàn)[18]提出一個(gè)通用型的面向跨語(yǔ)言生成的預(yù)訓(xùn)練模型,并在漢語(yǔ)事實(shí)性問(wèn)答數(shù)據(jù)上進(jìn)行了問(wèn)題生成試驗(yàn)。對(duì)于消防知識(shí),可使用類似的神經(jīng)網(wǎng)絡(luò)模型自動(dòng)生成問(wèn)題,通過(guò)輸入指定教學(xué)文本,系統(tǒng)輸出該模型下置信程度最高的問(wèn)題-答案組。通過(guò)這種方式,消防培訓(xùn)教師可快速生成大量高質(zhì)量練習(xí)題,幫助受眾更好地掌握知識(shí)。此外,自動(dòng)生成問(wèn)題的方法還可以用于自適應(yīng)學(xué)習(xí),學(xué)員可根據(jù)自己的學(xué)習(xí)進(jìn)度,通過(guò)系統(tǒng)自動(dòng)生成練習(xí)題。
5. 消防設(shè)施的辨識(shí)和使用
消防教育培訓(xùn)中,消防設(shè)施的辨識(shí)和使用是一個(gè)重要的教學(xué)內(nèi)容,其種類繁多,形狀與功能也各不相同,需要有針對(duì)性地進(jìn)行教學(xué)。文獻(xiàn)[19]提出名為OFA 的統(tǒng)一的文本圖像多模態(tài)預(yù)訓(xùn)練模型,可應(yīng)用于各種任務(wù),包括圖像生成、視覺(jué)基礎(chǔ)、圖像描述、圖像分類、語(yǔ)言建模等。通過(guò)圖像描述技術(shù),可生成消防設(shè)施圖片的文字描述,學(xué)員可通過(guò)自行拍攝照片生成文字描述來(lái)學(xué)習(xí)消防設(shè)施的特點(diǎn)和使用方法。但目前圖像描述技術(shù)對(duì)消防設(shè)施的識(shí)別不夠深入,用于模型訓(xùn)練的圖像描述文本未與國(guó)內(nèi)消防規(guī)范結(jié)合,無(wú)法根據(jù)消防設(shè)施的型號(hào)生成更具體的描述文本,在后續(xù)工作中可加強(qiáng)消防規(guī)范與多模態(tài)模型的耦合。
總體而言,消防教育培訓(xùn)應(yīng)用面對(duì)的群體多樣性強(qiáng),學(xué)習(xí)的連續(xù)性和強(qiáng)度也難以保證,因此當(dāng)前消防教育培訓(xùn)主要通過(guò)課程、媒體宣傳和平面圖指導(dǎo)等方式相結(jié)合,碎片化程度較高,導(dǎo)致群眾普遍缺乏系統(tǒng)完整的消防知識(shí)。自然語(yǔ)言生成技術(shù)所具備的特性適于消防教育培訓(xùn)行業(yè),如上文通過(guò)對(duì)火災(zāi)基礎(chǔ)理論教學(xué)和消防設(shè)施辨識(shí)和使用教學(xué)等的分析,分別提出利用文本風(fēng)格遷移和圖像描述的方法可解決該教學(xué)中存在的痛點(diǎn)。就目前而言,利用自然語(yǔ)言生成技術(shù)為消防教育培訓(xùn)賦能的情況較少,但隨著模型訓(xùn)練成本的進(jìn)一步下降和適于自然語(yǔ)言生成的消防文本/數(shù)據(jù)日益豐富,消防教育培訓(xùn)將會(huì)與自然語(yǔ)言生成技術(shù)深度融合,給群眾帶來(lái)更加個(gè)性化、即時(shí)性的消防知識(shí)。
消防安全管理制度要求社會(huì)所有個(gè)體遵守并執(zhí)行相應(yīng)規(guī)則,使消防管理工作的開(kāi)展具有一定科學(xué)性與規(guī)范性,避免出現(xiàn)盲目管理導(dǎo)致的安全事故[20]。然而,如果缺少消防專業(yè)人士的參與,消防安全管理制度可能存在覆蓋范圍不夠、缺乏可操作性及執(zhí)行不到位的問(wèn)題,通過(guò)自然語(yǔ)言生成技術(shù),可在如下方
面對(duì)消防安全管理制度進(jìn)行改進(jìn)。
1. 制度編寫
消防安全管理制度是消防安全管理的總綱,需要準(zhǔn)確、具體規(guī)定消防管理工作的各個(gè)方面。在編寫過(guò)程中,存在以下困難:首先,許多單位缺乏消防安全管理制度編寫經(jīng)驗(yàn),需要外部專家協(xié)助制定;其次,制度內(nèi)容編寫者需要對(duì)相關(guān)法規(guī)、標(biāo)準(zhǔn)和火災(zāi)相關(guān)知識(shí)、案例有深入了解,出臺(tái)的制度才具有指導(dǎo)性;此外,消防安全管理制度只有與單位內(nèi)部實(shí)際情況深度融合,才具有可操作性。
基于大語(yǔ)言模型的自然語(yǔ)言生成技術(shù)可通過(guò)學(xué)習(xí)消防安全管理制度的范本、單位情況、火災(zāi)案例和防控措施,生成符合標(biāo)準(zhǔn)的消防安全管理制度,并由單位消防安全管理制度編寫者承擔(dān)修改職責(zé),如圖3所示。此外,對(duì)單位現(xiàn)有建筑信息進(jìn)行抽取,可將所需要的建筑內(nèi)部細(xì)節(jié)轉(zhuǎn)化為文字?jǐn)?shù)據(jù)的表述,從而作為大語(yǔ)言模型的提示,幫助自然語(yǔ)言生成系統(tǒng)更加準(zhǔn)確地生成消防安全管理制度。由于大語(yǔ)言模型通過(guò)強(qiáng)化學(xué)習(xí)思想可將生成的制度符合所給定的制度模板,在制度規(guī)范化上具有優(yōu)勢(shì),此外通過(guò)對(duì)建筑信息和單位情況的讀取,可將所有相關(guān)的消防安全管理措施羅列出來(lái),方便制度編寫人員進(jìn)行修改。

圖3 消防安全管理制度編寫流程
然而,自然語(yǔ)言生成技術(shù)的黑箱特性可能會(huì)導(dǎo)致消防安全管理制度編寫應(yīng)用中存在信息不確定性、錯(cuò)誤、不完整等問(wèn)題。因此,可以采取以下措施來(lái)解決這些問(wèn)題:首先,完善自動(dòng)編寫制度的修改審核機(jī)制,確保制度通過(guò)專家的修改審核之后才可以發(fā)布,并著重對(duì)大語(yǔ)言模型未能根據(jù)新發(fā)布消防法規(guī)修訂內(nèi)容所制定的制度內(nèi)容進(jìn)行修正。其次,應(yīng)盡量使用高質(zhì)量和時(shí)效性的消防安全管理制度作為大語(yǔ)言模型的語(yǔ)料,并按照不同場(chǎng)所性質(zhì)分類,使得生成的制度文本更加具有指導(dǎo)性和適用性。
2. 制度執(zhí)行
消防安全管理制度的執(zhí)行是消防安全管理的關(guān)鍵環(huán)節(jié),也是防范火災(zāi)事故、保障人員生命財(cái)產(chǎn)安全的最后一道防線。然而,實(shí)際執(zhí)行中,由于人員流動(dòng)性大、制度培訓(xùn)不到位、員工維護(hù)制度的積極性不高等原因,制度執(zhí)行難以達(dá)到理想效果,從而導(dǎo)致消防安全管理工作的失誤。
基于自然語(yǔ)言的歷史火災(zāi)數(shù)據(jù)庫(kù)查詢(text-to-SQL),可根據(jù)具體消防安全管理制度和不同場(chǎng)所,生成真實(shí)火災(zāi)案例作為管理制度的補(bǔ)充資料。文獻(xiàn)[21]通過(guò)構(gòu)建多個(gè)深度學(xué)習(xí)模型來(lái)實(shí)現(xiàn)自然語(yǔ)言查詢到SQL 語(yǔ)句的轉(zhuǎn)化方法,可實(shí)現(xiàn)自然語(yǔ)言查詢數(shù)據(jù)庫(kù)內(nèi)容。通過(guò)將自然語(yǔ)言數(shù)據(jù)庫(kù)查詢技術(shù)與自然語(yǔ)言生成技術(shù)結(jié)合,可生成真實(shí)火災(zāi)案例補(bǔ)充資料,使消防安全管理制度中的要求更容易被接受,也可消除人們的僥幸心理。然而,真實(shí)火災(zāi)事故往往涉及公民隱私和數(shù)據(jù)安全問(wèn)題,因此需要通過(guò)火災(zāi)模擬結(jié)果作為補(bǔ)充。在后續(xù)研發(fā)中,可由國(guó)家統(tǒng)一發(fā)布典型火災(zāi)事故、單位內(nèi)部火災(zāi)案例及可信度高火災(zāi)模擬結(jié)果,三者組成歷史火災(zāi)數(shù)據(jù)庫(kù),并增加火災(zāi)查詢語(yǔ)句語(yǔ)料,提高針對(duì)消防安全管理方面的查詢語(yǔ)句生成效果。
使用自然語(yǔ)言生成技術(shù)可對(duì)消防安全管理制度生成針對(duì)性的制度執(zhí)行手冊(cè),幫助個(gè)體理解執(zhí)行消防安全管理制度。命名實(shí)體識(shí)別技術(shù)可實(shí)現(xiàn)從非結(jié)構(gòu)化的文本中識(shí)別出所需的實(shí)體及類型,其識(shí)別結(jié)果可用于實(shí)體關(guān)系抽取、知識(shí)圖譜構(gòu)建等眾多實(shí)際應(yīng)用[22]。通過(guò)命名實(shí)體識(shí)別技術(shù),可對(duì)消防安全管理制度中的關(guān)鍵實(shí)體進(jìn)行識(shí)別,如人員、消防設(shè)施、危險(xiǎn)源及建筑部位等。在實(shí)際應(yīng)用中,可對(duì)不同類型人員涉及的管理制度統(tǒng)一摘出,隨后將消防設(shè)施、危險(xiǎn)源及建筑部位等信息輸入大語(yǔ)言模型,經(jīng)修改審核輸出具體操作方法,從而生成針對(duì)特定類型人員的制度執(zhí)行手冊(cè)。
與消防教育培訓(xùn)不同的是,利用自然語(yǔ)言生成技術(shù)對(duì)消防安全管理制度進(jìn)行編寫和執(zhí)行對(duì)出現(xiàn)錯(cuò)誤的容忍性更低,專業(yè)性要求更高。在制度編寫上,因?yàn)橹贫鹊暮线m與否取決于其應(yīng)用場(chǎng)所和服務(wù)人群,而非消防知識(shí)類型的事實(shí)性文本,因此制度編寫依賴于人工干預(yù),但日后隨著按各種類型場(chǎng)所和不同受眾的消防安全管理制度文本大規(guī)模共享,自然語(yǔ)言生成制度的準(zhǔn)確率將會(huì)進(jìn)一步提高。而制度執(zhí)行是在制度編寫的基礎(chǔ)上解釋制度,因此從制度層面和用戶層面可分別生成輔助文本,以保證制度的準(zhǔn)確執(zhí)行。
隨著新一代信息技術(shù)的飛速發(fā)展,自然語(yǔ)言生成技術(shù)在消防安全管理領(lǐng)域中低成本、大規(guī)模的應(yīng)用成為可能,但也面臨著來(lái)自技術(shù)、安全和制度等多方面的挑戰(zhàn),急需進(jìn)一步改進(jìn)。
自然語(yǔ)言生成技術(shù)需要大量語(yǔ)料文本進(jìn)行模型訓(xùn)練,以ChatGPT 為例,其公開(kāi)的GPT-3 版本共使用了45 TB 大小的語(yǔ)料及1 750 億個(gè)參數(shù)[20],就目前而言,ChatGPT 在公開(kāi)文本信息較多的領(lǐng)域取得的效果更好。而在消防安全管理領(lǐng)域,相關(guān)制度、語(yǔ)料庫(kù)和數(shù)據(jù)集的缺乏目前是一個(gè)亟須解決的問(wèn)題,如文本風(fēng)格遷移需要大量平行語(yǔ)料、圖像描述需要大量圖像標(biāo)注數(shù)據(jù)。因此,要解決這個(gè)問(wèn)題,首先,需要各個(gè)單位在日常消防安全管理中積累并上傳各類語(yǔ)料和數(shù)據(jù),豐富語(yǔ)料庫(kù)和數(shù)據(jù)庫(kù)的內(nèi)容,提升自然語(yǔ)言生成應(yīng)用效果;其次,要解決好數(shù)據(jù)共享問(wèn)題,高質(zhì)量的語(yǔ)料作為消防工作的積累成果,可通過(guò)設(shè)立付費(fèi)機(jī)制或共享聯(lián)盟的方法,促進(jìn)語(yǔ)料之間的共享。
在使用自然語(yǔ)言生成技術(shù)時(shí),使用到的信息涉及單位內(nèi)部建筑細(xì)節(jié)、消防數(shù)據(jù)等,對(duì)某些單位而言,可能存在數(shù)據(jù)泄露、機(jī)密流出等風(fēng)險(xiǎn)。同時(shí),個(gè)人在使用服務(wù)器在境外自然語(yǔ)言生成服務(wù)時(shí),也會(huì)導(dǎo)致大量中文語(yǔ)料流出,不利于我國(guó)在自然語(yǔ)言生成技術(shù)領(lǐng)域與發(fā)達(dá)國(guó)家的競(jìng)爭(zhēng)。要解決這些問(wèn)題,首先,需要大力發(fā)展我國(guó)自主可控的消防自然語(yǔ)言生成系統(tǒng),對(duì)用戶上傳的消防信息要進(jìn)行加密和權(quán)限控制,保證數(shù)據(jù)安全;其次,也要防止境內(nèi)消防數(shù)據(jù)、消防資料等被境外通過(guò)計(jì)算機(jī)爬蟲(chóng)等技術(shù)抓取用于自然語(yǔ)言生成模型訓(xùn)練,如中國(guó)知網(wǎng)已根據(jù)《數(shù)據(jù)出境安全評(píng)估辦法》[23]限制境外用戶訪問(wèn),體現(xiàn)了我國(guó)對(duì)自然語(yǔ)言文本資源外泄的防范;最后,要加強(qiáng)對(duì)公民的信息安全教育,控制單位內(nèi)消防安全數(shù)據(jù)信息流向,并對(duì)違反規(guī)定的行為進(jìn)行處罰。
自然語(yǔ)言生成技術(shù)的準(zhǔn)確性和可靠性對(duì)消防安全管理領(lǐng)域的應(yīng)用至關(guān)重要。如果模型生成的信息不準(zhǔn)確或有誤,可能會(huì)影響消防工作的決策。因此,要提高自然語(yǔ)言生成技術(shù)的準(zhǔn)確性和可靠性,需要進(jìn)一步改進(jìn)其算法和模型,加強(qiáng)對(duì)語(yǔ)料庫(kù)和數(shù)據(jù)集的處理和分析,提高模型的精度和魯棒性。同時(shí),也要以增加人工審核環(huán)節(jié)、生成信息來(lái)源的方式,加強(qiáng)對(duì)生成內(nèi)容的審查,基于概率學(xué)的自然語(yǔ)言生成則需要通過(guò)引入第三方插件的方法來(lái)解決黑箱問(wèn)題。另外,也要實(shí)時(shí)更新自然語(yǔ)言生成技術(shù)中使用的模型或數(shù)據(jù)庫(kù),保證生成的內(nèi)容符合最新的消防法律法規(guī)。
當(dāng)前自然語(yǔ)言生成技術(shù)通過(guò)對(duì)人類作品的學(xué)習(xí)模仿,在許多行業(yè)達(dá)到了熟手的程度,深刻改變了人類社會(huì)的內(nèi)容產(chǎn)出模式。而消防安全管理領(lǐng)域涉及大量文本的處理,與自然語(yǔ)言生成技術(shù)的許多典型應(yīng)用場(chǎng)景不謀而合。本文首先從自然語(yǔ)言生成技術(shù)的主流應(yīng)用出發(fā),將其劃分為數(shù)據(jù)層、中間層和自然語(yǔ)言生成層,并結(jié)合消防安全管理應(yīng)用分析了應(yīng)用場(chǎng)景,梳理了當(dāng)前自然語(yǔ)言生成技術(shù)所需的消防文本和消防數(shù)據(jù)。隨后分別探討了自然語(yǔ)言生成技術(shù)在消防教育培訓(xùn)和消防安全管理制度改進(jìn)兩個(gè)方面的應(yīng)用形式,參考了自然語(yǔ)言生成技術(shù)中的文本風(fēng)格遷移、問(wèn)題生成等模型方法,為其實(shí)際落地應(yīng)用提供了借鑒。最后剖析了自然語(yǔ)言生成技術(shù)應(yīng)用所存在的普遍問(wèn)題和在消防安全管理結(jié)合應(yīng)用中存在的特殊問(wèn)題,包括語(yǔ)料庫(kù)及數(shù)據(jù)集缺乏問(wèn)題、信息安全問(wèn)題及準(zhǔn)確性和可靠性問(wèn)題。而在實(shí)際工作中,如何將自然語(yǔ)言生成技術(shù)真正在消防安全管理中應(yīng)用,還有賴于政府、企業(yè)和高校之間的協(xié)同合作,共同探索自然語(yǔ)言生成技術(shù)在消防安全管理行業(yè)的實(shí)際應(yīng)用方式。