999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于專家意見文本挖掘的技術風險識別研究

2022-07-14 04:14:30于越孫會鵬賈玻房桂祥中國運載火箭技術研究院
航天工業管理 2022年6期
關鍵詞:詞匯文本分析

于越、孫會鵬、賈玻、房桂祥 /中國運載火箭技術研究院

航天系統工程的復雜性、高可靠性要求決定了航天事業的高風險屬性。技術風險的識別與控制貫穿整個裝備研制過程,是航天裝備研制過程質量管控的核心。近年來,航天任務的快速增長以及新技術的不斷應用對技術風險識別工作提出了更高要求,技術風險的識別與分析既要覆蓋產品全任務剖面、全壽命周期的各個環節,又要突出重點風險,集中力量做深做透。目前,航天技術風險識別工作主要依靠隊伍內部技術人員進行分析匯總,不僅需要投入大量的時間與人力,還受限于研制隊伍的技術能力,容易出現對重大風險認識不足,進而導致重大質量問題甚至飛行試驗失敗。因此,需要一種更為客觀、定量、高效的風險識別方法,作為傳統風險識別方法的補充。

按照航天裝備研制流程,需組織外部專家在研制的各項關鍵環節進行評審把關。邀請的專家具備本專業較高的技術水平,且了解本裝備背景及特點,其意見更為客觀、全面,是傳統技術風險識別的重要補充。然而,專家意見數量龐大、涉及專業復雜,難以通過遍覽全部數據識別出有效的信息或規律。文本挖掘技術能夠從海量的文本數據中提取出可信度高、具有潛在利用價值的信息或趨勢,在圖書、科技、情報等領域已有廣泛應用。本文利用一款非結構化文本分析開源軟件KH Coder,運用詞頻統計、對應分析、共現分析等方法,對裝備研制評審過程中的專家意見進行多角度解析,從而有效挖掘專家意見的主題內容,定量識別重點技術環節與產品,并歸納出重大風險項目,為裝備研制技術風險管控提供支撐。

一、研究框架

運用文本量化分析方法提出基于專家意見文本挖掘的技術風險分析框架,如圖1所示。第一階段為專家意見數據收集。利用評審會場語音轉錄文本或者人工整理的專家意見紀要,獲取專家意見文本數據。第二階段為數據預處理。對獲取的文本進行數據清理,去除文本中的特殊符號、數值及單位等形成評審意見語料庫。結合航天裝備領域詞匯形成領域詞典并依據詞典進行分詞。過程中去除無關、無意義的停用詞,即得到經過預處理的文本。第三階段為數據分類。對數據按照特定屬性劃分并標記。為便于后續分析,對評審意見按照評審項目進行分類。第四階段為數據分析。采用KH Coder 軟件對文本進行詞頻統計、對應分析以及共現分析,以得到相應的分析結論。

二、研究結果分析

以某航天裝備演示驗證研制為例,統計該裝備研制過程中各項評審會議記錄的專家意見,共收集到各類評審會議23項,專家意見總計487條。根據圖1中的技術風險分析框架,對采集到的專家意見進行數據預處理。首先去除所有文本中的數字、單位、特殊符號;其次利用KH Coder 軟件對文本進行預分詞,對于未識別的專業性詞匯建立領域詞典,導入軟件進行強制識別;對于詞頻較高且無分析意義的詞匯建立停用詞清單,避免進行統計;對于具有相同含義的詞匯統一用詞,建立編碼規則文件,避免統計詞頻不準確。按照評審項目對專家意見進行屬性劃分。

圖1 基于專家意見文本挖掘的技術風險分析框架

1.基于詞頻統計的關鍵技術及產品識別

在數據預處理的基礎上,對全部文本數據使用詞頻工具進行統計。將文本高頻詞進行分類分析,得到評審意見中反復被提及的高頻技術及產品詞匯(見表1)。關鍵產品中飛行器、慣組、發動機、載荷、遙測、伺服為影響裝備基本功能性能的傳統關鍵產品;適配器、電纜、導航系統、空氣舵是在本裝備中新采用的或有新功能的產品。關鍵技術高頻詞可概括為發射過程安全性(發射、平臺、出筒)、環境適應性(環境、振動、模態),控制穩定性(攻角、時序、測力、軌跡)三大類別。對比由技術人員分析提煉出的關鍵技術項目,由專家意見詞頻統計得到的關鍵技術與產品能夠體現其中的主要內容,具有代表性。

表1 專家意見詞頻統計

2.基于對應分析的評審相關性研究

對應分析可以反映關鍵詞與不同屬性項目的關系。在數據分類的基礎上,統計上述20項高頻關鍵詞在各評審項目中的分布,如圖2所示。方塊大小為該關鍵詞在對應評審項目專家意見文本中的詞頻百分比,方塊顏色表示該詞頻與其他評審項目詞頻相比的差異程度。該圖可清晰展現不同評審項目與關鍵詞的對應關系。以發動機為例,該詞在發動機設計要求評審專家意見中出現頻率最高,同時也出現在與發動機相關的某試驗大綱評審以及存在接口關系的吊具、適配器設計要求評審中。評審項目之間對比可知,總體方案評審涵蓋要素全面,共涉及16個關鍵詞,而試驗大綱類評審只涉及參試產品和試驗條件。因此,通過詞頻分布統計能夠客觀反映評審項目的主題內容。

圖2 高頻關鍵詞在各評審項目中的分布

采用對應分析進一步解析評審項目的關聯關系。選取評審意見文本中詞頻為7次及以上的共107個詞匯與評審項目進行對應分析。圖3展示了23項評審項目與特征顯著的80個關鍵詞在二維坐標圖中的分布情況。關鍵詞圍繞坐標原點分布,與坐標原點的距離代表了該詞頻率分布的集中程度,與坐標軸的夾角體現了詞匯之間的關聯程度。靠近中心的詞匯往往在多條專家意見中出現;而遠離中心的詞匯,通常是只集中在特定的專家意見中。與坐標軸夾角相近的詞匯往往出現在同一條意見中共同,具有強相關性;夾角越大,詞匯在同一條意見中共同出現的頻率越低。評審項目可以視為所涉及關鍵詞的集合,分布在所涉及關鍵詞的中心。關鍵詞組成相似的評審項目坐標位置相鄰。相鄰的關鍵詞與評審項目可大致分為4個區域,每個區域都有獨特的內容與含義。1區涵蓋3項風洞試驗評審以及相關的產品和技術詞匯,與其他區域相比較為獨立。2區以電氣專業產品及試驗為主,包含慣組、伺服等相關試驗。3區以結構和地面專業設計要求為主。級間分離設計與試驗涉及到結構與電氣專業,因此位于2區與3區之間。4區以飛行器、發動機等系統的設計要求與試驗項目組成。對應分析通過詞匯結構揭示了評審項目之間的關聯關系,揭示了產品與技術之間的脈絡,作為技術索引,便于快速了解技術狀態,也為產品的影響域分析提供參考。

圖3 關鍵詞與評審項目的對應分析

3.基于詞語共現的技術風險識別

詞語共現分析能夠展示出經常共同出現的詞匯集群,從而分析出文本的主旨。選取詞頻最小為5的150個詞匯進行共現網絡分析,繪制出共現網絡圖,如圖4所示。圖中氣泡大小表示詞頻,之間的連線代表詞匯的共現關系,即2個相鄰詞匯在同一句話中共同出現的頻率。對具有共現關系的詞匯進行原文檢索,可瀏覽2個詞匯共同出現的語境,并從中分析出該共現關系所代表的主要內涵。詞匯之間主要形成了6組共現網絡,主要內涵概括如下:A組,建議進行分離姿態計算、飛行器姿態仿真、模態試驗與仿真、級間段分離壓力仿真,細化級間段起吊接口設計、發射間隙與安全性分析、軌跡設計;B組,注意慣組傳遞對準試驗,注意慣組安裝力矩系數調整;C組,關注級間分離起控、起控時序設計、氣動約束、氣動干擾、俯仰舵偏,關注發動機涂層;D組,關注裝填過程箭體滾轉現象,注意分離判據設計;E組,關注導航作用距離,載荷與射程關系,噴管與空氣舵的復合控制,出筒速度測量和堵片打開時間測量;F組,補充極性設計、熱環境分析和軟件研制內容,關注尾段電纜熱防護,振動、沖擊、噪聲、發射平臺等環境適應性。與設計人員分析匯總的技術風險識別結果相比,專家意見主要內容不僅能夠有效覆蓋相關風險項目,還能夠作為索引啟發獲得更為全面的技術風險識別?!胺蛛x”一詞在A組、C組、D組共現網絡中多次出現,說明分離過程涉及多項風險,應作為重大風險進行管控。此外,在C組、E組出現的時序設計、時間測量相關內容,以及在F組出現的極性設計、軟件研制等內容,在傳統技術風險識別中未覆蓋,可作為風險項目補充開展工作。

圖4 專家意見關鍵詞共現關系網絡圖

三、實踐成果

將上述技術風險項目、關鍵技術及關鍵產品分析結果應用于該裝備研制質量管理過程,跨組織、跨專業梳理各項技術方案的設計與驗證情況,形成專題并邀請相關專業專家以評審的形式進行審查把關。產品方面,選取基于詞頻統計獲得的高詞頻關鍵產品,對其功能性能實現情況、試驗驗證情況開展專題分析,形成飛行器設計與試驗結果分析、慣組動態特性設計及驗證、發動機性能專項審查共3項專題。針對關鍵技術,形成發射技術專項審查、環境適應性分析、穩定控制專項審查3項專題。對于時序、極性、軟件等新增風險項目,開展流程及時序設計、全系統極性、軟件專項審查3項專題。針對“分離”重大技術風險,專題開展了分離判據分析、分離動態過程數值仿真計算、追擊風險分析等論證工作,提出了優化級間段分離壓力、調整分離判據等改進措施。以上專項審查以及補充論證工作全面檢視了裝備研制技術風險的釋放情況,取得了良好的效果,有效保障了飛行試驗的圓滿成功。

專家意見文本挖掘是一種客觀、定量、高效的風險識別方法。專家評審意見能夠更為客觀地反映裝備研制關鍵技術與風險項目。對專家評審意見進行詞頻統計、對應分析及共現分析,能夠定量獲得裝備的關鍵技術與關鍵產品,揭示裝備研制的技術脈絡,歸納出未識別的風險項目以及重大風險項目。該方法能夠為傳統風險識別方法提供補充,可作為裝備研制精細化質量管控的有效手段。

不僅如此,專家意見文本挖掘還能夠快速概括評審意見內容,適用于對評審質量的精細化管控。例如,橫向比較不同裝備在相似評審環節的評審意見的全面性、比較不同參評專家的評審意見數量和質量,從而判斷評審的有效性,進而通過設置評審專題、優化評審專家組成員等方式提高評審質量。

猜你喜歡
詞匯文本分析
本刊可直接用縮寫的常用詞匯
隱蔽失效適航要求符合性驗證分析
一些常用詞匯可直接用縮寫
山東醫藥(2020年34期)2020-12-09 01:22:24
在808DA上文本顯示的改善
本刊可直接用縮寫的常用詞匯
電力系統不平衡分析
電子制作(2018年18期)2018-11-14 01:48:24
基于doc2vec和TF-IDF的相似文本識別
電子制作(2018年18期)2018-11-14 01:48:06
電力系統及其自動化發展趨勢分析
文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學隱喻
如何快速走進文本
語文知識(2014年1期)2014-02-28 21:59:13
主站蜘蛛池模板: 高潮毛片无遮挡高清视频播放 | 91亚洲影院| 99精品久久精品| 国产欧美在线观看精品一区污| 亚洲bt欧美bt精品| 波多野结衣在线se| 伊人色天堂| 国产在线无码av完整版在线观看| 欧洲极品无码一区二区三区| 国产午夜无码片在线观看网站| 永久免费av网站可以直接看的 | 亚洲成人免费看| 99青青青精品视频在线| www亚洲天堂| 热久久这里是精品6免费观看| 国产精品女主播| 欧美日韩国产精品va| 99久久精品无码专区免费| 露脸真实国语乱在线观看| 国产va视频| 成人国产一区二区三区| 免费看美女自慰的网站| 国产你懂得| 99热这里只有精品5| 国产欧美成人不卡视频| 久久九九热视频| 欧美国产日韩一区二区三区精品影视| 国产免费网址| 美女国产在线| 国产草草影院18成年视频| 亚洲爱婷婷色69堂| 九九视频免费在线观看| 国产成人精品第一区二区| 亚洲成a人片| 欧美国产日韩另类| 激情综合图区| 亚洲AV无码乱码在线观看裸奔 | 欧美激情第一区| 久久中文字幕2021精品| 全部免费特黄特色大片视频| 国精品91人妻无码一区二区三区| 亚洲成人在线免费观看| 色亚洲成人| 国产chinese男男gay视频网| 国产肉感大码AV无码| 黄色网在线| www.99精品视频在线播放| 六月婷婷精品视频在线观看 | 国产亚洲日韩av在线| 国产福利在线免费观看| 高潮毛片免费观看| 日韩a在线观看免费观看| 国产网站在线看| 97国产在线视频| 久草热视频在线| 国产女人在线| 五月丁香在线视频| 欧美成人手机在线观看网址| 国产成人精品无码一区二 | 久久99蜜桃精品久久久久小说| 亚洲精品黄| 欧美性爱精品一区二区三区| 国产特一级毛片| 欧美性色综合网| 高清不卡毛片| 国产97视频在线观看| 国产乱码精品一区二区三区中文| 伊人久久精品亚洲午夜| 亚洲码在线中文在线观看| 日韩最新中文字幕| 伊人激情综合| 成人夜夜嗨| 欧美成人免费| 国产成人1024精品| 亚洲一区二区三区香蕉| 一本久道热中字伊人| 欧美日韩免费观看| 在线不卡免费视频| 亚洲香蕉在线| 亚洲日韩国产精品无码专区| 激情无码字幕综合| 97亚洲色综久久精品|