999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

艦船推進系統集成管理知識挖掘方法研究

2017-01-16 02:02:37袁利國崔恒武曹詩杰
艦船科學技術 2016年12期
關鍵詞:規則

袁利國,崔恒武,曹詩杰

(1. 海軍北海艦隊裝備部, 山東 青島 266071;2. 青島92001部隊司令部, 山東 青島 266011;3. 海軍工程大學 動力工程學院,湖北 武漢 430033)

艦船推進系統集成管理知識挖掘方法研究

袁利國1,崔恒武2,曹詩杰3

(1. 海軍北海艦隊裝備部, 山東 青島 266071;2. 青島92001部隊司令部, 山東 青島 266011;3. 海軍工程大學 動力工程學院,湖北 武漢 430033)

針對艦船推進系統集成管理中的實船訓練仿真建模與機械設備狀態評估等高級應用對知識的需求,研究知識管理中所需要的知識內容與形式,探索數據挖掘方法在大數據知識獲取中的應用模式。以某型推進裝置為對象,研究使用數據挖掘技術獲取所需集成管理知識的途徑,包括聚類算法在推進系統穩態工況基準模式識別中的應用,以及關聯算法在狀態特征模式識別中的應用等。本文研究為實現基于知識的艦船推進系統集成管理提供了研究基礎。

集成管理;推進系統;數據挖掘;知識獲取

0 引 言

隨著艦船推進系統的復雜程度及相應的集成管理要求的不斷提高,對集成管理中數據信息層次的提升越來越引起了人們的重視。基于知識的集成管理是實現系統智能化的關鍵,也是集成管理的發展趨勢[1–3],這其中知識的獲取是關鍵問題,所獲取的知識可以以專家系統、智能程序等形式應用到集成管理的高級功能之中。

另一方面,新型艦船動力監控系統具備數據長時存儲的能力,隨著服役時間的增長,運行數據不斷積累,這些實時/歷史數據中保存了豐富的設備與系統的狀態信息,是一個新的寶貴知識源泉。研究針對海量數據的合適的知識獲取方法,提升數據的智能化程度,將各種數據轉化為計算機可以理解的知識形式,是數據信息處理的研究熱點[4–6]。使用數據挖掘算法,從歷史運行數據中找出系統和設備的運行模式知識,是知識獲取中的一個新途徑,可以彌補以專家經驗為主要來源的知識獲取方式的不足。

本文針對艦船推進系統集成管理中的實船訓練仿真建模與機械設備狀態評估等高級應用功能對知識的需求,研究推進裝置運行狀態模式知識的內容與形式,以及數據挖掘算法的應用模式,并詳細研究聚類分析算法在穩態運行工況基準模式識別中的應用,以及關聯分析算法在運行狀態特征模式識別中的應用。

1 集成管理中的知識挖掘模式

集成管理中的知識主要應用于高級應用功能中,其基礎是用合適的知識形式對推進系統所處的狀態模式進行正確識別,即提取推進系統所處狀態模式的量化特征,以及對推進系統狀態模式的分類與預測。

在實船訓練仿真建模中,隨著設備運行時間的增長,設備特性也在變化。常規仿真模型中,所有的參數一旦確定后,很少改變,這樣模型特性無法反映設備性能的時間衰減特性,對于實船訓練來講,模型精度和訓練效果會下降,模型性能與實際系統的性能之間的偏差會越來越大。需要找出一個方法,從歷史運行數據中識別出設備的當前狀態基準模式知識,便于對相應的模型參數進行修正。

在機械設備健康狀態監測中,需要發現設備健康狀態的基準模式知識,以及健康狀態下,系統與設備的特征模式知識,以此作為健康狀態監測的標準。在機械設備故障預測和診斷中,同樣的需要非健康狀態下的系統與設備的特征模式知識,以及故障模式的分類匹配知識。此外,由于推進系統存在多種運行工況,所以需要從歷史運行記錄中找到運行工況的分類知識。通過對運行工況的模式識別,在線判斷出推進系統的當前運行工況,便于調用相應工況下的健康狀態監測知識規則和故障診斷知識規則,更好地進行知識推理。

綜上所述,根據知識應用的需要,所需要挖掘的知識內容應包括:

①狀態基準模式,包括設備與系統的運行參數基準值;

②狀態特征模式,包括健康狀態、故障狀態、性能下降過程的特征;

③運行狀態模式識別,包括故障分類、工況分類和性能狀態分類等方面。

目前,主要有基于產生式規則、語義網絡以及基于框架的知識表示方法,其中產生式規則具有統一的IF-THEN 結構,符合思維的自然形式,易于實現控制與編程操作,還具有模塊性的特點,給知識庫的建立、擴展和維護提供了可管理性,是許多成功的專家系統所普遍采用的知識表示方法。基于產生式規則的知識表示中,知識庫由若干條規則組成,一條規則通常包括前件(前提條件)和后件(結論):

<Rule〉 = IF <條件〉 THEN <結論〉;

本文主要研究從運行數據集中通過數據挖掘技術獲取規則形式的知識,其應用模式如圖 1 所示。

圖 1 數據挖掘應用模式Fig. 1 Apllication mode of data mining

監控系統積累的原始大數據通過數據轉換進行預處理,去除噪音和異常數據,再根據不同的運行工況條件進行條件性拆分,得到不同工況的累積運行數據存儲在數據倉庫之中。在數據倉庫的基礎上,依據高級應用功能的需要,確定所需的知識模式類型,然后選取相應的挖掘算法進行知識發現。

2 聚類算法與穩態工況基準模式識別

穩態工況基準模式是在正常使用情況下系統所應達到的目標狀態,也可以認為這是一個標準無故障的健康狀態,或者在運行優化中的狀態標尺。它包括推進系統在各個穩態工況下,所有運行參數應達到的基準值。其中有的運行參數應達到的基準值可以根據車令表事前確定,如進行閉環控制的轉速、槳角以及離合器狀態等;而大多數運行參數的基準值是無法事先確定的,如某一穩態工況下的溫度、壓力等參數,需要根據實際運行狀態從歷史運行數據集中提取。

2.1 聚類算法

聚類是將數據樣本集 X {X1,X2,…,Xn} 按照某種相似性度量分成 k 簇 {C1,C2,…,Ck} 的過程[7–8],使同一個簇中的樣本之間具有很高的相似度,而不同簇中的樣本高度相異,即

數據樣本 Xi由 d 個屬性值組成,Xi=(Xi1,Xi2,…Xid),其中 Xif表示樣本中的各屬性,d 是樣本或樣本空間的維數(或屬性個數)。這樣,聚類的樣本集可看成是一個 n × d(n 個樣本 × d 個屬性)的數據矩陣,如式(1)所示:

簇的質心是簇的“中間值”,不需要是簇中實際點。令 ni表示簇 Ci中樣本的數量,mi表示對應樣本的均值,則簇的質心滿足:

簇的半徑是簇中 2 個點間的均方差的平方根。

相異度是聚類的依據,根據樣本屬性值數據類型的不同有不同的描述形式。常見數據類型有連續型、二元變量、分類、序數以及比例標度變量,對于連續型變量,通常使用度量距離。

根據不同的聚類需求,發展出了許多聚類算法,算法的選擇取決于數據的類型、聚類的目的和應用。

2.2 K-mean 算法

k-mean 算法最早由 Lloyd 以及 MacQueen 提出,屬于基于劃分的方法,以距離值的平均值對聚類成員進行分配,它能較好的處理連續值屬性的凸集聚類問題[9–10]。

k-mean 算法首先指定聚類數 k,隨機選擇 k 個對象,每個對象代表了一個簇的初始平均值。對剩余的每個對象,根據其與各個簇均值的距離,將它指派到最相似的簇,然后計算每個簇的新均值。這個過程循環進行,直到準則函數收斂時跳出循環。通常采用平方誤差準則函數:式中:E 為數據集中所有對象的平方誤差和;p 為樣本空間中的點;mi為簇 Ci 的均值。對于每個簇中的每個樣本,求樣本到其簇中心距離的平方,然后求和。這個準則試圖使生成的 k 個結果簇盡可能的緊湊和獨立。

k-mean 算法的基本思想基于距離的概念,當狀態變量為連續值時常使用 Lp- 范數來度量距離:

當 p = 2 時,表示歐幾里得距離(L2范數);當 p = 1時,表示曼哈頓距離(L1范數)。還可對每個屬性值根據其重要性人為的添加權重,成為加權 Lp- 范數。

k-mean 算法對數據簇中的所有數據取平均值,這樣導致如果存在個別距離過大的異常數據,則會對聚類中心造成很大影響,好的方面是如果異常數據反映故障狀態,則通過 k-mean 算法可以比較明顯地看出聚類中心的偏離,從而檢測出故障的存在;不好的方面是如果異常數據只是干擾信號,則也會使聚類中心明顯偏離,使人們對系統狀態產生誤判。所以 k-mean 算法對于異常點數據敏感,如果對待處理的數據集進行了較好的 ETL(抽取、轉換、加載)的預處理,則可以發揮 k-mean 算法的優勢,從數據集中抽取到真實的狀態模式信息。

2.3 基準模式知識識別

根據對推進系統工況劃分的先驗知識,各工況下的轉速、螺距穩態值由控制器中所存儲的車令表確定。所以在數據準備階段,根據車令表對原始數據進行數據提取,匯總各個穩態工況下的歷史運行數據,過濾其它工況下的運行數據。將提取的各個穩態工況下的運行數據以數據表的形式存入數據倉庫中。包括不同的推進系統運行模式,以及各個運行模式下的所有運行工況。考慮到在實際過程中存在狀態波動與測量誤差,取提取條件為在已知的主機轉速和調距槳螺距的基礎上適當擴大。這樣,從運行數據集中將符合提取條件的數據記錄提取出來,保存到單獨的數據表中。

對于各穩態工況下的數據集合,采用基于劃分的k-mean 算法對其中的連續狀態進行聚類,得出相應的聚類中心,從而得到各穩態工況下的狀態基準值。聚類中有 2 個問題對最終的聚類結果影響較大,一是參加聚類的狀態參數的數目與種類,另一個是聚類簇的數目 K。

不同的狀態參數數目,直接影響 k-mean 聚類算法中的計算過程,聚類結果也會不一樣。在進行聚類時,一般按照物理原則和所分析問題的視角來劃分子系統與設備,從而將狀態參數劃分種類,使所研究問題中存在耦合關系的參數盡量在一類中,而不同種類的參數之間耦合度盡量小。

算法中聚類簇數目 K 值的確定對于狀態基準模式的準確識別很重要。因為通過提取得到的數據是一個在滿足提取條件的區間范圍內匯總的數據集合,雖然這一區間范圍已經經過限制,但數據值還是存在相應的區間分布;另外,在數據集合中同時存在穩態與動態過程的狀態點,僅依據主機轉速和螺距這 2 個狀態屬性無法將穩態與動態狀態完全區分。所以在初次聚類時,選擇不同的 K 值分別計算狀態基準值,與研究平臺的穩態值相比較,選取最接近工況穩態值的簇中心點作為狀態基準值,因為抽取的樣本狀態已經相對集中,所以 K 值不用取較大的測試值,在 5 以內即可。

經過聚類計算和篩選后,可以得到在各穩態工況下的推進系統動力學狀態基準值,表 1 是某 CODAD推進系統港內模式 1# 機工作時聚類基準值與工況穩態值的比較列表。

系統的穩定狀態是一種理想情況,在實船穩態運行過程中,各參數實際上存在小范圍波動,一般測量的瞬時穩態值難以代表長期的狀態基準值,而采用聚類分析的手段能夠較好的從運行數據集中提取出推進系統各穩定工作狀態的基準值。采用聚類算法提取的狀態基準值,相對精確地反映了設備與系統的當前狀態,可以用于系統建模與模型修正。此外,還可以在狀態監測中作為性能退化程度的標準值,當實際狀態與該工況下的基準值之間的偏差大于一定程度時,認為系統處于故障狀態,相應的啟動報警和故障診斷模塊。狀態基準值同時在運行優化中可以作為管理者的目標值。

表 1 聚類基準值與工況穩態值比較Tab. 1 Compare cluster centre value and stable running value

3 關聯算法與狀態特征模式識別

狀態特征模式是指在一定工況下,推進系統狀態參數之間的一種特定量化關系,它通過定量的數值關系描述某一運行工況的特性。通過對特征模式的識別,可以建立各個運行工況和與之相應的特征模式之間一對一的映射關系。這樣,可以根據狀態特征模式推斷推進系統的運行工況。

3.1 Apriori 關聯算法

從數學上看,關聯是 2 個或多個變量取值之間存在的一類重要的可被發現的某種規律性。關聯分析的目的是尋找數據集中數據項之間隱藏的關聯關系,描述數據之間的密切度。關聯算法的實施一般分 2 個步驟:第 1 步從數據集中搜索頻繁項集;第 2 步在頻繁項集的基礎上歸納關聯規則,其中頻繁項集的計算是最主要的[11–13]。

Apriori 算法是 R.Agrawal 和 Srikant 于 1994 年提出的為布爾關聯規則挖掘頻繁項集的基本算法。它使用逐層搜索的迭代方法,通過侯選集產生頻繁項集,首先通過掃描數據庫,累積每個項的計數,并收集滿足最小支持度的項,找出頻繁 1 項集的集合,記作 L1。然后由 L1排列組合列出侯選 2 項集 C2,C2是頻繁 2項集 L2的超集,L2是 C2的子集。使用 Apriori 性質從C2中剪枝得到 L2。如此下去逐步搜索 L3和L4,直到不能再找到頻繁 k 項集。

Apriori 算法的核心內容是提出了用于壓縮搜索空間的 Apriori 性質:頻繁項集的所有非空子集也必須是頻繁的,即如果侯選集 I 不是頻繁項集,則項 A 添加到項集 I 后的合項集(I∪U)也不是頻繁項集。這一性質可以從較大的 C(k–1)快速提取L(k–1)。

一旦頻繁項集迭代搜索完畢,就可以由得到的頻繁項集產生出強關聯規則(滿足最小置信度和最小支持度)。具體步驟如下;

1)對于每個頻繁項集 Li(1 < i ≤ k),產生 Li的所有非空子集;

2)對于 Li的每個非空子集 S,如果 confidence即規則置信度超過最小置信度,則可以輸出關聯規則

置信度的計算公式:

即為頻繁項集 Li與 S 的支持度計數之比。

對于連續型變量,使用 Apriori 算法之前需要進行變量離散化。

3.2 特征模式識別

對于子系統和設備的狀態參數之間存在復雜映射關系的情況,使用關聯算法從工況運行數據中提取知識規律具有獨特的優勢。如主機主軸承溫度與主機工況之間的聯系;齒輪箱支撐軸承溫度、正倒車推力軸承溫度與齒輪箱工況之間的關聯情況;調距槳運行參數與調距槳工況間的關系等。識別出來的狀態特征模式可以作為狀態監測的知識儲備。

以調距槳工況與正車推力軸承溫度之間的聯系為例,如果采用機理函數的思路描述兩者之間的非線性映射關系,需要考慮復雜的影響因素,并且通過大量實際試驗研究才能分析過程中的機理關系。而采用關聯分析方法,不需要對物理過程的先驗知識,可以直接從運行數據中快速的發現調距槳運行工況與齒輪箱正車推力軸承溫度之間的關聯關系。

選取正常每軸單機模式 1# 機工作時的各動態工況數據集,采用基于 Apriori 算法的關聯算法進行計算。表 2 是從所有健康狀態記錄中提取的 9 條模式特征規則,(取規則的提取條件為概率大于 0.9,重要性大于1.0)。它們反映調距槳轉速、推力與正車推力軸承溫度之間的復雜映射關系。令規則的前件為軸轉速和螺旋槳推力,規則的后件為正車推力軸承溫度,可以看出,當螺旋槳推力為負時,仍然可以從運行數據集中識別出相應的知識規則,根據知識規則查出正車推力軸承的正常溫度范圍。

由于運行數據包含正常每軸單機模式 1# 機驅動下的所有運行工況,數據分布的區間較寬,所以識別出來的關聯知識規則中參數的數值分布也較寬。

表 2 動態工況特征模式關聯規則Tab. 2 Associate rules to dynamic running state characteristic

算法中連續值屬性的離散化方法對關聯規則的產生有一定影響,可使用聚類算法對連續值屬性進行離散化預處理。取不同的聚類數可以得到不同取值范圍的關聯規則,對于規則的敏感度與實用性影響較大。并不是每一條規則都有實用價值,存在規則篩選的問題。除了規則概率及重要性外,還要依據工況狀態的先驗知識進行分析篩選,更重要的是在應用過程中對規則的有效性進行檢驗。經過評估后得到的可靠特征模式規則,才能作為特征模式知識最終存入知識庫。

從推進系統狀態監測和故障診斷的角度來看,在運行數據集中最多的是系統在健康狀態下的記錄,所以可以首先將關聯規則知識用于推進系統健康狀態監測。在積累了一定程度的故障狀態運行數據信息后,可以提取故障狀態的特征模式,從而使用關聯知識規則進行故障預警與故障診斷分析。

4 結 語

在艦船推進系統的集成管理中,需要將數據信息提升到知識的層次。利用裝置運行數據和信息作為監控管理工具是一個尚未充分開發的領域。

本文探討了在推進系統集成管理中所需要的知識形式,數據挖掘技術在知識獲取中的應用模式,以某型 CODAD 聯合推進裝置為對象,研究了數據挖掘技術在知識獲取中的應用。為實現基于知識的艦船推進系統集成管理提供了研究基礎。需要注意的是,數據挖掘所能夠發現的知識模式是由數據集中所蘊涵信息所決定的。積累信息量充足的數據集是數據挖掘知識可用性的客觀基礎。

[1]KIEHNE T. Co-simulation and dynamic assessment of thermal management strategies aboard naval surface ships[R]. Texas: Electric Ship Research and Development Consortium, University of Texas, 2014.

[2]PINHA D, AHLUWALIA R. Decision support system for production planning in the ship repair industry[J]. Industrial and Systems Engineering Review, 2014, 2(1): 52–61.

[3]ELBASHIR M Z, COLLIER P A, SUTTON S G. The role of organizational absorptive capacity in strategic use of business intelligence to support integrated management control systems[J]. The Accounting Review, 2011, 86(1): 155–184.

[4]SHEN Y, LI X W, GAO H J, et al. Data-based techniques focused on modern industry: an overview[J]. IEEE Transactions on Industrial Electronics, 2015, 62(1): 657–667.

[5]Rotating machine condition monitoring-the state of the art[EB/OL]. [2014-10-15]. http://www.users.aston. ac.uk:880/modiarot/.

[6]MITGMBH. DataEngine[EB/OL]. [2014-10-15]. http://www.dataengine.de/english/sp/demos/english/dataengine.exe.

[7]VELMURUGAN T. Performance based analysis between k-Means and Fuzzy C-Means clustering algorithms for connection oriented telecommunication data[J]. Applied Soft Computing, 2014, 19: 134–146.

[8]CHATURVEDI A, GREEN P E, CARROLL J D. K-modes clustering[J]. Journal of Classification, 2001, 18(5): 35–55.

[9]TZORTZIS G, LIKAS A. The MinMax k-means clustering algorithm[J]. Pattern Recognition, 2014, 47(7): 2505–2516.

[10]CHAVES A A, LORENA L A N. Clustering search algorithm for the capacitated centered clustering problem[J]. Computers & Operations Research, 2010, 37(3): 552–558.

[11]GHARIB T F, NASSAR H, TAHA M, et al. An efficient algorithm for incremental mining of temporal association rules[J]. Data & Knowledge Engineering, 2010, 69(8): 800–815.

[12]WINARKO E, RODDICK J F. ARMADA-An algorithm for discovering richer relative temporal association rules from interval-based data[J]. Data & Knowledge Engineering, 2007, 63(1): 76–90.

[13]áLVAREZ V, VáZQUEZ J M. An evolutionary algorithm to discover quantitative association rules from huge databases without the need for an a priori discretization[J]. Expert Systems With Applications, 2012, 39(1): 585–593.

Research on knowledge mining method for marine propulsion system integrated management

YUAN Li-guo1, CUI Heng-wu2, CAO Shi-jie3
(1. Equipment Department of Naval North China Sea Fleet, Qingdao 266071, China; 2. Training Office of 92001 Troops Headquarters, Qingdao 266001, China; 3. Naval University of Engineering, College of Naval Power Engineering, Wuhan 430033, China)

To meet with the knowledge requirements of integrated management advanced applications of marine propulsion system, such as on board training simulation and mechanical equipment condition estimate et al. The type and expression of integrated management knowledge are analyzed. Data mining arithmetic is put forward to explore the application mode of knowledge mining and identify the running mode regulation of propulsion system. This research emphasis on clustering arithmetic applied to identify the norm value of running mode, associated arithmetic applied to identify the characteristic of running mode. The research in this paper can be a study foundation for knowledge based integrated management of marine propulsion system.

integrated management;propulsion system;data mining;knowledge acquire

C37

A

1672–7619(2016)12–0098–06

10.3404/j.issn.1672–7619.2016.12.020

2016–05–26;

2016–07–13

中國博士后科學基金資助項目(201150M1547);湖北省自然科學基金資助項目(2013CFB440)

袁利國(1975–),男,博士,工程師,研究方向為艦船動力裝置總體設計。

猜你喜歡
規則
拼寫規則歌
撐竿跳規則的制定
數獨的規則和演變
依據規則的推理
法律方法(2019年3期)2019-09-11 06:26:16
善用首次銷售規則
中國外匯(2019年7期)2019-07-13 05:44:52
規則的正確打開方式
幸福(2018年33期)2018-12-05 05:22:42
顛覆傳統規則
環球飛行(2018年7期)2018-06-27 07:26:14
讓規則不規則
Coco薇(2017年11期)2018-01-03 20:59:57
TPP反腐敗規則對我國的啟示
啦啦操2010—2013版與2013—2016版規則的對比分析
運動(2016年6期)2016-12-01 06:33:42
主站蜘蛛池模板: 免费可以看的无遮挡av无码 | 国内嫩模私拍精品视频| 国产乱人激情H在线观看| 精品国产自在在线在线观看| 最新加勒比隔壁人妻| JIZZ亚洲国产| 久久久久夜色精品波多野结衣| 性视频久久| 三区在线视频| 欧美一区中文字幕| 日韩第一页在线| 国产在线观看人成激情视频| 日韩在线视频网站| 为你提供最新久久精品久久综合| 日a本亚洲中文在线观看| 2020国产精品视频| 18禁黄无遮挡网站| 自拍偷拍欧美| 欧美激情第一区| 久久这里只有精品8| 在线视频精品一区| 人妻中文字幕无码久久一区| 欧美成人综合视频| 亚洲av片在线免费观看| 丝袜久久剧情精品国产| 一本色道久久88| 国产99久久亚洲综合精品西瓜tv| 欧美亚洲日韩中文| 好紧太爽了视频免费无码| 日韩在线观看网站| 国产一级毛片在线| 又粗又硬又大又爽免费视频播放| 成人欧美在线观看| 中文字幕无码制服中字| 国产无码在线调教| 欧美色视频日本| 精品久久蜜桃| 亚洲一区免费看| 亚洲第一极品精品无码| 97综合久久| 亚洲国产成人精品一二区| 欧美a级完整在线观看| 国产最新无码专区在线| 国产精品第一区在线观看| 国产美女无遮挡免费视频| 啊嗯不日本网站| 国产精品区视频中文字幕| 免费A级毛片无码无遮挡| 中国一级特黄视频| 国产精品女人呻吟在线观看| 超碰aⅴ人人做人人爽欧美 | 波多野结衣无码视频在线观看| 久久五月天综合| 国产精品视频观看裸模| 尤物亚洲最大AV无码网站| 国产成人福利在线视老湿机| 91精品国产一区| 亚洲国产欧美国产综合久久 | 波多野结衣一区二区三区88| 97se亚洲综合在线韩国专区福利| 国产成人久久777777| 91精品国产自产在线观看| 国产精品区网红主播在线观看| 国产高清不卡| 永久免费AⅤ无码网站在线观看| 婷婷色一二三区波多野衣| 91啪在线| 日韩欧美国产中文| 中文无码精品A∨在线观看不卡| 亚洲AV无码一二区三区在线播放| 91亚洲精品国产自在现线| 成人在线综合| 重口调教一区二区视频| 欧美色香蕉| 日韩在线播放欧美字幕| 午夜国产精品视频| 国产呦精品一区二区三区网站| 综合人妻久久一区二区精品| 99国产精品一区二区| 午夜a级毛片| 国产哺乳奶水91在线播放| 亚洲日韩AV无码精品|