全泓達(dá),蓋 磊
(中國(guó)海洋大學(xué) 物理與光電工程學(xué)院,山東 青島 266100)
熱機(jī)是將熱能轉(zhuǎn)換為機(jī)械能的儀器.法國(guó)青年工程師卡諾從理論上對(duì)理想熱機(jī)的工作原理進(jìn)行研究,提出了一種理想的由2個(gè)等溫及2個(gè)絕熱過(guò)程的循環(huán),稱為卡諾循環(huán),并在1824年提出了卡諾定理,為后來(lái)熱力學(xué)第二定律的建立奠定了基礎(chǔ),為提高熱機(jī)的效率指明了方向,為熱力學(xué)的發(fā)展做出了杰出的貢獻(xiàn)[1-3].
由于熱機(jī)的整個(gè)裝置處于動(dòng)態(tài)平衡,獲取精準(zhǔn)的靜態(tài)狀態(tài)數(shù)據(jù)需要較長(zhǎng)的判斷時(shí)間,因此本文主要基于空氣熱機(jī)實(shí)驗(yàn)中驗(yàn)證卡諾定理的靜態(tài)測(cè)量法,探索了快速判斷平衡點(diǎn)的方法.
實(shí)驗(yàn)采用世紀(jì)中科的ZKY-RJ空氣熱機(jī)實(shí)驗(yàn)儀,實(shí)驗(yàn)由空氣熱機(jī)電加熱器進(jìn)行加熱,并由空氣熱機(jī)測(cè)試儀得到冷端溫度、熱端溫度、轉(zhuǎn)速、氣缸壓力以及氣缸體積等實(shí)驗(yàn)數(shù)據(jù),并經(jīng)過(guò)實(shí)驗(yàn)通信器面板傳回電腦進(jìn)行數(shù)據(jù)顯示.
熱機(jī)每次循環(huán)從熱源吸收的熱量
(1)
其中,n為熱機(jī)轉(zhuǎn)速,ΔT為冷熱端溫差.因此熱機(jī)效率η可表示為
(2)
其中,A為氣體對(duì)外所做的凈功,即P-V圖中曲線所圍面積.由于式中的變量均可以在實(shí)驗(yàn)中測(cè)量得到,因此通過(guò)觀測(cè)不同冷熱端溫度時(shí)的nA/ΔT與ΔT/n的關(guān)系即可驗(yàn)證卡諾定理.
測(cè)量式子(2)中的參量有2種方法:靜態(tài)測(cè)量法和動(dòng)態(tài)測(cè)量法.靜態(tài)測(cè)量法是在電壓檔位一定時(shí),在系統(tǒng)穩(wěn)定后測(cè)量得到的平均值,可以表示在一定的冷熱端溫度時(shí)的關(guān)系.熱機(jī)穩(wěn)定工作是指冷熱端在一定的溫度下,保持一定的效率,即在每次循環(huán)中熱機(jī)對(duì)外做功近乎不變.在一定輸入功率下,系統(tǒng)是否達(dá)到平衡取決于冷熱端的溫差和轉(zhuǎn)速,即通過(guò)電加熱器可以使冷熱端溫差變大(視冷端溫度不變或者變化很小),而熱機(jī)每次循環(huán)都將從熱源吸收熱量,使冷熱端溫差下降.所以二者的平衡即是靜態(tài)測(cè)量法所需要的穩(wěn)定狀態(tài).
實(shí)驗(yàn)中判斷熱機(jī)是否平衡需要長(zhǎng)時(shí)間的數(shù)據(jù)記錄,當(dāng)轉(zhuǎn)速、冷熱端溫差在一定范圍內(nèi)上下浮動(dòng)時(shí)(例如n<1 r·s-1,ΔT<5 K),可判斷空氣熱機(jī)達(dá)到平衡狀態(tài),但判定平衡點(diǎn)的觀測(cè)時(shí)間通常需要10 min甚至更長(zhǎng),從而不利于實(shí)驗(yàn)教學(xué).
1)打開(kāi)計(jì)算機(jī)、測(cè)試儀和通信器,加熱電源;
2)將電壓調(diào)至5檔,預(yù)熱儀器使飛輪順利轉(zhuǎn)動(dòng)(一般ΔT>80 K);
3)將電壓調(diào)回1檔,開(kāi)始計(jì)時(shí)計(jì)數(shù),每隔1 min記錄1次T1,ΔT,n和A,直至各項(xiàng)數(shù)值在平衡點(diǎn)附近變化(記錄時(shí)間約1 h);
4)將電壓調(diào)至2檔重復(fù)上述步驟3).
3.1.1 K型均值聚類
K型均值聚類(K-means clustering)是經(jīng)典的無(wú)監(jiān)督機(jī)器學(xué)習(xí)算法,用于無(wú)目標(biāo)值的數(shù)據(jù)集[4].K型算法主要是通過(guò)迭代來(lái)對(duì)數(shù)據(jù)集進(jìn)行分類.首先在樣本中選取任意K個(gè)樣本作為聚類中心,利用所選取的聚類中心計(jì)算各樣本與中心間的距離;然后根據(jù)獲得的最小計(jì)算距離重新劃分對(duì)象.距離一般通過(guò)歐式距離Dδ進(jìn)行度量,表達(dá)式如下:
Dδ(xi,xj)=
(3)
其中,xi=(xi1,xi2,…,xip)和xj=(xj1,xj2,…,xjp)表示p維歐幾里德空間中的2點(diǎn).重新計(jì)算獲得每個(gè)樣本的均值后,迭代至目標(biāo)函數(shù)值不變或者小于指定閾值.目標(biāo)函數(shù)為平方誤差準(zhǔn)則函數(shù),表示為
(4)
其中,Ci為數(shù)據(jù)對(duì)象數(shù)量,ci表示第i個(gè)簇中心.
3.1.2 KNN分類
最近鄰節(jié)點(diǎn)分類(K-nearest neighbor,KNN)方法是有監(jiān)督的弱機(jī)器學(xué)習(xí)算法[5],其通過(guò)計(jì)算預(yù)測(cè)值與現(xiàn)有樣本的閔可夫斯基距離(Minkowski distance)來(lái)確定預(yù)測(cè)所屬類別.
閔式距離的表達(dá)式為:
(5)
當(dāng)p→∞時(shí),閔式距離轉(zhuǎn)化為切比雪夫距離(Chebyshev distance);當(dāng)p=2時(shí),閔式距離轉(zhuǎn)化為歐幾里得距離;當(dāng)p=1時(shí),閔式距離轉(zhuǎn)化為曼哈頓距離(Manhattan distance).通過(guò)閔式距離,可較好表示n維歐幾里德空間中2點(diǎn)相對(duì)距離.
KNN算法中最為重要的參量為判斷類別時(shí)采用的樣本個(gè)數(shù),若選取的樣本數(shù)量過(guò)小,容易受到異常點(diǎn)的影響;若選取的樣本數(shù)量過(guò)大,就會(huì)受到樣本均衡的影響,所以選取合適的樣本數(shù)對(duì)KNN模型具有重要作用.
本文對(duì)實(shí)驗(yàn)數(shù)據(jù)進(jìn)行KNN分類處理,以獲得能較好判斷熱機(jī)是否到達(dá)平衡的模型,通過(guò)該模型能準(zhǔn)確快速地判斷空氣熱機(jī)是否達(dá)到平衡,從而減少實(shí)驗(yàn)時(shí)間.
為使實(shí)驗(yàn)結(jié)果具有普適性,消除儀器和檔位(加熱電壓)的偶然性,本文對(duì)2臺(tái)儀器3個(gè)檔位進(jìn)行實(shí)驗(yàn),部分原始數(shù)據(jù)如表1所示.

表1 實(shí)驗(yàn)原始數(shù)據(jù)(部分)
由于各項(xiàng)指標(biāo)的數(shù)據(jù)單位以及數(shù)值大小不同,所以需要對(duì)各類數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化.假設(shè)進(jìn)行分析的指標(biāo)變量有m個(gè),分別為z1,z2,…,zm,共有n個(gè)評(píng)價(jià)對(duì)象,第i個(gè)評(píng)價(jià)對(duì)象的第j個(gè)指標(biāo)的取值為aij[6].將各指標(biāo)值轉(zhuǎn)化為標(biāo)準(zhǔn)化值有
(6)

由式(6)可獲得各項(xiàng)指標(biāo)標(biāo)準(zhǔn)化后隨時(shí)間的變化圖線,如圖1所示.根據(jù)卡諾定理,熱機(jī)在穩(wěn)定運(yùn)行時(shí),其在1個(gè)循環(huán)內(nèi)的效率僅跟冷熱端溫度有關(guān),而在多次循環(huán)中,轉(zhuǎn)速與循環(huán)次數(shù)有關(guān),那么是否平衡也與轉(zhuǎn)速有關(guān).以下將不考慮對(duì)外做功對(duì)平衡判斷的影響.需要補(bǔ)充說(shuō)明的是,為了獲取僅與上述因素有關(guān)的熱機(jī)平衡判定方法,而非對(duì)比儀器間差異,所以無(wú)需控制儀器A和B都在電壓檔1和2進(jìn)行實(shí)驗(yàn)測(cè)量.

(a)儀器A電壓檔1
利用得到的標(biāo)準(zhǔn)化數(shù)據(jù),進(jìn)行K型聚類[7],將歐幾里德距離作為K型聚類的判斷標(biāo)準(zhǔn),將數(shù)據(jù)分為平衡狀態(tài)與非平衡狀態(tài),由此可以獲得較為客觀公正的平衡點(diǎn),圖2為聚類后的輪廓圖.

(a)儀器A電壓檔1
圖2中簇1為聚類后認(rèn)定的平衡狀態(tài),簇2為聚類后認(rèn)定的非平衡狀態(tài).通過(guò)對(duì)輪廓圖的分析,可以發(fā)現(xiàn)聚類效果較為顯著.為了讓實(shí)驗(yàn)數(shù)據(jù)更具有信服力,本次實(shí)驗(yàn)記錄了長(zhǎng)時(shí)間(遠(yuǎn)超熱機(jī)平衡所需時(shí)間)的實(shí)驗(yàn)數(shù)據(jù),所以有大量的平衡狀態(tài)數(shù)據(jù)點(diǎn),而該類型的點(diǎn)能很好地被聚集在一起,形成較為明顯的數(shù)據(jù)邊際,說(shuō)明平衡與非平衡之間存在一定的衡量指標(biāo).
然后利用KNN進(jìn)行分類,將所有數(shù)據(jù)進(jìn)行整合,并將加熱電壓值作為模型建立的特征值.圖3和圖4為模型的訓(xùn)練結(jié)果.

圖3 模型ROC曲線與AUC

圖4 模型混淆矩陣
整體利用5折交叉驗(yàn)證獲得的模型準(zhǔn)確率達(dá)到93.3%,且為了防止過(guò)擬合,預(yù)留部分?jǐn)?shù)據(jù)進(jìn)行驗(yàn)證,最后效果較好,基本滿足預(yù)期需求.
圖3為模型的ROC曲線(Receiver operating characteristic),其中AUC[8](Area under curve)接近1,遠(yuǎn)在超假正率(False positive rate,F(xiàn)PR)等于真正率(True Positive Rate,TPR)的直線上方,接近1個(gè)完美的分類器.
圖4為模型的混淆矩陣[9],從矩陣可以看出誤判斷數(shù)量較少,整體能比較好地對(duì)平衡與非平衡狀態(tài)進(jìn)行分類.
基于以上模型,再次進(jìn)行5組實(shí)驗(yàn),在不同儀器不同電壓檔位下各測(cè)量60個(gè)數(shù)據(jù),并將得到的數(shù)據(jù)放入模型預(yù)測(cè)系統(tǒng)是否處于平衡狀態(tài).為了避免儀器因轉(zhuǎn)速過(guò)高而觸發(fā)保護(hù)機(jī)制,將最高電壓檔位設(shè)定為4檔.
圖5是模型對(duì)于系統(tǒng)是否達(dá)到平衡狀態(tài)判斷,橫坐標(biāo)表示儀器和電壓檔位,上下閾值為K-means聚類算法得出的平衡點(diǎn)的最大值和最小值,模型所判斷出的平衡點(diǎn)落在該范圍越多說(shuō)明模型判定準(zhǔn)確性越好.可以看出,模型判斷的平衡點(diǎn)基本都集中在平衡范圍內(nèi).

圖5 不同儀器、不同電壓檔位下系統(tǒng)平衡狀態(tài)的判斷結(jié)果
圖6為C儀器在電壓檔為4時(shí)的轉(zhuǎn)速隨時(shí)間的判斷結(jié)果,可看出系統(tǒng)在平衡狀態(tài)與非平衡狀態(tài)間的轉(zhuǎn)換位置處于曲線拐點(diǎn),與真實(shí)進(jìn)入平衡點(diǎn)時(shí)間不超過(guò)2 min,說(shuō)明該模型判斷效果較好.

圖6 C儀器在電壓檔為4時(shí)轉(zhuǎn)速隨時(shí)間的判斷結(jié)果
本文通過(guò)對(duì)空氣熱機(jī)實(shí)驗(yàn)測(cè)得的數(shù)據(jù)進(jìn)行分析,獲得了基于KNN的模型分類器,通過(guò)多種指標(biāo)對(duì)模型進(jìn)行衡量分類都有較好的預(yù)測(cè)結(jié)果.其中,誤分類點(diǎn)處于平衡狀態(tài)與非平衡狀態(tài)的模糊界線處,從錯(cuò)誤預(yù)測(cè)進(jìn)入正確預(yù)測(cè)所需時(shí)間不大于2 min,因此誤分類相較于接近10 min的主觀判斷有了大幅度的提升,并具備一定的實(shí)用性.將每一時(shí)刻獲得的數(shù)據(jù)輸入該模型,能得到較好的預(yù)測(cè)結(jié)果.另外,通過(guò)K-means聚類算法可以對(duì)因測(cè)量精度、環(huán)境影響、儀器誤差、動(dòng)態(tài)平衡等因素帶來(lái)的數(shù)據(jù)波動(dòng)提供較好的參考中心值,從而使得真實(shí)值的選取更加準(zhǔn)確.