










摘要:為了獲取更純凈的紅巨星樣本,采用基于深度學習的方法對來自APOGEE-2的2萬多顆星的演化類型進行了分類;使用APOKASC-2中的4216顆星為訓練集,將神經網絡訓練出的模型應用到紅巨星分支恒星和紅團簇星的分類中;以APOKASC-2中的1807顆星為測試集,模型應用到測試集的結果顯示,該方法的均方誤差、均方根誤差、平均絕對誤差分別是4%、20%、9%。接著將模型應用到來自APOGEE-2的2萬多顆星,得到結果的均方誤差、均方根誤差、平均絕對誤差分別是5%、24%、8%。此外,分析使用了LAMOST DR7的數據進行測試,結果顯示此方法的準確率目前能達到98%。通過對比,我們的方法與部分其他分類方法的準確率基本一致。未來可以將此方法應用于更大樣本的紅巨星分支恒星和紅團簇星的分類工作。
關鍵詞:紅巨星支;機器學習;恒星參數;星震學;紅團簇星
中圖分類號:P145.9文獻標志碼:A文章編號:1673-5072(2025)01-0086-09
Classification of Red Clump Stars and Red Giant Branch StarsBased on Deep Learning Method
Abstract:To obtain a purer sample of red giant branch stars,the study classify the evolutionary types of over 20 000 stars from APOGEE-2 with deep learning method.The model is trained using 4216 stars from APOKASC-2 as the training set and applied to classify red giant branch and red clump stars.Using 1807 stars from APOKASC-2 as the test set,the result obtained shows that the mean square error,root mean square error,and mean absolute error of the method applied are 4%,20%,and 9%.Applying the model to more than 20 000 stars from APOGEE-2,the mean square error,root mean square error,and mean absolute error of the results are 5%,24%,and 8%.Additionally,the analysis is tested with data from LAMOST DR7,demonstrating a current accuracy of 98%.The accuracy of the method in this study is basically equal to that of some other classification methods after comparison.Therefore,our method can be used in larger sky surveys for the classification of red clump and red giant branch stars.
Keywords:red giant branch;machine learning;stellar parameters;asteroseismology;red clump stars
紅巨星分支恒星是發生在氦核燃燒之前的一個恒星演化階段。這類恒星擁有一個簡并的氦核心,其氫殼層持續燃燒,光譜型通常屬于K或者M類型,代表中低質量恒星。相比之下,紅團簇星是一類低溫的水平分支恒星,相比于大多數亮度相似的紅巨星分支恒星,紅團簇星的溫度更高。它們被視為紅巨星分支的高密度區域,或是朝向更高溫度膨脹的一部分。它們大部分經歷了氦閃,是進入穩定的中心氦核聚變燃燒階段的低質量恒星[1-2]。由于紅團簇星的光度和顏色表現出極高的穩定性,因此常被用作測量距離的標準燭光[3-6]。這一特性使得紅團簇星在Teff-lg g圖中形成一個高密度分布區域,相對容易識別。然而,值得注意的是,該位置也存在著來自紅巨星分支恒星的污染[7],從而可能對銀河系研究的一些課題產生影響。因此,需要挑選這些紅巨星的不同演化狀態并進行分類。
Hon等[8]采用監督學習,使用一維卷積神經網絡從具有星震學信息的紅巨星光譜中學習特征參數來訓練模型,通過對來自Kepler巡天[9]的紅巨星光譜圖像進行訓練和測試,成功區分出紅巨星分支恒星(RGB)和氦燃燒恒星(HeB);此外,他們還預測了5379顆紅巨星的演化狀態。次年,Hon等[10]又改進了卷積神經網絡分類器,使用來自Kepler巡天的14 983顆星的低分辨率光譜完成了對紅巨星分支恒星(RGB)和氦燃燒恒星(HeB)的分類工作,并利用4年、356天、82天和27天的測光時間序列數據來訓練模型,測試集的準確率分別達到了98.3%、98.3%、95.4%和93.2%。He等[11]運用XGBoost集成學習算法,利用LAMOST光譜[12]成功分類出紅團簇星和紅巨星分支恒星;同時,還用該方法結合Kepler所提供的星震學參數信息來訓練模型,估算了主紅團簇星(Primary RC)的年齡和質量,結果顯示主紅團簇星的年齡和質量估算的不確定性分別是31%和13%。李啟達等[13]運用來自LAMOST DR5和Kepler的紅團簇星樣本,使用核主成分分析與隨機森林相結合的方法對恒星年齡進行預測,測試集結果顯示,模型的相對誤差平均值為13%。Leung等[14]基于APOGEE DR14的數據,運用深度學習方法對恒星參數進行預測,結果表明,即使是在信噪比較低的情況下,也能確定18種元素豐度并且誤差在0.03 dex。
本研究利用光譜和星震學參數信息的同時嘗試用新的方法來探索這個問題。首先,應用隨機森林算法計算出各特征參數之間的重要性因子。其次,選擇重要度排序前4的參數,并結合來自APOKASC-2[15]的真實演化狀態標簽形成輸入矩陣,完成對模型的訓練,并通過模型在測試集的表現來評估其準確率。此外,本文還對Shetrone等[16]處理過的來自APOGEE-2[17]的具有真實演化狀態標簽的數據進行分類,進一步驗證此方法的可行性。最后,我們與同樣利用LAMOST DR7數據的He等[11]使用的XGBoost方法進行了比較。
1數據
1.1數據介紹
APOKASC[18]的目標是從Kepler中獲得大量具有天體物理學意義的星震學數據,Kepler使用短周期和長周期兩種觀測模式,其中短周期適合研究矮星和亞巨星,而長周期適合研究紅巨星。同時,來自APOGEE光譜能針對較冷的恒星和已脫離主序的演化階段的恒星提供最精確的測量結果。APOGEE-2是SDSS-IV[19]的重要組成部分,主要利用高分辨率光譜研究銀河系內的大概300 000顆恒星并確定恒星參數。
在數據方面,使用Pinsonneault等[15]創建的 APOKASC DR2星表,結合Borucki等[9]在Kepler所獲得的星震學參數,總共得到6676顆帶有演化狀態的紅團簇星(RC)與紅巨星分支恒星(RGB)。由星震學得到的高精度恒星參數樣本是目前可靠性最高的,所以很適合作為機器學習的訓練樣本集,更好地幫助本研究訓練出優秀的模型。
同時,還使用了Shetrone等[16]從APOGEE-2 DR14選取的26 097顆帶有演化狀態的紅團簇星與紅巨星分支恒星的大樣本作為此模型的第二個測試集,來進一步驗證和測試模型的可行性。
最后,將模型應用于來自LAMOST DR7的1541顆帶有演化標簽的紅巨星樣本,以便與He等[11]使用的XGBoost方法進行比較。
1.2數據篩選
在機器學習的過程中,構建的模型參數會對模型的表現產生很大的影響,所以選取過程和方法尤為重要。APOKASC DR2 數據是由Pinsonneault等[15]的工作得到的,該星表中含有許多參數信息,如周期、頻率、表面重力、年齡等。接著,通過與Leung和Bovy[14]的研究結果進行數據交叉匹配,獲取每顆星的化學信息以及其他恒星參數[20],從而更好地探索不同參數之間和參數與演化狀態之間的特征關系。同時,也剔除了含有壞值、空值的數據。經過處理后,共得到了6023顆同時具有空間位置、速度、年齡、金屬豐度以及其他化學信息和演化狀態的星。接著以7∶3的比例將其隨機劃分為訓練集和測試集,分別包含4216顆和1807顆星。測試集中RGB和RC的比例分別為60%和40%。圖1展示了該樣本在Teff-lg g的分布,并且用不同顏色表示不同的演化狀態。
樣本中同時存在著少量演化狀態為模糊狀態(AMB)的星,本文測試了保留這些星而訓練出的模型,如圖2(a)所示,圖中縱坐標對應每顆星的真實演化狀態標簽值,橫坐標對應著模型所預測的演化狀態標簽值。對應顏色越深,表明對應值越趨于一致,預測的準確率也越高。數據表示對應預測的準確率,而括號內的數據表示對應的紅巨星數量。同時,剔除這部分星而訓練出的模型在相同測試集上的表現如圖2(b)所示。通過對比發現,剔除演化狀態為AMB的星后模型表現更好。
同樣地,把來自APOGEE-2 DR14的數據也與Leung等[14]的研究結果進行交叉匹配,獲取包括豐富的化學信息在內的更多參數信息。同時,也剔除了含有壞值、空值的數據。最后,得到24 946顆具有年齡、金屬豐度以及化學信息和真實演化狀態的星表來作為第2個測試集進一步驗證此模型,其中RGB和RC的占比分別為78%和22%。
此外,按照He等[11]所描述的數據處理步驟,同樣從LAMOST DR7中篩選出了1541顆帶有演化狀態的星。在去除了樣本中含有空值的部分后,最終得到了1431顆星,作為與He等[11]方法進行比較的樣本。
2方法
2.1特征參數的挑選
在本文中,首先使用隨機森林算法對特征參數進行重要度排序以篩選和提取特征參數。隨機森林算法[21]基于決策樹,通過評估每個特征在決策樹中的貢獻,并得出其平均值,從而得出特征的重要性。借助于此方法,可以得出不同參數之間的相關性,并且挑選出最適合成為神經網絡的輸入矩陣的特征參數。同時該方法具有良好的魯棒性,可以避免過擬合的情況。光譜參數通常包含關于恒星的化學豐度、溫度等信息,這些參數對紅巨星的分類至關重要,因為紅巨星的光譜特征會受到其內部結構和化學豐度的影響。而星震學參數涉及到恒星內部的振動頻率,提供了恒星內部結構和演化信息。在選取特征參數的過程中,組合不同的特征參數可能涉及到這些參數之間的相互聯系。例如,將光譜參數和星震學參數相結合訓練模型,可以更全面地揭示紅巨星的性質,從而提高分類結果的準確性。
通過隨機森林所得出的特征參數與恒星演化狀態相關性排序如圖3所示,這里選擇排序的前20個參數進行展示。通過測試發現,許多的恒星參數之間也是高度相關的,如圖4所示。
采取隨機森林方法選擇了前5個參數作為模型的特征參數,分別是R(半徑)、Rho(密度)、Dnu(頻率)、lg g(seis) (由星震學方法得到的表面重力)、age(年齡)。值得注意的是,這5個參數都是星震學參數。盡管完全由星震學參數參與訓練的模型在測試集表現得非常好(圖5(a)),但是這些參數數量極少,難以在大樣本數據中普遍運用這些參數所訓練出的模型,所以在特征參數的挑選上排除了一些只能由星震學獲取的參數。當只保留光譜數據作為特征參數來訓練模型時,在測試集中得到結果并不理想(圖5(b))。綜上分析,最終選擇了采用光譜和星震學相結合的方式作為本文對特征參數的選取策略。這樣不僅可以有效彌補只用光譜參數訓練導致的模型準確率不足的問題,同時也可以彌補星震學數據缺乏的問題。
理論上,通過隨機森林方法按重要度排序的參數選取的越多,訓練出的模型效果也會更好,與之相對應的訓練時間也會更長,測試結果如圖6所示。但是在不斷調整和測試的過程中,發現保留4個特征參數來參與模型的訓練效果是相對最好的。所以本文選取重要度分數在0.08以上的參數,從而合理地選取前4個參數來估計恒星演化狀態,分別是fakemag(預測得到的恒星亮度)、age(年齡)、lg g(表面重力)、Teff(有效溫度)。在這4個參數中,只有年齡是通過星震學方法獲取,其余3個參數是通過光譜得到。
2.2模型的選取
目前,通過星震學得到的恒星參數的樣本量很少。因此,基于大樣本數據,通過機器學習來獲取恒星參數和性質是一種高效且準確性較高的方法。在本次工作中,使用了來自He等[22]在2015年提出的ResNet網絡架構。在理論上,更深的神經網絡會比淺層網絡表現更好,但是事實上深層網絡會因為層數太深,網絡復雜程度過高,可能會出現過擬合等問題,反而表現不如一些淺層網絡。因此He等[22]在研究中提出了殘差網絡來解決這個問題。在此次工作中,使用的是基于ResNet架構的ResNet_50 (208層) 神經網絡。
在網絡結構的優化器選擇上,沒有選擇RMS prop,AdaGrad,SGD等傳統優化器,而是選擇了Google團隊在2023年研究出的LION (EvoLved Sign Momentum)優化器,經過多種數據和多輪測試的結果表明,LION相比傳統的優化器表現更好[23]。
隨后,對網絡超參數進行調整,并將由隨機森林算法選取的前4個特征參數輸入搭建好的網絡中進行訓練,最終選擇表現最佳的模型。圖7展示了本文方法的具體流程。
3結果
3.1測試集結果
經過300輪次的訓練得到了最終的模型。圖2(b)展示了此模型在測試集中1807顆星的預測結果和真實結果的混淆矩陣。通過觀察混淆矩陣,發現將光譜和星震學參數結合并應用機器學習的方法具有顯著優勢。這種綜合的輸入方式不僅能夠彌補僅使用光譜參數導致準確度不足的情況 (如圖5(b)所示),同時也能夠解決目前存在的星震數據稀缺的問題 (如圖5(a)所示)。
在圖2(b)中可以觀察到訓練模型對RGB的預測數量為1016顆,其準確率達到93%;而對RC的預測數量達到690顆,準確率達到了96%。這些結果表明此模型能準確地挑選出RGB和RC。
圖8展示了本文模型預測結果與原始測試集在Teff-lg g分布上的比對。圖8(a)、(b)分別顯示了原始測試集中RC、RGB樣本在Teff-lg g平面中的分布,其中不同顏色代表了對應的年齡信息。可以觀察到測試樣本中,年老的星基本上都屬于紅巨星分支恒星,而紅團簇星大多都比較年輕。這也一定程度地說明了,年齡是與演化狀態相關性較大的特征參數,是初步區分和判斷的依據。圖8(c)、(d)分別展示了模型預測結果中RC和RGB樣本在Teff-lg g中分布,顏色同樣是年齡信息,可以看到模型表現良好,基本上完整重構出了與真實標簽值相同的結果。
3.2APOGEE樣本的測試結果
圖9展示了此模型運用在APOGEE-2的測試樣本所得結果的混淆矩陣。如圖所示,在經過數據處理篩選過后的24 946顆星中,演化狀態為紅團簇星的一共有5383顆。此模型的結果預測了4680顆屬于RC,預測準確率達到87%。演化狀態為RGB的有19 563顆,此模型結果預測有18 557顆屬于RGB,預測準確率達到了95%,括號里顯示了分別對應的恒星數量。不過,在模型作用在測試集數據的結果中,預測RC的準確率要比預測RGB高。但是,在用APOGEE-2的數據測試時,預測RGB的結果卻比RC的結果要好,這可能是因為在APOGEE-2的訓練中RC的覆蓋率較少。
圖10展示了模型預測的結果與原本測試集比較的Teff-lg g分布。上部左側子圖中顯示了原測試集總體的Teff-lg g分布,其中不同的顏色代表著不同的演化狀態,同時用對應顏色的實線表示了數據的密度輪廓。中間和右側子圖分別展示了測試集中真實RC和RGB的Teff-lg g分布,這里分區間畫出了密度分布,并用白色的實線表示密度輪廓。下側子圖則是此模型所預測結果的Teff-lg g 分布,整體如上部子圖所示,也用不同的顏色標識出了不同的演化狀態。對比上下子圖可以觀察到,本研究不僅很好地挑選出了幾乎所有RGB,而且也基本重構出了RC的分布。
3.3與其他工作對比
對照He等[11]的數據篩選步驟對LAMOST DR7進行篩選,一共得到了1431顆紅巨星樣本,接著運用模型對1431顆紅巨星樣本的分類,結果準確率達到98%。與之對比,He等[11]采用XGBoost方法在測試集上的準確率為96%。他們的測試集主要來自LAMOST DR7,通過與 Kepler交叉匹配后篩選出了信噪比大于70的1793顆星,作為驗證XGBoost方法的測試樣本。圖11展示了模型的詳細預測結果,其中縱坐標對應每顆星的真實演化狀態標簽值,橫坐標對應模型所預測的演化狀態標簽值。觀察到模型對RGB的預測數量為439顆,準確率達到98%;對RC的預測數量達到962顆,準確率也達到了98%。與之對比,He等[11]在測試集中對RGB的預測準確率為94%,對RC的預測準確率為97%。通過對比發現,在合理的誤差范圍內,本文方法的準確率與其基本一致。
4結論
本文通過Pinsonneault等[15]得出的來自APOKASC-2的大樣本RGB和RC星表,構建了一個可以區分大樣本RC和RGB的模型。接著,通過測試集和Shetrone等[16]從APOGEE-2 DR14選取的26 097顆帶有演化狀態的星表來測試了此模型的準確性。測試結果表明,模型在測試數據中能夠準確地挑選出RGB和RC。對不同的演化狀態進行了準確分類,證明了該方法的可行性。此外,本研究還將模型的準確率與其他分類方法進行了比較,結果顯示與之前的研究結果在合理誤差范圍內基本一致。未來,計劃進一步發展這一方法,并將其應用于更大規模的恒星樣本,促進對銀河系星族結構動力學的深入探討[24-34]。
參考文獻:
[1]ELSWORTH Y,HEKKER S,BASU S,et al.A new method for the asteroseismic determination of the evolutionary state of Red-Giant Stars[J].Monthly Notices of the Royal Astronomical Society,2017,466(3):3344-3352.
[2]CASSISI S,SALARIS M.A critical investigation on the discrepancy between the observational and the theoretical Red Giant luminosity function ‘Bump’[J].Monthly Notices of the Royal Astronomical Society,1997,285(3):593-603.
[3]PACZYNˊKKI B,STANEK K Z.Galactocentric distance with the OGLE and Hipparcos red clump stars[J].The Astrophysical Journal,1998,494(2):L219.
[4]GIRARDI L,GROENEWEGEN M A T,WEISS A,et al.Fine structure of the red giant clump from Hipparcos data,and distance determinations based on its mean magnitude[J].Monthly Notices of the Royal Astronomical Society,1998,301(1):149-160.
[5]ALVES D R.K-band calibration of the red clump luminosity[J].The Astrophysical Journal,2000,539(2):732.
[6]GROENEWEGEN M A T.The red clump absolute magnitude based on revised Hipparcos parallaxes[J].Astronomy amp; Astrophysics,2008,488(3):935-941.
[7]LOˊPEZ-CORREDOIRA M,CABRERA-LAVERS A,GARZOˊN F,et al.Old stellar Galactic disc in near-plane regions according to 2MASS:scales,cut-off,flare and warp[J].Astronomy amp; Astrophysics,2002,394(3):883-899.
[8]HON M,STELLO D,YU J.Deep learning classification in asteroseismology[J].Monthly Notices of the Royal Astronomical Society,2017,469(4):4578-4583.
[9]BORUCKI W J,KOCH D,BASRI G,et al.Kepler planet-detection mission:introduction and first results[J].Science,2010,327(5968):977-980.
[10]HON M,STELLO D,YU J.Deep learning classification in asteroseismology using an improved neural network:results on 15 000 Kepler red giants and applications to K2 and TESS data[J].Monthly Notices of the Royal Astronomical Society,2018,476(3):3233-3244.
[11]HE X J,LUO A L,CHEN Y Q.Identification,mass,and age of primary red clump stars from spectral features derived with the LAMOST DR7[J].Monthly Notices of the Royal Astronomical Society,2022,512(2):1710-1721.
[12]ZHAO G,ZHAO Y H,CHU Y Q,et al.LAMOST spectral survey:an overview[J].Research in Astronomy and Astrophysics,2012,12(7):723.
[13]李啟達,李清,羅楊平.基于 LAMOST 數據與機器學習方法測定大樣本恒星年齡[J].西華師范大學學報(自然科學版),2023,44(2):195-200.
[14]LEUNG H W,BOVY J.Deep learning of multi-element abundances from high-resolution spectroscopic data[J].Monthly Notices of the Royal Astronomical Society,2019,483(3):3255-3277.
[15]PINSONNEAULT M H,ELSWORTH Y P,TAYAR J,et al.The second APOKASC catalog:the empirical approach[J].The Astrophysical Journal Supplement Series,2018,239(2):32.
[16]SHETRONE M,TAYAR J,JOHNSON J A,et al.Constraining metallicity-dependent mixing and extra mixing using [C/N] in alpha-rich field giants[J].The Astrophysical Journal,2019,872(2):137.
[17]MAJEWSKI S R,SCHIAVON R P,FRINCHABOY P M,et al.The Apache Point Observatory Galactic Evolution Experiment (APOGEE)[J].The Astronomical Journal,2017,154(3):94.
[18]PINSONNEAULT M H,ELSWORTH Y,EPSTEIN C,et al.The APOKASC catalog:an asteroseismic and spectroscopic joint survey of targets in the Kepler fields[J].The Astrophysical Journal Supplement Series,2014,215(2):19.
[19]BLANTON M R,BERSHADY M A,ABOLFATHI B,et al.Sloan digital sky survey IV:mapping the Milky Way,nearby galaxies,and the distant universe[J].The Astronomical Journal,2017,154(1):28.
[20]SKRUTSKIE M F,CUTRI R M,STIENING R,et al.The two Micron All Sky Survey (2MASS)[J].The Astronomical Journal,2006,131(2):1163.
[21]BREIMAN L.Random forests[J].Machine Learning,2001,45:5-32.
[22]HE K,ZHANG X,REN S,et al.Deep residual learning for image recognition[C]//Proceedings of the IEEE conference on computer vision and pattern recognition.2016:770-778.
[23]CHEN X N,LIANG C,HUANG D,et al.Symbolic discovery of optimization algorithms[Z/OL].(2023-5-8)[2024-10-7]https://arxiv.org/pdf/2302.06675.
[24]WANG H F,LO′PEZ-CORREDOIRA M,CARLIN J L,et al.3D Asymmetrical motions of the Galactic outer disc with LAMOST K giant stars[J].Monthly Notices of the Royal Astronomical Society,2018,477(3):2858-2866.
[25]WANG H F,LIU C,XU Y,et al.Mapping the Milky Way with LAMOST-III.Complicated spatial structure in the outer disc[J].Monthly Notices of the Royal Astronomical Society,2018,478(3):3367-3379.
[26]WANG H F,CARLIN J L,HUANG Y,et al.Mapping the Galactic disk with the LAMOST and Gaia red clump sample.III.A new velocity substructure and time stamps of the Galactic disk asymmetry in the disk between 12 and 15 kpc[J].The Astrophysical Journal,2019,884(2):135.
[27]WANG H F,LO′PEZ-CORREDOIRA M,HUANG Y,et al.Mapping the Galactic disc with the LAMOST and Gaia Red Clump sample:II.3D asymmetrical kinematics of mono-age populations in the disc between 6-14 kpc[J].Monthly Notices of the Royal Astronomical Society,2020,491(2):2104-2118.
[28]WANG H F,LO′PEZ-CORREDOIRA M,HUANG Y,et al.Mapping the Galactic disk with the LAMOST and Gaia red clump sample.VI.Evidence for the long-lived nonsteady warp of nongravitational scenarios[J].The Astrophysical Journal,2020,897(2):119.
[29]WANG H F,HUANG Y,ZHANG H W,et al.Diagonal ridge pattern of different age populations found in Gaia-DR2 with LAMOST main-sequence turnoff and OB-type stars[J].The Astrophysical Journal,2020,902(1):70.
[30]WANG H F,HAMMER F,YANG Y B,et al.The dark matter tidal stripping history of the Sagittarius core with N-body simulations[J].The Astrophysical Journal Letters,2022,940(1):L3.
[31]WANG H F,CHROB A′ KOV A′" ,L O′PEZ-CORREDOIRA M,et al.Mapping the Milky Way disk with GAIA DR3:3D extended kinematic maps and rotation curve to≈ 30 kpc[J].The Astrophysical Journal,2022,942(1):12.
[32]WANG H F,YANG Y B,HAMMER F,et al.Reconstructing the whole 6D properties of the Sagittarius stream with N-body simulation[Z/OL].(2023-12-20)[2024-10-7].https://arxiv.org/pdf/2204.08542.
[33]李祥,楊鵬,羅楊平.基于LAMOST和Gaia DR3探測銀河系盤翹曲的進動[J].西華師范大學學報(自然科學版),2024,45(1):87-92.
[34]楊鵬,李祥,羅志全,等.利用LAMOST紅團簇星探索銀河系外盤屋脊結構分布[J].西華師范大學學報(自然科學版),2023,44(6):647-654.