楊舟凡 楊堯文 蔣雙如



摘 ?要:矮星系是一類特殊的星系,其對于研究早期宇宙以及恒星系的形成和演化過程十分重要。但是目前人類所能觀察到的矮星系有限,如何從巡天項目獲取的海量圖像中識別出矮星系是研究的熱點問題。文章意在通過人工智能的方法將矮星系與非矮星系圖像進行分類,解決矮星系識別問題,提出卷積神經網絡和一類支持向量機兩種方法。經過實驗,一類支持向量機分類的準確率更高。
關鍵詞:天文圖像;卷積神經網絡;一類支持向量機
中圖分類號:TP301.6 ? ? 文獻標識碼:A 文章編號:2096-4706(2020)15-0101-03
Abstract:Dwarf galaxies are one special kind of galaxies,which are very important for the study of the formation and evolution of the early universe and star systems. However,the number of dwarf galaxies that can be observed is limited. How to identify dwarf galaxies from the massive images obtained by the sky survey project is a hot issue. The purpose of this paper is to classify dwarf galaxy and non dwarf galaxy image by artificial intelligence method,and solve the problem of dwarf galaxy recognition. Two methods of convolution neural network and One-class SVM are proposed. After the experiment,One-class SVM classification accuracy is higher.
Keywords:astronomical image;convolution neural network;One-class SVM
0 ?引 ?言
星系是由恒星系與星際塵埃組成的運行系統,矮星系是星系的一種,它是光度最弱的一類星系。由于矮星系的特殊性質,其對于研究早期銀河系的形成和演化過程有很大幫助[1]。但是目前人類觀察到的矮星系十分有限,如何從觀測到的測光數據中將矮星系區分出來是亟待解決的問題。
隨著天文望遠鏡的發展,人類所能觀測到的天文數據越來越龐大,傳統的數據分析方式已經不再適用。與天文學相關的人工智能領域應運而生,人工智能的興起為天文數據的分析提供了十分有利的條件。機器學習等方式可以快速、高效地對數據進行處理與訓練,算法和模型可以大大節省人力、物力和財力,能夠得到相對準確的分析結果。
R.E.González[2]等提出使用卷積神經網絡和數據增強進行星系的檢測和識別。石超君[3]等提出使用卷積神經網絡對恒星光譜進行分類,并將此算法與SVM和BP算法分類結果進行比較,其中卷積神經網絡分類的準確率更高。李鄉儒[4]等提出使用最近鄰方法研究正常星系與類星系光譜的識別問題。閆龍、胡曉鵬[5]提出使用上下文特征和單類支持向量機進行人臉活體檢測。
數據增強、支持向量機、神經網絡算法在天文圖像的分類中均有應用,且效果較好,但目前對于矮星系的分類問題研究較少。本文基于2019年國家級大學生創新創業訓練計劃項目“基于人工智能算法的天文光譜分類”的研究成果,使用數據增強、卷積神經網絡、一類支持向量機算法對矮星系圖像的自動分類問題進行研究,主要研究如何區分恒星圖像與矮星系圖像。
1 ?算法介紹
1.1 ?卷積神經網絡
卷積神經網絡廣泛運用于模式識別、圖像處理領域。其優點為結構簡單、訓練參數少、適應性強。卷積神經網絡在輸入是多維圖像的情況下優點更為明顯,它使圖像可以直接作為網絡的輸入,無需數據重建過程。
通用結構包括:輸入層、卷積層、池化層、全連接層和輸出層。
本文使用的卷積神經網絡的結構如圖1所示。
輸入層為訓練集,在預處理后大小為64×64。C1層有32個大小為3×3,步長為3的卷積核,激活函數為ReLU,各卷積核提取不同特征,加偏置后經過激活函數得到卷積層C1,生成32張大小為62×62的特征圖,卷積計算公式為:
其中,n為神經網絡層數,w為卷積核,j為特征圖,b為偏置值,f為激活函數,Nj為輸入特征圖集合,此模型使用的激活函數ReLU函數的表達式為:
S1層為池化層,本文采用最大池化的方法,窗口大小為2×2,S1層生成特征圖數量與C1層相同,大小為31×31。C2層有64個大小為3×3,步長為3的卷積核,激活函數為ReLU,輸出64張大小為29×29的特征圖。S2層下采樣得到64張大小為14×14的特征圖。C3層有128個大小為3×3,步長為3的卷積核,激活函數為ReLU,輸出128張大小為12×12的特征圖。S3層下采樣得到128張大小為6×6的特征圖,為防止過擬合使用dropout層隨機拿掉50%的神經元。全連接層神經元個數設置為512,每個神經元與S3層dropout后的所有神經元連接。輸出層神經元個數設置為2,激活函數采用Sigmoid函數,函數表達式為:
1.2 ?一類支持向量機
一類支持向量機屬于支持向量機,但是與傳統分類回歸支持向量機不同,它屬于無監督學習方法。此方法可用于奇異點或者異常點檢測和樣本數量分布不均勻時的分類問題。本文使用的矮星系與非矮星系數據量不平衡,適用此方法。
僅使用一類信息進行訓練,希望得到球形邊界,并最小化超球體的體積,最終采用超球體進行劃分。其本質為一個優化問題,可表示如下:
2 ?數據介紹
本文使用的數據來自于Sloan數字巡天[6]。Sloan數字巡天開始于2000年,共包括四期,每一期又包含不同的巡天子項目。目前正在進行的是四期巡天SDSS Ⅳ,項目時間是2014—2020年。整個巡天期間Sloan獲取了超過10億個天體的測光數據和超過400萬條天體的光譜數據,極大擴展了人類對銀河系以及宇宙的認知。
實驗使用數據來自于SDSS DR8,實驗數據包含11條矮星系數據和439條恒星數據。由于暗的矮星系與恒星在圖像上難以區分,因此本文的主要任務是使用機器學習算法區分恒星和矮星系。該研究將有助于在未來的大型巡天望遠鏡,如LSST中更快速準確地搜尋矮星系。
3 ?實驗過程與結果
3.1 ?卷積神經網絡實驗過程及結果
本文采用TensorFlow 2.0框架,軟件編程環境為Python 3.7,選用G波段數據進行研究。由于數據源以FITS格式保存在文件中,通過Astropy包解析出數據,得到多個ndarray類型的矩陣。
由于數據大小不一,但是大多數都在64×64以下,所以通過填充0將矩陣統一到64×64的大小。觀察到矩陣每個元素的值都在1 000左右,通過乘以1/1 000將每個元素的值控制在[-1,1]區間內。
對訓練集數據進行數據增強,使用隨機裁剪(random crop),隨機左右翻轉(random flip left right),轉動90°的整數倍(ROT90)。增強后訓練集的數據量為1 600條。
為將多個矩陣連續導入到訓練集中,將數據轉化為TFRecord格式,即進行編碼,把數據轉化為字節,存儲在TFRecord文件中,使用時再對TFRecord文件進行解析。優點為高效、節省內存。
實驗采用準確率A(Accuracy)指標評價模型性能。準確率的公式可表示為:
其中,TP(True Positive)為樣本真實類別為正,預測類別為正;TN(True Negative)為真實類別為正,預測類別為負,TP+TN為正確分類的樣本的個數,P+N為所有樣本的個數。A為正確分類的樣本占所有樣本的比例。得到分類的A值為93.30%。
3.2 ?一類支持向量機實驗過程及結果
選用439條G波段恒星數據作為訓練集,測試集包含44條G波段恒星數據,11條G波段矮星系數據。將數據讀取后均裁剪為64×64大小,再展為一維數組。
訓練誤差設定為0.1,核函數使用Linear Kernel。訓練后進行測試得到結果。使用精確率P(Precision)、召回率R(Recall)、準確率A(Accuracy)、F1分數F1(F1-score)進行評估。
其中,FP(False Positive)為真實類別為負,預測類別為正;FN(False Negative)為樣本真實類別為負,預測類別為負。
此方法得到的A值為96.36%,同時計算出矮星系的P、R和F1,結果如表1所示。
4 ?結 ?論
本文為解決矮星系圖像分類的問題,基于數據本身的特點使用了卷積神經網絡和一類支持向量機兩種方法。在使用卷積神經網絡前對訓練集數據進行了數據增強,以增加樣本數量,提升模型的魯棒性。通過實驗發現,一類支持向量機方法分類的準確率更高。
參考文獻:
[1] MATEO M. Dwarf Galaxies of the Local Group [J].Annual Review of Astronomy and Astrophysics,1998,36(1):435-506.
[2] GONZ?LEZ R E,MU?OZ R P,HERN?NDEZ C A. Galaxy detection and identification using deep learning and data augmentation [J].Astronomy and Computing,2018(25):103-109.
[3] 石超君,邱波,周亞同,等.基于卷積神經網絡的恒星光譜自動分類方法 [J].光譜學與光譜分析,2019,39(4):1312-1316.
[4] 李鄉儒,盧瑜,周建明,等.基于最近鄰方法的類星體與正常星系光譜分類 [J].光譜學與光譜分析,2011,31(9):2582-2585.
[5] 閆龍,胡曉鵬.基于上下文特征與單類支持向量機的人臉活體檢測 [J].電子技術應用,2020,46(6):32-35.
[6] YORK D G,ADELMAN J,ANDERSON J E,et al. The Sloan Digital Sky Survey:Technical Summary [J].The Astronomical Journal,2007,120(3):1579.
作者簡介:楊舟凡(1999.09—),女,漢族,安徽合肥人,本科在讀,研究方向:統計學、大數據分析;楊堯文(1999.12—),男,漢族,四川德陽人,本科在讀,研究方向:統計學、大數據分析;蔣雙如(1999.11—),女,漢族,山東濰坊人,本科在讀,研究方向:統計學、大數據分析。