999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于表示學習的高維光譜離群數據挖掘

2021-09-14 23:47:23李林睿常舒予喬一鳴
電腦知識與技術 2021年22期
關鍵詞:數據挖掘分類

李林睿 常舒予 喬一鳴

摘要:LAMOST(郭守敬望遠鏡)提供了大量的天文光譜數據,而天體分類是天文學中得到廣泛關注的問題,由于天體數量大,數據維度高,如何使用機器學習的方法對光譜進行處理,成為近些年的熱點。針對天體分類問題,提出了HSODM(High-dimensional Spectral with Outlier Data Mining),這是一種改進的高維離群數據識別方法,其采用無監督學習方式,基于隨機距離將大量高維光譜數據中的極少數未知天體或離群數據識別出來,便于后續天體分類、離群數據挖掘等相關處理。項目中運用數據預處理、主成分分析降維、長短期記憶神經網絡模型建立與訓練、參數調優、結果預測與分析,最終通過評估方法和數據可視化等手段對模型進行評價與展示。研究中提出的改進方法和優化的神經網絡可以縮短訓練時間,提高模型預測準確度。經過實驗發現,改進方法對ROC (receiver operating characteristic) 曲線面積、P-R曲線面積、F1分數和G-mean分數都有相應的提高。

關鍵詞: 表示學習;高維光譜;離群點檢測;數據挖掘; 分類

Abstract: LAMOST (Large Sky Area Multi-Object Fiber Spectroscopy Telescope) Telescope provides a large amount of astronomical spectral data, and astronomical classification is a problem that has received widespread attention in astronomy. Due to the large number of celestial bodies and the high dimensionality of data, how to use machine learning methods to process spectra has become a problem in recent years. Hot spot. Aiming at the problem of celestial body classification, HSODM (High-dimensional Spectral with Outlier Data Mining) is proposed, which is an improved method for identifying high-dimensional outlier data. It uses an unsupervised learning method and combines a large number of high-dimensional spectral data based on random distance. A very small number of unknown celestial bodies or outlier data can be identified to facilitate subsequent celestial body classification, outlier data mining and other related processing. In the project, data preprocessing, principal component analysis and dimensionality reduction, long and short-term memory neural network model establishment and training, parameter tuning, result prediction and analysis are used in the project, and the model is finally evaluated and displayed by means of evaluation methods and data visualization. The improved method and optimized neural network proposed in the research can shorten the training time and improve the accuracy of model prediction. After experimentation, it is found that the improved method has corresponding improvement on ROC curve area, P-R curve area, F1 score and G-mean score.

Key words: representation learning; high-dimensional spectral; outlier detection; data mining; classification

天文學隨著科學技術的發展,先進的觀測設備使我們能夠望向宇宙更深處,同時也帶來了天文數據爆炸式的增長[1]。郭守敬望遠鏡(LAMOST)作為世界上光譜獲取率最高的望遠鏡,LAMOST每個觀測夜晚能采集萬余條光譜,這將為一些天文和天體物理學家在星系紅移巡天、宇宙學模型、宇宙大尺度結構、星系形成和演化以及結合各類射線的光譜觀測等研究工作[2]上提供大量素材,對天文學領域的發展起到推動和完善作用。LAMOST數據集中的每一條光譜提供了3690-9100埃的波長范圍內的一系列輻射強度值。光譜分類就是要從上千維的光譜數據中選擇和提取對分類識別最有效的特征來構建特征空間,例如選擇特定波長或波段上的光譜流量值等作為特征,并運用算法對各種天體進行區分 。

猜你喜歡
數據挖掘分類
分類算一算
垃圾分類的困惑你有嗎
大眾健康(2021年6期)2021-06-08 19:30:06
探討人工智能與數據挖掘發展趨勢
分類討論求坐標
數據分析中的分類討論
教你一招:數的分類
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
數據挖掘技術在中醫診療數據分析中的應用
一種基于Hadoop的大數據挖掘云服務及應用
給塑料分分類吧
主站蜘蛛池模板: 欧美国产在线精品17p| 亚洲国产系列| 麻豆国产原创视频在线播放| a级高清毛片| 亚洲无码精品在线播放| 亚洲天堂成人在线观看| 99这里只有精品在线| 国产精品女人呻吟在线观看| 日本国产精品一区久久久| 四虎精品国产AV二区| 亚洲综合精品香蕉久久网| 丁香六月综合网| 亚洲午夜福利在线| 国产精选自拍| 午夜激情婷婷| 欧美日韩成人在线观看| 国产亚洲精品97在线观看| 成人午夜在线播放| 国产三级毛片| 亚洲天堂网在线播放| 婷婷亚洲天堂| 亚洲综合色婷婷| 亚洲系列无码专区偷窥无码| 日韩国产综合精选| 成年免费在线观看| 国产亚洲视频在线观看| 亚洲无线一二三四区男男| 亚洲综合香蕉| 99er精品视频| 狠狠亚洲婷婷综合色香| 亚洲不卡网| 美女视频黄又黄又免费高清| 99久久免费精品特色大片| 国产欧美日韩18| 免费观看欧美性一级| 精品福利网| 欧美a级在线| 男女性色大片免费网站| 亚洲精品少妇熟女| 91精品国产自产在线老师啪l| www.91在线播放| 中文成人在线| 性视频久久| 视频国产精品丝袜第一页| 亚洲天堂日韩av电影| 中文字幕无码中文字幕有码在线 | 精品视频第一页| 这里只有精品免费视频| 五月婷婷综合在线视频| 亚洲男人的天堂在线| 欧美一区二区丝袜高跟鞋| 国产精品欧美激情| 福利小视频在线播放| 久久久久无码国产精品不卡| 夜夜操天天摸| 国产青榴视频| 国内精品视频区在线2021| 欧美特黄一级大黄录像| 婷婷五月在线视频| 色有码无码视频| 久久久受www免费人成| 日本午夜精品一本在线观看| 欧洲日本亚洲中文字幕| 日本人又色又爽的视频| 国产精品黄色片| 99热6这里只有精品| 国产SUV精品一区二区6| 亚洲乱亚洲乱妇24p| 3D动漫精品啪啪一区二区下载| 欧美国产另类| 色婷婷在线播放| 国内嫩模私拍精品视频| 波多野结衣在线一区二区| 国产成人免费| 国产无码在线调教| 久久91精品牛牛| 一级毛片免费高清视频| 色一情一乱一伦一区二区三区小说| 亚洲成a人片| 国产99在线| 国产免费精彩视频| 亚洲午夜片|