标题:基于集成树的M型星光谱分类
作者:王晶;衣振萍;岳丽丽;董慧芬;潘景昌;卜育德
作者机构:[]山东大学(威海)机电与信息工程学院,山东威海264209,中国.;[]山东大学(威海)数学与统计学院,山东威海264209,中国
通讯作者:Yi, ZP;Yi, ZhenPing
通讯作者地址:[Yi, ZP]Shandong Univ, Sch Mech Elect & Informat Engn, Weihai 264209, Weihai, Peoples R China.
来源:光谱学与光谱分析
出版年:2019
卷:39
期:7
页码:2288-2292
DOI:10.3964/j.issn.1000-0593(2019)07-2288-05
关键词:M巨星;集成树;[6233023]光谱分类;[2553632]特征提取;
摘要:在赫罗图中,M巨星位于红巨星的顶端,是由类太阳的主序星逐渐演化而成的最明亮的一类恒星。M巨星的研究对于理解银河系,特别是银河系晕的性质至关重要。中低分辨率的M巨星光谱,常因为特征不显著、噪声影响等因素而与M矮星的光谱混在一起,不易区分。现有研究一般利用CaH2+CaH3vs.TiO5分子谱指数初步筛选M巨星光谱候选体,再通过人眼检查确认。但这种方法仅利用了三个巨星相关的分子带指数,没有利用识别M巨星的其他光谱特征,可能会由于噪声对指数的污染而导致分类错误。而且,人眼检查数量众多的光谱不仅耗时而且检查质量依赖于人的经验,可靠性无法得到保证。LAMOST望远镜自2011年开始先导巡天到2017年6月,已经发布了900多万天体的光谱,最新释放的光谱数据DR5包含了52万的M型星光谱数据,需要采用自动、准确、有效的方法来区分其中不同光度级的M子样本。本研究利用集成树模型分类M巨星和M矮星光谱,分别采用随机森林、GBDT、XGBoost和LightGBM算法,构建区分M巨星和M矮星的光度分类器。四种分类器的测试准确率分别达到97.23%,98%,98.05%和98.32%。实验表明LightGBM模型比其他三种集成树模型准确率更高,训练时间更少,分类效率更高。对分类器模型获取到的重要特征分析的结果表明,集成树算法有效提取并表达了用于区分M巨星和M矮星的结构性特征,模型提取到的重要特征不仅包括原子线或分子带吸收的波长位置,还包含了它们相邻的伪连续谱,这与传统上计算指数所需要特征波长和伪连续谱是一致的。相比于传统M巨星和M矮星分类方法,集成树模型能够采用光谱中的多个重要特征组合进行分类,避免仅依赖某一种特征易受噪声影响而得出错误的分类结果。研究结果表明集成树算法在巨星识别过程中具有显著优势,完全可以替代传统上只利用CaH和TiO指数�
收录类别:EI;CSCD;SCOPUS;SCIE
资源类型:期刊论文
原文链接:https://www.scopus.com/inward/record.uri?eid=2-s2.0-85072155491&doi=10.3964%2fj.issn.1000-0593%282019%2907-2288-05&partnerID=40&md5=8dca2e54c2397f2bfbbc34f09cd1ec45
TOP