机器学习为巡天项目提供分类预测

  近日,中国科学院国家天文台张彦霞研究员、赵永恒研究员和北京大学吴学兵教授合作,通过机器学习方法构建了适合不同波段样本的最优分类器,为X射线牛顿天文望远镜第九次发布数据(DR9)提供了分类预测和概率。相关成果发表于《皇家天文学会月刊》。

  20世纪以来,随着各类地基和空间大型天文观测设备的研制和运行,天文观测覆盖了从射电、红外、可见光、紫外至X射线和γ射线的全电磁波段,天文学步入全波段—大样本—海量信息的大数据时代。

  1999年,欧洲航天局(ESA)发射的X射线牛顿天文望远镜(XMM-Newton)具有极高的光谱分辨能力,其目的是对宇宙天体进行高质量的X射线观测,为研究黑洞、中子星和脉冲星、星系团、活动星系核等高能现象的X射线发射源提供极具价值的数据资源。2019年12月,该项目对外发布了第九次高质量数据集(DR9),该批数据的观测日期从2000年2月至2019年2月,观测的独立源数量达到55万。

  张彦霞等人首先利用中国郭守敬望远镜(LAMOST)和美国斯隆数字巡天(SDSS)的光谱数据,获得已知天体的分类信息,而后结合XMM-Newton项目的X射线数据、广域红外巡天探测器(WISE)数据及SDSS可见光测光数据,通过交叉证认方法获取了具有不同波段信息的多个已知样本。

  这里的交叉证认在多波段天文学研究中起着至关重要的作用,是多波段天文数据融合的关键技术和方法。张彦霞解释道,“通过对某一天体的多波段证认,可以获得该天体的不同波段信息,进而可以揭露更多的物理本质,加深对天体的认识,促进新的天文发现。”

  她告诉《中国科学报》:“该样本仅占X射线牛顿天文望远镜第九次发布总观测数据的5.78%,这就意味着X射线牛顿天文望远镜DR9数据集的绝大多数X射线观测数据仍为未知天体。”

  为此,张彦霞等人先通过数据融合提取了已知样本分别在不同波段的特征信息,接着利用机器学习方法针对不同波段的已知样本分别构建了不同的分类器,从中挑选出最优分类器对X射线牛顿天文望远镜DR9数据中的未知源给出了分类预测和概率。

  据了解,该成果是天文信息技术在国际多个大型多波段巡天项目融合数据中的应用典范,为进一步开展X射线源的细致分析和研究工作具有重要的研究价值。

  相关论文信息:https://doi.org/10.1093/mnras/stab744

本文由程序自动从互联网上获取,其版权均归原作者所有,文章内容系原作者个人观点,不代表本站对观点赞同或支持。如有侵权,请联系删除。