智源杯天文数据算法挑战赛开赛,前沿AI技术助力天文科学研究
- 时间:
- 浏览:0
由北京智源人工智能研究所主办、国家天文台和数据评估平台Biendata联合举办的天体分类数据竞赛将于2020年1月开始。本次竞赛的目的是通过使用最新的人工智能算法分析望远镜收集的真实科学数据,让公众参与天文学的探索。天文学是一门古老的学科,人类从来没有停止过仰望星星和探索宇宙。随着观测技术的不断发展,天文学已经进入了大数据时代,天文数据正以PB到EB的速度增长。大量的数据为天文学研究带来了机遇和挑战。在天文学中,光谱描述了物体辐射的性质,并表示为不同波长辐射强度的分布。天体观测光谱主要由黑体辐射产生的连续光谱、天体中元素原子级跃迁产生的特征谱线(吸收线和发射线)和噪声组成。天文学家可以根据光谱的特征线和物理参数来确定天体的类型。LAMOST望远镜,又称郭守敬望远镜(大天域多目标光纤光谱望远镜),是中国天文学家发明的一种新型光学望远镜,具有大视野、大口径。它在视野和口径方面都处于世界领先地位,在焦平面上有4000根光纤,可以同时获得4000个物体的光谱。LAMOST望远镜每晚可以收集超过10,000个光谱,是世界上光谱采集率最高的望远镜。LAMOST是大规模光学光谱观测和大视场天文学研究的全球领导者。在LAMOST发布的调查数据中,光谱主要分为四类:恒星,星系,类星体和未知物体。 LAMOST数据集中的每个光谱提供了一系列辐射强度值,波长范围为3690-9100埃(1埃=0.1纳米)光谱自动分类是指从数千维的光谱数据中选择和提取最有效的特征进行分类,例如选择特定波长或频带的光谱流量值作为特征,并应用算法对物体进行区分。传统的人工或半人工的模板匹配方法不能很好地适应,需要一种高效、准确的天体光谱识别分类算法。在本次比赛中,中国科学院国家天文台提供了来自LAMOSTDR4数据集的近100万个天体的光谱数据,由国家天文科学数据中心基于科学发布版本创建,并将其制作成机器学习数据集。在LAMOST巡天光谱分类的主题下,参加者将利用高效、高精度的自动算法,将未知天体分为恒星(star)、星系(galaxy)和类星体(QSO)三大类,目的是利用最新的人工智能技术解决天文学研究中的实际问题。国家天文科学数据中心副主任、中国国家天文台中国虚拟天文台团队负责人崔新洲博士表示,天文大数据继续扩大人类对宇宙知识的界限。天文数据作为科学数据的代表,具有高度标准化、数量丰富、复杂性,是机器学习、数据挖掘等算法训练的优秀样本。我们希望这次竞赛能发掘出更多的跨学科人才,不仅能推动人工智能产业的进步,还能在天文学领域产生更好的科研成果。比赛时间:2020年1月15日至3月15日比赛奖金:10万元(含税)