8月29日,在2024中国国际大数据产业博览会上,中国科学院地球化学研究所与阿里云联合发布国际首个“月球科学多模态专业大模型”(以下简称月球专业大模型)。该大模型以视觉、多模态及自然语言等通义系列模型为基模,结合RAG检索增强等技术,于阿里云百炼专属版进行微调及训练,目前最佳落地场景为月球撞击坑识别。
撞击坑的大小、深浅、形状等特征是研究月球地质演化的重要依据。据统计,目前月球上直径一公里以上的月球撞击坑数量已超100万个,直径一公里以下的撞击坑数量还无法确定。如果完全依赖人工,识别所有月球撞击坑几乎无法实现。
大模型的应用将极大提升这项工作的效率。中国科学院地球化学研究所研究员刘建忠介绍,在月球撞击坑年代和形态识别上,月球专业大模型的准确率已达到80%以上。
科研工作者只需输入月球撞击坑图像和相关问题,大模型即可调用通义视觉、多模态模型,从光谱、高程、重力等17种多模态数据中判定该图像对应的模态类型;通过检索知识库、调用通义语言模型,月球专业大模型可回答该撞击坑的形态、大小、年代等相关问题,并给出推理过程。“通过对海量数据的准确把握,大模型不仅可以对撞击坑进行分类,还可以解决一些目前仍未解决的科学问题。”刘建忠说。
中国科学院院士、中国月球探测工程首任首席科学家欧阳自远表示,随着人类深空探测活动的快速推进,探测数据呈井喷式增长。科学大数据已经成为推动科技创新的强大引擎。目前在数据管理方面,我国已经取得先发优势。在数据应用方面,我国必须充分发挥现有的人工智能技术优势。基于阿里云通义模型构建的月球专业大模型将大大加速海量数据的处理,帮助科研工作者挖掘新的科学发现。
据了解,接下来,月球专业大模型将嵌入“数字月球云平台”,推动“月球云平台”智慧化升级。“数字月球云平台”由中国科学院地球化学研究所牵头建设完成,是国际上月球探测数据最全,集科学研究、工程应用以及科普教育为一体的云平台,其将与FAST等大科学装置一同成为科研基础设施的重要组成部分,助力我国月球与行星科研创新。