记者19日从中国科学技术大学获悉,该校李微雪教授结合物理启发的可解释机器学习算法与第一性原理计算,解决了一个多相催化研究中长期存在的关于催化结构敏感性难题。研究成果近日发表于《美国化学会》期刊。
催化反应活性位及其结构敏感性是多相催化研究中最为重要的基本概念之一。尽管近年来研究取得了很大进展,但由于影响因素众多并横跨多个空间和时间尺度,如何在原子尺度上确定催化反应的活性位及其结构敏感性,依然是催化材料理性设计中所面临的一大挑战。
机器学习方法在多相催化研究中发挥着日益重要的作用,并被应用到催化剂的结构敏感性研究中。但迄今为止大多数研究都属于端到端的“黑盒子”研究,研究结果缺乏很好的物理可解释性。物理上具有清晰的可解释性,明确包含催化剂的几何结构和化学组分,并能准确预测催化反应能垒的解析关系,目前仍然亟待建立。另外,由于催化反应能垒的计算主要通过高精度、高成本的密度泛函理论来完成,系统的理论数据也较为匮乏。因此,经常需要参考不同的数据源,数据源的多样性所带来的挑战也需要采取合适的机器学习算法。
针对上述问题,研究人员基于物理启发的可解释多任务学习符号回归和包含多样性的第一性原理计算数据集,在领域知识和化学直觉的基础上,建立了一个简洁、物理图像清晰的描述符。该描述符由催化剂的结构项和催化反应的能量项两部分组成,可用于准确预测各种分子在不同组分和结构金属催化剂上的活化能垒。其中,新建立的结构项由催化剂的拓扑配位不饱和度、价电子和晶格常数三个变量组成,借此成功破解了金属催化剂的结构敏感性问题,并突显了数据驱动理论模型的透明度,即“白盒子”研究在构建催化物理模型方面的重要性。
(中国科大供图)