科大的研究人员开发了一种机器学习模型,杏耀QQ它可以分析碳氢化合物分子的结构,并准确预测一种称为生成焓的性质。在估计这一特性时,该模型已经比传统方法做出了更好的预测,而且它的准确性只会随着收集到更多的数据供模型学习而提高。
“分子性质的数据,例如生成焓,对于工程师模拟化学反应的动力学机制或能量流是必不可少的,”领导这项研究的Mani Sarathy研究小组的博士生Kiran Yalamanchi说。“碳氢燃料的动力学机制对于发动机设计和化学反应器的开发和优化非常重要,”Yalamanchi说。
生成动力学机制建模所需的大量热力学数据通常使用一种称为群加和的方法,这种方法的精度有限。Yalamanchi说:“群体可加性是在20世纪中期发展起来的,数据科学领域在过去几十年里也取得了很大进步。”
因此,Yalamanchi和Sarathy找到了KAUST的计算机科学家Xin Gao,希望将机器学习应用到这个问题上。“我们最初的研究给出了非常有希望的结果,”Yalamanchi说。“这种潜力帮助我们推动了产生热力学数据的收敛机器学习。”
机器学习提供了一种获取生成焓数据的方法——通过实验测量,或者用精确但缓慢的量子化学计算来计算少量分子的生成焓——然后再推断更广泛的分子。
机器学习程序分析了分子结构的“训练”数据集及其形成焓。然后,它使用检测到的模式来预测之前从未见过的分子的生成焓。
机器学习被证明比传统的组加性方法更准确。Yalamanchi说:“与传统方法相比,我们使用机器学习方法对化学物质的形成焓有了更好的估计。”
例如,尽管传统的基团加和性可以对具有线性结构的简单分子做出相对较好的预测,但其准确性会随着更复杂的分子(如那些结构中含有碳环的分子)而降低。Yalamanchi补充说:“与传统的组加和性相比,我们在生成焓估计数上看到的改进在循环物种中更为显著。”
“研究结果表明,机器学习将成为该领域越来越重要的工具,杏耀联系”Sarathy说。他补充说:“从分子描述符准确预测重要热力学性质的能力,是开发预测更复杂化学现象的全自动算法的重要一步。”
该团队现在正在进行高精度的量子化学计算,以扩展机器学习模型的训练数据集。Sarathy说:“通过这种方式,我们正在开发一种混合第一流原理人工智能框架,以便更准确地预测许多物理化学性质。”