【文章推荐】福州大学萨百晟/北京航空航天大学孙志梅教授团队–可解释机器学习用于预测III–VI族范德华异质结的稳定性和电子结构
文章引用:
Shi Y, Zhang Y, Wen J, et al.Interpretable machine learning for stability and electronic structure prediction of Janus III–VI van der Waals heterostructures. MGE Advances. 2024;e76.
https://doi.org/10.1002/mgea.76
文章摘要
机器学习技术在材料科学领域中的应用已经取得了显著进展。然而,传统机器学习模型大多像“黑盒”一样,难以揭示材料特性与目标属性之间的物理关系。为了克服这一问题,开发可解释机器学习模型至关重要,将有助于推动人工智能在材料领域的进一步应用。在本研究中,结合机器学习和符号回归方法开发了一个可解释性机器学习框架,以III–VI族范德华异质结为例开展研究,该框架能够快速且准确地预测III–VI族范德华异质结的稳定性和电子结构。结果表明,基于形成能的稳定性分类模型的预测准确率可达0.960;同时,基于带隙预测电子结构的回归模型的性能也非常出色,其R²、MAE和RMSE值分别达到了0.927、0.113和0.141。此外,还提出了一个仅由五个简单参数组成的带隙可解释性描述符,揭示了III–VI族范德华异质结的组成结构和带隙之间的潜在物理联系。
文章简介
化学式为M2X2(其中M = Al, Ga, In, X = S, Se, Te)的单层III–VI族材料由于其新颖的电子结构和光学性质,包括高载流子迁移率和强光致发光,受到了越来越多研究人员的关注。通过堆叠不同的单层III–VI族材料,可以搭建种类丰富的III–VI族范德华异质结。本研究基于III–VI族范德华异质结高通量计算数据库(Chem. Mater. 2022, 34, 6687–6701),通过耦合机器学习和符号回归方法,开发了一个可解释性机器学习框架,将机器学习的“黑盒”模型转变为透明的“玻璃盒”模型。在高效预测III–VI族范德华异质结稳定性和电子结构的基础上,提出了一个仅由五个简单参数组成的带隙可解释性描述符,为成分、结构和电子结构之间的潜在物理关系提供了显式理解。
图1. 基于ALKEMIE平台(https://alkemie.cloud/)的III–VI族范德华异质结性质可解释机器学习研究工作流。
图2. (a)III–VI族范德华异质结的晶体结构。(b)不同特征之间的Pearson相关性热图,采用|R| = 0.85作为特征分组的阈值剔除冗余特征。
图3. 稳定性分类模型在测试集上的性能评价。(a)不同稳定性分类模型在测试集上的受试者工作特征(ROC)曲线。(b)XGBC模型的混淆矩阵,展示了测试集上真阳性(TP)、真阴性(TN)、假阳性(FP)和假阴性(FN)的数量。测试集由207个样品组成,其中稳定样品160个,不稳定样品47个。
图4. (a)SVR、(b)AdaBR、(c)LR、(d)XGBR、(e)RFR和(f)GBR带隙预测模型在测试集中的真实值与预测值对比,数据点颜色表示真实值与预测值之间的偏差。GBR模型在测试集上表现出了最好的性能,RMSE为0.114,MAE为0.113,R²为0.927。
图5.(a)XGBR、(b)RFR和(c)GBR带隙预测模型的SHAP特征的重要性分析,结合全局特征重要度与局部特征重要度对模型预测结果进行综合解释。
图6. 测试集上复杂度为(a)2、(b)3、(c)4、(d)5、(e)6、(f)7的SISSO可解释性模型的真实值与预测值对比,数据点颜色表示真实值与预测值之间的偏差值。
作者介绍
通讯作者
萨百晟,福州大学材料科学与工程学院教授,博士生导师。2014年获厦门大学博士学位,同年进入福州大学材料科学与工程学院工作。入选福建省杰青、福州大学“旗山学者”。共在Phys. Rev. Lett.、Adv. Mater.、Adv. Funct. Mater.、npj Comput. Mater.、Laser Photonics Rev.等国际知名学术期刊上发表SCI论文200余篇,被引6500余次,H因子43。长期从事基于密度泛函理论计算和机器学习的材料集成计算研究。
黄筱淳,2018年获中国科学院物理研究所理学博士学位。自2018年以来,先后在德国亚琛工业大学,汉堡大学、荷兰拉德堡德大学以及德国维尔茨堡大学(当前)进行博士后研究。目前主要研究方向是新型低维量子材料与器件。共在Science、Phys. Rev. X、Phys. Rev. Lett.、Adv. Mater.、Adv. Funct. Mater.、Nano Lett.、Phys. Rev. B等刊物公开发表高水平学术论文23篇,其中第一/通讯作者(含共同)论文10篇,Web of Science他引累计5277次。H因子14。
孙志梅,北京航空航天大学材料科学与工程学院教授,博士生导师。获得全国三八红旗手、教育部长江学者、国家杰青、国家万人计划领军人才、国家百千万人才工程并授予“有突出贡献的中青年专家”、国务院特殊津贴等多项荣誉。在Phys .Rev. Lett.、Proc. Natl. Acad. Sci.、J. Am. Chem. Soc.、Nano Lett.等国际知名学术期刊上发表SCI论文300余篇,连续4年(2020–2023)入选材料领域爱思唯尔中国高被引学者。出版专著《先进材料的计算与设计》。授权13项国家发明专利,16项软件著作权。主要研究领域为材料基因工程高通量算法、材料数据库、材料人工智能方法,相变存储材料等。
第一作者
史玉栋,福州大学材料学院材料工程专业硕士研究生,研究方向为可解释机器学习在光电材料中的应用。
《材料基因工程前沿(英文)》简介
《材料基因工程前沿(英文)》(Materials Genome Engineering Advances,简称:MGE Advances)作为材料基因工程领域首个高水平综合性学术期刊,其宗旨是面向国家重点战略布局与材料学科国际学术前沿发展的重大需求,聚焦材料基因工程领域,刊载先进材料计算、高通量/自动化/智能化材料实验技术、材料数据库与大数据技术等材料基因工程关键技术的研究进展和前沿成果,以及三者在材料新效应/新原理探索和新材料发现等方面的重要应用,创建一个跨学科多领域交叉融合的国际一流高水平出版平台和学术交流平台,推动新材料研发模式变革。
2022年入选“中国科技期刊卓越行动计划高起点新刊项目”。
2024年入选北京市科委“2024支持高水平国际科技期刊建设-强刊提升”项目。
2024年被世界五大文献检索系统之一的开放获取期刊目录DOAJ收录。
《材料基因工程前沿(英文)》以全OA开放获取模式,在国际出版平台Wiley Online library全文数字化上线出版。期刊采用国际先进的单篇优先出版模式,实现了最新学术成果的及时快速优先发表并高效广泛地传播给全球读者,提升了期刊的可见度和传播效率。
2026年之前投稿免APC (Article Publication Charge)
期刊主页
特刊征稿
投稿方向
投稿指南
Materials Genome Engineering Advances编辑部
地址: 北京海淀区学院路30号
邮箱: mgeadvances@ustb.edu.cn
电话: (+86) 010-6233 3882
期刊网址:
https://onlinelibrary.wiley.com/journal/29409497