徐志平课题组通过物理增强机器学习方法解析二维大分子构象复杂度

大分子由基本结构单元构成骨架,在焓与熵的竞争作用下形成丰富构象特征,近年来石墨烯等二维大分子的制备与理解取得突破,二维晶体是后硅时代微纳电子器件的首选材料之一,其组装而成的纤维、薄膜在航天航空、能源环境领域有重要应用。二维大分子构象与其物性密切相关,然而显微技术难以表征其层内结构畸变,经典曲面理论缺乏层间相互作用与接触拓扑结构的合理描述,目前关于二维大分子构象的讨论局限于形貌特征。

图1:二维大分子形貌及其典型褶皱结构的变形能量投射图

清华大学航天航空学院徐志平教授课题组采用分子模拟技术,获得了石墨烯等二维材料的构象数据。研究发现了其形貌中“脊”结构处(Gauss曲率为零的弯曲变形以及脊交汇处“顶点”结构中(Gauss曲率非零的弯曲与层内结构畸变(图1;另一方面,二维材料层间存在范德华力(van der Waals和静电力作用,其行为由材料的表面化学和溶剂性质决定,定义了特征的接触结构。

在基于弹性理论和热力学的描述中,二维大分子的自由能中包括了层内形变能、层间接触能和熵的贡献,层内变形与面外弯曲在Gauss曲率非零时耦合作用,其竞争与平衡决定了构象的平衡态与相变行为。受此启发,该项研究在表征二维大分子构象时考虑了形变的物理过程和接触的拓扑结构,以期获得更为合理的特征描述。

20220428-二维大分子构象复杂度-徐志平-二维大分子构象分类与识别中引入形貌、形变物理和接触拓扑有效提升算法效果png

图2:二维大分子构象分类与识别中引入形貌、形变物理和接触拓扑有效提升算法效果

论文工作在基于K-means聚类算法的非监督学习中定义了回转半径、溶剂可及表面积、局域化接触因子等几何、拓扑参量以及基于变形、接触能量的主特征量,将二维大分子的形貌划分为准平面、折痕、褶皱三种特征类型和中间相;其结果被输出至监督学习算法,用于识别二维大分子的构象特征。研究发现,在引入晶格畸变的物理特征和层间接触的拓扑结构后,学习的效果得到显著提升(图2。结合分子模拟得到的各构象自由能信息,研究结果可以解析、预测其热力学稳定性和结构相变行为。

二维大分子的凝聚态构象特征与物性密切相关,其内部孔道结构的连通性决定了能量存储、物质输运等过程的性能与效率,晶格畸变对二维材料的光电子学特性有着显著影响,被应用于“应变工程”,而层间的接触与相互作用是调控二维大分子纤维、薄膜等聚集体中载荷传递与热、电学输运等特性的关键因素。本研究为解析二维大分子材料中的复杂结构与性能关联特性提供了新的视角与特征度量方法。

此外,研究中建立的机器学习理论框架可以应用到其他复杂构象行为的问题,例如细胞因病变发生的构象转变、大脑皮层褶皱与其功能关联机制等。在形貌特征描述的基础上引入变形、接触等隐含特征为解决此类问题提供了新的思路与工具。

该成果4月22日以“解析二维大分子的构象复杂性”(Unraveling the Morphological Complexity of Two-Dimensional Macromolecules为题发表在《细胞》出版社(Cell Press的《模式》Patterns期刊。

论文通讯作者为清华大学航天航空学院徐志平教授,共同第一作者为航院2021级博士生赵英杰、2016级博士生王识君和2017级本科生覃建树,工作得到了国家自然科学基金的资助。

论文链接:

https://doi.org/10.1016/j.patter.2022.100497