用于机器学习和实验信息共享的无损数据管理平台
在材料科学领域,即使是实验参数和协议的微小变化也可能导致材料特性发生不必要的变化。随着材料信息学的出现,该领域取得了突破性的发展——这是一个高度依赖数据的领域,专注于材料数据,包括合成协议、特性、机制和结构。它从人工智能(AI)中受益匪浅,人工智能能够进行大规模的自动化数据分析、材料设计和实验,有助于发现有用的材料。
不幸的是,科学界内部来回共享数据通常会导致数据丢失。这是因为大多数材料数据库和研究论文主要关注结构-性质关系,而不是重要信息,如基本实验协议。
为了解决这些问题,早稻田大学的助理教授KanHatakeyama-Sato和KenichiOyaizu教授领导的一组研究人员开发了一个实验室数据管理平台,该平台描述了电子实验室笔记本中的特性、结构和实验过程之间的关系。在这个电子实验室笔记本中,实验事件和相关的环境参数被表示为知识图谱。
他们的研究于2022年8月17日发表在npjComputationalMaterials上,该研究依赖于实验信息可以无损失地描述为知识图谱的概念。该团队结合了一种基于人工智能的算法,可以自动将这些知识图谱转换为表格,并将其上传到公共存储库中。合并此步骤是为了确保数据共享是无损的,并使科学界能够更好地了解实验条件。
为了证明该平台的适用性,该团队使用它来探索有机锂(Li+)离子电解质中的超离子电导率。他们将来自500多个实验的日常原始数据(包括成功和不成功的实验)记录到电子实验室笔记本中。接下来,数据转换模块自动将知识图谱数据转换为机器可学习的数据集,并分析实验操作与结果之间的关系。该分析揭示了实现10-4–10-3S/cm的优异室温离子电导率和高达0.8的Li+迁移数所需的重要参数。
那么,这个平台的实时应用有哪些呢?Hatakeyama-Sato说:“该平台目前适用于固态电池,性能的提高将有助于开发更安全、高容量的电池。”
这项研究不仅为可靠的面向数据的研究提供了一个平台,而且确保了所有信息,包括实验结果和原始测量数据,都对所有人公开可用。
在讨论其长期影响时,Hatakeyama-Sato说:“通过在全球研究人员之间共享原始实验数据,可以更快地发现新型功能材料。这种方法还可以加速能源相关设备的开发,包括下一代电池和太阳能电池。”
标签: