机器学习工具对量子数据的细微差别进行排序
康奈尔大学和哈佛大学研究人员组成的跨学科团队开发了一种机器学习工具来解析量子物质并在数据中做出重要区分,这种方法将帮助科学家解开亚原子领域中最令人困惑的现象。
康奈尔大学领导的项目论文“Correlator Convolutional Neural Networks as an Interpretable Architecture for Image-like Quantum Matter Data”于 6 月 23 日发表在Nature Communications 上。主要作者是博士生 Cole Miles。
康奈尔大学的团队由恩啊金,在艺术和科学学院物理学教授,谁与克里安温伯格,计算副教授,合作信息科学计算与信息科学和导演的康奈尔安S.鲍尔斯学院TRIPODS 数据科学中心改进决策。
与由物理学教授 Markus Greiner 领导的哈佛团队的合作是国家科学基金会 10 大创意计划“利用数据革命”的一部分。他们的项目“协作研究:使用机器学习工具理解亚原子尺度量子物质数据”旨在通过将数据科学家与专门从事传统物理、化学和工程领域的研究人员配对来解决科学和工程前沿的基本问题。
该项目的中心目标是找到从类似图像的数据快照中提取有关量子系统的新信息的方法。为此,他们正在开发机器学习工具,可以识别数据中微观属性之间的关系,否则无法在该规模下确定。
卷积神经网络是一种通常用于分析视觉图像的机器学习,它使用过滤器扫描图像以查找数据中的特征,而不管它们出现在哪里——这一步骤称为“卷积”。然后通过非线性函数发送卷积,使卷积神经网络学习特征之间的各种相关性。
现在,康奈尔小组通过创建一种称为相关卷积神经网络 (CCNN) 的“可解释架构”改进了该方法,使研究人员能够跟踪哪些特定的相关性最重要。
“卷积神经网络用途广泛,”Kim 说。“然而,来自非线性的多功能性使得很难弄清楚神经网络如何使用特定的过滤器来做出决定,因为非线性函数很难跟踪。这就是为什么天气预报很困难。这是一个非常非线性的系统。 ”
为了测试 CCNN,哈佛团队使用量子气体显微镜来模拟费米子哈伯德模型——通常用于演示量子粒子如何在晶格中相互作用,以及由此引发的许多未解决的问题。
“量子力学是概率论,但你不能从一次测量中学习概率,你必须重复多次测量,”金说。“从薛定谔的猫的角度来看,我们有一个完整的原子集合,一个活的或死的猫的集合。每次我们进行投影测量时,我们都会有一些死猫和一些活猫。我们正试图以此为基础了解系统处于什么状态,并且系统正在尝试模拟基本模型,这些模型是理解诸如高温超导等神秘现象的关键。”
哈佛团队为两种难以区分的状态生成了合成数据:几何弦理论和 pi-flux 理论。在几何弦理论中,该系统接近于反铁磁秩序,其中电子自旋形成一种反排列——即向上、向下、向上、向下、向上、向下——当电子空穴开始移动时,这种排列会被破坏在不同的时间尺度。在 pi-flux 理论中,自旋形成对,称为单线态,当引入一个洞时,它们开始翻转和翻转,导致混乱状态。
CCNN 能够通过识别数据与四阶的相关性来区分这两种模拟。
通过重复这个练习,CCNN 基本上了解了图像中的哪些事件对神经网络做出决定至关重要——Kim 将这个过程与人们登上救生艇所做的选择进行了比较。
“你知道当一艘大船即将沉没时,人们会被告知,好吧,你只能带一件私人物品,”金说。“这将显示他们内心的想法。它可能是结婚戒指,也可能是垃圾桶。你永远不知道。我们正在迫使神经网络选择一两个最能帮助它提出问题的特征。正确的评估。通过这样做,我们可以弄清楚定义状态或阶段的关键方面是什么,核心本质是什么。”
该方法可应用于生成量子材料图像类型数据的其他扫描探针显微镜,以及可编程量子模拟器。根据 Kim 的说法,下一步是结合一种无监督机器学习形式,它可以提供更客观的视角,这种视角受研究人员挑选要比较的样本的决定的影响较小。
Kim 认为像她的学生和主要作者 Cole Miles 这样的研究人员代表了下一代,他们将进一步融合这些前沿和传统方法以推动新的科学发现。
“更保守的人对新鲜事物持怀疑态度,”金说。“但我认为经典与新事物和闪亮之间的平衡和协同可以带来重要而令人兴奋的进步。我认为我们的论文就是一个例子。”
标签: 机器学习