训练神经网络来研究暗物质
随着宇宙学家和天体物理学家深入研究宇宙中最黑暗的凹陷,他们对越来越强大的观测和计算工具的需求呈指数增长。从暗能光谱仪器等设施到劳伦斯伯克利国家实验室的国家能源研究科学计算(NERSC)设施的Cori系统等超级计算机,他们正在寻求收集,模拟和分析可以帮助解释的越来越多的数据我们看不到的东西的本质,以及我们能看到的东西。
为此,引力透镜技术是科学家通过提供探测宇宙几何和宇宙结构生长的能力来提取这些信息的最有前途的工具之一。根据Deborah Bard的说法,引力透镜以某种方向视线中物质的数量决定了遥远星系的图像,并提供了一种观察暗物质二维图的方法。伯克利实验室国家能源研究科学计算中心(NERSC)数据科学参与小组的组长。
“引力透镜是我们研究暗物质的最佳方法之一,这很重要,因为它告诉了我们很多关于宇宙结构的信息,”她说。“宇宙中的大部分物质都是暗物质,我们无法直接看到,因此我们必须使用间接方法来研究它是如何分布的。”
但随着实验和理论数据集的增长,以及对这些数据进行成像和分析所需的模拟,出现了一个新的挑战:这些模拟越来越多 - 甚至过于昂贵 - 计算成本也很高。因此,计算宇宙学家经常采用计算上更便宜的替代模型,这模拟了昂贵的模拟。然而,最近,“基于神经网络的深度生成模型的进步开启了为许多类型的模拟器(包括宇宙学中的模拟器)构建更强大且更少手工设计的替代模型的可能性,”机器学习工程师Mustafa Mustafa说。 NERSC和一位新研究的主要作者,该研究描述了由伯克利实验室,谷歌研究院和夸祖鲁 - 纳塔尔大学合作开发的一种方法。
正在研究各种深度生成模型用于科学应用,但伯克利实验室领导的团队正在采取一种独特的策略:生成对抗网络(GAN)。在2019年5月6日发表在计算天体物理学和宇宙学的论文中,他们讨论了他们新的深度学习网络,称为CosmoGAN,以及它创建高保真,弱引力透镜会聚图的能力。
“收敛图实际上是我们在沿着视线的天空中看到的引力透镜的2D地图,”Bard说,他是计算天体物理学和宇宙学论文的共同作者。“如果你在会聚图中有一个峰值,它对应于沿着视线的大量物质的峰值,那意味着在那个方向上存在大量的暗物质。”
GAN的优势
为什么选择GAN而不是其他类型的生成模型?据Mustafa说,性能和精度。
“从深度学习的角度来看,还有其他方法可以学习如何从图像生成收敛图,但是当我们开始这个项目时,与竞争方法相比,GAN似乎产生了非常高分辨率的图像,同时仍然在计算和神经网络中有效,“ 他说。
“我们正在寻找两件事:准确和快速,”共同作者,伯克利实验室计算宇宙学中心的研究科学家Zaria Lukic补充说。“与完整的物理模拟相比,GAN提供了几乎同样准确的希望。”
研究团队特别感兴趣的是构建一个可以降低运行这些模拟的计算成本的替代模型。在计算天体物理学和宇宙学论文中,他们概述了GAN在大型物理模拟研究中的许多优点。
“GAN在训练期间非常不稳定,特别是当你到达训练结束时,图像开始看起来很好 - 那时网络的更新真的很混乱,”Mustafa说。“但是因为我们有宇宙学中使用的汇总统计数据,我们能够在训练的每一步评估GAN,这有助于我们确定我们认为最好的发电机。这个程序通常不用于训练GAN。 “
使用CosmoGAN生成器网络,该团队已经能够生成收敛图,其具有高统计可信度 - 与完全模拟的地图相同的汇总统计数据。会聚图之间的这种非常高水平的一致性在统计上与基于物理的生成模型产生的图无法区分,这为从深度神经网络构建仿真器迈出了重要的一步。
“这里的巨大优势在于,我们正在处理的问题是一个与相关指标有关的物理问题,”巴德说。“但是通过我们的方法,有一些实际的指标可以让你量化你的GAN的准确程度。对我来说,真正令人兴奋的是 - 这些物理问题如何影响机器学习方法。
最终,这些方法可以改变目前依赖于需要数十亿计算小时并占用数PB磁盘空间的详细物理模拟的科学 - 但仍有大量工作要做。宇宙学数据(以及一般的科学数据)可能需要非常高分辨率的测量,例如全天空望远镜图像。
“为这个项目考虑的2D图像是有价值的,但实际的物理模拟是3D,可以是时变的?不规则的,产生丰富的,类似网络的特征结构,”Wahid Bhmiji说,他是一位大数据架构师。 NERSC的数据和分析服务小组,以及计算天体物理学和宇宙学论文的共同作者。“此外,需要扩展该方法以探索新的虚拟宇宙而不是已经模拟过的宇宙 - 最终建立一个可控制的CosmoGAN。”
“做可控GAN的想法本质上是我们正在研究的整个问题的圣杯:能够真正模拟我们需要建立基于可控GAN的替代模型的物理模拟器,”Mustafa补充说。“现在我们正在努力了解如何稳定训练动力,考虑到过去几年在该领域取得的所有进展。稳定训练对于实际能够做我们想做的事情非常重要“。
标签: 训练神经网络