火星科技网您的位置:首页 >人工智能 >

节能芯片可以执行强大的人工智能任务

导读 近年来,人工智能中一些最令人兴奋的进展来自卷积神经网络,简单信息处理单元的大型虚拟网络,这些网络松散地模拟了人脑的解剖结构。神经网

近年来,人工智能中一些最令人兴奋的进展来自卷积神经网络,简单信息处理单元的大型虚拟网络,这些网络松散地模拟了人脑的解剖结构。神经网络通常使用图形处理单元(GPU)来实现,GPU是在所有带屏幕的计算设备中都可以找到的专用图形芯片。在手机中可以找到的这种类型的移动GPU可能具有近200个内核或处理单元,使其非常适合模拟分布式处理器的网络。

在2016年旧金山举行的国际固态电路会议上,麻省理工学院的研究人员展示了一种专门设计用于实现神经网络的新型芯片。它的效率是移动GPU的10倍,因此它可以使移动设备在本地运行强大的人工智能算法,而不必将数据上传到Internet进行处理。

麻省理工学院的研究人员设计了一种新的芯片来实现神经网络。 它的效率是移动GPU的10倍,因此它可以使移动设备在本地运行强大的人工智能算法,而不必将数据上传到Internet进行处理。 图片来源:麻省理工学院新闻

麻省理工学院的研究人员设计了一种新的芯片来实现神经网络。它的效率是移动GPU的10倍,因此它可以使移动设备在本地运行强大的人工智能算法,而不必将数据上传到Internet进行处理。图片来源:麻省理工学院新闻

在人工智能研究的早期,人们对神经网络进行了广泛的研究,但是到了1970年代,神经网络已经不受欢迎了。但是,在过去的十年中,他们以“深度学习”为名经历了复兴。

麻省理工学院电气工程学助理教授Vivienne Sze说:“深度学习对许多应用都是有用的,例如对象识别,语音,面部检测。” “目前,网络非常复杂,并且大多在大功率GPU上运行。您可以想象,如果您可以将该功能带到手机或嵌入式设备中,即使没有Wi-Fi连接,您仍然可以运行。出于隐私原因,您可能还希望在本地进行处理。在手机上进行处理还避免了任何传输延迟,因此您可以对某些应用做出更快的反应。”

研究人员将其称为“ Eyeriss”的新芯片还可以帮助引入“物联网”,即车辆,电器,土木工程结构,制造设备甚至牲畜都将具有直接向其报告信息的传感器的想法。网络服务器,有助于维护和任务协调。借助强大的人工智能算法,联网设备可以在本地做出重要决策,仅将其结论(而不是原始个人数据)委托给Internet。而且,当然,车载神经网络对于电池供电的自动机器人很有用。

分工

神经网络通常被组织成多个层,并且每个层包含大量的处理节点。数据进入并在底层的节点之间分配。每个节点操纵它接收的数据并将结果传递给下一层中的节点,节点操纵它们接收的数据并传递结果,依此类推。最后一层的输出产生了一些计算问题的解决方案。

在卷积神经网络中,每一层中的许多节点以不同的方式处理相同的数据。网络因此可以膨胀到很大的比例。尽管它们在许多视觉处理任务上的性能优于常规算法,但它们需要更多的计算资源。

神经网络中每个节点执行的特定操作是训练过程的结果,在该过程中,网络尝试查找原始数据与人工注释者对其施加的标签之间的相关性。使用麻省理工学院研究人员开发的芯片,可以将训练有素的网络简单地导出到移动设备。

此应用程序对研究人员施加了设计约束。一方面,降低芯片功耗并提高效率的方法是使每个处理单元尽可能简单。另一方面,该芯片必须足够灵活,以实现针对不同任务量身定制的不同类型的网络。

Sze和她的同事-Chen Yu-Hsin Chen,电气工程和计算机科学专业的研究生,并且是会议论文的第一作者;乔尔·埃默尔(Joel Emer),麻省理工学院电气工程与计算机科学系的实践教授,芯片制造商NVidia的资深杰出研究科学家,与Sze一起,是该项目的两名主要研究人员之一;Tushar Krishna在工作完成时是新加坡-麻省理工学院研究与技术联盟的博士后,现在是佐治亚理工学院的计算机与电气工程学助理教授,他选择了一个带有168核的芯片,大约与移动GPU拥有的。

本地行动

Eyeriss效率的关键在于最大程度地减少内核与远程存储体交换数据的频率,这种操作会消耗大量的时间和精力。GPU中的许多内核共享一个大的内存库,而每个Eyeriss内核都有自己的内存。此外,该芯片还具有在将数据发送到各个内核之前对其进行压缩的电路。

每个内核还能够直接与其直接邻居进行通信,因此,如果它们需要共享数据,则不必通过主内存路由。这在卷积神经网络中至关重要,在卷积神经网络中,许多节点都在处理相同的数据。

芯片效率的最后关键是专用电路,该电路可以跨内核分配任务。在其本地内存中,内核不仅需要存储其正在模拟的节点所操纵的数据,还需要存储描述节点本身的数据。分配电路可以针对不同类型的网络进行重新配置,从而自动地在内核之间分配两种类型的数据,从而最大程度地利用它们在从主存储器中获取更多数据之前所做的工作量。

在会议上,麻省理工学院的研究人员使用Eyeriss实现了执行图像识别任务的神经网络,这是首次在定制芯片上演示了最新的神经网络。

三星微等离子体离子实验室高级副总裁Mike Polley表示:“这项工作非常重要,展示了用于深度学习的嵌入式处理器如何提供功能和性能优化,将这些复杂的计算从云带入移动设备。” “除了硬件方面的考虑之外,麻省理工学院的论文还仔细考虑了如何通过支持行业标准[网络体系结构] AlexNet和Caffe使嵌入式内核对应用程序开发人员有用。”

标签:

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如有侵权行为,请第一时间联系我们修改或删除,多谢。