突破性的光学传感器模仿人眼迈向更好的人工智能的关键一步
俄勒冈州立大学的研究人员正在通过一种新型光学传感器取得重大进展,该传感器更接近地模仿人眼感知视野变化的能力。该传感器是图像识别、机器人和人工智能等领域的重大突破。俄勒冈州立大学工程学院研究员JohnLabram和研究生CinthyaTrujilloHerrera的研究结果发表在AppliedPhysicsLetters上。
电气工程和计算机科学助理教授拉布拉姆说,以前尝试构建一种称为视网膜传感器的人眼类型的设备,依赖于软件或复杂的硬件。但新传感器的操作是其基本设计的一部分,使用钙钛矿半导体的超薄层——近年来对其太阳能潜力进行了广泛研究——当放置在光线下时,它们从强电绝缘体变为强导体。
“你可以把它想象成一个单像素做一些目前需要微处理器的事情,”拉布拉姆说,他在国家科学基金会的支持下领导了这项研究工作。
Labram说,新传感器可能与神经形态计算机完美匹配,后者将为自动驾驶汽车、机器人技术和高级图像识别等应用中的下一代人工智能提供动力。与将信息作为一系列指令顺序处理的传统计算机不同,神经形态计算机旨在模拟人脑的大规模并行网络。
“人们试图在硬件中复制这一点,并取得了相当成功,”拉布拉姆说。“然而,尽管旨在处理信息的算法和架构越来越像人脑,但这些系统接收的信息仍然是为传统计算机设计的。”
换句话说:为了充分发挥其潜力,一台更像人脑“思考”的计算机需要一个更像人眼“看”的图像传感器。
眼睛是一个极其复杂的器官,包含大约1亿个光感受器。然而,视神经与大脑只有100万个连接。这意味着在传输图像之前,必须在视网膜中进行大量的预处理和动态压缩。
事实证明,我们的视觉特别适合检测移动物体,而对静态图像相对“不太感兴趣”,拉布拉姆说。因此,我们的光学电路优先处理来自光感受器检测光强度变化的信号——您可以通过盯着一个固定点直到周边视觉中的物体开始消失来证明这一点,这种现象被称为Troxler效应。
Labram说,传统的传感技术,如数码相机和智能手机中的芯片,更适合顺序处理。图像以设定的频率在二维传感器阵列上逐个像素地扫描。每个传感器产生一个幅度直接随它接收到的光强度而变化的信号,这意味着静态图像将导致传感器或多或少的恒定输出电压。
相比之下,视网膜传感器在静态条件下保持相对安静。当它感应到光照变化时,它会记录一个短而尖锐的信号,然后迅速恢复到其基线状态。这种行为归因于一类被称为钙钛矿的半导体的独特光电特性,该类半导体已显示出作为下一代低成本太阳能电池材料的巨大希望。
在Labram的视网膜形传感器中,钙钛矿应用于超薄层,只有几百纳米厚,本质上作为电容器,在光照下改变其电容。电容器在电场中储存能量。
“我们测试它的方式基本上是,我们把它放在黑暗中一秒钟,然后我们打开灯,然后让它们开着,”他说。“一旦灯亮起,你就会得到这么大的电压尖峰,然后电压会迅速衰减,即使光的强度是恒定的。而这正是我们想要的。”
尽管Labram的实验室目前一次只能测试一个传感器,但他的团队测量了许多设备并开发了一个数值模型来复制它们的行为,从而达到Labram认为理论与实验之间的“良好匹配”。
这使该团队能够模拟一系列视网膜形态传感器,以预测视网膜形态摄像机如何响应输入刺激。
“我们可以将视频转换为一组光强度,然后将其放入我们的模拟中,”Labram说。“从传感器预测到较高电压输出的区域会亮起,而较低电压区域则保持黑暗。如果相机相对静止,你可以清楚地看到所有正在移动的东西反应强烈。这对于哺乳动物的光学传感范式来说是相当真实的。”
使用棒球练习镜头的模拟演示了预期结果:内场的球员显示为清晰可见的明亮移动物体。相对静止的物体——棒球场、看台,甚至外野手——逐渐消失在黑暗中。
一个更引人注目的模拟显示一只鸟飞入视野,然后几乎消失,因为它停在一个看不见的喂鸟器上。这只鸟在起飞时重新出现。摇摆的喂食器只有在它开始移动时才变得可见。
“好消息是,通过这种模拟,我们可以将任何视频输入这些阵列之一,并以与人眼基本相同的方式处理该信息,”拉布拉姆说。“例如,您可以想象机器人使用这些传感器来跟踪物体的运动。其视野中的任何静态物体都不会引起响应,但是,移动物体会记录到高电压。这将立即告诉机器人物体在哪里,无需任何复杂的图像处理。”
标签: