研究有助于建立人类如何估算速度的预测模型
对心理机制的大多数研究都涉及观察这些机制的作用,然后为它们的工作原理设计理论。宾夕法尼亚大学和德克萨斯大学奥斯汀分校的心理学家已经颠倒了这一过程。他们更像物理学家一样工作,他们分析了估计物体移动速度的所有步骤,这些过程包括:从物体反射回来的光线,穿过眼睛的晶状体,撞击视网膜并通过视神经将信息传递到大脑,等等。建立一个最佳模型。
这种以尽可能最佳的方式使用所有可用信息的模型被称为“理想观察者”。然后,他们在速度估算实验中针对人们的表现测试了这个理想的观察者模型。
人们在此任务上与最佳模型差不多,这意味着可以非常精确地理解和预测与速度估计相关的神经机制。它还建议工程师可以通过模仿生物系统,类似地优化需要估算移动物体(例如自动驾驶汽车上的摄像头)速度的技术应用。
视觉处理这一方面的大多数先前研究仅使用人工图像。通过使用小块自然图像,研究人员的模型可以更广泛地应用于在现实世界中自然条件下如何完成速度估算。
这项研究是由宾夕法尼亚大学艺术与科学学院心理学系的助理教授Johannes Burge,以及UT-Austin感知系统中心的教授兼主任威尔逊·盖斯勒(Wilson Geisler)进行的。
它发表在《自然通讯》上。
布尔格说:“关于视觉系统在估计运动时的功能已有很多描述,但对于如何应做的预测却不多。” “我们以最佳情况为起点来了解视觉系统的实际功能。如果我们在理想的观察者模型的性能和人类的性能之间取得了紧密的匹配,那么我们就有证据表明人类正在以最佳的方式使用视觉信息。”
Burge和Geisler着手建模的视觉系统的方面是其估计运动对象图像速度的能力。
由于这种能力对于生存至关重要,因此有理由相信,对于视觉系统而言,选择进化压力是可以做出非常准确的估计的。
Burge和Geisler首先通过对处理运动图像所涉及的各个步骤进行建模,例如眼睛晶状体的光学系统,视网膜如何将刺激转换为神经冲动以及早期的视觉皮层如何对其进行解释。
主要的挑战是确定刺激中的哪些特征对于后一项任务确实至关重要。不同的感觉神经元具有不同的感受野,这些感受野决定了导致神经元发出信号的刺激特征。例如,一个神经元在感知到从右向左移动而不是从左向右移动的明亮图像块时可能会触发。另一个神经元可能具有相反的排列,仅响应具有从左到右移动的亮斑的图像而触发。
布尔格说:“我们确定了最能支持精确运动估计的这些不同类型的感受野中的一小部分。” “我们认为,这些感受野构成了视觉系统想要最大程度地提高运动估计精度时应该拥有的感受野。”
通过将接收场与光子如何到达这些接收场的众所周知的物理模型相结合,研究人员能够预测一个人如何估计自然图像中的运动速度。。这与该主题的先前研究形成了鲜明对比,之前的研究对运动中的抽象图像上的模型进行了测试,例如黑条在白色背景上漂移。尽管在这些情况下是准确的,但是当将这些模型应用于自然图像时,它们就会开始失效。
为了使他们的理想观察者尽可能真实和可概括,Burge和Geisler在很小的自然场景上对它进行了训练,这类似于通过吸管从移动的车窗向外看时所看到的场景。视网膜上图像的速度取决于到场景中物体的距离。与较远物体相关的图像移动得更慢。与附近物体相关的图像移动更快。如何结合图像速度的局部估计以获得对自身运动和物体运动的准确估计是未来研究的一个大问题。
布尔格说:“有了良好的本地估计,将可以更好地将它们集成到准确的全球速度估计中。”
为了将人类行为与其模型进行比较,研究人员让实验参与者查看了成千上万对移动的自然图像斑块。该对中的每部电影的移动速度都略有不同。参加者将指出该对中哪部电影的放映速度更快。
当两种速度几乎相同且两种速度完全不同时,参与者的反应与理想观察者模型的预测非常吻合。
布尔格说:“在感知心理学实验中看到如此干净的数据是不寻常的。” “理想观察者模型的性能与人类的性能之间的紧密匹配表明,我们真正了解了导致人类速度估计性能的计算。我们可以将这种理解应用于改进技术。”
除了在生物和机器视觉系统的未来研究中的应用之外,研究人员还认为,这种理论驱动的心理学研究方法代表了一种更好的理解大脑的方法。
布尔格说:“这项工作是综合的,没有很多研究。” “模拟光线如何照射在视网膜上,模拟光线如何被神经元捕获,选择相关特征并测量实验中的行为-这些步骤中的每个步骤都需要一套不同的技能和专门知识。每个都可以组成一个独立的项目。我们将它们放在一起,以增强我们对视觉系统工作原理的理解。”
标签: 人类如何估算速度