制造机器的机器学习将视觉搜索应用于机械零件
2022年1月5日整理发布:普渡大学的机械工程师创建了一个包含58,000多个机械零件的开源数据集,专为机器学习应用程序而设计。计算机视觉研究人员使用机器学习来训练计算机视觉识别物体——但很少有人将机器学习应用于齿轮箱、轴承、制动器、离合器、电机、螺母、螺栓和垫圈等机械部件。
普渡大学机械工程师团队创建了第一个综合性开源注释数据库,其中包含58,000多个3D机械零件,旨在帮助研究人员将机器学习应用于实际机器中的这些零件。
“我们正处于深度学习时代,使用计算机以视觉方式搜索事物,”普渡大学唐纳德·W·费德森机械工程杰出教授KarthikRamani说。“但没有人关注进入机器的零件:管道、轴承、电机、垫圈、螺母和螺栓等。这些对我们作为工程师和制造商来说很重要。我们希望能够将相机对准真实世界的零件,并让计算机告诉我们有关该零件或设计的所有信息。”
Ramani的团队在2000年代初期尝试了对零件的视觉搜索,但计算能力和机器学习技术还不够先进。从那以后的几年里,研究人员已经了解到,构建可靠的数据集关乎质量和数量。
“深度学习需要数据,”Ramani说。“计算机需要大量示例才能了解人类的意思以及事物之间的关系。这意味着我们需要大量零件的3D模型,这也需要基础工程分类。”
该团队首先与一家名为TraceParts的法国公司合作,该公司让普渡大学的研究人员能够访问他们的3D工程部件数据库。该团队与德克萨斯大学奥斯汀分校助理教授QixingHuang合作,在其他数据库中搜索类似的3D模型。他们最终编译了一个包含58,696个机械部件的数据库。
但是,没有好的数据,数据库也无济于事。Ramani的团队根据国际标准分类(由国际标准化组织创建和维护的技术标准系统)建立了68个等级的分层分类法来组织零件。
“现在,当计算机看到密封组件的图片时,它就会知道它属于动态密封类别,更具体地说,属于复合密封类别,”拉马尼说。
研究人员现在已经发布了他们的开源数据库,邀请计算机视觉和机器学习研究人员访问它并创建他们自己的实验。他们在8月的第16届欧洲计算机视觉会议上展示了他们的工作。
有了现在建立的基准数据集,机器学习制造机器的未来是什么?
“我们看到了这项技术的许多现实情况,”拉马尼说。“想象一下,您在工厂进行维护工作,并且正在更换机器的一部分。您可以将摄像头对准零件,计算机会识别它,并立即为您提供该零件的所有规格——它的名称、连接到什么以及它们在工厂中的物理存储位置。这甚至可以通过增强现实眼镜实现;您可以立即触手可及公司的整个视觉目录,并学习如何修理东西或订购零件。
“机器学习面临很多挑战。但是除非您知道如何测试自己的表现,否则您无法应对挑战。我们很自豪能够创建世界上第一个带注释的3D机械组件的大规模基准数据集,我们希望在深度学习时代推进视觉搜索。”
这项研究正在普渡大学的融合设计实验室进行。这项工作得到了国家科学基金会FW-HTF1839971、OIA1937036和CRI1729486的部分支持。
标签: