用于识别面部表情的改进AI模型
当涉及到我们的心态和情绪时,我们的脸可以很能说明问题。面部表情是人类非语言交流的重要方面。即使我们无法解释我们是如何做到的,我们通常可以从另一个人的脸上看到他们的感受。在许多情况下,阅读面部表情尤为重要。例如,老师可能会检查他们的学生是否投入或无聊,护士可能会检查患者的病情是否有所改善或恶化。
由于技术的进步,计算机在识别人脸方面可以做得很好。然而,识别面部表情则完全不同。许多在人工智能(AI)领域工作的研究人员试图使用各种建模和分类技术来解决这个问题,包括流行的卷积神经网络(CNN)。然而,面部表情识别很复杂,需要复杂的神经网络,这需要大量的训练并且计算成本很高。
为了解决这些问题,吉林工程师范大学田嘉博士领导的一个研究小组最近开发了一种新的CNN面部表情识别模型。正如发表在《电子成像杂志》上的一篇文章中所述,该团队专注于在模型的训练速度、内存使用和识别准确性之间取得良好的平衡。
传统CNN模型与团队提出的模型之间的主要区别之一是使用了深度可分离卷积。这种类型的卷积(在CNN的每一层执行的核心操作)与标准卷积的不同之处在于它独立处理输入图像的不同通道(例如RGB)并在最后组合结果。
通过将这种类型的卷积与一种称为“预激活残差块”的技术相结合,所提出的模型能够以粗到细的方式处理输入的面部表情。通过这种方式,团队大大降低了计算成本和系统为准确分类而学习的必要参数数量。“我们设法获得了一个具有良好泛化能力的模型,参数少至58,000个,”Tian说。
研究人员通过将其面部表情识别性能与课堂环境中报告的其他模型进行比较,对他们的模型进行了测试。他们使用称为“扩展Cohn-Kanade数据集”的流行数据集训练和测试所有模型,该数据集包含超过35,000张表达共同情绪的面部标记图像。结果令人鼓舞,Tian团队开发的模型以最少的参数显示出最高的准确度(72.4%)。
“我们开发的模型在使用小样本数据集时对面部表情识别特别有效。我们研究的下一步是进一步优化模型的架构并实现更好的分类性能,”田说。
考虑到面部表情识别可以广泛应用于人机交互、安全驾驶、智能监控、监控、医疗等领域,希望团队早日实现他们的愿景。
标签: