新研究描述了通过游戏进行优化和决策的多智能体系统
在人工智能中,多智能体系统可以被认为是个体(智能体)的社会,它们通过交换知识和相互协商以实现个人/全球目标进行交互。在现实生活中,多智能体系统被用于许多不同的领域,如资源管理;信息安全; 制造计划、调度和控制;监测、诊断和控制;电子商务; 生物医学;和虚拟企业。鉴于它们的巨大用途,研究人员一直在努力寻找在现实环境中使用这些系统的新方法。
在此背景下,上海华东理工大学唐阳教授与欧洲科学院院士、英国斯威本大学IEEE Fellow韩庆龙教授带领的研究团队Technology,澳大利亚墨尔本,和来自德国波茨坦气候影响研究所的欧洲学术界成员 Jürgen Kurths 教授合作,深入研究与多智能体系统相关的问题。他们探讨了从优化到游戏的多智能体系统的合作/非合作行为的本质,作为解决复杂现实世界问题的一种方法。他们在IEEE/CAA Journal of Automatica Sinica的 5 月刊上发表了他们的发现。
“多智能体系统往往涉及目标相互冲突的多目标优化,每个对象都不可避免地受到不确定性的影响。因此,博弈论可以赋予多智能体系统更多的解决方案,并提供一种跨学科整合的手段,例如游戏和控制、人工智能、数学和其他学科,”唐教授和库尔思教授声称。
他们出于一个非常重要的原因考虑博弈论。简单来说,游戏,尤其是回合制策略游戏,在我们身边无处不在。博弈是特定于相互依赖的情境,根据主体的行为和动作顺序,可分为合作博弈和非合作博弈,或分为静态博弈和动态博弈。研究人员整合了这两种分类,以便更全面地了解复杂的现实世界场景。
在他们的调查中,作者使用博弈论为个人或全局优化目标创建了合作或竞争行为模型。重点关注多智能体系统中合作与竞争的三个方面:合作优化、合作博弈和非合作博弈。“对于博弈相关的问题,当一个智能体的目标可能与其他智能体的目标不同或完全相反时,就形成了非合作博弈;反之,当一个智能体与其他智能体绝对合作并考虑共同利益时,就形成了合作博弈, ”王和洪说。
该调查涉及多个角度:首先,它侧重于分布式在线优化、联合优化及其在隐私保护中的应用。然后,通过分别关注具有合作和竞争因素的静态和动态博弈,该研究以一种新颖的方式架起了从合作优化到合作博弈的过渡。
那么这些发现可以用在哪里呢?据作者称,这些应用程序是多方面的。
韩教授举了一个特别说明的例子,“在智慧城市中,这些发现可以用来构建一个依靠城市大数据的智能交通决策系统。这意味着可以优化路口红绿灯的持续时间,从而调整交通流量,平衡路网负荷,提高道路资源利用效率。”
这些应用程序还涉及其他领域。在经济学中,市场竞争可以建模为一个博弈问题。在信息安全领域,可以构建非合作攻防博弈,通过识别交互信息的意图和预测攻击行为来寻找最优防御策略。即使在药物开发中,也可以构建合作博弈,以获得大分子结构的最大效用。
标签: