发布时间:2026年5月6日
近日,由我所博士生姚畅在林友芳老师和吕凯老师指导下完成的论文《Role-Level Inductive Bias for Cross-Task Generalization in Multi-Agent Reinforcement Learning》被国际顶级会议 ICML 2026 录用,论文的相关信息如下:
多智能体强化学习在复杂协同决策场景中展现出了强大的应用潜力,然而如何提升策略在跨任务场景下的泛化能力,仍是该领域面临的关键挑战。现有多智能体策略往往受限于特定任务的环境特征,缺乏可迁移的通用决策单元与有效的归纳偏置约束,难以在不同任务场景下保持稳定的协同表现。
为了应对这一挑战,本文创新性提出角色级归纳偏置以提升多智能体策略的跨任务泛化能力,将角色作为跨任务泛化的基础单元,采用混合高斯模型构建角色先验分布,依托效用加权 DPP 机制增强角色的多样性,并设计意图 - 影响角色正则化约束角色表征,从而为多智能体策略提供了可迁移的通用决策单元与有效的归纳偏置支撑。
在星际争霸多智能体协同测试场景中进行的实验表明,与基线方法相比,所提出的方法展现出了显著优越的跨任务泛化性能。
