我所一篇关于视觉强化学习泛化的研究被国际著名学术期刊ACM TOMM录用

发布时间：2026年5月9日

由我所师生王金文、林友芳老师、胡小波、已毕业硕士生徐倩、王硕老师和吕凯老师共同完成的一篇论文Task-Relevant Representation Decoupling for Visual Reinforcement Learning Generalization被国际著名学术期刊ACM Transactions on Multimedia Computing Communications and Applications (TOMM)录用。

视觉强化学习在解决复杂控制任务方面已取得显著进展。然而，将已学习策略迁移至新环境仍面临重要挑战，其中一个关键原因在于智能体在训练过程中容易对任务无关特征产生过拟合，从而影响其在环境变化下的泛化能力。针对这一问题，本文提出了一种将观测数据解耦为任务相关表征与任务无关表征的新思路，并进一步设计了自监督的任务相关表征解耦算法 T2RD。该算法主要包含三个核心模块：任务相关表征一致性机制、交叉重构机制和动态预测机制。其中，前两个模块用于实现内容特征与风格特征的有效解耦；在此基础上，动态预测机制进一步从内容表征中提取与任务决策密切相关的特征，从而提升策略在复杂视觉变化场景下的鲁棒性与泛化能力。在机器人运动和机器人操作任务中，T2RD算法取得了领先的泛化性能与样本效率表现。

研究所动态

我所一篇关于视觉强化学习泛化的研究被国际著名学术期刊ACM TOMM录用