研究所动态

我所一篇智能决策技术的研究被国际顶级学术期刊ACM TOMM录用

发布时间:2025年08月12日

      由我所师生合作完成的一篇论文Learning Robust Representations via Bidirectional Transition for Visual Reinforcement Learning被CCF B类国际顶级期刊ACM Transactions on Multimedia Computing, Communications, and Applications(TOMM)录用,该论文由我所博士生胡小波、王金文、刘悦、在吕凯老师、林友芳老师、王硕老师,以及浙江大学范鹤鹤老师的指导下共同完成。

      视觉强化学习在解决高维观测特征的控制任务中展现出显著效果。然而,如何从视觉观测中提取可靠且可泛化的表征仍是核心挑战。受人类思维启发,当视觉表征能预测未来并追溯历史时,其在理解环境状态方面便具备可靠性和准确性。基于这一理念,我们提出双向转换(BT)框架进行表征学习。该框架通过正向与逆向环境转换的双向预测作为辅助任务,有效提取可靠表征。同时引入逆向动态模型预测导致环境状态转换的动作,从而学习状态表征的任务相关性。我们的方法在DeepMind控制套件的两个场景中展现出优异的泛化性能和样本效率。此外,通过机器人操作模拟器、自动驾驶模拟器CARLA以及视觉导航模拟器Habitat的验证,证明了该方法的广泛适用性。实验结果表明,BT框架能提供更稳定可靠的表征,并在视觉强化学习任务中展现出强大的泛化能力。