研究所动态

喜报 | 我所一篇论文被多媒体领域顶级学术期刊IEEE TMM录用

发布时间:2023年01月11日

      由我所师生合作完成的一篇论文Skill-based Hierarchical Reinforcement Learning for Target Visual Navigation被多媒体领域顶刊IEEE Transactions on Multimedia (TMM)录用。主要由林友芳、武志昊、吕凯老师指导,博士生王硕、胡小波完成。

      目标视觉导航任务旨在仅依赖单目视觉RGB图像作为输入来控制智能体导航到目标对象。目标视觉导航是一项复杂的任务,包含视觉特征提取,语义理解,空间理解,策略控制等。因此,了解智能体的行为动机有利于改善模型。在本文中,我们提出了一个名为基于技能的分层强化学习(SHRL)的框架。该框架包含一个高级策略和三个低级技能。高级策略通过在每一步使用或切换低级技能来完成任务。低级技能旨在分别解决三个子任务,即搜索、调整和探索。此外,我们提出了一个抽象表示和两个惩罚项来为高级策略提供稳健的特征和训练。其中,抽象表示旨在使智能体专注于选择低级技能而不是导航的细节。在仿真环境AI2Thor中的实验结果表明,所提出的方法在未见过的室内环境中优于现有技术。此外,我们还提供案例研究来说明SHRL行为具有可读性。