发布时间:2023年9月27日
近日,顶级人工智能CCF A类国际会议NeurIPS 2023放榜,本次会议共收到有效投稿文章12343篇,录用率约为26.1%。我所两篇论文被NeurIPS 2023接收,其中一篇Spotlight、一篇Poster,下面是论文列表及介绍:
论文一
WITRAN: Water-wave Information Transmission and Recurrent Acceleration Network for Long-range Time Series Forecasting(Spotlight)
作者:Yuxin Jia, Youfang Lin, Xinyan Hao, Yan Lin, Shengnan Guo, Huaiyu Wan*
本篇论文由我所博士生贾宇欣和林友芳老师、万怀宇老师、博士生郝鑫岩、博士生林彦以及郭晟楠老师合作完成。
捕获语义信息对于长程时间序列的准确预测至关重要,其中包括两大方面:(1)建模全局和局部相关性,(2)挖掘长期和短期的重复模式。以往的研究工作能够一定程度上捕获这些方面中的一部分,但无法完成它们的同时捕获。此外,以往研究工作的时间和空间复杂性仍然很高。
基于此,我们提出了一种新颖的水波信息传递(Water-wave Information Transmission,简称WIT)框架,能够通过双粒度的信息传递捕捉短期和长期的重复模式。在WIT框架中,我们设计了一种新型水平垂直门控选择单元(Horizontal Vertical Gated Selective Unit,简称HVGSU),通过循环地融合和选择信息,来建模全局和局部相关性。此外,在提高计算效率方面,我们提出了一种通用的循环加速网络(Recurrent Acceleration Network,简称RAN),能够在保证空间复杂度为O(L)的同时,将时间复杂度降低到为O(√L)。
综上,我们将提出的方法命名为:水波信息传递和循环加速网络(Water-wave Information Transmission and Recurrent Acceleration Network,简称WITRAN)。通过在能源、交通、天气等领域的四个大型公开数据集上的实验证明,相对于现有方法,WITRAN在长程和超长程时间序列预测任务上成为了最佳方法(SOTA)。
论文二
Look Beneath the Surface: Exploiting Fundamental Symmetry for Sample-Efficient Offline RL(Poster)
作者:Peng Cheng, Xianyuan Zhan, Zhihao Wu, Wenjia Zhang, Youfang Lin, Shoucheng Song, Han Wang, Li Jiang
本篇论文由我所博士生成鹏和武志昊老师、林友芳老师以及清华大学智能产业研究院詹仙园老师合作完成。
离线强化学习(RL)通过从预先收集的数据集中学习策略,而无需与环境进行交互,为RL部署到实际应用场景提供了一种可行的技术的路径。
然而,现有的离线RL算法的性能在很大程度上取决于数据集本身的规模和状态-动作空间覆盖率。但在现实应用场景中,收集大量可靠的数据集所需的成本往往十分昂贵。因此,如何在十分有限的且覆盖范围狭窄的数据集中学习到一个可靠的策略,对离线RL算法来说是一个十分关键的挑战。
为应对该挑战,我们提出了一个新的算法,即利用动力学系统中的对称性从而显著提高小样本数据集下的离线RL算法的性能。具体来说,通过结合时间反演对称性(T-对称性),我们在隐空间中对前向和反向的动力学过程的一致性建立动力学模型(TDM)。我们发现TDM为小样本数据集提供了良好可靠的的表示空间,并可以基于T-对称性为衡量指标为OOD样本进行度量。基于此,我们构造了一个新的离线RL算法(TSRL),该算法具有较少保守的策略约束和一个可靠数据增强方法。基于大量的实验,我们发现TSRL在极小样本上表现十分出色,即使只有原始样本的1%,该算法的性能显著优于现有的离线RL算法,无论是在数据利用效率还是算法本身的泛化能性方面。
恭喜以上老师和同学在科研中取得优秀的成果,也希望同学们能够再接再厉,继续在科研的道路上不断前行,取得更多优异的成果。