发布时间:2025年9月22日
近日,人工智能领域国际顶级会议NeurIPS 2025公布录用结果,由我所师生共同完成的5篇论文被大会录用。Neural Information Processing Systems (NeurIPS)是中国计算机学会(CCF)推荐的A类国际学术会议。今年 NeurIPS 主赛道共收到 21575 份有效论文投稿,录用5290 篇,录用率为 24.52%。此次我所被录用的论文的相关信息如下: 此次我所被录用的论文的相关信息如下:
论文一
PLMTrajRec: A Scalable and Generalizable Trajectory Recovery Method with Pre-trained Language Models
该论文由我所博士生韦统龙、毕业博士生林彦和林友芳老师,郭晟楠老师、万怀宇老师,华东师范大学胡吉林老师,南洋理工大学博士后袁海涛以及丛高老师合作完成。
时空轨迹数据对于各种交通相关应用至关重要。然而,设备故障和网络不稳定等问题常常导致轨迹稀疏从而丢失详细的运动信息。因此,恢复稀疏轨迹中的缺失点至关重要。尽管近期取得了一些进展,但仍存在三个挑战。首先,缺乏大规模密集轨迹数据集阻碍了轨迹恢复模型的训练。其次,稀疏轨迹中不同的时空相关性使其难以在不同的采样间隔之间推广。第三,比较难提取缺失点的路况信息。
为了应对这些挑战,本文提出了一种新颖的轨迹恢复模型PLMTrajRec。该模型利用预训练语言模型 (PLM) 的可扩展性,并能够通过使用小规模稠密轨迹数据集进行微调来有效地恢复轨迹。为了处理稀疏轨迹中不同的采样间隔,首先将采样间隔和运动特征转换为PLM能够理解的提示词。然后,通过引入轨迹编码器将不同间隔的轨迹统一为同一间隔。为了提取缺失点的路况信息,提出一种区域流引导的隐式轨迹提示,用于表示每个区域的交通状况;以及一种路况传递机制,用于利用观测到的路况推断缺失点的路况。在四个公开轨迹数据集上(包含三个采样间隔)的实验证明了PLMTrajRec的有效性、可扩展性和泛化能力。
论文二
TransferTraj: A Vehicle Trajectory Learning Model for Region and Task Transferability
该论文由我所博士生韦统龙、毕业博士生林彦、毕业硕士生周泽宇、毕业博士生温浩珉和林友芳老师,郭晟楠老师、万怀宇老师,华东师范大学胡吉林老师,以及南洋理工大学丛高老师合作完成。
车辆 GPS 轨迹提供了丰富的运动信息,支持各种下游任务和应用。理想的轨迹学习模型应该在无需重新训练的情况下能够跨区域和任务迁移,从而避免保存多个专用模型以及在有限训练数据的情况下性能不佳。然而,每个区域都有其独特的空间特征和上下文,这些特征和上下文会反映在车辆运动模式中,并且难以迁移。此外,由于每个任务所需的输入输出结构各不相同,跨任务迁移也面临技术挑战。现有的迁移研究主要涉及学习轨迹的嵌入向量,但这些向量在区域迁移方面表现不佳,并且需要重新训练预测模块才能进行任务迁移。
为了应对这些挑战,本文提出TransferTraj,一个在区域和任务迁移方面均表现优异的车辆 GPS 轨迹学习模型。在区域迁移方面引入RTTE 作为 TransferTraj 中的主要可学习模块。它整合了轨迹的空间、时间、POI 和道路网络模态,以管理不同区域空间上下文分布的变化。它还引入了一个 TRIE 模块来合并空间特征的相关信息,以及一个空间上下文 MoE 模块来处理不同上下文中的运动模式。对于任务可迁移性,提出一种任务可迁移的输入输出方案,将不同任务的输入输出结构统一到模态和轨迹点的掩蔽和恢复中。这种方法允许 TransferTraj 进行一次预训练,然后无需重新训练即可迁移到不同的任务。在三个真实车辆轨迹数据集上在各种迁移设置下进行了广泛的实验,包括任务迁移、零样本区域迁移和少样本区域迁移。实验结果表明,TransferTraj 在不同场景下的表现明显优于最先进的基线,验证了其在区域和任务迁移方面的有效性。
论文三
TrajMamba: An Efficient and Semantic-rich Vehicle Trajectory Pre-training Model
该论文主要由我所硕士生刘奕辰,已毕业博士生林彦和毕业硕士生周泽宇在万怀宇老师、郭晟楠老师和林友芳老师的指导下完成。
车辆GPS轨迹记录了车辆随时间的移动过程,并存储了宝贵的出行语义信息,包括移动模式与出行目的。有效且高效地学习这些出行语义,对于轨迹数据的实际应用至关重要,而这一目标的实现面临两大挑战。首先,出行目的与行程所涉及的道路和兴趣点(POIs)的功能密切相关,这类信息被编码在文本地址与描述中,会给建模过程带来沉重的计算负担。其次,现实中的轨迹往往包含冗余点,这些冗余点既会影响计算效率,也会损害轨迹嵌入的质量。为应对上述挑战,我们提出了一种高效且语义丰富的车辆轨迹学习方法TrajMamba。该方法引入了一个Traj-Mamba编码器,通过联合建模轨迹的GPS视角与道路视角来捕捉移动模式,能够对连续的出行行为进行稳健表征。同时,TrajMamba设计了一个出行目的感知预训练流程,将出行目的融入学习到的嵌入中,且不会为嵌入计算增加额外开销。为减少轨迹中的冗余信息,TrajMamba还设计了一个知识蒸馏预训练方案,通过一个可学习的掩码生成器识别关键轨迹点,进而获得高效的压缩轨迹嵌入。在两个真实世界数据集和三个下游任务上的大量实验表明,TrajMamba在效率与准确性两方面均优于当前最先进的基线模型。
论文四
From Indicators to Insights: Diversity-Optimized for Medical Series-Text Decoding via LLMs
该论文主要由我所博士生靳希源,贾倩茹,宁晓军和王晶老师,林友芳老师,本科生林子微,以及首都医科大学三博脑科医院的史中华老师完成。
医学时间序列分析与一般分析有着根本的不同,它需要专门的领域知识来解释复杂的信号和临床背景。大型语言模型(LLM)通过从生物医学文献和临床指南中提取丰富的上下文知识来补充原始序列,为增强医学时间序列分析带来了巨大的希望。然而,只有通过精确且有意义地构建提示,引导LLM关注数据中最相关的方面,才能实现这一潜力。事实上,确定什么是有效的提示内容仍然不是一件小事,尤其是在医疗环境中,信号解释往往取决于微妙的、专家定义的决策指标。为了应对这一挑战,我们引入了InDiGO,这是一个知识感知的进化学习框架,系统地整合了临床信号和决策指标,通过迭代学习不断优化。四个真实世界医学基准的实验表明,InDiGO始终优于现有的最先进方法。
论文五
REFED: A Subject Real-time Dynamic Labeled EEG-fNIRS Synchronized Recorded Emotion Dataset
该论文主要由我所林友芳老师、王晶老师,博士生宁晓军,毕业硕士生冯志洋、辛天佐、张烁、张绍琪,南洋理工大学丁一老师,中国科学院自动化研究所连政老师、贾子钰老师共同合作完成。
情感脑机接口(aBCIs)在个性化人机交互和神经反馈调节中发挥着至关重要的作用。为了开发实用有效的aBCI范式,研究在不同情绪诱发下脑活动时空动态,脑电(EEG)信号已被广泛采用;为了进一步提高时空感知,功能性近红外光谱(fNIRS)也在aBCI领域引起了越来越多的兴趣,并已与EEG结合进行探索。然而,现有的数据集通常只提供静态的情感标签,忽略了受试者情绪的动态变化。值得注意的是,一些研究试图收集连续的情绪数据,但它们只记录了外周生理信号,而没有直接观观测脑活动,限制了在不同情绪下对潜在神经状态的探索。为了解决这些挑战,我们提出了REFED情绪数据集,这是首个具有实时动态情绪标注的EEG-fNIRS数据集。REFED同时使用ESI Neuroscan EEG和Shimadzu LABNIRS分别记录EEG和fNIRS两种模态的脑信号,同时提供连续、实时的效价-唤醒度标注。数据分析结果证明了情绪诱发的有效性和实时标注的可靠性。数据集为研究情绪演变下的神经血管耦合机制以及开发动态、鲁棒的情感BCI范式提供了可能。
恭喜以上老师和同学在科研中取得优秀的成果,也希望同学们能够再接再厉,继续在科研的道路上不断前行,取得更多优异的成果。