发布时间:2020年11月12日
深度强化学习是深度学习与强化学习的结合,主要研究马尔科夫决策过程中的智能体的控制策略设计与优化问题。近年来,以Deepmind的AlphaGo、AlphaStar、OpenAI Five为代表的一系列研究成果展现了深度强化学习在单智能体游戏场景、仿真环境、线上环境等的广泛应用前景。随着物联网技术的不断落地成熟,多智能体深度强化学习逐渐成为主流,并将在智能城市、智能物流、智能交通、智能工厂等一系列场景中得到应用。
深度强化学习是本研究所特色的重要研究和应用方向,本课题组已经完成多项有关研究项目。现面向全校公开招募3-5名有兴趣、有能力的本科同学加入研究队伍,合作开展创新研究项目。本项目的主题是“基于多智能体深度强化学习的指挥调度”,目标是在游戏环境中训练多个智能体完成特定任务。本项目将在主流的深度学习框架(PyTorch优先)与最新进展的基础上开展研究,旨在培养学生的科研能力、学习能力、团队能力,增强学生对于深度强化学习理解,锻炼学生的编程能力,提升学生的综合素质。
对有志加入的同学要求如下:
1.综合成绩排名在年级前50%,吃苦耐劳,勤奋上进,品学兼优;
2.具备良好的团队协作能力,善于沟通表达,对科研工作有浓厚兴趣,有比较明确的目标和计划并自觉执行;
3.有较强的学习能力,能够在指导下自学深度强化学习的基础知识,快速熟悉掌握编程思路,有PyTorch使用经验、具备深度(强化)学习代码复现能力的优先;
4.原则上面向大二大三学生,需要暑假期间有50天左右的完整时间。本项目不仅可作为大创项目,也可作为纯粹的科研经历。欢迎有志做深度强化学习相关研究的同学加入我们的队伍,期待你的简历!
请准备一份个人简历(情况简介,能力介绍,所获奖项,相关经历,自我陈述等),附上本科期间成绩单以及所获荣誉奖项等相关证明材料电子版,发送至: 19112039@bjtu.edu.cn;shhan@bjtu.edu.cn;
本项目报名截止时间2021年1月31日,随时报名随时考察,招满为止。本课题组长期接收本科同学参与科研创新实践,欢迎随时投递简历!
注:北京交通大学网络科学与智能系统研究所(INSIS)负责人是林友芳教授,现有教师7名,专职科研人员十几名,博士、硕士研究生100余名。研究所的详细信息请参见:http://insis.bjtu.edu.cn
北京交通大学网络科学与智能系统研究所
2020年11月12日