博彩导航

科学研究
  • 通知公告
  • 科研成果
  • 科研平台
  • 科研团队
  • 学术交流
  • 地方服务
  • 设备信息
  • 相关下载

绣山讲坛第436讲-基于局部感知的流场中未知信息源深度强化学习探寻策略研究

作者:   已浏览:9次 更新日期:2026-05-31

报告题目基于局部感知的流场中未知信息源深度强化学习探寻策略研究

报告时间:20260601日,星期一,上午9:00 AM

报告地点:宗瑞航海楼501会议室

主讲人:李高进副教授

摘要:

在动态复杂流场中实现高效自主导航,是生物行为中的一类基元任务,对理解生物演化以及提升机器人操作能力具有重要意义。针对源点探寻任务中存在的环境部分可观测性问题,本报告将解释一种高效利用记忆的深度强化学习框架。该框架采用循环神经网络作为策略表征网络,并引入自举随机更新机制来训练策略参数。通过选择浓度与局部绝对流速作为智能体的观测输入,系统性地调节策略训练中的片段长度(即记忆长度),有效提升了参数更新过程的稳定性,进而优化了训练效率。与经典的生物启发式算法及主流强化学习基线方法相比,本方案在性能上展现出显著优势,同时在抗噪声干扰、参数鲁棒性以及跨环境泛化能力方面均表现优异。研究结果表明,以浓度和局部绝对流速为观测输入的智能体,能够表现出类似生物界中常见的“之”字形投射行为以主动搜寻高浓度区域,并有效利用背景流场提升导航效率。此外,本报告还定量揭示了智能体的寻源性能随记忆长度变化的演化规律。

主讲人简介:

李高进,上海交通大学船建学院长聘教轨副教授,国家级青年人才。中国科学技术大学近代力学系学士、硕士,美国普渡大学机械工程系博士,美国康奈尔大学化学与分子生物工程系博士后。研究领域为多物理场计算流体力学,主要包括复杂介质多相流、微纳尺度流动、仿生流动及电磁流体等。研究成果在Physical Review Letters, Journal of Fluid Mechanics, Nature CommunicationScience Advances等期刊发表论文40余篇,主持国家级青年人才基金、国家自然科学基金、上海市自然科学基金等多个项目。


学术交流
学院博彩导航 - 网站新版 - 正文
绣山讲坛第436讲-基于局部感知的流场中未知信息源深度强化学习探寻策略研究
作者: 已浏览:次 更新日期:2026-05-31

报告题目基于局部感知的流场中未知信息源深度强化学习探寻策略研究

报告时间:20260601日,星期一,上午9:00 AM

报告地点:宗瑞航海楼501会议室

主讲人:李高进副教授

摘要:

在动态复杂流场中实现高效自主导航,是生物行为中的一类基元任务,对理解生物演化以及提升机器人操作能力具有重要意义。针对源点探寻任务中存在的环境部分可观测性问题,本报告将解释一种高效利用记忆的深度强化学习框架。该框架采用循环神经网络作为策略表征网络,并引入自举随机更新机制来训练策略参数。通过选择浓度与局部绝对流速作为智能体的观测输入,系统性地调节策略训练中的片段长度(即记忆长度),有效提升了参数更新过程的稳定性,进而优化了训练效率。与经典的生物启发式算法及主流强化学习基线方法相比,本方案在性能上展现出显著优势,同时在抗噪声干扰、参数鲁棒性以及跨环境泛化能力方面均表现优异。研究结果表明,以浓度和局部绝对流速为观测输入的智能体,能够表现出类似生物界中常见的“之”字形投射行为以主动搜寻高浓度区域,并有效利用背景流场提升导航效率。此外,本报告还定量揭示了智能体的寻源性能随记忆长度变化的演化规律。

主讲人简介:

李高进,上海交通大学船建学院长聘教轨副教授,国家级青年人才。中国科学技术大学近代力学系学士、硕士,美国普渡大学机械工程系博士,美国康奈尔大学化学与分子生物工程系博士后。研究领域为多物理场计算流体力学,主要包括复杂介质多相流、微纳尺度流动、仿生流动及电磁流体等。研究成果在Physical Review Letters, Journal of Fluid Mechanics, Nature CommunicationScience Advances等期刊发表论文40余篇,主持国家级青年人才基金、国家自然科学基金、上海市自然科学基金等多个项目。


学术交流