科学研究

绣山讲坛第436讲-基于局部感知的流场中未知信息源深度强化学习探寻策略研究

作者：已浏览：9次更新日期：2026-05-31

报告题目：基于局部感知的流场中未知信息源深度强化学习探寻策略研究

报告时间：2026年06月01日，星期一，上午9:00 AM

报告地点：宗瑞航海楼501会议室

主讲人：李高进副教授

摘要：

在动态复杂流场中实现高效自主导航，是生物行为中的一类基元任务，对理解生物演化以及提升机器人操作能力具有重要意义。针对源点探寻任务中存在的环境部分可观测性问题，本报告将解释一种高效利用记忆的深度强化学习框架。该框架采用循环神经网络作为策略表征网络，并引入自举随机更新机制来训练策略参数。通过选择浓度与局部绝对流速作为智能体的观测输入，系统性地调节策略训练中的片段长度（即记忆长度），有效提升了参数更新过程的稳定性，进而优化了训练效率。与经典的生物启发式算法及主流强化学习基线方法相比，本方案在性能上展现出显著优势，同时在抗噪声干扰、参数鲁棒性以及跨环境泛化能力方面均表现优异。研究结果表明，以浓度和局部绝对流速为观测输入的智能体，能够表现出类似生物界中常见的“之”字形投射行为以主动搜寻高浓度区域，并有效利用背景流场提升导航效率。此外，本报告还定量揭示了智能体的寻源性能随记忆长度变化的演化规律。

主讲人简介：

李高进，上海交通大学船建学院长聘教轨副教授，国家级青年人才。中国科学技术大学近代力学系学士、硕士，美国普渡大学机械工程系博士，美国康奈尔大学化学与分子生物工程系博士后。研究领域为多物理场计算流体力学，主要包括复杂介质多相流、微纳尺度流动、仿生流动及电磁流体等。研究成果在Physical Review Letters, Journal of Fluid Mechanics, Nature Communication，Science Advances等期刊发表论文40余篇，主持国家级青年人才基金、国家自然科学基金、上海市自然科学基金等多个项目。