7月18日,应数学与统计学院邀请,法国阿图瓦大学Shahin Gelareh教授,在数学院北楼N216,为学院师生作题为Using Imitation Learning to Solve Optimization Problems的学术报告,相关专业教师和研究生十余人参加了此次报告。报告由数学与统计学院崔鲁宾教授主持。
本次报告,Shahin教授主要介绍了如何通过模仿学习(Imitation Learning, IL)技术提升传统优化问题的求解效率。传统的优化求解方法具有许多挑战,组合优化、整数规划等问题通常依赖启发式算法或数学规划求解器(如CPLEX、Gurobi),计算成本高且难以适应实时需求。Shahin教授将优化问题转化为马尔可夫决策过程(MDP),利用模仿学习(如行为克隆或逆强化学习)训练模型模仿专家求解策略。相比传统求解器,模仿学习模型在推理阶段显著降低计算时间,尤其适合大规模或实时性问题。Shahin教授的工作展示了模仿学习在优化领域的潜力,通过数据驱动方法弥补传统方法的不足,为实时决策系统提供了新思路。未来可能结合强化学习(RL)进一步探索更自主的优化策略生成。该报告会引起了师生们的极大兴趣,报告结束后,大家相互交流了自己的问题和看法,Shahin教授与崔鲁宾教授共同探讨了该课题的未来发展方向。会议气氛活跃,学术氛围良好,参会师生收获颇丰。
专家简介:
Shahin Gelareh(哈比尔博士)是法国阿图瓦大学运筹学和物流学教授,博士生导师,也是《Transportation Research Part E》编委会成员。Shahin的研究重点是从数学规划、算法和多面体的角度研究物流(陆地、海洋等)中出现的组合优化问题。随着最近基于机器学习技术的成功趋势Shahin还致力于利用机器学习的力量来提高整数规划技术的计算性能。Shahin Gelareh教授曾在新加坡国立大学、丹麦技术大学、里尔理工大学和英国朴茨茅斯商学院工作。他目前是中科院数学与系统科研究院的客座研究员,与戴教授和其他同事合作。
(数学与统计学院 崔鲁宾)