北京雁栖湖应用数学研究院 北京雁栖湖应用数学研究院

  • 关于我们
    • 院长致辞
    • 理事会
    • 协作机构
    • 参观来访
  • 人员
    • 管理层
    • 科研人员
    • 博士后
    • 来访学者
    • 行政团队
  • 学术研究
    • 研究团队
    • 公开课
    • 讨论班
  • 招生招聘
    • 教研人员
    • 博士后
    • 学生
  • 会议
    • 学术会议
    • 工作坊
    • 论坛
  • 学院生活
    • 住宿
    • 交通
    • 配套设施
    • 周边旅游
  • 新闻
    • 新闻动态
    • 通知公告
    • 资料下载
关于我们
院长致辞
理事会
协作机构
参观来访
人员
管理层
科研人员
博士后
来访学者
行政团队
学术研究
研究团队
公开课
讨论班
招生招聘
教研人员
博士后
学生
会议
学术会议
工作坊
论坛
学院生活
住宿
交通
配套设施
周边旅游
新闻
新闻动态
通知公告
资料下载
清华大学 "求真书院"
清华大学丘成桐数学科学中心
清华三亚国际数学论坛
上海数学与交叉学科研究院
BIMSA > 计算和应用数学讨论班 Advancing Stochastic Optimal Control: An Actor-Critic Framework
Advancing Stochastic Optimal Control: An Actor-Critic Framework
组织者
Computational & Applied Mathematics Group
演讲者
周默
时间
2023年11月16日 11:30 至 13:30
地点
Online
线上
Tencent 677 1805 8331 ()
摘要
Solving the stochastic optimal control problem and its associated Hamilton—Jacobi—Bellman (HJB) equation poses significant challenges due to complexity and non-convexity. In this presentation, we introduce an innovative actor-critic approach tailored to address this complexity. Our method involves deriving an explicit derivative for the cost functional and implementing a policy gradient method for the actor (control) update. The necessity of the current control's value function prompts the development of a policy evaluation process for the critic. We present compelling numerical evidence demonstrating the efficacy of our algorithm and provide rigorous proofs of exponential convergence rates for both the actor and the critic under mild assumptions. Furthermore, we establish a convergence rate for the joint actor-critic dynamics within a single time scale, showcasing the robustness and efficiency of our proposed framework.
演讲者介绍
Mo Zhou (周默) is an assistant adjunct Professor at UCLA, where he conducts cutting-edge research at the intersection of optimal control, mean-field game problems and deep learning. Currently, he is in Prof. Stan Osher's and Prof. Hayden Schaeffer's research groups. Before joining UCLA, Mo earned his Ph.D. at Duke University, where he was mentored by Prof. Jianfeng Lu. Prior to that, he was an undergraduate at Tsinghua University.
北京雁栖湖应用数学研究院
CONTACT

No. 544, Hefangkou Village Huaibei Town, Huairou District Beijing 101408

北京市怀柔区 河防口村544号
北京雁栖湖应用数学研究院 101408

Tel. 010-60661855
Email. administration@bimsa.cn

版权所有 © 北京雁栖湖应用数学研究院

京ICP备2022029550号-1

京公网安备11011602001060 京公网安备11011602001060