北京雁栖湖应用数学研究院 北京雁栖湖应用数学研究院

  • 关于我们
    • 院长致辞
    • 理事会
    • 协作机构
    • 参观来访
  • 人员
    • 管理层
    • 科研人员
    • 博士后
    • 来访学者
    • 行政团队
  • 学术研究
    • 研究团队
    • 公开课
    • 讨论班
  • 招生招聘
    • 教研人员
    • 博士后
    • 学生
  • 会议
    • 学术会议
    • 工作坊
    • 论坛
  • 学院生活
    • 住宿
    • 交通
    • 配套设施
    • 周边旅游
  • 新闻
    • 新闻动态
    • 通知公告
    • 资料下载
关于我们
院长致辞
理事会
协作机构
参观来访
人员
管理层
科研人员
博士后
来访学者
行政团队
学术研究
研究团队
公开课
讨论班
招生招聘
教研人员
博士后
学生
会议
学术会议
工作坊
论坛
学院生活
住宿
交通
配套设施
周边旅游
新闻
新闻动态
通知公告
资料下载
清华大学 "求真书院"
清华大学丘成桐数学科学中心
清华三亚国际数学论坛
上海数学与交叉学科研究院
BIMSA > BIMSA Thursday Machine Learning Applications Seminar OpenRL通用强化学习框架
OpenRL通用强化学习框架
组织者
焦小沛 , 熊繁升 , 杨武岳
演讲者
黄世宇
时间
2023年10月31日 14:00 至 15:00
地点
A3-1-101
线上
Zoom 230 432 7880 (BIMSA)
摘要
强化学习作为机器学习领域中重要的训练范式,在机器人、自然语言、内容生成、自动驾驶、推荐系统中都发挥着极其重要的作用。OpenRL作为一个通用强化学习框架,通过统一的训练接口,同时支持单智能体,多智能体,离线强化学习、自然语言等任务的训练。另外,OpenRL提供易用且可定制化的编程模式,既方便入门用户快速上手,又能为专业人员提供灵活的配置方式。未来,OpenRL将会在促进强化学习智能体开源和应用方面做出更多贡献。
演讲者介绍
第四范式强化学习科学家,开源强化学习OpenRL Lab负责人。本科与博士均毕业于清华大学计算机系,导师是朱军和陈挺教授,本科期间在CMU交换,导师为Deva Ramanan教授。主要研究方向为强化学习,多智能体强化学习,分布式强化学习。曾在ICLR、CVPR、AAAI、NeurIPS, Nature Machine Intelligence, ICML, AAMAS, Pattern Recognition等会议和期刊发表多篇学术论文。其领导开发的TiZero谷歌足球游戏智能体曾在及第平台上取得排名第一的成绩。黄世宇也曾在腾讯AI Lab、华为诺亚、商汤、瑞莱智慧等工作。
北京雁栖湖应用数学研究院
CONTACT

No. 544, Hefangkou Village Huaibei Town, Huairou District Beijing 101408

北京市怀柔区 河防口村544号
北京雁栖湖应用数学研究院 101408

Tel. 010-60661855
Email. administration@bimsa.cn

版权所有 © 北京雁栖湖应用数学研究院

京ICP备2022029550号-1

京公网安备11011602001060 京公网安备11011602001060