DeepMind 创始人 ICML2016:深度增强学习

分享者:Jian.1990 | 分享时间: 2016-6-21 10:26 | 我要分享
知识文档-点击下载

deep_rl_tutorial.pdf

34.53 MB

所需流量: 5 积分 [立即下载]

完整版 PDF

ICML2016今天进入课程讲座环节,DeepMind的资深科学家、AlphaGo作者之一的David Silver作了题为《深度增强学习》(Deep Reinforcement Learning)的报告。新智元带来本次报告的全部PPT。与前几日发表在DeepMind博客上的综述性文章不一样的是,本次David具体描述了DeepMind在深度增强学习运用的细节,他认为AI=增强学习+深度学习,详细介绍了基于价值、策略和模型的三种深度增强学习实现途径。

报告目录:
  • 深度学习介绍
  • 增强学习介绍
  • 基于价值的深度增强学习
  • 基于策略的深度增强学习
  • 基于模型的深度增强学习


增强学习概述
  • 增强学习是一种用于决策的通用框架
  • 增强学习指的是具有行动能力的智能体
  • 每一步行动都会影响智能体的未来状态
  • 成功由标量的回报信号来衡量
  • 目标:选择行动,实现未来回报的最大化


深度学习概述
  • 深度学习是一种表示(representation)学习通用框架
  • 给定对象
  • 学习为了实现获取目标所必需的表示
  • 直接从原始输入中获取
  • 使用最小化的域知识


来源:deepmind.com 作者:David Silver 翻译:胡祥杰

deep_rl_tutorialPDF第000页.jpg

deep_rl_tutorialPDF第001页.jpg

deep_rl_tutorialPDF第002页.jpg

deep_rl_tutorialPDF第003页.jpg

deep_rl_tutorialPDF第004页.jpg

deep_rl_tutorialPDF第005页.jpg

deep_rl_tutorialPDF第006页.jpg

deep_rl_tutorialPDF第007页.jpg

deep_rl_tutorialPDF第008页.jpg

deep_rl_tutorialPDF第009页.jpg

deep_rl_tutorialPDF第010页.jpg

deep_rl_tutorialPDF第011页.jpg

deep_rl_tutorialPDF第012页.jpg

deep_rl_tutorialPDF第013页.jpg

deep_rl_tutorialPDF第014页.jpg

deep_rl_tutorialPDF第015页.jpg

deep_rl_tutorialPDF第016页.jpg

deep_rl_tutorialPDF第017页.jpg

deep_rl_tutorialPDF第018页.jpg

deep_rl_tutorialPDF第019页.jpg

deep_rl_tutorialPDF第020页.jpg

deep_rl_tutorialPDF第021页.jpg

deep_rl_tutorialPDF第022页.jpg

deep_rl_tutorialPDF第023页.jpg

deep_rl_tutorialPDF第024页.jpg

deep_rl_tutorialPDF第025页.jpg

deep_rl_tutorialPDF第026页.jpg

deep_rl_tutorialPDF第027页.jpg

deep_rl_tutorialPDF第028页.jpg

deep_rl_tutorialPDF第029页.jpg

deep_rl_tutorialPDF第030页.jpg

deep_rl_tutorialPDF第031页.jpg

deep_rl_tutorialPDF第032页.jpg

deep_rl_tutorialPDF第033页.jpg

deep_rl_tutorialPDF第034页.jpg

deep_rl_tutorialPDF第035页.jpg

deep_rl_tutorialPDF第036页.jpg

deep_rl_tutorialPDF第037页.jpg

deep_rl_tutorialPDF第038页.jpg

deep_rl_tutorialPDF第039页.jpg

deep_rl_tutorialPDF第040页.jpg

deep_rl_tutorialPDF第041页.jpg

deep_rl_tutorialPDF第042页.jpg

deep_rl_tutorialPDF第043页.jpg

deep_rl_tutorialPDF第044页.jpg

deep_rl_tutorialPDF第045页.jpg

deep_rl_tutorialPDF第046页.jpg

deep_rl_tutorialPDF第047页.jpg

deep_rl_tutorialPDF第048页.jpg

deep_rl_tutorialPDF第049页.jpg

deep_rl_tutorialPDF第050页.jpg

deep_rl_tutorialPDF第051页.jpg

deep_rl_tutorialPDF第052页.jpg

deep_rl_tutorialPDF第053页.jpg

deep_rl_tutorialPDF第054页.jpg

deep_rl_tutorialPDF第055页.jpg

deep_rl_tutorialPDF第056页.jpg

deep_rl_tutorialPDF第057页.jpg

deep_rl_tutorialPDF第058页.jpg

deep_rl_tutorialPDF第059页.jpg

deep_rl_tutorialPDF第060页.jpg

deep_rl_tutorialPDF第061页.jpg

deep_rl_tutorialPDF第062页.jpg

deep_rl_tutorialPDF第063页.jpg

deep_rl_tutorialPDF第064页.jpg

deep_rl_tutorialPDF第065页.jpg






最新热门
 
相关知识
邮件订阅

Copyright© 2005-2018 USEIT.COM.CN|帮助中心|关于我们|注册协议|投诉指引|获取积分|投稿须知|作者权益|下载须知|常见问题|联系我们|手机版|USEIT Inc.

GMT+8, 2020-5-27 16:45 , Processed in 0.221480 second(s), 20 queries , Gzip On, MemCache On.

鄂公网安备 42011202000160号 鄂ICP备13013806号-1

网络经济主体信息湖北省互联网举报平台 中国互联网违法和不良信息举报中心

快速回复 返回顶部 返回列表