控制系统与强化学习 机械工业出版社 9787111775768

配送至
$ $ USD 美元

开本:16开
纸张:胶版纸
包装:平装-胶订
是否套装:否
国际标准书号ISBN:9787111775768
所属分类:图书>计算机/网络>硬件外部设备维修
编辑推荐
本书旨在以一种易于理解的方式解释强化学习和很优控制背后的科学,读者只需要具有微积分和矩阵代数背景即可。本书的独特之处在于通过算法设计来获得学习算法最快收敛速度,以及对为什么强化学习有时会失败的洞见。本书通过使用更直观的确定性探索代替随机探索进行学习,从一开始就避免了高级随机过程理论。一旦读者理解了这些思想,就不难掌握植根于随机控制的技术。本书共分为两部分:第一部分介绍无噪声情况下的基础知识;第二部分介绍强化学习与随机控制。本书适合控制相关专业研究生、高年级本科生,以及对控制工程和强化学习感兴趣的工程师阅读。商品详情内容简介
一个高中生可以创建深度的代码来控制她的机器人,却不了解 深度 或 的含义,也不知道为什么代码有时会失败。本书旨在以具有微积分和矩阵代数背景的学生可以理解的方式,解释强化学习和优化控制背后的科学。本书的一个独特重点是算法设计,以获得学习算法的快收敛速度,以及对强化学习有时失败的原因的洞察。一开始就避开了高级随机过程理论,用更直观的确定性探测来代替学习的随机探索。一旦理解了这些思想,掌握植根于随机控制的技术就不难了。这些主题在本书的第二部分有所涉及,从马尔科夫链理论开始,以对强化学习的行为者批评方法的全新审视结束。

目 录
译者序

第章引言
本书涵盖的内容
未深入探讨的内容
参考资料
第一部分无噪声情况下的基础知识
第章控制理论概述
身边的控制问题
该怎么办
状态空间模型
充分统计量与非线性状态空间模型
状态增广和学习
线性状态空间模型 译者序

前言

第章引言

本书涵盖的内容

未深入探讨的内容

参考资料

第一部分无噪声情况下的基础知识

第章控制理论概述

身边的控制问题

该怎么办

状态空间模型

充分统计量与非线性状态空间模型

状态增广和学习

线性状态空间模型

向牛顿和莱布尼茨致敬

稳定性和性能

总成本

平衡点的稳定性

李雅普诺夫函数

技术证明

连续时间域的几何

线性状态空间模型

展望未来:从控制理论到强化学习

演员评论家

时间差分

老虎机与探索

显示全部信息