深度强化学习算法原理与实战 基于MATLAB 化学工业出版社 9787122475756

配送至
$ $ USD 美元

开本:16开
纸张:胶版纸
包装:平装-胶订
是否套装:否
国际标准书号ISBN:9787122475756
所属分类:图书>计算机/网络>计算机理论
新华书店正版,关注店铺成为会员可享店铺专属优惠,团购客户请咨询在线客服!重磅推荐
鬼灭之刃漫画全套无删减版册 鬼灭之刃无限城篇鬼灭之刃公式书台鬼灭之刃见闻录心理学简体中文版吾峠呼世晴著日番超人气热血漫画书咒术回战日本动漫小说畅销书籍 浙江人民美术出版社
券限时抢


【人教版】朝花夕拾鲁迅原著正版和西游记七八九年级上下 鲁滨逊漂流记骆驼祥子海底两万里经典常谈钢铁是怎样炼成的简爱儒林外史红星照耀中国昆虫记艾青诗选初中生必读课外书七年级必读书目人民教育出版社
券限时抢赠品


人教版快乐读书吧一二三四五六年级上下册全套和大人一起读人教版读读童谣和儿歌小鲤鱼跳龙门中国古代寓言安徒生童话学生阅读课外书一二三四年级必读经典书目课外阅读必读书老师推荐
券限时抢

红岩红星照耀中国青少版插图版昆虫记人教版正版原著完整版八年级上册的课外书初二课外阅读书籍人教上昆虫记经典常谈钢铁是怎样炼成的下册阅读名著人民文学出版社
券限时抢


如果历史是一群喵晚清残晖篇 历史喵肥志历史喵系列新作 假如历史是一群喵肥志漫画中国史系列第十六册 中国历史漫画书籍自营正版


【人民文学任选】经典名著口碑版本语文推荐阅读丛书人民文学出版社呼兰河传乡土中国海底两万里钢铁是怎样炼成的儒林外史骑鹅旅行记初中生必读课外书七年级必读书目人民文学出版社
券限时抢赠品


内容简介

本书在详细阐述强化学习基本概念与基本理论的基础上,循序渐进地介绍了深度强化学习各常用算法的基本思想、算法伪代码、算法实现、基于实例的算法演示与程序分析等内容。具体介绍了算法求解很优路径问题,算法求解很优安全路径问题,策略迭代算法求解两地租车很优调度问题,价值选代算法求解很优路径问题,算法求解平衡系统的很优控制问题,算法求解双积分系统的很优控制问题,类算法求解股票交易的很优推荐策略,算法求解机器人手臂控球平衡问题,算法求解飞行器平稳着陆很优控制问题,算法求解四足机器人行走控制策略问题,算法求解控制器参数整定问题,多智能体强化学习的基本概念与基本方法,算法求解多智能体协作运送物体问题,算法与算法求解协作竞争探索区域问题,与算法求解车辆路径跟踪控制问题。
本书可作为高等院校深度强化学习课程的教材,亦可作为本科生毕业设计、研究生项目设计和广大科研人员的技术参考用书。

作者简介


目 录
第章 强化学习的基本概念与基本理论
强化学习研究的问题及基本概念
一些强化学习研究实例
智能体
环境
状态及其观测
状态转移概率
动作
奖励
策略
马尔可夫决策过程
马尔可夫性质与转移概率
轨迹、回合及经验转换样本
回报及现率第章 强化学习的基本概念与基本理论
强化学习研究的问题及基本概念
一些强化学习研究实例
智能体
环境
状态及其观测
状态转移概率
动作
奖励
策略
马尔可夫决策过程
马尔可夫性质与转移概率
轨迹、回合及经验转换样本
回报及现率
马尔可夫决策过程的数学记号及其含义
强化学习的基本函数
……

显示全部信息

商品详情