
开本:16开 |
纸张:胶版纸 |
包装:平装-胶订 |
是否套装:否 |
国际标准书号ISBN:9787302685913 |
所属分类:图书>计算机/网络>计算机理论 |
商品详情内容简介
本书循序渐进地讲解了使用语言实现强化学习的核心算法开发的知识,内容涵盖了数据处理、算法、大模型等知识,并通过具体实例的实现过程演练了各个知识点的使用方法和使用流程。《强化学习基础、原理与应用》共分为章,主要内容包括强化学习基础、马尔可夫决策过程、蒙特卡洛方法、与贝尔曼方程、时序差分学习和算法、算法、算法、竞争算法、算法、算法、算法、算法、连续动作空间的强化学习、值分布式算法、基于模型的强化学习、多智能体强化学习实战: 游戏及自动驾驶系统。本书内容简洁而不失技术深度,以极简的文字介绍了复杂的案例,易于阅读和理解。
本书适用于已经了解语言基础语法的读者,想进一步学习强化学习、机器学习、深度学习及相关技术的读者,还可作为大专院校相关专业的师生用书和培训机构的教材使用。
目 录
第章强化学习基础
强化学习概述
强化学习的背景
强化学习的核心特点
强化学习与其他机器学习方法的区别
强化学习的应用领域
机器人控制与路径规划
游戏与虚拟环境
金融与投资决策
自动驾驶与智能交通
自然语言处理
强化学习中的常用概念。
智能体、环境与交互
奖励与回报的概念第章强化学习基础
强化学习概述
强化学习的背景
强化学习的核心特点
强化学习与其他机器学习方法的区别
强化学习的应用领域
机器人控制与路径规划
游戏与虚拟环境
金融与投资决策
自动驾驶与智能交通
自然语言处理
强化学习中的常用概念。
智能体、环境与交互
奖励与回报的概念
马尔可夫性质与马尔可夫决策过程
策略与价值函数
第章马尔可夫决策过程
马尔可夫决策过程的定义
马尔可夫决策过程的核心思想
马尔可夫决策过程的形式化定义
……
显示全部信息
作者简介
张百珂,计算机硕士,前百度云研发工程师,在大规模机器学习、深度学习、数据搜索、行业垂直应用、研发管理等领域拥有丰富经验。在企业智能化转型、业务线上化经营,拥有丰富的大规模搜索架构、个性化推荐架构、机器学习系统架构经验和技术团队管理经验。现在从事与城市大数据中心的开发和建设工作,将深度学习运用到数字经济利领域。
本书循序渐进地讲解了使用语言实现强化学习的核心算法开发的知识,内容涵盖了数据处理、算法、大模型等知识,并通过具体实例的实现过程演练了各个知识点的使用方法和使用流程。《强化学习基础、原理与应用》共分为章,主要内容包括强化学习基础、马尔可夫决策过程、蒙特卡洛方法、与贝尔曼方程、时序差分学习和算法、算法、算法、竞争算法、算法、算法、算法、算法、连续动作空间的强化学习、值分布式算法、基于模型的强化学习、多智能体强化学习实战: 游戏及自动驾驶系统。本书内容简洁而不失技术深度,以极简的文字介绍了复杂的案例,易于阅读和理解。
本书适用于已经了解语言基础语法的读者,想进一步学习强化学习、机器学习、深度学习及相关技术的读者,还可作为大专院校相关专业的师生用书和培训机构的教材使用。
目 录
第章强化学习基础
强化学习概述
强化学习的背景
强化学习的核心特点
强化学习与其他机器学习方法的区别
强化学习的应用领域
机器人控制与路径规划
游戏与虚拟环境
金融与投资决策
自动驾驶与智能交通
自然语言处理
强化学习中的常用概念。
智能体、环境与交互
奖励与回报的概念第章强化学习基础
强化学习概述
强化学习的背景
强化学习的核心特点
强化学习与其他机器学习方法的区别
强化学习的应用领域
机器人控制与路径规划
游戏与虚拟环境
金融与投资决策
自动驾驶与智能交通
自然语言处理
强化学习中的常用概念。
智能体、环境与交互
奖励与回报的概念
马尔可夫性质与马尔可夫决策过程
策略与价值函数
第章马尔可夫决策过程
马尔可夫决策过程的定义
马尔可夫决策过程的核心思想
马尔可夫决策过程的形式化定义
……
显示全部信息
作者简介
张百珂,计算机硕士,前百度云研发工程师,在大规模机器学习、深度学习、数据搜索、行业垂直应用、研发管理等领域拥有丰富经验。在企业智能化转型、业务线上化经营,拥有丰富的大规模搜索架构、个性化推荐架构、机器学习系统架构经验和技术团队管理经验。现在从事与城市大数据中心的开发和建设工作,将深度学习运用到数字经济利领域。