
开本:16开 |
纸张:胶版纸 |
包装:平装-胶订 |
是否套装:否 |
国际标准书号ISBN:9787302681472 |
所属分类:图书>计算机/网络>程序设计>Python |
博客专家力作系统、深入剖析机器学习算法原理和模型构建结合大量实例和个项目实战案例全面展现各种算法的实际应用与实践个小贴士个避坑提示道实训题送程序源码教学
编辑推荐
全面、深入剖析机器学习的算法原理和模型构建等核心技术。
结合大量实例和两个实战项目案例展现各种算法的实际应用。
详解监督学习、无监督学习和强化学习的理论基础与应用场景。
详解模型训练中的风险函数、参数寻优方法,以及欠拟合与过拟合解决方案。
深入解析机器学习常用经典模型的基本原理及其实现。
详解数据标准化、异常值检测、缺失值处理和特征筛选等数据预处理技术。
详解两个典型项目实战案例,带领读者动手实践,提高实际开发水平。
内容丰富:详解机器学习的基础知识和相关算法原理并进行实践,还对深度学习的基础知识进行讲解,帮助读者系统掌握机器学习的完整知识体系。
循序渐进:从机器学习的基本概念和环境搭建开始讲解,逐步深入其算法原理和模型构建等核心技术,最后进行项目实战,学习梯度非常平滑。
理论结合实践:不仅深入剖析机器学习的常用算法原理和模型构建方法,而且基于进行实践,从理论和实践两个维度展现其核心技术。
案例实战:通过行人检测和厨余垃圾处理的指标预测两个典型案例,带领读者进行项目实战,提高他们的动手能力和开发水平。
经验总结:归纳和总结大量的实战经验和技巧,并给出多个“避坑”提示,帮助读者提高实战技能并避开一些弯路,从而更加顺利地进行学习与实践。
配实训习题:提供大量的实训习题并给出参考答案和解题代码,让读者通过动手练习更好地掌握和巩固相关知识。
赠超值资源:附赠程序源代码和教学等学习资源,便于读者高效、直观地学习,也方便高等院校的相关授课老师教学时使用。
前 言
在长期的机器学习研究和应用实践中,笔者深刻地体会到了语言的巨大优势:它生态系统完整,拥有大量现成的数据分析和机器学习库,如、和等,无论是数据预处理和特征解析,还是模型构建和结果分析等,这些库都能提供高效且简洁的解决方案,从而帮助研发人员较为轻松地实现复杂的机器学习算法应用。
为了帮助读者全面、深入地理解机器学习的基本原理并进行应用实践,笔者结合自己多年的机器学习研发和实践经验编写了本书。相信通过本书,可以帮助读者全面、系统、深入地掌握机器学习的相关基础知识和核心技术,从而对机器学习的相关算法原理和模型构建方法等知识有一个全面、深入的理解,为从事相关研发工作打好基础。
本书特色
内容丰富:详细讲解机器学习的基础知识和相关算法原理并进行应用实践,还对深度学习的基础知识进行讲解,从而帮助读者系统掌握机器学习完整的知识体系。
循序渐进:从机器学习的基本概念和环境搭建开始讲解,逐步深入机器学习的相关算法原理和模型构建等核心技术,最后进行项目实战,学习梯度非常平滑。
理论结合实践:不仅深入剖析机器学习的常用算法原理和模型构建方法,而且结合大量实例用语言进行实践,从理论和实践两个维度带领读者学习机器学习的相关知识。
随着大数据和人工智能的快速发展,机器学习在各行各业中的应用变得越来越广泛和深入,从推荐系统和图像处理到自然语言处理,都无不体现出机器学习技术的强大。在面对复杂的机器学习模型和大规模数据时,像这样的传统数据处理工具往往显得力不从心,而作为一款高效、简洁的编程语言,不仅功能强大,而且有丰富的文档和社区支持,能轻松解决这些问题,因此成为机器学习领域的首选工具。
在长期的机器学习研究和应用实践中,笔者深刻地体会到了语言的巨大优势:它生态系统完整,拥有大量现成的数据分析和机器学习库,如、和等,无论是数据预处理和特征解析,还是模型构建和结果分析等,这些库都能提供高效且简洁的解决方案,从而帮助研发人员较为轻松地实现复杂的机器学习算法应用。
为了帮助读者全面、深入地理解机器学习的基本原理并进行应用实践,笔者结合自己多年的机器学习研发和实践经验编写了本书。相信通过本书,可以帮助读者全面、系统、深入地掌握机器学习的相关基础知识和核心技术,从而对机器学习的相关算法原理和模型构建方法等知识有一个全面、深入的理解,为从事相关研发工作打好基础。
本书特色
内容丰富:详细讲解机器学习的基础知识和相关算法原理并进行应用实践,还对深度学习的基础知识进行讲解,从而帮助读者系统掌握机器学习完整的知识体系。
循序渐进:从机器学习的基本概念和环境搭建开始讲解,逐步深入机器学习的相关算法原理和模型构建等核心技术,最后进行项目实战,学习梯度非常平滑。
理论结合实践:不仅深入剖析机器学习的常用算法原理和模型构建方法,而且结合大量实例用语言进行实践,从理论和实践两个维度带领读者学习机器学习的相关知识。
案例实战:通过行人检测和厨余垃圾处理的指标预测两个典型案例带领读者进行项目实战,从而提高他们的实际动手能力和开发水平。
经验总结:讲解中给出笔者归纳和总结的大量实战经验及技巧,并给出多个“避坑”提示,帮助读者提高实战技能并避开一些弯路,从而更加顺利地进行机器学习应用实践。
配实训习题:除项目实战外的各章均提供大量的实训习题并给出参考答案和解题代码,让读者通过动手练习能够更好地掌握和巩固相关知识。
赠超值资料:附赠实例源代码和教学等学习资料,便于读者高效、直观地学习,也方便高等院校相关授课老师教学时使用。
本书内容
本书共章,分为篇,分别是机器学习基础知识、机器学习核心技术、机器学习项目实战。
第篇 机器学习基础知识
本篇包括第~章,首先介绍机器学习的基本概念,帮助读者理解机器学习的定义、作用和各种不同类型的机器学习方法;然后详细介绍机器学习的基本流程,从一元线性回归模型开始,逐步介绍模型的基本概念、训练过程和评价方法等;接着介绍开发环境的搭建和常用工具箱的使用,以及多元线性回归和逻辑回归及其实现;最后介绍基于的机器学习云平台搭建。
通过学习本篇内容,读者可以初步掌握机器学习的基础知识,为后续章节的算法学习和模型构建打好基础。
第篇 机器学习核心技术
本篇包括第~章,主要介绍模型训练的数学原理、多样性特征解析、数据标准化与特征筛选、贝叶斯分类器、广义线性模型、支持向量机、决策树、人工神经网络(神经网络、卷积神经网络)、集成学习、模型的正则化、模型的评价与选择、无监督学习(如聚类、聚类、谱聚类、密度聚类)等相关知识。本篇不但详细介绍机器学习相关算法和模型的基本原理,而且给出多个典型实例并用语言进行实现,从而带领读者进行机器学习应用实践。
通过学习本篇内容,读者可以全面、深入地理解机器学习的算法原理和模型构建方法等核心技术,为后续章节的机器学习项目实战打好基础。
第篇 机器学习项目实战
本篇包括第、章,主要通过行人检测和厨余垃圾处理的指标预测两个典型案例带领读者进行项目实战,帮助读者将前面章节所学的知识应用到实际问题的解决之中。本篇不但详细介绍项目的技术清单、数据读取与预处理,而且详细介绍项目的模型筛选、训练与应用等。
通过学习本篇内容,读者可以巩固和应用前面章节所学的知识,并了解机器学习项目开发的基本流程,从而提高实际动手能力,为自己的职业道路奠定基础。
附录主要介绍语言的基础知识,方便读者随时查阅语言的基础语法。
附录主要介绍模型和模型的保存与导入方法。
读者对象
机器学习入门与进阶人员;
机器学习应用开发人员;
深度学习入门人员;
数据处理与分析人员;
人工智能技术爱好者;
高等院校人工智能相关专业的学生。
本书约定
部分章节标题和习题前标注了星号(),表示这部分内容难度略大,属于拓展阅读部分。
讲解中穿插了“注意”和“提示”段落,用楷体编排,表示一些需要读者“避坑”的地方。
讲解中穿插了段落,用楷体编排,表示一些知识点的小贴士。
配套资源获取
本书提供的程序源代码和配套教学有两种获取方式:一是关注本书微信公众号(见书),回复数字“”获取下载链接;二是在清华大学出版社网站上搜索本书,然后在本书页面上找到“资源下载”栏目,单击“网络资源”或“课件下载”按钮进行下载。
售后支持
由于笔者水平有限,书中难免存在疏漏与不足之处,恳请广大读者批评与指正。读者在阅读本书时若有疑问,可发送电子邮件获取帮助。
卓泽滨
年月
显示全部信息
目 录
第章 机器学习的基本概念
机器学习的定义
机器学习的相关学科
机器学习与统计学习
机器学习的作用
机器学习的分类
监督学习
无监督学习
强化学习
其他
习题
参考文献
第章 机器学习的基本流程与模型
第篇 机器学习基础知识
第章 机器学习的基本概念
机器学习的定义
机器学习的相关学科
机器学习与统计学习
机器学习的作用
机器学习的分类
监督学习
无监督学习
强化学习
其他
习题
参考文献
第章 机器学习的基本流程与模型
从一元线性回归开始
实例:梅花鹿湿重预测
模型求解
模型评
机器学习模型
基本概念
参数模型与无参数模型
模型的训练过程
风险函数
参数寻优方法简介
模型的评价方法
评价拟合优度的常见指标
欠拟合与过拟合
防止过拟合的办法
简单的机器学习模型
一元非线性回归
曲线拟合工具
算法
小结
习题
参考文献
第章 搭建机器学习环境并进行应用实践
搭建开发环境
安装
安装模块
常用工具箱简介
函数句柄与搜索路径
优化工具箱
统计与机器学习工具箱
深度学习工具箱
其他有用的工具
多元线性回归及其实现
案例:房价预测
多元线性回归的一般步骤
实现
回归
逻辑回归及其实现
逻辑回归的原理
逻辑回归的训练
分类阈值的选取
实例:鸢尾花分类问题
类别不均衡
多分类转换为二分类
习题
参考文献
第章 基于的机器学习云平台搭建
注册
注册步骤
登录
创建机器学习工作区
订阅
创建机器学习工作区
使用机器学习
启动工作室
新建
在中执行简单的机器学习任务
习题
第篇 机器学习核心技术
第章 模型训练的数学原理
风险函数
最小二乘法
极大似然法
极大后验假设法
基于信息论的风险函数
模型训练与优化问题
线性搜索
法
步长选取准则
对应的搜索算法
常见的优化算法
梯度下降法
坐标下降法
牛顿法
拟牛顿法
收敛速率
几何分析
随机搜索算法
随机梯度下降法
单位化梯度
动量法
单位化结合动量法
约束优化方法
其他优化算法
网格寻优法
模拟退火法
遗传算法
习题
参考文献
第章 多样性特征解析
类别变量处理
有序类别变量
无序类别变量
字典变量
变量离散化
文本处理
文本预处理
词汇处理
特征提取
网页处理
汉语言处理
图像处理
图像读取
图像转换
图像缩放
边缘检测
边角检测
图像转特征
习题
参考文献
第章 数据标准化与特征筛选
数据标准化
特征标准化
对稀疏矩阵的标准化
个体标准化
非线性标准化
异常值检测
四分差法
正态分布法
聚类法
法
监督学习法
缺失值处理
统计量替代法
一元回归模型法
子模型法
特征过滤
维度灾难
方差过滤法
相关系数过滤法
单因素方差分析
递归特征删除
特征降维
主成分分析
的核函数
习题
参考文献
第章 贝叶斯分类器
贝叶斯理论
概率论基础
贝叶斯公式
朴素贝叶斯分类器
朴素贝叶斯分类器的原理
拉普拉斯修正
朴素贝叶斯分类器的实现
实例:邮件过滤器的实现
贝叶斯网络
贝叶斯网络的基本概念
贝叶斯网络的构成
贝叶斯网络的查询
贝叶斯网络的实现
半朴素贝叶斯分类器
删除法
删除结合法
网络法
习题
参考文献
第章 广义线性模型
广义线性模型简介
经典线性模型的缺陷
广义线性模型的原理
指数族分布
指数族分布简介
常见的分布
模型求解
回归
回归的原理
模型训练
实例:手写体识别模型
习题
参考文献
第章 支持向量机
支持向量机的基本原理
划分超平面与间隔
支持向量机的基本模型
支持向量分类器
线性硬间隔分类器
线性软间隔分类器
核函数与非线性分类器
支持向量分类器
支持向量回归机
ε带超平面
线性硬间隔回归机
线性软间隔回归机
支持向量机回归
支持向量机的实现
软间隔的实现
核软间隔
的实现
软间隔的实现
习题
参考文献
第章 决策树
决策树简介
决策树的结构
决策树的使用
分类决策树
构造分类决策树
模型求解
剪枝处理
分类决策树的实现案例
回归决策树
模型训练与求解
回归决策树的实现案例
模型缺点与实践技巧
习题
参考文献
第章 人工神经网络
人工神经网络简介
神经网络的原理
多层感知器
神经网络
神经网络的构成
神经网络的训练
神经网络的实现
与的交互
卷积神经网络
卷积层
池化层
层
卷积神经网络的实现
习题
参考文献
第章 集成学习
集成学习简介
集成算法简介
集成学习的优点
集成与随机森林
集成的原理
随机森林的原理
集成与随机森林的实现
集成与集成
集成的原理
集成的实现
集成
集成的原理
集成的实现
习题
参考文献
第章 模型的正则化
结构风险与正则化
经验风险与过拟合
结构风险与正则化
正则化的原理
常见模型的正则化
广义线性回归模型的正则化
其他模型的正则化
正则化的实现
与的正则化
的正则化
习题
参考文献
第章 模型的评价与选择
没有免费午餐定理
模型评价指标
回归指标
分类指标
拆分数据集
模型选择
验证集法
自助采样法
交叉验证法
留一法
检验法
参数选择
遍历法
网格寻优法
流程总结
选择模型的整体流程
案例:葡萄酒分类模型
习题
参考文献
第章 无监督学习
聚类简介
聚类算法
聚类的原理
聚类的实现
聚类的缺点
聚类
的原理
聚类的实现
聚类簇数的选择
的缺点
谱聚类
谱聚类的原理
谱聚类算法
谱聚类的实现
谱聚类的优缺点
密度聚类
密度聚类算法的原理
密度聚类算法的实现
密度聚类算法的优缺点
深度自动编码器
深度自动编码器的原理
深度自动编码器的实现
习题
参考文献
第篇 机器学习项目实战
第章 行人检测项目
技术清单
项目描述
数据读取与预处理
读取图像
数据预处理
参数筛选与模型筛选
参数筛选
模型筛选
模型应用
动态窗口调整与行人检测模型的改进
第章 厨余垃圾处理的指标预测项目
技术清单
项目描述
数据读取与预处理
参数筛选与模型筛选
参数筛选
模型筛选
神经网络预测产出物
神经网络
集成神经网络
正常范围分析
预测产出物的挑战与解决方法
附录 语言基础知识
注释
导入模块
常用的数据结构
结构表达式
自定义函数
模块化编程
附录 模型的保存与导入
保存与导入模型
保存与导入模型
显示全部信息
媒体评论
本书核心知识点
? 机器学习基本概念:从机器学习的定义、作用和分类入手,帮助读者建立扎实的理论基础。
? 机器学习的基本流程:通过一元线性回归实例,逐步引入模型训练、评价方法与简单的机器学习模型的实现,确保读者能够掌握从数据处理到模型构建的基本过程。
? 编程环境与应用实践:详解环境的搭建和工具箱的使用,并通过具体实例展现多元线性回归和逻辑回归的实现。
? 模型训练的数学原理:深入探讨风险函数和优化算法在模型训练中的应用,从而加深读者对机器学习核心算法的理解。
? 数据处理与特征工程:详解类别变量处理、文本处理和图像处理,以及数据标准化和特征筛选方法,帮助读者掌握数据预处理的关键技术。
? 机器学习经典模型:详解贝叶斯分类器、广义线性模型、支持向量机、决策树和人工神经网络等经典模型的原理及其实现,帮助读者构建和应用这些模型。
? 集成学习与模型正则化:详解、和等集成方法,以及模型的正则化技术,帮助读者提升模型的性能和健壮性。
? 模型评价与选择:探讨不同的模型评价指标和选择方法,帮助读者掌握在实际项目中进行模型评估和优化的方法。本书核心知识点
? 机器学习基本概念:从机器学习的定义、作用和分类入手,帮助读者建立扎实的理论基础。
? 机器学习的基本流程:通过一元线性回归实例,逐步引入模型训练、评价方法与简单的机器学习模型的实现,确保读者能够掌握从数据处理到模型构建的基本过程。
? 编程环境与应用实践:详解环境的搭建和工具箱的使用,并通过具体实例展现多元线性回归和逻辑回归的实现。
? 模型训练的数学原理:深入探讨风险函数和优化算法在模型训练中的应用,从而加深读者对机器学习核心算法的理解。
? 数据处理与特征工程:详解类别变量处理、文本处理和图像处理,以及数据标准化和特征筛选方法,帮助读者掌握数据预处理的关键技术。
? 机器学习经典模型:详解贝叶斯分类器、广义线性模型、支持向量机、决策树和人工神经网络等经典模型的原理及其实现,帮助读者构建和应用这些模型。
? 集成学习与模型正则化:详解、和等集成方法,以及模型的正则化技术,帮助读者提升模型的性能和健壮性。
? 模型评价与选择:探讨不同的模型评价指标和选择方法,帮助读者掌握在实际项目中进行模型评估和优化的方法。
? 无监督学习:深入讲解聚类算法、高斯混合模型、谱聚类和深度自动编码器等无监督学习方法及其应用。
? 机器学习项目实战:通过行人检测和厨余垃圾处理的指标预测两个典型项目案例,展示机器学习在不同领域的应用,帮助读者将所学知识转化为实际能力。
显示全部信息
作者简介
卓泽滨, 毕业于华南理工大学。在校期间获得全国大学生数学建模竞赛省二等奖、认证杯国际建模比赛国际赛奖(二等奖)、高校数学建模挑战赛全国三等奖和泰迪杯数据挖掘挑战赛全国二等奖等。开通博客,发表技术博文余篇,阅读量高达万。毕业后供职于中国电器科学研究院股份有限公司,任开发工程师。申请两项发明专利。考取了工程和信息化部教育与考试中心颁发的软件评测工程师证书和泰迪智能研究院国际培训中心颁发的大数据分析工程师证书。对机器学习和深度学习等人工智能开发技术有广泛的涉猎和深入的研究。
编辑推荐
全面、深入剖析机器学习的算法原理和模型构建等核心技术。
结合大量实例和两个实战项目案例展现各种算法的实际应用。
详解监督学习、无监督学习和强化学习的理论基础与应用场景。
详解模型训练中的风险函数、参数寻优方法,以及欠拟合与过拟合解决方案。
深入解析机器学习常用经典模型的基本原理及其实现。
详解数据标准化、异常值检测、缺失值处理和特征筛选等数据预处理技术。
详解两个典型项目实战案例,带领读者动手实践,提高实际开发水平。
内容丰富:详解机器学习的基础知识和相关算法原理并进行实践,还对深度学习的基础知识进行讲解,帮助读者系统掌握机器学习的完整知识体系。
循序渐进:从机器学习的基本概念和环境搭建开始讲解,逐步深入其算法原理和模型构建等核心技术,最后进行项目实战,学习梯度非常平滑。
理论结合实践:不仅深入剖析机器学习的常用算法原理和模型构建方法,而且基于进行实践,从理论和实践两个维度展现其核心技术。
案例实战:通过行人检测和厨余垃圾处理的指标预测两个典型案例,带领读者进行项目实战,提高他们的动手能力和开发水平。
经验总结:归纳和总结大量的实战经验和技巧,并给出多个“避坑”提示,帮助读者提高实战技能并避开一些弯路,从而更加顺利地进行学习与实践。
配实训习题:提供大量的实训习题并给出参考答案和解题代码,让读者通过动手练习更好地掌握和巩固相关知识。
赠超值资源:附赠程序源代码和教学等学习资源,便于读者高效、直观地学习,也方便高等院校的相关授课老师教学时使用。
前 言
在长期的机器学习研究和应用实践中,笔者深刻地体会到了语言的巨大优势:它生态系统完整,拥有大量现成的数据分析和机器学习库,如、和等,无论是数据预处理和特征解析,还是模型构建和结果分析等,这些库都能提供高效且简洁的解决方案,从而帮助研发人员较为轻松地实现复杂的机器学习算法应用。
为了帮助读者全面、深入地理解机器学习的基本原理并进行应用实践,笔者结合自己多年的机器学习研发和实践经验编写了本书。相信通过本书,可以帮助读者全面、系统、深入地掌握机器学习的相关基础知识和核心技术,从而对机器学习的相关算法原理和模型构建方法等知识有一个全面、深入的理解,为从事相关研发工作打好基础。
本书特色
内容丰富:详细讲解机器学习的基础知识和相关算法原理并进行应用实践,还对深度学习的基础知识进行讲解,从而帮助读者系统掌握机器学习完整的知识体系。
循序渐进:从机器学习的基本概念和环境搭建开始讲解,逐步深入机器学习的相关算法原理和模型构建等核心技术,最后进行项目实战,学习梯度非常平滑。
理论结合实践:不仅深入剖析机器学习的常用算法原理和模型构建方法,而且结合大量实例用语言进行实践,从理论和实践两个维度带领读者学习机器学习的相关知识。
随着大数据和人工智能的快速发展,机器学习在各行各业中的应用变得越来越广泛和深入,从推荐系统和图像处理到自然语言处理,都无不体现出机器学习技术的强大。在面对复杂的机器学习模型和大规模数据时,像这样的传统数据处理工具往往显得力不从心,而作为一款高效、简洁的编程语言,不仅功能强大,而且有丰富的文档和社区支持,能轻松解决这些问题,因此成为机器学习领域的首选工具。
在长期的机器学习研究和应用实践中,笔者深刻地体会到了语言的巨大优势:它生态系统完整,拥有大量现成的数据分析和机器学习库,如、和等,无论是数据预处理和特征解析,还是模型构建和结果分析等,这些库都能提供高效且简洁的解决方案,从而帮助研发人员较为轻松地实现复杂的机器学习算法应用。
为了帮助读者全面、深入地理解机器学习的基本原理并进行应用实践,笔者结合自己多年的机器学习研发和实践经验编写了本书。相信通过本书,可以帮助读者全面、系统、深入地掌握机器学习的相关基础知识和核心技术,从而对机器学习的相关算法原理和模型构建方法等知识有一个全面、深入的理解,为从事相关研发工作打好基础。
本书特色
内容丰富:详细讲解机器学习的基础知识和相关算法原理并进行应用实践,还对深度学习的基础知识进行讲解,从而帮助读者系统掌握机器学习完整的知识体系。
循序渐进:从机器学习的基本概念和环境搭建开始讲解,逐步深入机器学习的相关算法原理和模型构建等核心技术,最后进行项目实战,学习梯度非常平滑。
理论结合实践:不仅深入剖析机器学习的常用算法原理和模型构建方法,而且结合大量实例用语言进行实践,从理论和实践两个维度带领读者学习机器学习的相关知识。
案例实战:通过行人检测和厨余垃圾处理的指标预测两个典型案例带领读者进行项目实战,从而提高他们的实际动手能力和开发水平。
经验总结:讲解中给出笔者归纳和总结的大量实战经验及技巧,并给出多个“避坑”提示,帮助读者提高实战技能并避开一些弯路,从而更加顺利地进行机器学习应用实践。
配实训习题:除项目实战外的各章均提供大量的实训习题并给出参考答案和解题代码,让读者通过动手练习能够更好地掌握和巩固相关知识。
赠超值资料:附赠实例源代码和教学等学习资料,便于读者高效、直观地学习,也方便高等院校相关授课老师教学时使用。
本书内容
本书共章,分为篇,分别是机器学习基础知识、机器学习核心技术、机器学习项目实战。
第篇 机器学习基础知识
本篇包括第~章,首先介绍机器学习的基本概念,帮助读者理解机器学习的定义、作用和各种不同类型的机器学习方法;然后详细介绍机器学习的基本流程,从一元线性回归模型开始,逐步介绍模型的基本概念、训练过程和评价方法等;接着介绍开发环境的搭建和常用工具箱的使用,以及多元线性回归和逻辑回归及其实现;最后介绍基于的机器学习云平台搭建。
通过学习本篇内容,读者可以初步掌握机器学习的基础知识,为后续章节的算法学习和模型构建打好基础。
第篇 机器学习核心技术
本篇包括第~章,主要介绍模型训练的数学原理、多样性特征解析、数据标准化与特征筛选、贝叶斯分类器、广义线性模型、支持向量机、决策树、人工神经网络(神经网络、卷积神经网络)、集成学习、模型的正则化、模型的评价与选择、无监督学习(如聚类、聚类、谱聚类、密度聚类)等相关知识。本篇不但详细介绍机器学习相关算法和模型的基本原理,而且给出多个典型实例并用语言进行实现,从而带领读者进行机器学习应用实践。
通过学习本篇内容,读者可以全面、深入地理解机器学习的算法原理和模型构建方法等核心技术,为后续章节的机器学习项目实战打好基础。
第篇 机器学习项目实战
本篇包括第、章,主要通过行人检测和厨余垃圾处理的指标预测两个典型案例带领读者进行项目实战,帮助读者将前面章节所学的知识应用到实际问题的解决之中。本篇不但详细介绍项目的技术清单、数据读取与预处理,而且详细介绍项目的模型筛选、训练与应用等。
通过学习本篇内容,读者可以巩固和应用前面章节所学的知识,并了解机器学习项目开发的基本流程,从而提高实际动手能力,为自己的职业道路奠定基础。
附录主要介绍语言的基础知识,方便读者随时查阅语言的基础语法。
附录主要介绍模型和模型的保存与导入方法。
读者对象
机器学习入门与进阶人员;
机器学习应用开发人员;
深度学习入门人员;
数据处理与分析人员;
人工智能技术爱好者;
高等院校人工智能相关专业的学生。
本书约定
部分章节标题和习题前标注了星号(),表示这部分内容难度略大,属于拓展阅读部分。
讲解中穿插了“注意”和“提示”段落,用楷体编排,表示一些需要读者“避坑”的地方。
讲解中穿插了段落,用楷体编排,表示一些知识点的小贴士。
配套资源获取
本书提供的程序源代码和配套教学有两种获取方式:一是关注本书微信公众号(见书),回复数字“”获取下载链接;二是在清华大学出版社网站上搜索本书,然后在本书页面上找到“资源下载”栏目,单击“网络资源”或“课件下载”按钮进行下载。
售后支持
由于笔者水平有限,书中难免存在疏漏与不足之处,恳请广大读者批评与指正。读者在阅读本书时若有疑问,可发送电子邮件获取帮助。
卓泽滨
年月
显示全部信息
目 录
第章 机器学习的基本概念
机器学习的定义
机器学习的相关学科
机器学习与统计学习
机器学习的作用
机器学习的分类
监督学习
无监督学习
强化学习
其他
习题
参考文献
第章 机器学习的基本流程与模型
第篇 机器学习基础知识
第章 机器学习的基本概念
机器学习的定义
机器学习的相关学科
机器学习与统计学习
机器学习的作用
机器学习的分类
监督学习
无监督学习
强化学习
其他
习题
参考文献
第章 机器学习的基本流程与模型
从一元线性回归开始
实例:梅花鹿湿重预测
模型求解
模型评
机器学习模型
基本概念
参数模型与无参数模型
模型的训练过程
风险函数
参数寻优方法简介
模型的评价方法
评价拟合优度的常见指标
欠拟合与过拟合
防止过拟合的办法
简单的机器学习模型
一元非线性回归
曲线拟合工具
算法
小结
习题
参考文献
第章 搭建机器学习环境并进行应用实践
搭建开发环境
安装
安装模块
常用工具箱简介
函数句柄与搜索路径
优化工具箱
统计与机器学习工具箱
深度学习工具箱
其他有用的工具
多元线性回归及其实现
案例:房价预测
多元线性回归的一般步骤
实现
回归
逻辑回归及其实现
逻辑回归的原理
逻辑回归的训练
分类阈值的选取
实例:鸢尾花分类问题
类别不均衡
多分类转换为二分类
习题
参考文献
第章 基于的机器学习云平台搭建
注册
注册步骤
登录
创建机器学习工作区
订阅
创建机器学习工作区
使用机器学习
启动工作室
新建
在中执行简单的机器学习任务
习题
第篇 机器学习核心技术
第章 模型训练的数学原理
风险函数
最小二乘法
极大似然法
极大后验假设法
基于信息论的风险函数
模型训练与优化问题
线性搜索
法
步长选取准则
对应的搜索算法
常见的优化算法
梯度下降法
坐标下降法
牛顿法
拟牛顿法
收敛速率
几何分析
随机搜索算法
随机梯度下降法
单位化梯度
动量法
单位化结合动量法
约束优化方法
其他优化算法
网格寻优法
模拟退火法
遗传算法
习题
参考文献
第章 多样性特征解析
类别变量处理
有序类别变量
无序类别变量
字典变量
变量离散化
文本处理
文本预处理
词汇处理
特征提取
网页处理
汉语言处理
图像处理
图像读取
图像转换
图像缩放
边缘检测
边角检测
图像转特征
习题
参考文献
第章 数据标准化与特征筛选
数据标准化
特征标准化
对稀疏矩阵的标准化
个体标准化
非线性标准化
异常值检测
四分差法
正态分布法
聚类法
法
监督学习法
缺失值处理
统计量替代法
一元回归模型法
子模型法
特征过滤
维度灾难
方差过滤法
相关系数过滤法
单因素方差分析
递归特征删除
特征降维
主成分分析
的核函数
习题
参考文献
第章 贝叶斯分类器
贝叶斯理论
概率论基础
贝叶斯公式
朴素贝叶斯分类器
朴素贝叶斯分类器的原理
拉普拉斯修正
朴素贝叶斯分类器的实现
实例:邮件过滤器的实现
贝叶斯网络
贝叶斯网络的基本概念
贝叶斯网络的构成
贝叶斯网络的查询
贝叶斯网络的实现
半朴素贝叶斯分类器
删除法
删除结合法
网络法
习题
参考文献
第章 广义线性模型
广义线性模型简介
经典线性模型的缺陷
广义线性模型的原理
指数族分布
指数族分布简介
常见的分布
模型求解
回归
回归的原理
模型训练
实例:手写体识别模型
习题
参考文献
第章 支持向量机
支持向量机的基本原理
划分超平面与间隔
支持向量机的基本模型
支持向量分类器
线性硬间隔分类器
线性软间隔分类器
核函数与非线性分类器
支持向量分类器
支持向量回归机
ε带超平面
线性硬间隔回归机
线性软间隔回归机
支持向量机回归
支持向量机的实现
软间隔的实现
核软间隔
的实现
软间隔的实现
习题
参考文献
第章 决策树
决策树简介
决策树的结构
决策树的使用
分类决策树
构造分类决策树
模型求解
剪枝处理
分类决策树的实现案例
回归决策树
模型训练与求解
回归决策树的实现案例
模型缺点与实践技巧
习题
参考文献
第章 人工神经网络
人工神经网络简介
神经网络的原理
多层感知器
神经网络
神经网络的构成
神经网络的训练
神经网络的实现
与的交互
卷积神经网络
卷积层
池化层
层
卷积神经网络的实现
习题
参考文献
第章 集成学习
集成学习简介
集成算法简介
集成学习的优点
集成与随机森林
集成的原理
随机森林的原理
集成与随机森林的实现
集成与集成
集成的原理
集成的实现
集成
集成的原理
集成的实现
习题
参考文献
第章 模型的正则化
结构风险与正则化
经验风险与过拟合
结构风险与正则化
正则化的原理
常见模型的正则化
广义线性回归模型的正则化
其他模型的正则化
正则化的实现
与的正则化
的正则化
习题
参考文献
第章 模型的评价与选择
没有免费午餐定理
模型评价指标
回归指标
分类指标
拆分数据集
模型选择
验证集法
自助采样法
交叉验证法
留一法
检验法
参数选择
遍历法
网格寻优法
流程总结
选择模型的整体流程
案例:葡萄酒分类模型
习题
参考文献
第章 无监督学习
聚类简介
聚类算法
聚类的原理
聚类的实现
聚类的缺点
聚类
的原理
聚类的实现
聚类簇数的选择
的缺点
谱聚类
谱聚类的原理
谱聚类算法
谱聚类的实现
谱聚类的优缺点
密度聚类
密度聚类算法的原理
密度聚类算法的实现
密度聚类算法的优缺点
深度自动编码器
深度自动编码器的原理
深度自动编码器的实现
习题
参考文献
第篇 机器学习项目实战
第章 行人检测项目
技术清单
项目描述
数据读取与预处理
读取图像
数据预处理
参数筛选与模型筛选
参数筛选
模型筛选
模型应用
动态窗口调整与行人检测模型的改进
第章 厨余垃圾处理的指标预测项目
技术清单
项目描述
数据读取与预处理
参数筛选与模型筛选
参数筛选
模型筛选
神经网络预测产出物
神经网络
集成神经网络
正常范围分析
预测产出物的挑战与解决方法
附录 语言基础知识
注释
导入模块
常用的数据结构
结构表达式
自定义函数
模块化编程
附录 模型的保存与导入
保存与导入模型
保存与导入模型
显示全部信息
媒体评论
本书核心知识点
? 机器学习基本概念:从机器学习的定义、作用和分类入手,帮助读者建立扎实的理论基础。
? 机器学习的基本流程:通过一元线性回归实例,逐步引入模型训练、评价方法与简单的机器学习模型的实现,确保读者能够掌握从数据处理到模型构建的基本过程。
? 编程环境与应用实践:详解环境的搭建和工具箱的使用,并通过具体实例展现多元线性回归和逻辑回归的实现。
? 模型训练的数学原理:深入探讨风险函数和优化算法在模型训练中的应用,从而加深读者对机器学习核心算法的理解。
? 数据处理与特征工程:详解类别变量处理、文本处理和图像处理,以及数据标准化和特征筛选方法,帮助读者掌握数据预处理的关键技术。
? 机器学习经典模型:详解贝叶斯分类器、广义线性模型、支持向量机、决策树和人工神经网络等经典模型的原理及其实现,帮助读者构建和应用这些模型。
? 集成学习与模型正则化:详解、和等集成方法,以及模型的正则化技术,帮助读者提升模型的性能和健壮性。
? 模型评价与选择:探讨不同的模型评价指标和选择方法,帮助读者掌握在实际项目中进行模型评估和优化的方法。本书核心知识点
? 机器学习基本概念:从机器学习的定义、作用和分类入手,帮助读者建立扎实的理论基础。
? 机器学习的基本流程:通过一元线性回归实例,逐步引入模型训练、评价方法与简单的机器学习模型的实现,确保读者能够掌握从数据处理到模型构建的基本过程。
? 编程环境与应用实践:详解环境的搭建和工具箱的使用,并通过具体实例展现多元线性回归和逻辑回归的实现。
? 模型训练的数学原理:深入探讨风险函数和优化算法在模型训练中的应用,从而加深读者对机器学习核心算法的理解。
? 数据处理与特征工程:详解类别变量处理、文本处理和图像处理,以及数据标准化和特征筛选方法,帮助读者掌握数据预处理的关键技术。
? 机器学习经典模型:详解贝叶斯分类器、广义线性模型、支持向量机、决策树和人工神经网络等经典模型的原理及其实现,帮助读者构建和应用这些模型。
? 集成学习与模型正则化:详解、和等集成方法,以及模型的正则化技术,帮助读者提升模型的性能和健壮性。
? 模型评价与选择:探讨不同的模型评价指标和选择方法,帮助读者掌握在实际项目中进行模型评估和优化的方法。
? 无监督学习:深入讲解聚类算法、高斯混合模型、谱聚类和深度自动编码器等无监督学习方法及其应用。
? 机器学习项目实战:通过行人检测和厨余垃圾处理的指标预测两个典型项目案例,展示机器学习在不同领域的应用,帮助读者将所学知识转化为实际能力。
显示全部信息
作者简介
卓泽滨, 毕业于华南理工大学。在校期间获得全国大学生数学建模竞赛省二等奖、认证杯国际建模比赛国际赛奖(二等奖)、高校数学建模挑战赛全国三等奖和泰迪杯数据挖掘挑战赛全国二等奖等。开通博客,发表技术博文余篇,阅读量高达万。毕业后供职于中国电器科学研究院股份有限公司,任开发工程师。申请两项发明专利。考取了工程和信息化部教育与考试中心颁发的软件评测工程师证书和泰迪智能研究院国际培训中心颁发的大数据分析工程师证书。对机器学习和深度学习等人工智能开发技术有广泛的涉猎和深入的研究。