
开本:16开 |
纸张:胶版纸 |
包装:平装-胶订 |
是否套装:否 |
国际标准书号ISBN:9787111760696 |
所属分类:图书>计算机/网络>数据库>数据仓库与数据挖掘 |
编辑推荐
随着大数据和人工智能技术的发展,各行各业积累的数据越来越丰富,如何从这些数据中挖掘出有价值的信息,助力科学、合理的决策变得日益重要。数据挖掘技术可以从大量异构、随机数据中提取有用的信息和知识,已经广泛应用于工作和生活的各个领域。本书基于作者长期从事数据挖掘科研、工程和教学工作的经验编写而成,通过案例牵引,帮助读者掌握常用的数据挖掘算法、模型和技术,并解决常见的数据挖掘实际问题。本书特点:以实践为目标,系统介绍数据挖掘的流程,并给出代码实现。内容涵盖数据清洗、数据转换、数据降维、回归分析、聚类、神经网络分类等常用的数据挖掘技术和方法,使读者能够利用编程来解决基本的数据挖掘问题。本书提供了丰富的案例,规模由小到大,帮助读者循序渐进地掌握各类数据挖掘模型和算法。掌握这些案例后,读者可以举一反三,进一步解决更复杂、更大规模的问题。作者在中国大学上开设了“数据挖掘”课程(),并在头歌平台上开设了“数据挖掘”实验课程(),读者可通过在线视频课程的学习、作业训练与编程实践加深对数据挖掘知识点的理解,提高运用能力。内容简介
数据挖掘算法为大数据与人工智能的核心,掌握数据挖掘各算法的编程实现,有助于提升大数据的实践运用能力。本书详细阐述了数据挖掘常用算法与编程实现,同时,本书以多个经典的数据挖掘赛题为案例,详细论述了数据预处理、特征选择、可视化、算法选择等全流程数据挖掘过程的编程实现,有助于提升读者面对实际数据问题时灵活运用各类算法能力。
目 录
目 录
前言
第章 绪论
数据挖掘技术的由来
数据挖掘的分类
关联规则挖掘
监督式机器学习
非监督式机器学习
的安装步骤
环境的配置
的安装
常见的数据集
鸢尾花数据集
员工离职预测数据集 目 录
前言
第章 绪论
数据挖掘技术的由来
数据挖掘的分类
关联规则挖掘
监督式机器学习
非监督式机器学习
的安装步骤
环境的配置
的安装
常见的数据集
鸢尾花数据集
员工离职预测数据集
泰坦尼克号灾难预测数据集
空气质量预测数据集
本章小结
第章 分类
分类的概念
分类中的训练集与测试集
分类的过程及验证方法
准确率
交叉验证
贝叶斯分类的编程实践
鸢尾花数据集的贝叶斯分类
基于贝叶斯分类的员工离职
预测
本章小结
第章 数据的特征选择
直方图
直方图可视化
直方图特征选择
直方图与柱状图的差异
特征选择实践
本章小结
第章 数据预处理之数据清洗
案例概述
缺失值处理
缺失值处理概述
缺失值处理实例
噪声数据处理
正态分布噪声数据检测
用箱线图检测噪声数据
数据预处理案例实践
问题
解决方法
实践结论
本章小结
第章 数据预处理之转换
数据的数值化处理
顺序编码
二进制编码
数据规范化
最小–最大规范化
分数规范化
小数定标规范化
本章小结
第章 数据预处理之数据降维
散点图可视化分析
主成分分析
本章小结
第章 不平衡数据分类
不平衡数据分类问题的特征
数据稀缺问题
噪声问题
决策面偏移问题
评价标准问题
重采样方法
上采样
对上采样方法的改进
下采样
对下采样方法的改进
不平衡问题的其他处理方式
不平衡数据分类实践
本章小结
第章 回归分析
线性回归
一元线性回归
多元线性回归
回归分析检测
正态分布可能性检测
线性分布可能性检测
转换后的分布
回归预测案例实践
案例背景
代码实现
本章小结
第章 聚类分析
均值聚类
算法的步骤
代码实现
层次聚类
算法的步骤
代码实现
密度聚类
算法的步骤
代码实现
本章小结
第章 关联分析
算法
关联分析案例实践
案例背景
案例的数据集
代码实现
运行结果
提升算法性能的方法
本章小结
第章 分类
算法的步骤
函数
的代码实现
结果分析
案例实践
案例分析
案例实现
运行结果
本章小结
第章 支持向量机
支持向量机的可视化分析
的代码实现
鸢尾花数据分类
新闻文本数据分类
本章小结
第章 神经网络分类
多层人工神经网络
多层人工神经网络的代码实现
神经网络分类案例实践
案例背景
数据说明
代码实现
本章小结
第章 集成学习
方法
随机森林
显示全部信息
作者简介
丁兆云,国防科技大学博士毕业后留校任教至今,长期教授数据挖掘课程,负责国防科技大学系统工程学院“数据挖掘”专业方向考博命题工作,主持湖南省教改课题项、国防科技大学教改课题项、发表教学论文篇,获得国防科技大学研究生教学优秀奖。
随着大数据和人工智能技术的发展,各行各业积累的数据越来越丰富,如何从这些数据中挖掘出有价值的信息,助力科学、合理的决策变得日益重要。数据挖掘技术可以从大量异构、随机数据中提取有用的信息和知识,已经广泛应用于工作和生活的各个领域。本书基于作者长期从事数据挖掘科研、工程和教学工作的经验编写而成,通过案例牵引,帮助读者掌握常用的数据挖掘算法、模型和技术,并解决常见的数据挖掘实际问题。本书特点:以实践为目标,系统介绍数据挖掘的流程,并给出代码实现。内容涵盖数据清洗、数据转换、数据降维、回归分析、聚类、神经网络分类等常用的数据挖掘技术和方法,使读者能够利用编程来解决基本的数据挖掘问题。本书提供了丰富的案例,规模由小到大,帮助读者循序渐进地掌握各类数据挖掘模型和算法。掌握这些案例后,读者可以举一反三,进一步解决更复杂、更大规模的问题。作者在中国大学上开设了“数据挖掘”课程(),并在头歌平台上开设了“数据挖掘”实验课程(),读者可通过在线视频课程的学习、作业训练与编程实践加深对数据挖掘知识点的理解,提高运用能力。内容简介
数据挖掘算法为大数据与人工智能的核心,掌握数据挖掘各算法的编程实现,有助于提升大数据的实践运用能力。本书详细阐述了数据挖掘常用算法与编程实现,同时,本书以多个经典的数据挖掘赛题为案例,详细论述了数据预处理、特征选择、可视化、算法选择等全流程数据挖掘过程的编程实现,有助于提升读者面对实际数据问题时灵活运用各类算法能力。
目 录
目 录
前言
第章 绪论
数据挖掘技术的由来
数据挖掘的分类
关联规则挖掘
监督式机器学习
非监督式机器学习
的安装步骤
环境的配置
的安装
常见的数据集
鸢尾花数据集
员工离职预测数据集 目 录
前言
第章 绪论
数据挖掘技术的由来
数据挖掘的分类
关联规则挖掘
监督式机器学习
非监督式机器学习
的安装步骤
环境的配置
的安装
常见的数据集
鸢尾花数据集
员工离职预测数据集
泰坦尼克号灾难预测数据集
空气质量预测数据集
本章小结
第章 分类
分类的概念
分类中的训练集与测试集
分类的过程及验证方法
准确率
交叉验证
贝叶斯分类的编程实践
鸢尾花数据集的贝叶斯分类
基于贝叶斯分类的员工离职
预测
本章小结
第章 数据的特征选择
直方图
直方图可视化
直方图特征选择
直方图与柱状图的差异
特征选择实践
本章小结
第章 数据预处理之数据清洗
案例概述
缺失值处理
缺失值处理概述
缺失值处理实例
噪声数据处理
正态分布噪声数据检测
用箱线图检测噪声数据
数据预处理案例实践
问题
解决方法
实践结论
本章小结
第章 数据预处理之转换
数据的数值化处理
顺序编码
二进制编码
数据规范化
最小–最大规范化
分数规范化
小数定标规范化
本章小结
第章 数据预处理之数据降维
散点图可视化分析
主成分分析
本章小结
第章 不平衡数据分类
不平衡数据分类问题的特征
数据稀缺问题
噪声问题
决策面偏移问题
评价标准问题
重采样方法
上采样
对上采样方法的改进
下采样
对下采样方法的改进
不平衡问题的其他处理方式
不平衡数据分类实践
本章小结
第章 回归分析
线性回归
一元线性回归
多元线性回归
回归分析检测
正态分布可能性检测
线性分布可能性检测
转换后的分布
回归预测案例实践
案例背景
代码实现
本章小结
第章 聚类分析
均值聚类
算法的步骤
代码实现
层次聚类
算法的步骤
代码实现
密度聚类
算法的步骤
代码实现
本章小结
第章 关联分析
算法
关联分析案例实践
案例背景
案例的数据集
代码实现
运行结果
提升算法性能的方法
本章小结
第章 分类
算法的步骤
函数
的代码实现
结果分析
案例实践
案例分析
案例实现
运行结果
本章小结
第章 支持向量机
支持向量机的可视化分析
的代码实现
鸢尾花数据分类
新闻文本数据分类
本章小结
第章 神经网络分类
多层人工神经网络
多层人工神经网络的代码实现
神经网络分类案例实践
案例背景
数据说明
代码实现
本章小结
第章 集成学习
方法
随机森林
显示全部信息
作者简介
丁兆云,国防科技大学博士毕业后留校任教至今,长期教授数据挖掘课程,负责国防科技大学系统工程学院“数据挖掘”专业方向考博命题工作,主持湖南省教改课题项、国防科技大学教改课题项、发表教学论文篇,获得国防科技大学研究生教学优秀奖。