
开本:32开 |
纸张:胶版纸 |
包装:平装-胶订 |
是否套装:否 |
国际标准书号ISBN:9787302684534 |
所属分类:图书>计算机/网络>数据库>Oracle |
商品详情内容简介
本书详细阐述了与数据科学面试相关的基本解决方案,主要包括探索现代数据科学领域、在数据科学领域寻找工作、编程、数据可视化与数据叙述、使用查询数据库、中的和脚本编写、使用进行版本控制、用概率和统计挖掘数据、理解特征工程和为建模准备数据、精通机器学习概念、用深度学习构建网络、用实现机器学习解决方案、掌握面试环节、协商薪酬等内容。此外,本书还提供了相应的示例、代码,以帮助读者进一步理解相关方案的实现过程。本书适合作为高等院校计算机及相关专业的教材和教学参考书,也可作为相关开发人员的自学用书和参考手册。
目 录
第篇 进入数据科学领域
第章 探索现代数据科学领域
数据科学是什么
探索数据科学过程
数据收集
数据探索
数据建模
模型评估
模型部署和监控
分析数据科学的不同类型
数据工程师
仪表板和可视化专家
机器学习专家
领域专家 第篇 进入数据科学领域
第章 探索现代数据科学领域
数据科学是什么
探索数据科学过程
数据收集
数据探索
数据建模
模型评估
模型部署和监控
分析数据科学的不同类型
数据工程师
仪表板和可视化专家
机器学习专家
领域专家
审视数据科学的职业路径
传统型数据科学家
领域专家型数据科学家
非传统路径数据科学家
解决经验瓶颈问题
学术经验
工作经验
理解预期的技能和能力
硬技能(技术技能)
软技能(沟通技能)
探索数据科学的演变
新模型
新环境
新计算
新应用
本章小结
参考文献
第章 在数据科学领域寻找工作
寻找第一份数据科学工作
准备前行
寻找招聘板
构建出色的作品集
申请工作
制作金牌简历
完美简历的神话
理解自动化简历筛选
打造有效的简历
格式和组织
使用正确的术语
准备获得面试机会
摩尔定律
研究、研究、再研究
品牌塑造
本章小结
参考文献
第篇 操控和管理数据
第章 编程
变量、数据类型和数据结构
中的索引
字符串操作
初始化字符串
字符串索引
使用 控制语句和列表推导
条件语句
循环语句
列表推导
使用用户定义的函数
用户定义的函数的语法
使用用户定义的函数进行操作
熟悉 函数
创建优秀的函数
在 中处理文件
使用 整理数据
处理缺失数据
选择数据
排序数据
合并数据
使用 进行聚合
本章小结
参考文献
第章 数据可视化与数据叙述
理解数据可视化
条形图
线图
散点图
直方图
密度图
分位数分位数图( 图)
箱线图
饼图
调查行业工具
()
()
()
开发仪表板、报告和关键绩效指标
开发图表和图形
条形图——
条形图——
散点图——
散点图——
直方图——
直方图——
应用基于情景的叙事
本章小结
第章 使用查询数据库
介绍关系数据库
掌握 基础知识
语句
子句
子句
使用 和 聚合数据
子句
子句
使用 创建字段
分析子查询和
子句中的子查询
子句中的子查询
子句中的子查询
子句中的子查询
区分公用表表达式()和子查询
使用连接合并表格
内连接
左连接和右连接
全外连接
多表连接
计算窗口函数
、 、 和
和
和
使用日期函数
处理复杂查询
本章小结
第章 中的和脚本编写
操作系统简介
导航系统目录
介绍基本命令行提示符
理解目录类型
文件和目录操作
使用 进行脚本编写
介绍控制语句
创建函数
数据处理和管道
使用
本章小结
第章 使用进行版本控制
介绍仓库
创建仓库
克隆现有的远程仓库
从头开始创建本地仓库
将本地仓库和远程仓库关联
详解数据科学家的 工作流程
在数据科学中使用 标签
理解 标签
作为数据科学家使用标签
理解常见操作
本章小结
第篇 探索人工智能
第章 用概率和统计挖掘数据
用描述性统计描述数据
测量中心趋势
测量变异性
介绍总体和样本
定义总体和样本
代表性样本
减少抽样误差
理解中心极限定理
中心极限定理
证明正态性假设
用抽样分布塑造数据
概率分布
均匀分布
正态分布和学生 分布
二项分布
泊松分布
指数分布
几何分布
威布尔分布
假设检验
理解单样本 检验
理解双样本 检验
理解配对样本 检验
理解方差分析和多元方差分析
卡方检验
测试
理解Ⅰ 型错误和Ⅱ型错误
Ⅰ 型错误(假阳性)
Ⅱ型错误(假阴性)
寻求平衡
本章小结
参考文献
第章 理解特征工程和为建模准备数据
理解特征工程
避免数据泄漏
处理缺失数据
数据缩放
应用数据转换
引入数据转换
对数转换
幂次转换
转换
指数转换
处理分类数据和其他特征
独热编码
标签编码
目标编码
计算字段
执行特征选择
特征选择的类型
递归特征消除
正则化
基于树的特征选择
方差膨胀因子
处理不平衡数据
理解不平衡数据
处理不平衡数据
降低维度
主成分分析
奇异值分解
自编码器
本章小结
第章 精通机器学习概念
介绍机器学习工作流程
问题陈述
模型选择
模型调整
模型预测
监督机器学习
回归与分类
线性回归——回归
逻辑回归
最近邻()
随机森林
特别梯度提升()
无监督机器学习
具有噪声的基于密度的聚类应用()
其他聚类算法
评估聚类
总结其他值得注意的机器学习模型
理解偏差方差权衡
超参数调整
网格搜索
随机搜索
贝叶斯优化
本章小结
第章 用深度学习构建网络
介绍神经网络和深度学习
讨论权重和偏差
权重介绍
偏差介绍
使用激活函数激活神经元
常见激活函数
选择合适的激活函数
剖析反向传播
梯度下降
什么是反向传播
损失函数
梯度下降步骤
梯度消失问题
使用优化器
优化算法
网络调整
理解嵌入
词嵌入
训练嵌入
列出常见的网络架构
常见网络
工具和包
介绍 和
揭示语言模型
和自注意力
迁移学习
应用
本章小结
第章 用实现机器学习解决方案
引入
理解数据采集
学习数据存储的基础知识
审查模型开发
模型部署的打包
确定要求
虚拟环境
环境管理的工具和方法
使用容器部署模型
验证和监控模型
验证模型部署
模型监控
思考治理
使用 的
本章小结
第 篇 获得工作
第章 掌握面试环节
掌握与招聘人员的早期互动
掌握不同的面试阶段
招聘经理阶段
技术面试
编码问题
小组面试阶段
本章小结
参考文献
第章 协商薪酬
理解薪酬格局
谈判报
谈判考虑因素
回应报
优选可谈判薪酬和情境
本章小结
最后的话
显示全部信息
本书详细阐述了与数据科学面试相关的基本解决方案,主要包括探索现代数据科学领域、在数据科学领域寻找工作、编程、数据可视化与数据叙述、使用查询数据库、中的和脚本编写、使用进行版本控制、用概率和统计挖掘数据、理解特征工程和为建模准备数据、精通机器学习概念、用深度学习构建网络、用实现机器学习解决方案、掌握面试环节、协商薪酬等内容。此外,本书还提供了相应的示例、代码,以帮助读者进一步理解相关方案的实现过程。本书适合作为高等院校计算机及相关专业的教材和教学参考书,也可作为相关开发人员的自学用书和参考手册。
目 录
第篇 进入数据科学领域
第章 探索现代数据科学领域
数据科学是什么
探索数据科学过程
数据收集
数据探索
数据建模
模型评估
模型部署和监控
分析数据科学的不同类型
数据工程师
仪表板和可视化专家
机器学习专家
领域专家 第篇 进入数据科学领域
第章 探索现代数据科学领域
数据科学是什么
探索数据科学过程
数据收集
数据探索
数据建模
模型评估
模型部署和监控
分析数据科学的不同类型
数据工程师
仪表板和可视化专家
机器学习专家
领域专家
审视数据科学的职业路径
传统型数据科学家
领域专家型数据科学家
非传统路径数据科学家
解决经验瓶颈问题
学术经验
工作经验
理解预期的技能和能力
硬技能(技术技能)
软技能(沟通技能)
探索数据科学的演变
新模型
新环境
新计算
新应用
本章小结
参考文献
第章 在数据科学领域寻找工作
寻找第一份数据科学工作
准备前行
寻找招聘板
构建出色的作品集
申请工作
制作金牌简历
完美简历的神话
理解自动化简历筛选
打造有效的简历
格式和组织
使用正确的术语
准备获得面试机会
摩尔定律
研究、研究、再研究
品牌塑造
本章小结
参考文献
第篇 操控和管理数据
第章 编程
变量、数据类型和数据结构
中的索引
字符串操作
初始化字符串
字符串索引
使用 控制语句和列表推导
条件语句
循环语句
列表推导
使用用户定义的函数
用户定义的函数的语法
使用用户定义的函数进行操作
熟悉 函数
创建优秀的函数
在 中处理文件
使用 整理数据
处理缺失数据
选择数据
排序数据
合并数据
使用 进行聚合
本章小结
参考文献
第章 数据可视化与数据叙述
理解数据可视化
条形图
线图
散点图
直方图
密度图
分位数分位数图( 图)
箱线图
饼图
调查行业工具
()
()
()
开发仪表板、报告和关键绩效指标
开发图表和图形
条形图——
条形图——
散点图——
散点图——
直方图——
直方图——
应用基于情景的叙事
本章小结
第章 使用查询数据库
介绍关系数据库
掌握 基础知识
语句
子句
子句
使用 和 聚合数据
子句
子句
使用 创建字段
分析子查询和
子句中的子查询
子句中的子查询
子句中的子查询
子句中的子查询
区分公用表表达式()和子查询
使用连接合并表格
内连接
左连接和右连接
全外连接
多表连接
计算窗口函数
、 、 和
和
和
使用日期函数
处理复杂查询
本章小结
第章 中的和脚本编写
操作系统简介
导航系统目录
介绍基本命令行提示符
理解目录类型
文件和目录操作
使用 进行脚本编写
介绍控制语句
创建函数
数据处理和管道
使用
本章小结
第章 使用进行版本控制
介绍仓库
创建仓库
克隆现有的远程仓库
从头开始创建本地仓库
将本地仓库和远程仓库关联
详解数据科学家的 工作流程
在数据科学中使用 标签
理解 标签
作为数据科学家使用标签
理解常见操作
本章小结
第篇 探索人工智能
第章 用概率和统计挖掘数据
用描述性统计描述数据
测量中心趋势
测量变异性
介绍总体和样本
定义总体和样本
代表性样本
减少抽样误差
理解中心极限定理
中心极限定理
证明正态性假设
用抽样分布塑造数据
概率分布
均匀分布
正态分布和学生 分布
二项分布
泊松分布
指数分布
几何分布
威布尔分布
假设检验
理解单样本 检验
理解双样本 检验
理解配对样本 检验
理解方差分析和多元方差分析
卡方检验
测试
理解Ⅰ 型错误和Ⅱ型错误
Ⅰ 型错误(假阳性)
Ⅱ型错误(假阴性)
寻求平衡
本章小结
参考文献
第章 理解特征工程和为建模准备数据
理解特征工程
避免数据泄漏
处理缺失数据
数据缩放
应用数据转换
引入数据转换
对数转换
幂次转换
转换
指数转换
处理分类数据和其他特征
独热编码
标签编码
目标编码
计算字段
执行特征选择
特征选择的类型
递归特征消除
正则化
基于树的特征选择
方差膨胀因子
处理不平衡数据
理解不平衡数据
处理不平衡数据
降低维度
主成分分析
奇异值分解
自编码器
本章小结
第章 精通机器学习概念
介绍机器学习工作流程
问题陈述
模型选择
模型调整
模型预测
监督机器学习
回归与分类
线性回归——回归
逻辑回归
最近邻()
随机森林
特别梯度提升()
无监督机器学习
具有噪声的基于密度的聚类应用()
其他聚类算法
评估聚类
总结其他值得注意的机器学习模型
理解偏差方差权衡
超参数调整
网格搜索
随机搜索
贝叶斯优化
本章小结
第章 用深度学习构建网络
介绍神经网络和深度学习
讨论权重和偏差
权重介绍
偏差介绍
使用激活函数激活神经元
常见激活函数
选择合适的激活函数
剖析反向传播
梯度下降
什么是反向传播
损失函数
梯度下降步骤
梯度消失问题
使用优化器
优化算法
网络调整
理解嵌入
词嵌入
训练嵌入
列出常见的网络架构
常见网络
工具和包
介绍 和
揭示语言模型
和自注意力
迁移学习
应用
本章小结
第章 用实现机器学习解决方案
引入
理解数据采集
学习数据存储的基础知识
审查模型开发
模型部署的打包
确定要求
虚拟环境
环境管理的工具和方法
使用容器部署模型
验证和监控模型
验证模型部署
模型监控
思考治理
使用 的
本章小结
第 篇 获得工作
第章 掌握面试环节
掌握与招聘人员的早期互动
掌握不同的面试阶段
招聘经理阶段
技术面试
编码问题
小组面试阶段
本章小结
参考文献
第章 协商薪酬
理解薪酬格局
谈判报
谈判考虑因素
回应报
优选可谈判薪酬和情境
本章小结
最后的话
显示全部信息