任选 CDA三级认证教材:敏捷数据挖掘 9787121516030

配送至
$ $ USD 美元

开本:128开
纸张:胶版纸
包装:平装
是否套装:否
国际标准书号ISBN:9787121516030
所属分类:图书>计算机/网络>计算机考试认证>其他
重磅推荐
商品详情
重磅推荐
产品特色
编辑推荐

数字化人才认证教材
历经次升级迭代
精英专家团队,品质教材保障
畅销多万册的数据红宝书

内容简介
本书作为三级认证教材,打破了传统的学院派知识整合模式,从业务应用场景出发来组织内容, 旨在更加贴近业务需求,而非单纯罗列算法。经过多年的打磨,本书精选了在行业应用中价值最大的九类场景,并提供不同场景下构建数据应用的最佳实践。 本书涉及的算法不仅涵盖传统的统计学习,还结合企业实际需求,解构了机器学习、深度学习的前沿方法,并提供了丰富的示例代码, 以便读者借鉴。本书分为三篇:理论篇、技术篇和管理篇。 理论篇共章,讲解数据挖掘的核心思维、算法模型和数据挖掘之间的关系, 以及数据挖掘的落地场景框架。技术篇共章,讲解决策类、识别类、优化分析类模型的具体算法,以及参数调优、特征工程、类别不平衡问题等内容。管理篇共章,讲解 和模型生命周期管理。

作者简介
数据科学研究院简介年,大数据行业方兴未艾, 数据科学研究院孕育而生,是全球率先成立的专注于数据科学领域的专业研究机构。 数据科学研究院汇集国内外数据行业专家,团队具有专业的学术素养、精湛的研究水平、扎实的企业实战经验、丰富的行业资源,通过对各类企业、社会组织等进行全面、系统、深入的调查和访问,获得紧跟技术发展的经验与数据,并结合数据行业的未来发展方向进行系统的研究,不断研发创新的知识体系和技术应用。近十年来, 数据科学研究院秉持“专业性、前沿性、科学性”的定位,深耕数据分析、大数据、人工智能等核心领域,持续推进数据科学的行业发展和数字化人才标准体系的建立。未来, 数据科学研究院也将顺应数字化时代浪潮,持续开拓创新,继续加大数据科学领域的内容建设,推进人才数字化赋能,助力企业数字化转型。

目录
第篇理 论 篇
第章数据挖掘综述
企业中数据分析的层级
数据分析的过程
数据挖掘方法论
方法论
方法论
数据挖掘的核心思维
算法建模的个要素
目标函数
学习策略
寻优方法
评估方法
算法模型分类介绍 宋体第 篇理 论 篇 宋体第 章数据挖掘综述 宋体 宋体企业中数据分析的层级 宋体 宋体数据分析的过程 宋体 宋体数据挖掘方法论 宋体 宋体 方法论 宋体 宋体 方法论 宋体 宋体数据挖掘的核心思维 宋体 宋体算法建模的 个要素 宋体 宋体目标函数 宋体 宋体学习策略 宋体 宋体寻优方法 宋体 宋体评估方法 宋体 宋体算法模型分类介绍 宋体 宋体预测性——有监督学习 宋体 宋体描述性——无监督学习 宋体 宋体数据挖掘落地场景框架 宋体 宋体数据挖掘建模模型的评估 宋体 宋体第 篇技 术 篇 宋体第 章决策类模型 宋体 宋体客户价值预测 宋体 宋体线性回归模型概述 宋体 宋体 案例:线性回归建模 宋体 宋体多元线性回归的变量筛选 宋体 宋体 案例:多元线性回归变量筛选 宋体 宋体模型假设检验 宋体 宋体残差分析 宋体 宋体强影响点分析 宋体 宋体 案例:线性回归调优实践 宋体 宋体线性回归建模的完整流程小结 宋体 宋体正则化 宋体 宋体 案例:岭回归与 回归实战 宋体 宋体营销响应预测 宋体 宋体使用逻辑回归预测客户响应率 宋体 宋体比较逻辑回归与线性回归 宋体 宋体图解逻辑回归 宋体 宋体逻辑回归模型概述 宋体 宋体分类变量的处理 宋体 宋体 案例:逻辑回归建模实战 宋体 宋体逻辑回归建模小结 宋体 宋体细分画像 宋体 宋体 聚类算法 宋体 宋体基于密度的聚类算法 宋体 宋体交叉销售 宋体 宋体关联规则 宋体 宋体序列模式 宋体第 章识别类模型 宋体 宋体申请反欺诈 宋体 宋体决策树 宋体 宋体集成算法 宋体 宋体 最近邻域算法 宋体 宋体朴素贝叶斯 宋体 宋体支持向量机 宋体 宋体神经网络 宋体 宋体违规行为识别 宋体 宋体孤立森林 宋体 宋体局部异常因子 宋体第 章优化分析类模型 宋体 宋体预测技术 宋体 宋体基于动力模型的 宋体 宋体基于深度学习的 宋体 宋体运筹优化 宋体 宋体线性规划 宋体 宋体整数规划 宋体 宋体非线性规划 宋体 宋体流程挖掘 宋体 宋体业务流程挖掘的总体理念 宋体 宋体流程发现 宋体 宋体流程监控 宋体 宋体流程遵循 宋体 宋体 案例:利用 进行流程挖掘 宋体第 章预测类模型的参数调优 宋体 宋体模型参数优化的方法 宋体 宋体网格搜索 宋体 宋体随机搜索 宋体 宋体其他搜索方法 宋体 宋体随机搜索优化实践 宋体 宋体选择最佳模型算法的方法 宋体 宋体将数据预处理加入模型选择 宋体 宋体并行化加速模型的选择 宋体 宋体建模门槛值优化的方法 宋体第 章特征工程 宋体 宋体特征工程概述 宋体 宋体数据预处理 宋体 宋体错误值处理 宋体 宋体异常值处理 宋体 宋体缺失值填补 宋体 宋体二值化 宋体 宋体离散化 宋体 宋体哑编码 宋体 宋体标准化 宋体 宋体规范化 宋体 宋体特征构造 宋体 宋体特征选择 宋体 宋体过滤式 宋体 宋体包裹式 宋体 宋体嵌入式 宋体 宋体特征转换 宋体 宋体线性特征转换 宋体 宋体非线性特征转换 宋体 宋体特征转换小结 宋体第 章类别不平衡问题 宋体 宋体不平衡数据概述 宋体 宋体传统学习方法在不平衡数据中的局限性 宋体 宋体类别不平衡所造成的问题 宋体 宋体类别不平衡问题的处理方法 宋体 宋体过采样与欠采样技术 宋体 宋体数据合成 宋体 宋体模型惩罚技术 宋体 宋体第 篇管理篇 宋体第 章机器学习研发运营一体化( ) 宋体 宋体 的背景 宋体 宋体 的机器学习建模工作流程 宋体 宋体数据工程 宋体 宋体模型工程 宋体 宋体模型部署 宋体 宋体 的设计框架 宋体 宋体版本管理 宋体 宋体测试 宋体 宋体模型持续部署 宋体 宋体模型持续监控 宋体 宋体自动化 宋体第 章模型生命周期管理 宋体 宋体模型生命周期概念 宋体 宋体模型开发 宋体 宋体模型上线 宋体 宋体模型退役 宋体 宋体模型管理 宋体 宋体外部和本地模型导入 宋体 宋体模型的预测和检验 宋体 宋体模型的监控和迭代 宋体 宋体模型服务 宋体 宋体实时服务 宋体 宋体批量服务 宋体 宋体准实时服务 宋体 宋体工作流管理 宋体 宋体权限管理 宋体
前言
,数智人才的身份认证

一级认证教材主要讲解商业分析所涉及的指标体系构建方法、用户标签体系和用户画像专题、描述性统计分析等技术; 二级认证教材主要讲解客户运营、流程分析和策略优化所涉及的用户高级标签的构建、模型归因分析、预测模型等业务宏观分析与客户微观洞察相融合的技术; 三级认证教材主要讲解企业数据挖掘体系的构建,在机器学习运营()的框架下设计、开发、落地数据挖掘模型,包括机器学习经典算法及案例、算法模型管理等技术。 认证教材在工具实现上选择企业中应用最为广泛的数据库语言和编程语言 等。
很多企业将 证书作为企业内部数据分析人才的评定标准和招聘要求。这套教材旨在帮助读者形成体系化、专业化的数据分析思维,通过 认证,为其职业发展提供更多可能性。 宋体 宋体,数智人才的身份认证 宋体数据曾经被视为商业“尾气”,如今却已成为世界的“石油”。借助合适的模型、算法、技术,我们可以从数据中挖掘巨大的商业价值。数据分析极大地促进了现代服务业、制造业差异化竞争格局的形成,将来更会成为各行业获得竞争优势的助推力。 宋体数据分析的主要目标之一就是满足组织的业务运营需求,为业务服务。大部分组织经历了从以产品为中心到以客户为中心的转变,其数据分析的重点也从关注组织经营结果转向进行全方位的组织运营和客户洞察,分析方法也从以管理报表为主,到对微观个体进行行为洞察和预测。另外, 技术的发展使得组织能够以更低的成本存储和处理大量数据,从而推动分析视角从宏观的业务层面逐步深入到个体微观层面。分析中的数据范畴也从基本属性和时点状态数据逐步扩展到行为数据,分析技术从传统的统计分析逐步向机器学习和深度学习过渡。 宋体满足业务运营需求更本质的目标,是通过数据分析改变决策方式,从依靠经验转向依靠数据。在当前,数据分析是学习型组织的重要表现形式。学习型组织的能力建设有两个主要阶段,分别是隐性知识显性化阶段和显性知识算法化阶段。前者是概念明晰和逐渐量化的过程,后者是提取知识形成算法并固化在业务流程系统中的过程。组织的核心能力从“以人为核心”转变到“以算法为核心”。通过数据分析进行科学决策、自主决策,从而实现业务价值,使数据分析在决策过程中不可或缺,逐渐成为组织的核心竞争力。 宋体宋体数据科学研究院经过多年在数据分析领域的深耕,建立了 数据分析师认证体系,为企业实现宏观与微观相结合的数字化转型提供有力支持,并为企业提供了坚实的数字化人才保障。 宋体宋体数据分析师认证体系与企业管理工具“平衡计分卡”相得益彰,涵盖绩效分析、客户分析、流程分析、智能学习,助力企业实现宏观与微观相结合的数字化战略中心组织。在平衡计分卡中,前面的分析为后面的工作指明方向,后面的活动为前面目标的实现提供能力支持。而 体系把“平衡计分卡”中最基础的“员工学习”活动与“机器学习”相融合,强调如何将业务知识以算法的形式固化在系统中,以更适合数字化时代的诉求。 宋体基于先进企业的实践, 数据科学研究院提出了企业数字化需要具备的数据人才能力的模型。企业中的数据分析任务分为业务现状描述、问题归因分析、个体行为预测,这就要求数据人才具备描述现状、分析原因、预测行为的能力。数据人才的范围也不限于数据分析师和数据挖掘工程师,还包括经营决策人员和业务骨干。 ! ! 宋体业务问题归因分析和策略优化是企业中数据分析任务的核心,对上游的现状描述提出建立完备的指标体系和报表可视化的需求,对下游的预测分析提供算法模型的应用场景。 数据分析师认证体系根据归因分析和策略优化的应用深度,以及从宏观业务分析到微观个体预测的技术难度,设计了 一级认证教材至三级认证教材的学习内容,并对各类分析工具的掌握提出了相应的要求,通过分级课程来帮助数据人才全面掌握从业务问题归因到策略优化的能力。 图片 ! ! 宋体 宋体一级认证教材主要讲解商业分析所涉及的指标体系构建方法、用户标签体系和用户画像专题、描述性统计分析等技术; 二级认证教材主要讲解客户运营、流程分析和策略优化所涉及的用户高级标签的构建、模型归因分析、预测模型等业务宏观分析与客户微观洞察相融合的技术; 三级认证教材主要讲解企业数据挖掘体系的构建,在机器学习运营( )的框架下设计、开发、落地数据挖掘模型,包括机器学习经典算法及案例、算法模型管理等技术。 认证教材在工具实现上选择企业中应用最为广泛的数据库语言 和编程语言 等。 宋体很多企业将 证书作为企业内部数据分析人才的评定标准和招聘要求。这套教材旨在帮助读者形成体系化、专业化的数据分析思维,通过 认证,为其职业发展提供更多可能性。 宋体无论读者是否参加认证考试,这套教材都是理解和应用数据分析的宝贵资源。常读常新,体会数据分析之美,灵活运用教材中的分析方法和案例,让数据分析和实证研究相得益彰,让数据分析和业务经验优势互补。这套教材将在数据分析行业中产生影响,如春风化雨般滋养各个领域中孜孜不倦的数据分析学习者和从业者,在数据分析的新理念、理论、方法、技术及工具等方面,为他们提供知识支持与启发。 宋体