
开本:16开 |
纸张:胶版纸 |
包装:平装-胶订 |
是否套装:是 |
国际标准书号ISBN:9000302002956 |
所属分类:图书>计算机/网络>数据库>数据仓库与数据挖掘 |
编辑推荐
国内某一线大厂资深大数据架构师多年项目实战经验的总结,理论结合实践,深入剖析海量数据处理的核心技术。
内容全面:全面涵盖基础知识和分布式文件系统(),以及分布式编程框架和资源调度器等内容,帮助读者全面掌握海量数据处理的核心技术。
讲解深入:不仅系统地剖析海量数据处理技术原理,还从代码层面深入地分析系统的实现过程,并分析和的每一步操作,帮助读者洞悉其工作机制与运行原理。
实用性强:讲解理论知识时穿插多个典型示例,帮助读者深入理解海量数据处理技术的精髓。另外,通过高可用集群搭建和经典的统计案例构建两个实战项目,帮助读者上手实践,从而提高实际项目开发水平。
适用面广:无论是初学者,还是开发人员、数据分析人员、大数据工程师和数据科学家等相关从业人员,都可以从本书中获得需要的知识和技能。
前瞻性强:基于 版写作,内容新颖,技术前瞻,不但介绍纠删码和 联邦机制等 的新特性,而且对比不同版本之间的差异。
全面、深入地总结资深工程师多年大数据项目实战经验
理论结合实践,由浅入深地展现性能优化的核心技术
内容全面:涵盖性能优化的基础知识、核心技术和应用实践,对性能优化进行全面、系统的探讨。
实用性强:不但介绍理论知识,而且结合多个示例和多个实战案例解析性能优化的核心技术与应用,帮助读者更好地实施优化策略。
适用面广:无论是性能优化初学者,还是开发人员、数据工程师和数据科学家等从业人员,都可以从本书中获得需要的知识和技能。
前瞻性强:基于的新版本写作,不但介绍其新特性,而且介绍其集成、和使用时的性能优化方法。
讲解深入:对性能优化的核心技术与工作原理进行深入讲解,以便让读者能够理解的内部结构和运行机制,从而更有效地对其性能进行优化。内容简介
《海量数据处理》从的基础知识讲起,逐步深入分布式文件系统()和分布式编程框架的核心技术,帮助读者全面、系统、深入地理解海量数据处理技术的精髓。本书在讲解技术原理时穿插大量的典型示例,并详解两个典型项目实战案例,帮助读者提高实际项目开发水平。
《海量数据处理》共章,分为篇。第篇基础知识,包括大数据概述、概述、环境搭建与配置;第篇分布式存储技术,包括概述、基础操作、的读写原理和工作机制、 的新特性;第篇分布式编程框架,包括概述、开发基础、框架的原理、数据压缩、资源调度器、企业级优化;第篇项目实战,包括高可用集群搭建实战和统计经典项目案例实战。
《海量数据处理》通俗易懂、案例丰富、实用性强,适合初学者和进阶人员阅读,也适合大数据工程师、数据分析工程师和数据科学家等大数据技术从业人员和爱好者阅读,还适合作为高等院校和相关培训机构的大数据教材。《海量数据处理》从的基础知识讲起,逐步深入分布式文件系统()和分布式编程框架的核心技术,帮助读者全面、系统、深入地理解海量数据处理技术的精髓。本书在讲解技术原理时穿插大量的典型示例,并详解两个典型项目实战案例,帮助读者提高实际项目开发水平。
《海量数据处理》共章,分为篇。第篇基础知识,包括大数据概述、概述、环境搭建与配置;第篇分布式存储技术,包括概述、基础操作、的读写原理和工作机制、 的新特性;第篇分布式编程框架,包括概述、开发基础、框架的原理、数据压缩、资源调度器、企业级优化;第篇项目实战,包括高可用集群搭建实战和统计经典项目案例实战。
《海量数据处理》通俗易懂、案例丰富、实用性强,适合初学者和进阶人员阅读,也适合大数据工程师、数据分析工程师和数据科学家等大数据技术从业人员和爱好者阅读,还适合作为高等院校和相关培训机构的大数据教材。
《性能优化实战:突破性能瓶颈,遨游数据重洋》全面、系统、深入地介绍 性能优化的相关技术和策略,涵盖从性能优化的基础知识到核心技术,再到应用实践的方方面面。本书不但系统地介绍各种监控工具的使用,而且还结合实战案例,详细介绍性能优化的各种经验和技巧,提升读者的实际应用技能。
《性能优化实战:突破性能瓶颈,遨游数据重洋》共章。第章从性能优化的基本概念出发,介绍的基础知识,并介绍如何进行性能优化;第章介绍性能优化的几个方面,包括程序设计优化、资源优化、网络通信优化和数据读写优化等;第章深入介绍任务执行过程优化;第章介绍 性能优化;第章结合实战案例全面解析性能优化的核心技术与应用;第章详细介绍不同应用场景的性能优化策略;第章介绍集成、和使用时的性能优化,从而提供更实用的性能提升方案;第章介绍应用程序开发与优化,以及集群管理实践。
《性能优化实战:突破性能瓶颈,遨游数据重洋》内容丰富,讲解深入浅出,适合 开发人员、数据工程师和数据科学家阅读,也适合需要处理大规模数据集和对性能优化感兴趣的技术人员阅读,还可作为高等院校大数据专业的教材和相关培训机构的教学用书。
显示全部信息
目 录
第篇 基础知识
第章 大数据概述
大数据简介
大数据的特点
大数据的发展前景
大数据技术生态体系
大数据部门的组织架构
小结
第章 概述
简介
的发展历史
的三大发行版本
的优势
各版本之间的区别 第篇 基础知识
第章 大数据概述
大数据简介
大数据的特点
大数据的发展前景
大数据技术生态体系
大数据部门的组织架构
小结
第章 概述
简介
的发展历史
的三大发行版本
的优势
各版本之间的区别
的组成
小结
第章 环境搭建与配置
搭建开发环境
配置本地运行模式
配置伪分布式模式
配置完全分布式模式
小结
第篇 分布式存储技术
第章 概述
的背景和定义
的优缺点
的组成架构
设置文件块的大小
小结
第章 基础操作
的命令操作
的调用操作
小结
第章 的读写原理和工作机制
剖析的写数据流程
剖析的读数据流程
剖析和 的工作机制
剖析
小结
第章 的新特性
纠删码技术
复制集群间的数据
解决海量小文件的存储问题
配置回收站
快照管理
小结
第篇 分布式编程框架
第章 概述
的定义
的优缺点
的核心编程思想
官方的源码解析
小结
第章 开发基础
的序列化概述
数据序列化的类型
如何开发程序
小结
第章 框架的原理
数据输入解析
解析的工作流程
剖析的工作机制
剖析的工作机制
剖析的工作机制
数据输出类详解
的多种应用
小结
第章 数据压缩
数据压缩概述
支持的压缩编码器
选择压缩方式
配置压缩参数
压缩实战案例
小结
第章 资源调度器
解析的基本架构
剖析的工作机制
作业提交全过程
资源调度器的分类
任务的推测执行
小结
第章 企业级优化
优化
优化
小结
第篇 项目实战
第章 高可用集群搭建实战
高可用简介
的工作机制
搭建集群
搭建集群
小结
第章 统计经典项目案例实战
项目案例构建流程
小结
目 录
第章 性能优化基础
简介
什么是性能优化
应用程序性能指标
自带的
自带的历史服务器
事件日志
驱动程序日志
日志
系统监控工具
监控工具
第三方工具
第三方工具
性能测试与验证
执行计划
任务性能瓶颈的定位
第章 应用程序性能优化
程序设计优化
资源优化
网络通信优化
数据读写优化
第章 任务执行过程优化
调度优化
任务执行器优化
第章 性能优化
常用的查询优化
的新特性
数据倾斜优化
特定场景优化
第章 性能优化案例分析
基于的短视频推荐系统性能优化
基于的航空数据分析系统性能优化
第章 不同场景的性能优化
批处理模式的优化策略
流式处理场景的优化策略
第章 集成其他技术的
性能优化
与整合优化
与整合优化
与的整合优化
第章 性能优化实践
应用程序开发建议
应用程序优化建议
集群管理的优化建议
结束语
显示全部信息
作者简介
许政:毕业于哈尔滨工业大学,获硕士学位。现居深圳,任某一线大厂大数据架构师。参加工作以来,带领团队完成了多个百亿级大数据平台的建设。在实时计算方面有深厚的实践经验。熟悉多种大数据技术框架,如、、、、、、等。被评为优秀博主,撰写了大数据技术相关博文余篇,博客访问量高达多万。运维自己的独立博客网站。在大数据实时处理技术和人工智能算法方面有深入的研究,申请发明专利余项。
谢雪葵资深研发工程师,会员,阿诚网络创始人。有多年的软件设计和开发经验,专注于大数据技术与服务。近年来主持和参与多个大型银行和互联网公司的大数据项目,累积了丰富的大数据项目开发及性能优化经验。为多家企业提供技术支持,帮助其降低成本和提高效率。
国内某一线大厂资深大数据架构师多年项目实战经验的总结,理论结合实践,深入剖析海量数据处理的核心技术。
内容全面:全面涵盖基础知识和分布式文件系统(),以及分布式编程框架和资源调度器等内容,帮助读者全面掌握海量数据处理的核心技术。
讲解深入:不仅系统地剖析海量数据处理技术原理,还从代码层面深入地分析系统的实现过程,并分析和的每一步操作,帮助读者洞悉其工作机制与运行原理。
实用性强:讲解理论知识时穿插多个典型示例,帮助读者深入理解海量数据处理技术的精髓。另外,通过高可用集群搭建和经典的统计案例构建两个实战项目,帮助读者上手实践,从而提高实际项目开发水平。
适用面广:无论是初学者,还是开发人员、数据分析人员、大数据工程师和数据科学家等相关从业人员,都可以从本书中获得需要的知识和技能。
前瞻性强:基于 版写作,内容新颖,技术前瞻,不但介绍纠删码和 联邦机制等 的新特性,而且对比不同版本之间的差异。
全面、深入地总结资深工程师多年大数据项目实战经验
理论结合实践,由浅入深地展现性能优化的核心技术
内容全面:涵盖性能优化的基础知识、核心技术和应用实践,对性能优化进行全面、系统的探讨。
实用性强:不但介绍理论知识,而且结合多个示例和多个实战案例解析性能优化的核心技术与应用,帮助读者更好地实施优化策略。
适用面广:无论是性能优化初学者,还是开发人员、数据工程师和数据科学家等从业人员,都可以从本书中获得需要的知识和技能。
前瞻性强:基于的新版本写作,不但介绍其新特性,而且介绍其集成、和使用时的性能优化方法。
讲解深入:对性能优化的核心技术与工作原理进行深入讲解,以便让读者能够理解的内部结构和运行机制,从而更有效地对其性能进行优化。内容简介
《海量数据处理》从的基础知识讲起,逐步深入分布式文件系统()和分布式编程框架的核心技术,帮助读者全面、系统、深入地理解海量数据处理技术的精髓。本书在讲解技术原理时穿插大量的典型示例,并详解两个典型项目实战案例,帮助读者提高实际项目开发水平。
《海量数据处理》共章,分为篇。第篇基础知识,包括大数据概述、概述、环境搭建与配置;第篇分布式存储技术,包括概述、基础操作、的读写原理和工作机制、 的新特性;第篇分布式编程框架,包括概述、开发基础、框架的原理、数据压缩、资源调度器、企业级优化;第篇项目实战,包括高可用集群搭建实战和统计经典项目案例实战。
《海量数据处理》通俗易懂、案例丰富、实用性强,适合初学者和进阶人员阅读,也适合大数据工程师、数据分析工程师和数据科学家等大数据技术从业人员和爱好者阅读,还适合作为高等院校和相关培训机构的大数据教材。《海量数据处理》从的基础知识讲起,逐步深入分布式文件系统()和分布式编程框架的核心技术,帮助读者全面、系统、深入地理解海量数据处理技术的精髓。本书在讲解技术原理时穿插大量的典型示例,并详解两个典型项目实战案例,帮助读者提高实际项目开发水平。
《海量数据处理》共章,分为篇。第篇基础知识,包括大数据概述、概述、环境搭建与配置;第篇分布式存储技术,包括概述、基础操作、的读写原理和工作机制、 的新特性;第篇分布式编程框架,包括概述、开发基础、框架的原理、数据压缩、资源调度器、企业级优化;第篇项目实战,包括高可用集群搭建实战和统计经典项目案例实战。
《海量数据处理》通俗易懂、案例丰富、实用性强,适合初学者和进阶人员阅读,也适合大数据工程师、数据分析工程师和数据科学家等大数据技术从业人员和爱好者阅读,还适合作为高等院校和相关培训机构的大数据教材。
《性能优化实战:突破性能瓶颈,遨游数据重洋》全面、系统、深入地介绍 性能优化的相关技术和策略,涵盖从性能优化的基础知识到核心技术,再到应用实践的方方面面。本书不但系统地介绍各种监控工具的使用,而且还结合实战案例,详细介绍性能优化的各种经验和技巧,提升读者的实际应用技能。
《性能优化实战:突破性能瓶颈,遨游数据重洋》共章。第章从性能优化的基本概念出发,介绍的基础知识,并介绍如何进行性能优化;第章介绍性能优化的几个方面,包括程序设计优化、资源优化、网络通信优化和数据读写优化等;第章深入介绍任务执行过程优化;第章介绍 性能优化;第章结合实战案例全面解析性能优化的核心技术与应用;第章详细介绍不同应用场景的性能优化策略;第章介绍集成、和使用时的性能优化,从而提供更实用的性能提升方案;第章介绍应用程序开发与优化,以及集群管理实践。
《性能优化实战:突破性能瓶颈,遨游数据重洋》内容丰富,讲解深入浅出,适合 开发人员、数据工程师和数据科学家阅读,也适合需要处理大规模数据集和对性能优化感兴趣的技术人员阅读,还可作为高等院校大数据专业的教材和相关培训机构的教学用书。
显示全部信息
目 录
第篇 基础知识
第章 大数据概述
大数据简介
大数据的特点
大数据的发展前景
大数据技术生态体系
大数据部门的组织架构
小结
第章 概述
简介
的发展历史
的三大发行版本
的优势
各版本之间的区别 第篇 基础知识
第章 大数据概述
大数据简介
大数据的特点
大数据的发展前景
大数据技术生态体系
大数据部门的组织架构
小结
第章 概述
简介
的发展历史
的三大发行版本
的优势
各版本之间的区别
的组成
小结
第章 环境搭建与配置
搭建开发环境
配置本地运行模式
配置伪分布式模式
配置完全分布式模式
小结
第篇 分布式存储技术
第章 概述
的背景和定义
的优缺点
的组成架构
设置文件块的大小
小结
第章 基础操作
的命令操作
的调用操作
小结
第章 的读写原理和工作机制
剖析的写数据流程
剖析的读数据流程
剖析和 的工作机制
剖析
小结
第章 的新特性
纠删码技术
复制集群间的数据
解决海量小文件的存储问题
配置回收站
快照管理
小结
第篇 分布式编程框架
第章 概述
的定义
的优缺点
的核心编程思想
官方的源码解析
小结
第章 开发基础
的序列化概述
数据序列化的类型
如何开发程序
小结
第章 框架的原理
数据输入解析
解析的工作流程
剖析的工作机制
剖析的工作机制
剖析的工作机制
数据输出类详解
的多种应用
小结
第章 数据压缩
数据压缩概述
支持的压缩编码器
选择压缩方式
配置压缩参数
压缩实战案例
小结
第章 资源调度器
解析的基本架构
剖析的工作机制
作业提交全过程
资源调度器的分类
任务的推测执行
小结
第章 企业级优化
优化
优化
小结
第篇 项目实战
第章 高可用集群搭建实战
高可用简介
的工作机制
搭建集群
搭建集群
小结
第章 统计经典项目案例实战
项目案例构建流程
小结
目 录
第章 性能优化基础
简介
什么是性能优化
应用程序性能指标
自带的
自带的历史服务器
事件日志
驱动程序日志
日志
系统监控工具
监控工具
第三方工具
第三方工具
性能测试与验证
执行计划
任务性能瓶颈的定位
第章 应用程序性能优化
程序设计优化
资源优化
网络通信优化
数据读写优化
第章 任务执行过程优化
调度优化
任务执行器优化
第章 性能优化
常用的查询优化
的新特性
数据倾斜优化
特定场景优化
第章 性能优化案例分析
基于的短视频推荐系统性能优化
基于的航空数据分析系统性能优化
第章 不同场景的性能优化
批处理模式的优化策略
流式处理场景的优化策略
第章 集成其他技术的
性能优化
与整合优化
与整合优化
与的整合优化
第章 性能优化实践
应用程序开发建议
应用程序优化建议
集群管理的优化建议
结束语
显示全部信息
作者简介
许政:毕业于哈尔滨工业大学,获硕士学位。现居深圳,任某一线大厂大数据架构师。参加工作以来,带领团队完成了多个百亿级大数据平台的建设。在实时计算方面有深厚的实践经验。熟悉多种大数据技术框架,如、、、、、、等。被评为优秀博主,撰写了大数据技术相关博文余篇,博客访问量高达多万。运维自己的独立博客网站。在大数据实时处理技术和人工智能算法方面有深入的研究,申请发明专利余项。
谢雪葵资深研发工程师,会员,阿诚网络创始人。有多年的软件设计和开发经验,专注于大数据技术与服务。近年来主持和参与多个大型银行和互联网公司的大数据项目,累积了丰富的大数据项目开发及性能优化经验。为多家企业提供技术支持,帮助其降低成本和提高效率。