大语言模型工程师手册 从概念到生产实践 人民邮电出版社 9787115667373

配送至
$ $ USD 美元

开本:16开
纸张:胶版纸
包装:平装-胶订
是否套装:否
国际标准书号ISBN:9787115667373
所属分类:图书>计算机/网络>计算机理论
编辑推荐
独特之处:实践导向,以一个应用项目贯穿全书,使读者能通过实际项目深入理解和掌握工程的各个环节。 内容全面:涵盖了工程的多个关键领域,包括数据工程、特征流水线、监督微调、偏好对齐微调、评估和部署等,为读者提供了系统全面的知识体系。 配套视频教程:包含主要理论知识解读、环境搭建和动手实践内容的演示,帮助理解书中的重点和难点内容。 作者与译者经验丰富:两位作者拥有多年的系统工作经验,两位译者均为国内互联网大厂的大模型运维方向的工程师。商品详情内容简介
本书基于很好实践,系统阐释如何在生产环境中设计、训练和部署。本书通过构建兼具成本效益、可扩展且模块化的 系统,突破 演示的局限,完整呈现生产级端到端系统的工程化实现路径。
本书包括数据工程、有监督微调和部署的相关知识。通过跟随 项目的全流程实践,读者可将原则和组件无缝地融入真实项目,同时掌握推理优化、偏好对齐和实时数据处理等前沿技术。
作为工程化实践指南,本书可以帮助读者熟练掌握如何部署强大的——既能解决实际问题,又能保持低延迟和高可用的推理能力。本书适合领域的新手与经验丰富的从业者阅读,不仅能加深读者对的理解,更能提升读者在生产环境中应用它们的能力。

目 录
第章 理解 的概念与架构
理解 的概念
什么是
为什么构建
为什么不使用(或其他类似的聊天机器人)
规划 的
什么是
定义 的
基于特征、训练和推理流水线构建机器学习系统
构建生产级机器学习系统的挑战
以往解决方案的问题
解决方案:机器学习系统的流水线
流水线的优势
设计 的系统架构 第章 理解 的概念与架构
理解 的概念
什么是
为什么构建
为什么不使用(或其他类似的聊天机器人)
规划 的
什么是
定义 的
基于特征、训练和推理流水线构建机器学习系统
构建生产级机器学习系统的挑战
以往解决方案的问题
解决方案:机器学习系统的流水线
流水线的优势
设计 的系统架构
列出 架构的技术细节
使用流水线设计 架构
关于流水线架构和 架构的最终思考
小结
第章 工具与安装
生态环境与项目安装
:项目依赖与环境管理利器
: 项目任务管理利器
与工具生态
:模型仓库
:编排、工件和元数据
:实验跟踪工具
:提示监控
用于存储和向量数据的数据库
:数据库
:向量数据库
为做准备
设置账户、访问密钥和
:训练与推理计算
小结
第章 数据工程
设计 的数据采集流水线
实现 数据采集流水线
流水线及其步骤
分发器:实例化正确的爬虫
爬虫
数据仓库文档
采集原始数据并存储到数据仓库
小结
第章 特征流水线
理解
为什么使用
基础框架
什么是嵌入
关于向量数据库的更多内容
高级技术概览
预检索
检索
后检索
探索 的特征流水线架构
待解决的问题
特征存储
原始数据从何而来
设计特征流水线架构
实现 的特征流水线
配置管理
流水线与步骤
领域实体
分发器层
处理器
小结
第章 监督微调
构建指令训练数据集
构建指令数据集的通用框架
数据管理
基于规则的过滤
数据去重
数据净化
数据质量评估
数据探索
数据生成
数据增强
构建自定义指令数据集
探索及其关键技术
何时进行微调
指令数据集格式
聊天模板
参数高效微调技术
训练参数
微调技术实践
小结
第章 偏好对齐微调
理解偏好数据集
偏好数据
数据生成与评估
构建个性化偏好数据集
偏好对齐
基于人类反馈的强化学习

实践
小结
第章 的评估方法
模型能力评估
机器学习与评估的对比
通用评估
领域特定评估
任务特定评估
系统的评估

模型评估
生成答案
答案评估
结果分析
小结
第章 模型推理性能优化
模型优化方法

连续批处理
投机解码
优化的注意力机制
模型并行化
数据并行
流水线并行
张量并行
组合使用并行化方法
模型量化
量化简介
基于和的模型量化
和量化技术
其他量化技术
小结
第章 推理流水线
理解 的推理流水线
探索 的高级技术
高级预检索优化:查询扩展与自查询
高级检索优化:过滤向量搜索
高级后检索优化:重排序
构建基于的 推理流水线
实现检索模块
整合推理流水线
小结
第章 推理流水线部署
部署方案的选择
吞吐量和延迟
数据
基础设施
深入理解推理部署方案
在线实时推理
异步推理
离线批量转换
模型服务的单体架构与微服务架构
单体架构
微服务架构
单体架构与微服务架构的选择
探索 的推理流水线部署方案
部署 服务
基于 构建微服务
使用构建业务微服务
自动缩放应对突发流量高峰
注册缩放目标
创建弹性缩放策略
缩放的上下限设置
小结
第章 与
发展之路:从和寻根

将 流水线部署到云端
理解基础架构
环境配置
环境配置
设置云环境
为 添加
的流水线工作流程
快速概览
流水线
流水线
测试流水线
流水线
提示监控
告警
小结
附录 原则

显示全部信息

媒体评论
本书旨在确保尽可能多的人不仅能使用大语言模型(),还能对其进行调整、微调和量化优化,最终使其达到可部署于现实场景的高效状态。 —— , 首席技术官兼联合创始人 本书为任何希望深入掌握大语言模型实践技能的人士提供了无价指南。 —— ,谷歌高级总监

作者简介
作者简介 保罗·尤斯廷( ),资深机器学习工程师,在生成式 、计算机视觉和 领域拥有超 年的实战经验。曾在 担任核心工程师,专注于将大型神经网络推向生产环境。 马克西姆·拉博纳( ) 的后训练负责人,拥有巴黎理工学院机器学学位,并获得谷歌人工智能与机器学习领域( )开发者专家认证。作为开源社区的活跃贡献者,在 上开设了 课程,开发了 译者简介 孟凡杰,腾讯云技术专家,腾讯云原生调度技术负责人,云原生基金会大使,致力于将 技术与云原生技术相结合,探索资源调度的很优解决方案。 方佳瑞,清华大学计算机系博士,曾任腾讯云技术专家。在机器学习、分布式系统和高性能计算等领域具有丰富的从业经验。