| 开本:16开 |
| 纸张:胶版纸 |
| 包装:平装-胶订 |
| 是否套装:否 |
| 国际标准书号ISBN:9787301361696 |
| 所属分类:图书>计算机/网络>管理信息系统(MIS) |
官方 正版内容简介
这是一本系统讲解大模型的技术指南,它全面覆盖的底层架构、核心原理及实际应用。本书从人工智能基础、的技术架构,到多模态模型的训练与优化,帮助读者深入理解的工作机制,并掌握在大规模预训练、推理优化及应用部署中的关键技术。全书共有章,主要包括的使命与愿景、人工智能与大模型、底层架构解密、的工作原理、的内部机制、的架构揭秘、的训练过程、的训练优化与成本控制、、稀疏矩阵技术、部署实战,以及接入实战。
本书全面而深入的技术解读,不仅适用于对大模型感兴趣的技术人员,还适合人工智能研究者、开发者及行业从业者。同时,书中结合实战案例和对比分析,帮助读者理解的独特优势及未来的发展方向。
作者简介
王卓
华中科技大学计算机硕士,精通、、、等语言。曾任阿里达摩院资深算法工程师,参与大模型落地工作,擅长人工智能算法原理、大模型开发、计算机视觉及自然语言处理。目前专注于电商预训练语言模型和舆情风险监控大模型的研发。
薛栋
华东理工大学信息科学与技术学院副教授硕士生导师,德国慕尼黑工业大学博士,荣获上海市高层次青年人才计划等称号。曾在荷兰格罗宁根大学()、德国卡尔斯鲁厄理工学院()任教,长期从事人工智能与大数据研究,发表论文余篇,主持多项国家及企业科研项目。所在 已推出、、等垂直领域大模型项目。
王卓
华中科技大学计算机硕士,精通、、、等语言。曾任阿里达摩院资深算法工程师,参与大模型落地工作,擅长人工智能算法原理、大模型开发、计算机视觉及自然语言处理。目前专注于电商预训练语言模型和舆情风险监控大模型的研发。
薛栋
华东理工大学信息科学与技术学院副教授硕士生导师,德国慕尼黑工业大学博士,荣获上海市高层次青年人才计划等称号。曾在荷兰格罗宁根大学()、德国卡尔斯鲁厄理工学院()任教,长期从事人工智能与大数据研究,发表论文余篇,主持多项国家及企业科研项目。所在 已推出、、等垂直领域大模型项目。
隆建
华东理工大学副教授博导,主要研究人工智能方法及工业应用,发表论文余篇,拥有余项专利。主持余项国家及企业科研项目,荣获多项国家省部级科技奖项,并指导学生获得余项奖项。
显示全部信息
目 录
第章 的使命与愿景:开辟应用新纪元
的由来
的主要产品和应用场景
与其他模型的性能对比
初体验
第章 人工智能与大模型:智能时代的核心引擎
人工智能基础介绍
什么是大模型
神经网络
网络模型
第章 底层架构解密:探寻大模型的基石
基于 架构
动态任务分配:智能计算的自适应引擎 第章 的使命与愿景:开辟应用新纪元
的由来
的主要产品和应用场景
与其他模型的性能对比
初体验
第章 人工智能与大模型:智能时代的核心引擎
人工智能基础介绍
什么是大模型
神经网络
网络模型
第章 底层架构解密:探寻大模型的基石
基于 架构
动态任务分配:智能计算的自适应引擎
稀疏激活机制:动态结构感知的高效优化范式
架构:基于稀疏专家的动态路由系统
归一化技术:稳定性与效率的平衡术
多令牌预测技术:增强推理能力的新途径
高效并行策略:性能极限的系统设计
混合精度与量化:训练效率的加速器
显存优化与结构共享:资源利用的范式创新
第章 的工作原理:从生成到模型安全的全面解析
逐词生成:的输出过程
概率模型:如何生成有意义的文本
性能优化与效率提升
模型的安全性与可靠性
第章 的内部机制:智能思维的发动机
“嵌入”与向量空间
语义理解与生成
模型的决策过程
第章 的架构揭秘:驾驭大模型的核心
探索模型网络:基础架构剖析
升级进化:模型全景
多模态大模型:的跨感知融合
升级版:多模态进阶的实践与优化
第章 的训练过程:从数据到微调的全流程揭秘
数据准备与预处理
基础训练:从无到有
微调与优化:提升性能
第章 的训练优化与成本控制:效率与经济性的双重探索
数据规模、训练策略与低成本秘诀
链式思考与可解释推理:的独到之处
开源策略:如何用开放共享降低壁垒
第章 :推理模型的革新之旅
全景探秘
开源信息概览
自进化训练体系揭秘
全场景强化学习:分析完整的训练策略
蒸馏处理
第章 稀疏矩阵技术:计算效率的新型加速利器
稀疏矩阵技术概述
稀疏矩阵技术在中的应用
稀疏矩阵技术的前沿探索
第章 部署实战:从本地到云端的一体化落地
基于的本地部署
基于的本地部署
基于 的本地部署
基于 的本地部署
的远程和云端部署
第章 接入实战:无缝集成与多平台落地指南
接入实战
接入实战
通过将接入
将接入
将接入
基于茴香豆的微信聊天机器人
显示全部信息
商品详情
书名:这就是:从原理到实践
书号
作者编者王卓薛栋隆建 著
出版社:北京大学出版社
出版时间年月
编辑推荐
大模型技术全揭秘,架构训练优化落地全覆盖,理论结合实践,掌握在大规模预训练、推理优化及应用部署中的关键技术,全面提升自主开发与创新能力。
这是一本系统讲解大模型的技术指南,它全面覆盖的底层架构、核心原理及实际应用。本书从人工智能基础、的技术架构,到多模态模型的训练与优化,帮助读者深入理解的工作机制,并掌握在大规模预训练、推理优化及应用部署中的关键技术。全书共有章,主要包括的使命与愿景、人工智能与大模型、底层架构解密、的工作原理、的内部机制、的架构揭秘、的训练过程、的训练优化与成本控制、、稀疏矩阵技术、部署实战,以及接入实战。
本书全面而深入的技术解读,不仅适用于对大模型感兴趣的技术人员,还适合人工智能研究者、开发者及行业从业者。同时,书中结合实战案例和对比分析,帮助读者理解的独特优势及未来的发展方向。
作者简介
王卓
华中科技大学计算机硕士,精通、、、等语言。曾任阿里达摩院资深算法工程师,参与大模型落地工作,擅长人工智能算法原理、大模型开发、计算机视觉及自然语言处理。目前专注于电商预训练语言模型和舆情风险监控大模型的研发。
薛栋
华东理工大学信息科学与技术学院副教授硕士生导师,德国慕尼黑工业大学博士,荣获上海市高层次青年人才计划等称号。曾在荷兰格罗宁根大学()、德国卡尔斯鲁厄理工学院()任教,长期从事人工智能与大数据研究,发表论文余篇,主持多项国家及企业科研项目。所在 已推出、、等垂直领域大模型项目。
王卓
华中科技大学计算机硕士,精通、、、等语言。曾任阿里达摩院资深算法工程师,参与大模型落地工作,擅长人工智能算法原理、大模型开发、计算机视觉及自然语言处理。目前专注于电商预训练语言模型和舆情风险监控大模型的研发。
薛栋
华东理工大学信息科学与技术学院副教授硕士生导师,德国慕尼黑工业大学博士,荣获上海市高层次青年人才计划等称号。曾在荷兰格罗宁根大学()、德国卡尔斯鲁厄理工学院()任教,长期从事人工智能与大数据研究,发表论文余篇,主持多项国家及企业科研项目。所在 已推出、、等垂直领域大模型项目。
隆建
华东理工大学副教授博导,主要研究人工智能方法及工业应用,发表论文余篇,拥有余项专利。主持余项国家及企业科研项目,荣获多项国家省部级科技奖项,并指导学生获得余项奖项。
显示全部信息
目 录
第章 的使命与愿景:开辟应用新纪元
的由来
的主要产品和应用场景
与其他模型的性能对比
初体验
第章 人工智能与大模型:智能时代的核心引擎
人工智能基础介绍
什么是大模型
神经网络
网络模型
第章 底层架构解密:探寻大模型的基石
基于 架构
动态任务分配:智能计算的自适应引擎 第章 的使命与愿景:开辟应用新纪元
的由来
的主要产品和应用场景
与其他模型的性能对比
初体验
第章 人工智能与大模型:智能时代的核心引擎
人工智能基础介绍
什么是大模型
神经网络
网络模型
第章 底层架构解密:探寻大模型的基石
基于 架构
动态任务分配:智能计算的自适应引擎
稀疏激活机制:动态结构感知的高效优化范式
架构:基于稀疏专家的动态路由系统
归一化技术:稳定性与效率的平衡术
多令牌预测技术:增强推理能力的新途径
高效并行策略:性能极限的系统设计
混合精度与量化:训练效率的加速器
显存优化与结构共享:资源利用的范式创新
第章 的工作原理:从生成到模型安全的全面解析
逐词生成:的输出过程
概率模型:如何生成有意义的文本
性能优化与效率提升
模型的安全性与可靠性
第章 的内部机制:智能思维的发动机
“嵌入”与向量空间
语义理解与生成
模型的决策过程
第章 的架构揭秘:驾驭大模型的核心
探索模型网络:基础架构剖析
升级进化:模型全景
多模态大模型:的跨感知融合
升级版:多模态进阶的实践与优化
第章 的训练过程:从数据到微调的全流程揭秘
数据准备与预处理
基础训练:从无到有
微调与优化:提升性能
第章 的训练优化与成本控制:效率与经济性的双重探索
数据规模、训练策略与低成本秘诀
链式思考与可解释推理:的独到之处
开源策略:如何用开放共享降低壁垒
第章 :推理模型的革新之旅
全景探秘
开源信息概览
自进化训练体系揭秘
全场景强化学习:分析完整的训练策略
蒸馏处理
第章 稀疏矩阵技术:计算效率的新型加速利器
稀疏矩阵技术概述
稀疏矩阵技术在中的应用
稀疏矩阵技术的前沿探索
第章 部署实战:从本地到云端的一体化落地
基于的本地部署
基于的本地部署
基于 的本地部署
基于 的本地部署
的远程和云端部署
第章 接入实战:无缝集成与多平台落地指南
接入实战
接入实战
通过将接入
将接入
将接入
基于茴香豆的微信聊天机器人
显示全部信息
商品详情
书名:这就是:从原理到实践
书号
作者编者王卓薛栋隆建 著
出版社:北京大学出版社
出版时间年月
编辑推荐
大模型技术全揭秘,架构训练优化落地全覆盖,理论结合实践,掌握在大规模预训练、推理优化及应用部署中的关键技术,全面提升自主开发与创新能力。