这就是DeepSeek：DeepSeek从原理到实践大模型技术全揭秘架构训练优化落地全覆盖北京大学出版社旗舰店 9787301361696

配送至

$ $ USD 美元

加入购物车

商品编号: 6189455 类别: 图书计算机/网络管理信息系统(MIS)

详情
推荐

更多信息

开本：16开

纸张：胶版纸

包装：平装-胶订

是否套装：否

国际标准书号ISBN：9787301361696

所属分类：图书>计算机/网络>管理信息系统(MIS)

官方正版内容简介
这是一本系统讲解大模型的技术指南，它全面覆盖的底层架构、核心原理及实际应用。本书从人工智能基础、的技术架构，到多模态模型的训练与优化，帮助读者深入理解的工作机制，并掌握在大规模预训练、推理优化及应用部署中的关键技术。全书共有章，主要包括的使命与愿景、人工智能与大模型、底层架构解密、的工作原理、的内部机制、的架构揭秘、的训练过程、的训练优化与成本控制、、稀疏矩阵技术、部署实战，以及接入实战。
本书全面而深入的技术解读，不仅适用于对大模型感兴趣的技术人员，还适合人工智能研究者、开发者及行业从业者。同时，书中结合实战案例和对比分析，帮助读者理解的独特优势及未来的发展方向。

作者简介
王卓
华中科技大学计算机硕士，精通、、、等语言。曾任阿里达摩院资深算法工程师，参与大模型落地工作，擅长人工智能算法原理、大模型开发、计算机视觉及自然语言处理。目前专注于电商预训练语言模型和舆情风险监控大模型的研发。

薛栋
华东理工大学信息科学与技术学院副教授硕士生导师，德国慕尼黑工业大学博士，荣获上海市高层次青年人才计划等称号。曾在荷兰格罗宁根大学（）、德国卡尔斯鲁厄理工学院（）任教，长期从事人工智能与大数据研究，发表论文余篇，主持多项国家及企业科研项目。所在已推出、、等垂直领域大模型项目。
王卓
华中科技大学计算机硕士，精通、、、等语言。曾任阿里达摩院资深算法工程师，参与大模型落地工作，擅长人工智能算法原理、大模型开发、计算机视觉及自然语言处理。目前专注于电商预训练语言模型和舆情风险监控大模型的研发。

薛栋
华东理工大学信息科学与技术学院副教授硕士生导师，德国慕尼黑工业大学博士，荣获上海市高层次青年人才计划等称号。曾在荷兰格罗宁根大学（）、德国卡尔斯鲁厄理工学院（）任教，长期从事人工智能与大数据研究，发表论文余篇，主持多项国家及企业科研项目。所在已推出、、等垂直领域大模型项目。

隆建
华东理工大学副教授博导，主要研究人工智能方法及工业应用，发表论文余篇，拥有余项专利。主持余项国家及企业科研项目，荣获多项国家省部级科技奖项，并指导学生获得余项奖项。
显示全部信息

目录
第章的使命与愿景：开辟应用新纪元
的由来
的主要产品和应用场景
与其他模型的性能对比
初体验

第章人工智能与大模型：智能时代的核心引擎
人工智能基础介绍
什么是大模型
神经网络
网络模型
第章底层架构解密：探寻大模型的基石
基于架构
动态任务分配：智能计算的自适应引擎第章的使命与愿景：开辟应用新纪元
的由来
的主要产品和应用场景
与其他模型的性能对比
初体验

第章人工智能与大模型：智能时代的核心引擎
人工智能基础介绍
什么是大模型
神经网络
网络模型
第章底层架构解密：探寻大模型的基石
基于架构
动态任务分配：智能计算的自适应引擎
稀疏激活机制：动态结构感知的高效优化范式
架构：基于稀疏专家的动态路由系统
归一化技术：稳定性与效率的平衡术
多令牌预测技术：增强推理能力的新途径
高效并行策略：性能极限的系统设计
混合精度与量化：训练效率的加速器
显存优化与结构共享：资源利用的范式创新
第章的工作原理：从生成到模型安全的全面解析
逐词生成：的输出过程
概率模型：如何生成有意义的文本
性能优化与效率提升
模型的安全性与可靠性
第章的内部机制：智能思维的发动机
“嵌入”与向量空间
语义理解与生成
模型的决策过程
第章的架构揭秘：驾驭大模型的核心
探索模型网络：基础架构剖析
升级进化：模型全景
多模态大模型：的跨感知融合
升级版：多模态进阶的实践与优化
第章的训练过程：从数据到微调的全流程揭秘
数据准备与预处理
基础训练：从无到有
微调与优化：提升性能
第章的训练优化与成本控制：效率与经济性的双重探索
数据规模、训练策略与低成本秘诀
链式思考与可解释推理：的独到之处
开源策略：如何用开放共享降低壁垒
第章：推理模型的革新之旅
全景探秘
开源信息概览
自进化训练体系揭秘
全场景强化学习：分析完整的训练策略
蒸馏处理
第章稀疏矩阵技术：计算效率的新型加速利器
稀疏矩阵技术概述
稀疏矩阵技术在中的应用
稀疏矩阵技术的前沿探索
第章部署实战：从本地到云端的一体化落地
基于的本地部署
基于的本地部署
基于的本地部署
基于的本地部署
的远程和云端部署
第章接入实战：无缝集成与多平台落地指南
接入实战
接入实战
通过将接入
将接入
将接入
基于茴香豆的微信聊天机器人
显示全部信息

商品详情
书名：这就是：从原理到实践
书号

作者编者王卓薛栋隆建著
出版社：北京大学出版社
出版时间年月
编辑推荐
大模型技术全揭秘，架构训练优化落地全覆盖，理论结合实践，掌握在大规模预训练、推理优化及应用部署中的关键技术，全面提升自主开发与创新能力。

这就是DeepSeek：DeepSeek从原理到实践 大模型技术全揭秘 架构 训练 优化 落地全覆盖 北京大学出版社旗舰店 9787301361696

这就是DeepSeek：DeepSeek从原理到实践大模型技术全揭秘架构训练优化落地全覆盖北京大学出版社旗舰店 9787301361696