DeepSeek图解:大模型是怎样构建的 张治政 薛栋 公鑫 著 北京大学出版社 9787301362020

配送至
$ $ USD 美元

开本:16开
纸张:胶版纸
包装:平装-胶订
是否套装:否
国际标准书号ISBN:9787301362020
所属分类:图书>计算机/网络>管理信息系统(MIS)
官方 正版

商品详情
书名:图解:大模型是怎样构建的
书号

作者编者张治政薛栋公鑫 著
出版社:北京大学出版社
出版时间年月
编辑推荐

()图解奥义 :思维导图详解大模型构建之道,开启智能新时代
()全面覆盖:从文本预处理到知识库系统,全链路解析核心技术
()实战演练:理论与实战交织,深度剖析大模型构建的关键环节
()聚焦未来:聚焦、多模态与,助你掌握未来智能发展的密码

目 录
目录
第章 明月松间照,清泉石上流:文本预处理
分词
分词的重要性和基本原理
基于空格的分词
基于标点符号的分词
词干化与词形还原
词干化与词形还原的区别
词干化
词形还原
去除停用词
什么是停用词
基于词汇列表的去除
基于词频的去除 目录
第章 明月松间照,清泉石上流:文本预处理
分词
分词的重要性和基本原理
基于空格的分词
基于标点符号的分词
词干化与词形还原
词干化与词形还原的区别
词干化
词形还原
去除停用词
什么是停用词
基于词汇列表的去除
基于词频的去除
方法去除
机器学习方法去除
数据清洗和处理
处理缺失值
异常值检测与处理
处理重复数据
第章 大音希声,大象无形:特征提取
特征提取介绍
特征在大模型中的关键作用
特征提取与数据预处理的关系
特征选择
特征选择的必要性
特征选择的方法
特征抽取
特征抽取的概念
主成分分析
独立成分分析
自动编码器
嵌入
嵌入介绍
使用嵌入层进行特征提取
模型
模型
词袋模型
实现词袋模型的步骤
词袋模型的限制与改进

什么是
使用 方法提取文本特征
方法与词袋模型的比较
第章 人有悲欢离合,月有阴晴圆缺:文本分类与情感分析
朴素贝叶斯分类器
朴素贝叶斯分类器的基本概念
朴素贝叶斯分类器的应用场景
支持向量机
介绍
线性 与非线性
随机森林
随机森林介绍
随机森林的应用场景
卷积神经网络
的发展背景
的结构
文本特征提取与分类
循环神经网络
循环神经网络介绍
使用 框架制作情感分析模型
递归神经网络
递归神经网络的主要特点

第章 白日依山尽,黄河入海流:语言的生成
基于规则的生成
基于规则的生成方法介绍
基于规则的生成方法在 中的应用场景
基于统计的生成
基于统计的生成方法介绍
模型
隐马尔可夫模型
最大熵模型
基于神经网络的生成
基于神经网络的生成方法
生成对抗网络
注意力机制
注意力机制介绍
注意力机制的变体
序列到序列模型
模型介绍
使用 模型实现翻译系统
第章 海内存知己,天涯若比邻:机器翻译
统计机器翻译
介绍
模型
的训练和解码
神经机器翻译
的特点和工作流程
的训练和解码
基于 的简易翻译系统
第章 会当凌绝顶,一览众山小: 的核心 模型
模型介绍
模型的基本概念
模型的优势
模型的核心组件
机器翻译任务中的 模型
多头注意力机制和多头潜在注意力
多头注意力机制
多头潜在注意力
混合专家架构
架构介绍
架构的特点
架构的应用
中的 架构介绍
第章 大漠孤烟直,长河落日圆:多模态模型的架构和训练
多模态技术简介
多模态介绍
多模态技术的发展历史
的多模态大模型
多模态大模型的发展历程
架构介绍
多模态理解
视觉生成路径
自回归 模型
三阶段训练策略
训练策略
多任务学习
全量微调
对比学习
参数高效微调
迁移学习
人类反馈强化学习
动态学习率调整
监督微调
第章 学而时习之,不亦说乎:预训练模型的训练和微调
预训练模型的训练和微调介绍
预训练
微调
预训练与微调的对比
模型的微调
实例介绍
创建文本和图像配对数据集
创建模型
训练模型
模型微调
调试运行
使用 微调 模型
的概念
模型介绍
具体实现
第章 千帆过尽,始见真章: 应用开发实战
开发基础
介绍
基本教程
基于 的对话应用程序
的基本接入实战
接入实战
接入实战
社交媒体工具接入实战
基于 的微信聊天 机器人
基于 的 机器人
将 接入到
介绍
在 中应用
在 中应用
将 接入
插件基础
将 接入
调用 生成代码
代码生成和补全
第 章 纸上得来终觉浅,绝知此事要躬行:基于 的 知识库系统
项目介绍
背景介绍
市场需求
主要功能
技术栈
配置文件和基础工具函数
导航栏配置
基础工具函数
交互工具函数
组件
页面布局组件
聊天组件
调试运行
显示全部信息

作者简介
张治政

张治政,中国海洋大学计算机硕士,哈尔滨工业大学通信博士,百度云研发工程师,百度大模型工程师,在大规模机器学习、深度学习、数据搜索、行业垂直应用、研发管理等领域拥有丰富经验。在企业智能化转型、业务线上化经营、拥有丰富的大规模搜索架构、个性化推荐架构、机器学习系统架构经验和技术团队管理经验。现在从事城市大数据中心的开发和建设工作,将深度学习运用到数字经济等领域。

薛栋
张治政

张治政,中国海洋大学计算机硕士,哈尔滨工业大学通信博士,百度云研发工程师,百度大模型工程师,在大规模机器学习、深度学习、数据搜索、行业垂直应用、研发管理等领域拥有丰富经验。在企业智能化转型、业务线上化经营、拥有丰富的大规模搜索架构、个性化推荐架构、机器学习系统架构经验和技术团队管理经验。现在从事城市大数据中心的开发和建设工作,将深度学习运用到数字经济等领域。

薛栋

薛栋,华东理工大学信息科学与技术学院副教授、硕士生导师,德国慕尼黑工业大学工学博士,上海市高层次青年人才计划上海市浦江人才计划获得者。所在的 (心动实验室)致力于人工智能技术的探索与研究,已发布多个垂直领域的大模型项目,包括心理领域的(漫谈)、医疗领域的 (孙思邈)、教育领域的 (锦鲤)。

公鑫

公鑫,东南大学副教授,香港大学控制工程专业博士,研究领域主要聚焦集群智能,包括分布式控制、估计与优化、基于分布式估计和数字孪生的复合网络攻击与防御等。现任中国指挥与控制学会高级会员和青工委委员、中国自动化学会会员、中国计算机学会会员和网络弹性专委会委员、 ,并在多个国际期刊和会议上担任审稿人和分会场主席,曾获多项杰出审稿人奖。

显示全部信息