| 开本:16开 |
| 纸张:胶版纸 |
| 包装:平装-胶订 |
| 是否套装:否 |
| 国际标准书号ISBN:9787302696872 |
| 所属分类:图书>计算机/网络>计算机理论 |
深度学习案例拆解,实战落地指南,赠送课件和视频讲解。重磅推荐
马斯克科技帝国 马斯克如何构建商业生态闭环 如何用“第一性原理”改写商业规则
自营
网络工程师实训教程:华为、新华三、思科案例集锦(视频教学版)
自营券限时抢
学会提问,驾驭:提示词从入门到精通
自营券限时抢
通识课讲:走进人工智能
自营券预售
机器人学与具身智能
自营券满减满
智能体开发实践
自营券限时抢
人工智能:时代的机遇和挑战
自营券满减
图解 小时掌握虚拟优先时代的新生存策略 图解新科技系列
自营券满减满
精进图表:赋能,成为图表高手
自营券限时抢
产品特色
编辑推荐
《深度学习与大模型部署及微调》根据大多数软件公司对大模型开发程序员的标准要求,结合范例程序,针对零基础人群,讲述了从“入门”到“能干活”所必需掌握的知识点。
《深度学习与大模型部署及微调》内容涵盖了深度学习各种模型的知识点,包括和的开发环境、神经网络预测技术、用卷积和残差神经网络分类图片的技术、数据预处理和数据增强、用生成对抗网络识别图片的技术、用循环神经网络和 网络分析文本的技术、用模型分类图片的技术、人脸识别和目标物体识别的技术、音频处理技术,以及本地化部署和微调技术等。
内容简介
《深度学习与大模型部署及微调》根据大多数软件公司对大模型开发程序员的标准要求,结合范例程序,针对零基础人群,讲述了从“入门”到“能干活”所必需掌握的知识点。
《深度学习与大模型部署及微调》内容涵盖了深度学习各种模型的知识点,包括和的开发环境、神经网络预测技术、用卷积和残差神经网络分类图片的技术、数据预处理和数据增强、用生成对抗网络识别图片的技术、用循环神经网络和 网络分析文本的技术、用模型分类图片的技术、人脸识别和目标物体识别的技术、音频处理技术,以及本地化部署和微调技术等。
作者简介
胡书敏,大连理工大学计算机硕士,有年开发经验,资深架构师,目前在知名外企从事和的开发,有平安、花旗和等大厂的工作经验,同时有约年的技术面试官的经验。出版过《爬虫、数据分析与可视化:工具详解与案例实战》、《基于股票大数据分析的入门实战》等图书,有大模型搭建、训练和部署的落地经验。
金华,上海浦东软件园股份有限公司培训中心主任,兼任上海张江信息技术专修学院院长,上海市浦东软件园职业技能培训中心主任,上海市人力资源和社会保障局职业技能鉴定中心专家组组长,上海市教育委员会职业教育教学工作诊断与改进专家。长期从事软件和信息技术专业职业标准、培训课程、鉴定方案等研发工作。主审中国劳动社会保障出版社《计算机程序设计员()高级》教材,主编上海市经济和信息化委员会工程师继续教育《大数据与数据挖掘》、《移动互联网》与《大数据可视化技术与应用》等教材。
曹宇,上海城建职业学院机电工程与信息学院,副教授、工程师、二级技师(计算机程序设计员)。
历任高级程序员、项目经理、信息技术总监、专业教师、专业负责人等职务。主导与开发染整生产管理信息系统、企业专利信息协同平台、上海城市管理职业技术学院教务系统管理平台、大宗商品信息管理系统等项目。胡书敏,大连理工大学计算机硕士,有年开发经验,资深架构师,目前在知名外企从事和的开发,有平安、花旗和等大厂的工作经验,同时有约年的技术面试官的经验。出版过《爬虫、数据分析与可视化:工具详解与案例实战》、《基于股票大数据分析的入门实战》等图书,有大模型搭建、训练和部署的落地经验。
金华,上海浦东软件园股份有限公司培训中心主任,兼任上海张江信息技术专修学院院长,上海市浦东软件园职业技能培训中心主任,上海市人力资源和社会保障局职业技能鉴定中心专家组组长,上海市教育委员会职业教育教学工作诊断与改进专家。长期从事软件和信息技术专业职业标准、培训课程、鉴定方案等研发工作。主审中国劳动社会保障出版社《计算机程序设计员()高级》教材,主编上海市经济和信息化委员会工程师继续教育《大数据与数据挖掘》、《移动互联网》与《大数据可视化技术与应用》等教材。
曹宇,上海城建职业学院机电工程与信息学院,副教授、工程师、二级技师(计算机程序设计员)。
历任高级程序员、项目经理、信息技术总监、专业教师、专业负责人等职务。主导与开发染整生产管理信息系统、企业专利信息协同平台、上海城市管理职业技术学院教务系统管理平台、大宗商品信息管理系统等项目。
参与的《上海市信息港建设政策报告》、《上海信息港集约化信息管线发展研究》分获上海市决策咨询类二等奖和三等奖。
指导学生多项获奖,其中上海市星光计划网站设计项目获得一等奖且排名第一。
显示全部信息
目 录
第章 神经网络、深度学习和大模型
神经网络和深度学习
神经元和神经网络
深度神经网络与深度学习
深度学习的应用场景
深度学习和大模型
实现深度学习的框架
简介
的常用模块
搭建开发环境
简单安装框架
搭建支持的环境
和
安装基于的第章 神经网络、深度学习和大模型
神经网络和深度学习
神经元和神经网络
深度神经网络与深度学习
深度学习的应用场景
深度学习和大模型
实现深度学习的框架
简介
的常用模块
搭建开发环境
简单安装框架
搭建支持的环境
和
安装基于的
小结和预告
第章 学习张量,搭建神经网络
张量的概念和基本操作
标量、向量、矩阵和张量
张量和深度学习的关系
创建张量
张量的常见方法
张量与数据的相互转换
张量的常见运算
张量的索引操作
张量的切片操作
转换张量的维度
过滤与条件操作
搭建第一个神经网络
训练集、验证集和测试集
过拟合与欠拟合
损失函数
神经网络的超参数
搭建神经网络的定式
小结和预告
第章 实战神经网络(多层感知机)
自带的数据集
数据集介绍
下载数据集
可视化数据集
激活函数
引入非线性因素的激活函数
激活函数
激活函数
激活函数
神经网络与损失函数
用训练,观察损失值
交叉熵损失函数
优化器与前后向传播
优化器与梯度下降
前向传播与后向传播
引入参数
、和优化器
用神经网络作预测
小结和预告
第章 用卷积神经网络识别图片
下载并使用数据集
获取数据集
观察数据集
卷积神经网络概述
二维卷积的计算范例
填充和移动步长
卷积通道数值说明
二维卷积方法及其参数
池化层及池化策略
整体结构及工作流程
用训练卷积神经网络
搭建模型,观察训练结果
观察模型的结构
用卷积神经网络预测结果
用训练卷积神经网络
卷积及池化后的尺寸计算方式
搭建及训练模型
用模型预测图片分类
小结和预告
第章 实战残差神经网络
梯度爆炸和梯度消失
可视化观察梯度下降
后向传播、梯度消失和梯度爆炸
梯度消失和梯度爆炸的解决方法
搭建残差神经网络
残差模块的结构
搭建残差神经网络的方法
残差神经网络与图片分类
识别手写数字体
分类图片
小结和预告
第章 对模型的实用性操作
可视化模型
用可视化模型
用可视化模型
用观察训练过程
保存和加载模型
保存模型
加载模型
数据预处理和数据增强
归一化处理
图片的随机裁剪
图片的中心裁剪
图片缩放
水平、垂直与随机角度翻转图片
随机灰度化
亮度、对比度、饱和度和色度变换
小结和预告
第章 基于深度学习的回归分析和聚类分析
回归分析
获取房价数据集
用神经网络分析预测房价
获取股票数据集
用神经网络分析股价
聚类分析
分类葡萄酒数据
分类鸢尾花数据
用神经网络预测股票涨跌
小结和预告
第章 迁移学习实战
迁移学习的概念和常用方法
迁移学习的两大实现方法
可供使用的预训练模型
基于微调参数的迁移学习
和
用数据集训练微调参数
基于特征提取器的迁移学习
获取蚂蚁和蜜蜂数据集
对特征提取器的说明
基于特征提取器的迁移学习
小结和预告
第章 基于词向量和模型的文本分析
文本分析的基础:向量化
文本向量化概述
词频逆频率
基于词频逆频率的向量化示例
分词、向量化和词嵌入
基于分词的向量化
基于向量化的相似度分析
深入了解词嵌入和词向量
基于模型的词嵌入
基于词嵌入的相似度分析
基于卷积模型的情感分析
数据集介绍
用库实现向量化
与卷积模型
训练模型,预测新文本的情感
基于循环神经网络的情感分析
单向神经网络
双向神经网络
基于双向神经网络的情感分析
小结和预告
第章 基于生成对抗网络的图片识别实战
生成对抗网络概述
用两个模型来对抗
生成器和判别器损失值的计算方式
生成对抗网络的训练过程
基于数据集的实战
训练过程和损失值
训练与预测的代码分析
生成对抗卷积网络实战
数据集分析
基于卷积的生成对抗网络
训练并拟合图片
小结和预告
第章 人脸检测和人脸识别技术实战
人脸检测和人脸识别技术概述
人脸检测相关算法介绍
人脸识别技术介绍
支持人脸检测和识别的类库
获取人脸数据集
安装库
基于的人脸检测
绘制人脸范围
获取人脸特征点
用对抗网络拟合人脸
数据集介绍
用基于卷积的生成对抗网络拟合人脸
实战人脸识别技术
基于的人脸识别技术
基于的人脸识别技术
小结和预告
第章 音频处理技术实战
必要的准备工作
安装库
下载音频数据集
音频知识点概述
时域图和频域图
声谱图
梅尔频谱
用卷积模型分类音频
加载数据集的特征值和目标值
用交叉验证扩充数据集
搭建卷积神经网络模型
训练、验证及预测
小结和预告
第章 目标检测技术实战
目标检测技术概述
传统目标检测的流程及缺陷
基于深度学习的目标检测技术
目标检测的相关概念
通过数据集初识目标标记
介绍 数据集
展示目标标记效果
用模型标记目标
模型
用 模型标记目标
用模型标记目标
用模型标记目标
小结和预告
第章 强化学习实战
强化学习概述
强化学习的概念和流程
强化学习的算法框架
算法概述
基于算法的模型概述
安装强化学习的环境类库
基于倒立摆环境的强化学习
倒立摆问题概述
搭建网络模型
引用模型,实现强化学习
基于着陆舱环境的强化学习
着陆舱降落问题概述
搭建 网络模型
实现强化学习的案例分析
小结和预告
第章 基于模型的自然语言翻译
模型概述
模型的架构和构成
注意力机制和计算规则
自注意力和多头注意力机制
基于模型的自然语言翻译流程
翻译的主要流程
下载训练数据集和分词模型
搭建文本翻译的模型
训练模型
尝试翻译,观察训练成果
小结和预告
第章 模型实战
的概念和架构
的组成架构
分类图片的大致流程
简要版分类图片实战
数据集分析
搭建简要版的模型
训练模型,观察分类结果
完整版分类图片实战
实现注意力机制的类
实现层
实现编码器层
搭建完整版的模型
训练模型,观察分类结果
小结和预告
第章 本地化部署和微调实战
模型概述
大语言模型概述
大语言模型简介
本地化部署
下载
观察本地化部署效果
微调
获取数据集
基于的微调方法
微调大模型
小结和预告
显示全部信息
前 言
当下深度学习和大模型是一个技术热点,如果读者想学习这方面的技能,那么本书是一个不错的选择。
从知识体系上来看,本书的内容涵盖了深度学习各种模型的知识点,包括但不限于搭建和的开发环境、用多层感知机预测数据的技术、用卷积和残差神经网络分类图片的技术、用生成对抗网络识别图片的技术、用循环神经网络和网络分析文本的技术、用模型分类图片的技术、人脸识别和目标物体识别的技术,以及强化学习和音频分析等技术。
此外,本书还用专门的一章讲述了模型在本地部署和微调的技能点。
本书的作者具有多年、和大模型的开发经验,谙熟模型方面高级开发所需要掌握的知识体系,也非常清楚从零基础升级到高级开发人员可能会走的弯路,所以在本书的内容安排上,第一,只讲初学者有必要学习的知识点,而不会导致过度学习;第二,并没有像其他同类书那样给出复杂的数学公式,而是用通俗的文字讲述各种技能;第三,结合具体范例程序讲述各知识点,从而能确保读者学得会并用得上。当下深度学习和大模型是一个技术热点,如果读者想学习这方面的技能,那么本书是一个不错的选择。
从知识体系上来看,本书的内容涵盖了深度学习各种模型的知识点,包括但不限于搭建和的开发环境、用多层感知机预测数据的技术、用卷积和残差神经网络分类图片的技术、用生成对抗网络识别图片的技术、用循环神经网络和网络分析文本的技术、用模型分类图片的技术、人脸识别和目标物体识别的技术,以及强化学习和音频分析等技术。
此外,本书还用专门的一章讲述了模型在本地部署和微调的技能点。
本书的作者具有多年、和大模型的开发经验,谙熟模型方面高级开发所需要掌握的知识体系,也非常清楚从零基础升级到高级开发人员可能会走的弯路,所以在本书的内容安排上,第一,只讲初学者有必要学习的知识点,而不会导致过度学习;第二,并没有像其他同类书那样给出复杂的数学公式,而是用通俗的文字讲述各种技能;第三,结合具体范例程序讲述各知识点,从而能确保读者学得会并用得上。
本书的全部范例在环境下也均可运行。本书还附带一些范例所必需的数据集,而且对于所有范例,笔者都是逐行讲述了关键要点。所以笔者相信,即使是零基础的初学者,也能通过本书提供的范例及文字,高效地掌握深度学习的相关技能点。本书的范例程序篇幅适中,通俗易懂,还可作为课程设计或毕业设计的参考范例。
本书赠送代码、数据集、和视频讲解,读者扫描下方二维码可获取。
为了让读者能高效掌握本书的知识点和范例,笔者在编写本书时,处处留心、字字斟酌。本书不会出现复杂的数学公式和术语,而是用比较通俗易懂的文字,由浅入深地讲述诸多知识点。
由于编者水平有限,书中难免存在缺点和错误,殷切希望广大读者批评指正。
显示全部信息
马斯克科技帝国 马斯克如何构建商业生态闭环 如何用“第一性原理”改写商业规则
自营
网络工程师实训教程:华为、新华三、思科案例集锦(视频教学版)
自营券限时抢
学会提问,驾驭:提示词从入门到精通
自营券限时抢
通识课讲:走进人工智能
自营券预售
机器人学与具身智能
自营券满减满
智能体开发实践
自营券限时抢
人工智能:时代的机遇和挑战
自营券满减
图解 小时掌握虚拟优先时代的新生存策略 图解新科技系列
自营券满减满
精进图表:赋能,成为图表高手
自营券限时抢
产品特色
编辑推荐
《深度学习与大模型部署及微调》根据大多数软件公司对大模型开发程序员的标准要求,结合范例程序,针对零基础人群,讲述了从“入门”到“能干活”所必需掌握的知识点。
《深度学习与大模型部署及微调》内容涵盖了深度学习各种模型的知识点,包括和的开发环境、神经网络预测技术、用卷积和残差神经网络分类图片的技术、数据预处理和数据增强、用生成对抗网络识别图片的技术、用循环神经网络和 网络分析文本的技术、用模型分类图片的技术、人脸识别和目标物体识别的技术、音频处理技术,以及本地化部署和微调技术等。
内容简介
《深度学习与大模型部署及微调》根据大多数软件公司对大模型开发程序员的标准要求,结合范例程序,针对零基础人群,讲述了从“入门”到“能干活”所必需掌握的知识点。
《深度学习与大模型部署及微调》内容涵盖了深度学习各种模型的知识点,包括和的开发环境、神经网络预测技术、用卷积和残差神经网络分类图片的技术、数据预处理和数据增强、用生成对抗网络识别图片的技术、用循环神经网络和 网络分析文本的技术、用模型分类图片的技术、人脸识别和目标物体识别的技术、音频处理技术,以及本地化部署和微调技术等。
作者简介
胡书敏,大连理工大学计算机硕士,有年开发经验,资深架构师,目前在知名外企从事和的开发,有平安、花旗和等大厂的工作经验,同时有约年的技术面试官的经验。出版过《爬虫、数据分析与可视化:工具详解与案例实战》、《基于股票大数据分析的入门实战》等图书,有大模型搭建、训练和部署的落地经验。
金华,上海浦东软件园股份有限公司培训中心主任,兼任上海张江信息技术专修学院院长,上海市浦东软件园职业技能培训中心主任,上海市人力资源和社会保障局职业技能鉴定中心专家组组长,上海市教育委员会职业教育教学工作诊断与改进专家。长期从事软件和信息技术专业职业标准、培训课程、鉴定方案等研发工作。主审中国劳动社会保障出版社《计算机程序设计员()高级》教材,主编上海市经济和信息化委员会工程师继续教育《大数据与数据挖掘》、《移动互联网》与《大数据可视化技术与应用》等教材。
曹宇,上海城建职业学院机电工程与信息学院,副教授、工程师、二级技师(计算机程序设计员)。
历任高级程序员、项目经理、信息技术总监、专业教师、专业负责人等职务。主导与开发染整生产管理信息系统、企业专利信息协同平台、上海城市管理职业技术学院教务系统管理平台、大宗商品信息管理系统等项目。胡书敏,大连理工大学计算机硕士,有年开发经验,资深架构师,目前在知名外企从事和的开发,有平安、花旗和等大厂的工作经验,同时有约年的技术面试官的经验。出版过《爬虫、数据分析与可视化:工具详解与案例实战》、《基于股票大数据分析的入门实战》等图书,有大模型搭建、训练和部署的落地经验。
金华,上海浦东软件园股份有限公司培训中心主任,兼任上海张江信息技术专修学院院长,上海市浦东软件园职业技能培训中心主任,上海市人力资源和社会保障局职业技能鉴定中心专家组组长,上海市教育委员会职业教育教学工作诊断与改进专家。长期从事软件和信息技术专业职业标准、培训课程、鉴定方案等研发工作。主审中国劳动社会保障出版社《计算机程序设计员()高级》教材,主编上海市经济和信息化委员会工程师继续教育《大数据与数据挖掘》、《移动互联网》与《大数据可视化技术与应用》等教材。
曹宇,上海城建职业学院机电工程与信息学院,副教授、工程师、二级技师(计算机程序设计员)。
历任高级程序员、项目经理、信息技术总监、专业教师、专业负责人等职务。主导与开发染整生产管理信息系统、企业专利信息协同平台、上海城市管理职业技术学院教务系统管理平台、大宗商品信息管理系统等项目。
参与的《上海市信息港建设政策报告》、《上海信息港集约化信息管线发展研究》分获上海市决策咨询类二等奖和三等奖。
指导学生多项获奖,其中上海市星光计划网站设计项目获得一等奖且排名第一。
显示全部信息
目 录
第章 神经网络、深度学习和大模型
神经网络和深度学习
神经元和神经网络
深度神经网络与深度学习
深度学习的应用场景
深度学习和大模型
实现深度学习的框架
简介
的常用模块
搭建开发环境
简单安装框架
搭建支持的环境
和
安装基于的第章 神经网络、深度学习和大模型
神经网络和深度学习
神经元和神经网络
深度神经网络与深度学习
深度学习的应用场景
深度学习和大模型
实现深度学习的框架
简介
的常用模块
搭建开发环境
简单安装框架
搭建支持的环境
和
安装基于的
小结和预告
第章 学习张量,搭建神经网络
张量的概念和基本操作
标量、向量、矩阵和张量
张量和深度学习的关系
创建张量
张量的常见方法
张量与数据的相互转换
张量的常见运算
张量的索引操作
张量的切片操作
转换张量的维度
过滤与条件操作
搭建第一个神经网络
训练集、验证集和测试集
过拟合与欠拟合
损失函数
神经网络的超参数
搭建神经网络的定式
小结和预告
第章 实战神经网络(多层感知机)
自带的数据集
数据集介绍
下载数据集
可视化数据集
激活函数
引入非线性因素的激活函数
激活函数
激活函数
激活函数
神经网络与损失函数
用训练,观察损失值
交叉熵损失函数
优化器与前后向传播
优化器与梯度下降
前向传播与后向传播
引入参数
、和优化器
用神经网络作预测
小结和预告
第章 用卷积神经网络识别图片
下载并使用数据集
获取数据集
观察数据集
卷积神经网络概述
二维卷积的计算范例
填充和移动步长
卷积通道数值说明
二维卷积方法及其参数
池化层及池化策略
整体结构及工作流程
用训练卷积神经网络
搭建模型,观察训练结果
观察模型的结构
用卷积神经网络预测结果
用训练卷积神经网络
卷积及池化后的尺寸计算方式
搭建及训练模型
用模型预测图片分类
小结和预告
第章 实战残差神经网络
梯度爆炸和梯度消失
可视化观察梯度下降
后向传播、梯度消失和梯度爆炸
梯度消失和梯度爆炸的解决方法
搭建残差神经网络
残差模块的结构
搭建残差神经网络的方法
残差神经网络与图片分类
识别手写数字体
分类图片
小结和预告
第章 对模型的实用性操作
可视化模型
用可视化模型
用可视化模型
用观察训练过程
保存和加载模型
保存模型
加载模型
数据预处理和数据增强
归一化处理
图片的随机裁剪
图片的中心裁剪
图片缩放
水平、垂直与随机角度翻转图片
随机灰度化
亮度、对比度、饱和度和色度变换
小结和预告
第章 基于深度学习的回归分析和聚类分析
回归分析
获取房价数据集
用神经网络分析预测房价
获取股票数据集
用神经网络分析股价
聚类分析
分类葡萄酒数据
分类鸢尾花数据
用神经网络预测股票涨跌
小结和预告
第章 迁移学习实战
迁移学习的概念和常用方法
迁移学习的两大实现方法
可供使用的预训练模型
基于微调参数的迁移学习
和
用数据集训练微调参数
基于特征提取器的迁移学习
获取蚂蚁和蜜蜂数据集
对特征提取器的说明
基于特征提取器的迁移学习
小结和预告
第章 基于词向量和模型的文本分析
文本分析的基础:向量化
文本向量化概述
词频逆频率
基于词频逆频率的向量化示例
分词、向量化和词嵌入
基于分词的向量化
基于向量化的相似度分析
深入了解词嵌入和词向量
基于模型的词嵌入
基于词嵌入的相似度分析
基于卷积模型的情感分析
数据集介绍
用库实现向量化
与卷积模型
训练模型,预测新文本的情感
基于循环神经网络的情感分析
单向神经网络
双向神经网络
基于双向神经网络的情感分析
小结和预告
第章 基于生成对抗网络的图片识别实战
生成对抗网络概述
用两个模型来对抗
生成器和判别器损失值的计算方式
生成对抗网络的训练过程
基于数据集的实战
训练过程和损失值
训练与预测的代码分析
生成对抗卷积网络实战
数据集分析
基于卷积的生成对抗网络
训练并拟合图片
小结和预告
第章 人脸检测和人脸识别技术实战
人脸检测和人脸识别技术概述
人脸检测相关算法介绍
人脸识别技术介绍
支持人脸检测和识别的类库
获取人脸数据集
安装库
基于的人脸检测
绘制人脸范围
获取人脸特征点
用对抗网络拟合人脸
数据集介绍
用基于卷积的生成对抗网络拟合人脸
实战人脸识别技术
基于的人脸识别技术
基于的人脸识别技术
小结和预告
第章 音频处理技术实战
必要的准备工作
安装库
下载音频数据集
音频知识点概述
时域图和频域图
声谱图
梅尔频谱
用卷积模型分类音频
加载数据集的特征值和目标值
用交叉验证扩充数据集
搭建卷积神经网络模型
训练、验证及预测
小结和预告
第章 目标检测技术实战
目标检测技术概述
传统目标检测的流程及缺陷
基于深度学习的目标检测技术
目标检测的相关概念
通过数据集初识目标标记
介绍 数据集
展示目标标记效果
用模型标记目标
模型
用 模型标记目标
用模型标记目标
用模型标记目标
小结和预告
第章 强化学习实战
强化学习概述
强化学习的概念和流程
强化学习的算法框架
算法概述
基于算法的模型概述
安装强化学习的环境类库
基于倒立摆环境的强化学习
倒立摆问题概述
搭建网络模型
引用模型,实现强化学习
基于着陆舱环境的强化学习
着陆舱降落问题概述
搭建 网络模型
实现强化学习的案例分析
小结和预告
第章 基于模型的自然语言翻译
模型概述
模型的架构和构成
注意力机制和计算规则
自注意力和多头注意力机制
基于模型的自然语言翻译流程
翻译的主要流程
下载训练数据集和分词模型
搭建文本翻译的模型
训练模型
尝试翻译,观察训练成果
小结和预告
第章 模型实战
的概念和架构
的组成架构
分类图片的大致流程
简要版分类图片实战
数据集分析
搭建简要版的模型
训练模型,观察分类结果
完整版分类图片实战
实现注意力机制的类
实现层
实现编码器层
搭建完整版的模型
训练模型,观察分类结果
小结和预告
第章 本地化部署和微调实战
模型概述
大语言模型概述
大语言模型简介
本地化部署
下载
观察本地化部署效果
微调
获取数据集
基于的微调方法
微调大模型
小结和预告
显示全部信息
前 言
当下深度学习和大模型是一个技术热点,如果读者想学习这方面的技能,那么本书是一个不错的选择。
从知识体系上来看,本书的内容涵盖了深度学习各种模型的知识点,包括但不限于搭建和的开发环境、用多层感知机预测数据的技术、用卷积和残差神经网络分类图片的技术、用生成对抗网络识别图片的技术、用循环神经网络和网络分析文本的技术、用模型分类图片的技术、人脸识别和目标物体识别的技术,以及强化学习和音频分析等技术。
此外,本书还用专门的一章讲述了模型在本地部署和微调的技能点。
本书的作者具有多年、和大模型的开发经验,谙熟模型方面高级开发所需要掌握的知识体系,也非常清楚从零基础升级到高级开发人员可能会走的弯路,所以在本书的内容安排上,第一,只讲初学者有必要学习的知识点,而不会导致过度学习;第二,并没有像其他同类书那样给出复杂的数学公式,而是用通俗的文字讲述各种技能;第三,结合具体范例程序讲述各知识点,从而能确保读者学得会并用得上。当下深度学习和大模型是一个技术热点,如果读者想学习这方面的技能,那么本书是一个不错的选择。
从知识体系上来看,本书的内容涵盖了深度学习各种模型的知识点,包括但不限于搭建和的开发环境、用多层感知机预测数据的技术、用卷积和残差神经网络分类图片的技术、用生成对抗网络识别图片的技术、用循环神经网络和网络分析文本的技术、用模型分类图片的技术、人脸识别和目标物体识别的技术,以及强化学习和音频分析等技术。
此外,本书还用专门的一章讲述了模型在本地部署和微调的技能点。
本书的作者具有多年、和大模型的开发经验,谙熟模型方面高级开发所需要掌握的知识体系,也非常清楚从零基础升级到高级开发人员可能会走的弯路,所以在本书的内容安排上,第一,只讲初学者有必要学习的知识点,而不会导致过度学习;第二,并没有像其他同类书那样给出复杂的数学公式,而是用通俗的文字讲述各种技能;第三,结合具体范例程序讲述各知识点,从而能确保读者学得会并用得上。
本书的全部范例在环境下也均可运行。本书还附带一些范例所必需的数据集,而且对于所有范例,笔者都是逐行讲述了关键要点。所以笔者相信,即使是零基础的初学者,也能通过本书提供的范例及文字,高效地掌握深度学习的相关技能点。本书的范例程序篇幅适中,通俗易懂,还可作为课程设计或毕业设计的参考范例。
本书赠送代码、数据集、和视频讲解,读者扫描下方二维码可获取。
为了让读者能高效掌握本书的知识点和范例,笔者在编写本书时,处处留心、字字斟酌。本书不会出现复杂的数学公式和术语,而是用比较通俗易懂的文字,由浅入深地讲述诸多知识点。
由于编者水平有限,书中难免存在缺点和错误,殷切希望广大读者批评指正。
显示全部信息