
开本:16开 |
纸张:胶版纸 |
包装:平装-胶订 |
是否套装:否 |
国际标准书号ISBN:9787115655387 |
所属分类:图书>计算机/网络>硬件外部设备维修 |
编辑推荐
本书用三个案例讲解多模态大模型的落地实践 系统地讲解了多模态技术的基础理论、发展历程及其广泛的应用场景,深入地介绍了图像、文本、音频和视频等多模态数据的处理方法。 内容涵盖主流深度学习框架和多模态模型的核心原理,并配以实际开发中的应用案例与完整实例代码。 详细讲解了多模态数据的预处理、数据增强和特征提取方法,系统地阐述了多模态表示学习的关键技术,并提供全面的模型评估与验证方法。 通过实用案例介绍了多模态翻译系统的开发过程、基于多模态大模型的音视频广义零样本学习系统的实现,以及文生图生成系统的设计思路,为读者提供丰富的实战案例与开发指导。 作者主导多个垂直领域的大模型项目,包括心理领域的(漫谈)、医疗领域的 (孙思邈)、教育领域的 (锦鲤),以及通用多模态大模型(相生),所主持的 项目累计获得超过 次 。商品详情内容简介
本书循序渐进地阐述了多模态大模型的核心开发技术与应用实战的知识。全书共章,分别讲解了多模态技术概述、多模态模型与框架、多模态数据处理、多模态表示学习、多模态嵌入表示、多模态大模型的训练、多模态大模型的评估与验证、基于多模态大模型的翻译系统、基于多模态大模型的音视频广义零样本学习系统、基于 的文生图系统。全书简洁而不失技术深度,内容丰富全面,案例翔实,以通俗易懂的文字介绍了复杂的知识体系,易于阅读,是学习多模态大模型开发的实用教程。
本书适用于已经了解了语言基础语法,想进一步学习大模型开发、自然语言处理、计算机视觉处理、机器学习、深度学习技术的读者,还可以作为各类院校相关专业师生的学习用书和培训学校的教材。
目 录
第章 多模态技术概述
多模态技术简介
什么是多模态
多模态技术的发展历史
多模态技术的应用场景
多模态数据类型
常见的多模态类型
图像数据
文本数据
音频数据
视频数据
多模态技术的基本原理
数据融合与对齐
多模态表示学习 第章 多模态技术概述
多模态技术简介
什么是多模态
多模态技术的发展历史
多模态技术的应用场景
多模态数据类型
常见的多模态类型
图像数据
文本数据
音频数据
视频数据
多模态技术的基本原理
数据融合与对齐
多模态表示学习
多模态推理
第 章 多模态模型与框架
常用的深度学习框架
……
显示全部信息
作者简介
薛栋,华东理工大学信息科学与技术学院副教授硕士生导师,德国慕尼黑工业大学工学博士,“上海市高层次青年人才计划”、“浦江人才计划”、华理“青年英才培育计划”获得者。长期从事基于人工智能与大数据相关研究,其中包括自然语言处理与大语言模型、工业互联网与工业软件、复杂网络与多智能体系统等课题。主导多个垂直领域的大模型项目,包括心理领域的(漫谈)、医疗领域的 (孙思邈)、教育领域的 (锦鲤),以及通用多模态大模型(相生),所主持的 项目累计获得超过 次 。
本书用三个案例讲解多模态大模型的落地实践 系统地讲解了多模态技术的基础理论、发展历程及其广泛的应用场景,深入地介绍了图像、文本、音频和视频等多模态数据的处理方法。 内容涵盖主流深度学习框架和多模态模型的核心原理,并配以实际开发中的应用案例与完整实例代码。 详细讲解了多模态数据的预处理、数据增强和特征提取方法,系统地阐述了多模态表示学习的关键技术,并提供全面的模型评估与验证方法。 通过实用案例介绍了多模态翻译系统的开发过程、基于多模态大模型的音视频广义零样本学习系统的实现,以及文生图生成系统的设计思路,为读者提供丰富的实战案例与开发指导。 作者主导多个垂直领域的大模型项目,包括心理领域的(漫谈)、医疗领域的 (孙思邈)、教育领域的 (锦鲤),以及通用多模态大模型(相生),所主持的 项目累计获得超过 次 。商品详情内容简介
本书循序渐进地阐述了多模态大模型的核心开发技术与应用实战的知识。全书共章,分别讲解了多模态技术概述、多模态模型与框架、多模态数据处理、多模态表示学习、多模态嵌入表示、多模态大模型的训练、多模态大模型的评估与验证、基于多模态大模型的翻译系统、基于多模态大模型的音视频广义零样本学习系统、基于 的文生图系统。全书简洁而不失技术深度,内容丰富全面,案例翔实,以通俗易懂的文字介绍了复杂的知识体系,易于阅读,是学习多模态大模型开发的实用教程。
本书适用于已经了解了语言基础语法,想进一步学习大模型开发、自然语言处理、计算机视觉处理、机器学习、深度学习技术的读者,还可以作为各类院校相关专业师生的学习用书和培训学校的教材。
目 录
第章 多模态技术概述
多模态技术简介
什么是多模态
多模态技术的发展历史
多模态技术的应用场景
多模态数据类型
常见的多模态类型
图像数据
文本数据
音频数据
视频数据
多模态技术的基本原理
数据融合与对齐
多模态表示学习 第章 多模态技术概述
多模态技术简介
什么是多模态
多模态技术的发展历史
多模态技术的应用场景
多模态数据类型
常见的多模态类型
图像数据
文本数据
音频数据
视频数据
多模态技术的基本原理
数据融合与对齐
多模态表示学习
多模态推理
第 章 多模态模型与框架
常用的深度学习框架
……
显示全部信息
作者简介
薛栋,华东理工大学信息科学与技术学院副教授硕士生导师,德国慕尼黑工业大学工学博士,“上海市高层次青年人才计划”、“浦江人才计划”、华理“青年英才培育计划”获得者。长期从事基于人工智能与大数据相关研究,其中包括自然语言处理与大语言模型、工业互联网与工业软件、复杂网络与多智能体系统等课题。主导多个垂直领域的大模型项目,包括心理领域的(漫谈)、医疗领域的 (孙思邈)、教育领域的 (锦鲤),以及通用多模态大模型(相生),所主持的 项目累计获得超过 次 。