
开本:16开 |
纸张:胶版纸 |
包装:平装-胶订 |
是否套装:否 |
国际标准书号ISBN:9787111773429 |
所属分类:图书>计算机/网络>软件工程/开发项目管理 |
商品详情
基本信息(以实物为准)
商品名称:从零开始构建企业级系统
作者:李多多 范国斌 定 开
出版社:机械工业 号 页数
出版时间 版次 商品类型:图书
印刷时间 印次内容简介
这是一本面向企业级应用开发者和决策者的技术实战指南,全面覆盖了从基础理论到 优化的各个环节。本书采用循序渐进的讲解方式,配以丰富的图表和代码示例,为读者提供了一条完整的学习路径,帮助读者快速掌握技术的精髓。
本书共章,分为四部分。
部分(第章和第章) 技术基础介绍了技术的定义、发展背景、核心组成以及落地面临的挑战,同时深入探讨了技术背后的原理,包括嵌入技术、数据索引与检索,以及大语言模型的应用。
第二部分(第章) 应用构建流程详细讲解了应用的各个环节,从数据准备与处理,到检索环节的优化,再到生成环节的技巧。
第三部分(第章) 技术进阶主要介绍了系统的 优化策略、常见框架实现原理与性能评估方法。针对 优化策略,介绍了索引构建、预检索、检索、生成预处理和生成五个环节;针对常见框架,介绍了自省式、自适应、基于树结构索引的、纠错性等;针对评估方法,从评估指标和评估框架两个方面介绍了检索环节和生成环节的各种衡量指标的特点。这是一本面向企业级应用开发者和决策者的技术实战指南,全面覆盖了从基础理论到 优化的各个环节。本书采用循序渐进的讲解方式,配以丰富的图表和代码示例,为读者提供了一条完整的学习路径,帮助读者快速掌握技术的精髓。
本书共章,分为四部分。
部分(第章和第章) 技术基础介绍了技术的定义、发展背景、核心组成以及落地面临的挑战,同时深入探讨了技术背后的原理,包括嵌入技术、数据索引与检索,以及大语言模型的应用。
第二部分(第章) 应用构建流程详细讲解了应用的各个环节,从数据准备与处理,到检索环节的优化,再到生成环节的技巧。
第三部分(第章) 技术进阶主要介绍了系统的 优化策略、常见框架实现原理与性能评估方法。针对 优化策略,介绍了索引构建、预检索、检索、生成预处理和生成五个环节;针对常见框架,介绍了自省式、自适应、基于树结构索引的、纠错性等;针对评估方法,从评估指标和评估框架两个方面介绍了检索环节和生成环节的各种衡量指标的特点。
第四部分(第章和 章) 应用实例首先通过具体的企业级应用案例和行业特定解决方案,展示了技术在文档生成、知识库检索、客户服务等领域的实际应用,以及在金融、医疗、法律等特定行业的落地实践。然后展望了技术的未来发展趋势,如长上下文对的影响、多模态的应用,以及嵌入模型与大模型语义空间融合等前沿话题, 对落地挑战进行了总结。
为了给读者提供 好的学习体验,本书准备了丰富的配套资源 仓库:地址为 ,包含 的代码 新和额外的学习资料。 读者社区:关注公众号“莫尔索随笔”与“”,加入交流群,与作者和其他读者交流讨论。
显示全部信息
目 录
目 录
前言
部分 技术基础
第章 技术简介
为什么需要
技术的发展背景
早期阶段:信息检索与问答系统
过渡阶段:自然语言处理与机器学习
发展阶段:技术的兴起与优化
技术的核心组成
检索模块
生成模块
数据增强
与大语言模型集成
与的结合
和
面临的挑战
总结
第章 技术背后的原理
技术
为什么要用
的工作原理
的发展历程
的代码示例
数据索引与检索
数据索引的基本概念
数据检索的基本原理
数据索引与检索的技术
实现
数据索引与检索的应用
场景
大语言模型
大语言模型的特点
大语言模型的技术原理
大语言模型在中的
应用
总结
第二部分 应用构建流程
第章 数据准备与处理
数据清洗
数据收集
文本处理
文本分词
文本分割
固定大小分块
递归分块
基于文档逻辑的分块
语义分块
索引构建
列表索引
关键词表索引
向量索引
树索引
文档摘要索引
总结
第章 检索环节
索引构建与优化
索引构建回顾
索引 新策略
索引压缩技术
多模态索引构建
检索策略与算法
匹配检索
相似度检索
语义检索
混合检索
检索结果排序与过滤
查询转化
查询预处理
查询扩展
查询理解与意图识别
总结
第章 生成环节
重排序
重排序的概念
重排序的基本原理
提示工程
零样本提示
少样本提示
思维链提示
归纳生成
数据合成
文章摘要生成
人物场景创作
对话生成
结构化输出
总结
第三部分 技术进阶
第章 优化技术
索引构建优化
长文档优化
大规模文档系统的优化
预检索优化
查询转换
查询扩展
结构化查询
查询路由
查询缓存
检索阶段优化
知识图谱的混合检索
关键词检索与向量检索
结合
微调嵌入模型
生成预处理
重排序
压缩与选择
生成阶段优化
提示工程
归因生成
事实验证
生成模型微调
总结
第章 常见框架的实现
原理
自省式
实现原理
构建自省式应用
自适应
实现原理
构建自适应应用
基于树结构索引的
实现原理
树结构的特点
构建应用
纠错性
实现原理
构建纠错性应用
融合
实现原理
构建融合系统
基于知识图谱的
实现原理
构建基于知识图谱的
应用
其他
总结
第章 系统性能评估
评估指标
检索环节评估
生成环节评估
常见的评估框架
框架
框架
框架
其他
总结
第四部分 应用实例
第章 企业级应用实践
通用应用
智能文档问答
企业知识库智能搜索
智能客服系统
行业应用
在金融行业的应用
在医疗行业的应用
在法律行业的应用
在教育行业的应用
构建企业级系统
用户认证
输入防护
组件
输出防护
反馈收集
数据存储
可观测性
总结
章 技术展望
技术演进
大模型主动参与知识
选取
嵌入模型与大模型语义
空间融合
流程动态编排
多模态
三种检索策略
两种响应方式
落地挑战
显示全部信息
作者简介
李多多(笔名:莫尔索)
技术专家,专注工程化落地与企业级解决方案。某公司 项目研发负责人,多家企业 技术顾问。在大语言模型应用开发领域有丰富经验,擅长应用工程化、系统构建以及 开发,著有《编程:从人门到实践》、开源电子书《应用开发实践》。
范国斌
大模型技术专家,连续创业者,百度飞桨技术专家, 技术负责人。在大语言模型应用开发方面积累了深厚经验,精通 工程化落地、 系统搭建以及 的开发与实现。开发的多款原生应用获得百度飞桨首页曝光,其中“ 信息官”获评“百度年度星河产业百强应用”。
基本信息(以实物为准)
商品名称:从零开始构建企业级系统
作者:李多多 范国斌 定 开
出版社:机械工业 号 页数
出版时间 版次 商品类型:图书
印刷时间 印次内容简介
这是一本面向企业级应用开发者和决策者的技术实战指南,全面覆盖了从基础理论到 优化的各个环节。本书采用循序渐进的讲解方式,配以丰富的图表和代码示例,为读者提供了一条完整的学习路径,帮助读者快速掌握技术的精髓。
本书共章,分为四部分。
部分(第章和第章) 技术基础介绍了技术的定义、发展背景、核心组成以及落地面临的挑战,同时深入探讨了技术背后的原理,包括嵌入技术、数据索引与检索,以及大语言模型的应用。
第二部分(第章) 应用构建流程详细讲解了应用的各个环节,从数据准备与处理,到检索环节的优化,再到生成环节的技巧。
第三部分(第章) 技术进阶主要介绍了系统的 优化策略、常见框架实现原理与性能评估方法。针对 优化策略,介绍了索引构建、预检索、检索、生成预处理和生成五个环节;针对常见框架,介绍了自省式、自适应、基于树结构索引的、纠错性等;针对评估方法,从评估指标和评估框架两个方面介绍了检索环节和生成环节的各种衡量指标的特点。这是一本面向企业级应用开发者和决策者的技术实战指南,全面覆盖了从基础理论到 优化的各个环节。本书采用循序渐进的讲解方式,配以丰富的图表和代码示例,为读者提供了一条完整的学习路径,帮助读者快速掌握技术的精髓。
本书共章,分为四部分。
部分(第章和第章) 技术基础介绍了技术的定义、发展背景、核心组成以及落地面临的挑战,同时深入探讨了技术背后的原理,包括嵌入技术、数据索引与检索,以及大语言模型的应用。
第二部分(第章) 应用构建流程详细讲解了应用的各个环节,从数据准备与处理,到检索环节的优化,再到生成环节的技巧。
第三部分(第章) 技术进阶主要介绍了系统的 优化策略、常见框架实现原理与性能评估方法。针对 优化策略,介绍了索引构建、预检索、检索、生成预处理和生成五个环节;针对常见框架,介绍了自省式、自适应、基于树结构索引的、纠错性等;针对评估方法,从评估指标和评估框架两个方面介绍了检索环节和生成环节的各种衡量指标的特点。
第四部分(第章和 章) 应用实例首先通过具体的企业级应用案例和行业特定解决方案,展示了技术在文档生成、知识库检索、客户服务等领域的实际应用,以及在金融、医疗、法律等特定行业的落地实践。然后展望了技术的未来发展趋势,如长上下文对的影响、多模态的应用,以及嵌入模型与大模型语义空间融合等前沿话题, 对落地挑战进行了总结。
为了给读者提供 好的学习体验,本书准备了丰富的配套资源 仓库:地址为 ,包含 的代码 新和额外的学习资料。 读者社区:关注公众号“莫尔索随笔”与“”,加入交流群,与作者和其他读者交流讨论。
显示全部信息
目 录
目 录
前言
部分 技术基础
第章 技术简介
为什么需要
技术的发展背景
早期阶段:信息检索与问答系统
过渡阶段:自然语言处理与机器学习
发展阶段:技术的兴起与优化
技术的核心组成
检索模块
生成模块
数据增强
与大语言模型集成
与的结合
和
面临的挑战
总结
第章 技术背后的原理
技术
为什么要用
的工作原理
的发展历程
的代码示例
数据索引与检索
数据索引的基本概念
数据检索的基本原理
数据索引与检索的技术
实现
数据索引与检索的应用
场景
大语言模型
大语言模型的特点
大语言模型的技术原理
大语言模型在中的
应用
总结
第二部分 应用构建流程
第章 数据准备与处理
数据清洗
数据收集
文本处理
文本分词
文本分割
固定大小分块
递归分块
基于文档逻辑的分块
语义分块
索引构建
列表索引
关键词表索引
向量索引
树索引
文档摘要索引
总结
第章 检索环节
索引构建与优化
索引构建回顾
索引 新策略
索引压缩技术
多模态索引构建
检索策略与算法
匹配检索
相似度检索
语义检索
混合检索
检索结果排序与过滤
查询转化
查询预处理
查询扩展
查询理解与意图识别
总结
第章 生成环节
重排序
重排序的概念
重排序的基本原理
提示工程
零样本提示
少样本提示
思维链提示
归纳生成
数据合成
文章摘要生成
人物场景创作
对话生成
结构化输出
总结
第三部分 技术进阶
第章 优化技术
索引构建优化
长文档优化
大规模文档系统的优化
预检索优化
查询转换
查询扩展
结构化查询
查询路由
查询缓存
检索阶段优化
知识图谱的混合检索
关键词检索与向量检索
结合
微调嵌入模型
生成预处理
重排序
压缩与选择
生成阶段优化
提示工程
归因生成
事实验证
生成模型微调
总结
第章 常见框架的实现
原理
自省式
实现原理
构建自省式应用
自适应
实现原理
构建自适应应用
基于树结构索引的
实现原理
树结构的特点
构建应用
纠错性
实现原理
构建纠错性应用
融合
实现原理
构建融合系统
基于知识图谱的
实现原理
构建基于知识图谱的
应用
其他
总结
第章 系统性能评估
评估指标
检索环节评估
生成环节评估
常见的评估框架
框架
框架
框架
其他
总结
第四部分 应用实例
第章 企业级应用实践
通用应用
智能文档问答
企业知识库智能搜索
智能客服系统
行业应用
在金融行业的应用
在医疗行业的应用
在法律行业的应用
在教育行业的应用
构建企业级系统
用户认证
输入防护
组件
输出防护
反馈收集
数据存储
可观测性
总结
章 技术展望
技术演进
大模型主动参与知识
选取
嵌入模型与大模型语义
空间融合
流程动态编排
多模态
三种检索策略
两种响应方式
落地挑战
显示全部信息
作者简介
李多多(笔名:莫尔索)
技术专家,专注工程化落地与企业级解决方案。某公司 项目研发负责人,多家企业 技术顾问。在大语言模型应用开发领域有丰富经验,擅长应用工程化、系统构建以及 开发,著有《编程:从人门到实践》、开源电子书《应用开发实践》。
范国斌
大模型技术专家,连续创业者,百度飞桨技术专家, 技术负责人。在大语言模型应用开发方面积累了深厚经验,精通 工程化落地、 系统搭建以及 的开发与实现。开发的多款原生应用获得百度飞桨首页曝光,其中“ 信息官”获评“百度年度星河产业百强应用”。