大模型知识增强:概念、方法与技术 9787121500794

配送至
$ $ USD 美元

开本:16开
纸张:胶版纸
包装:平塑勒
是否套装:否
国际标准书号ISBN:9787121500794
所属分类:图书>计算机/网络>程序设计>其他
探索“大模型知识图谱()”的神经符号融合之道!浙江大学陈华钧教授领先撰写!陆汝钤院士倾情作序,清华大学计算机学院孙茂松教授、北京大学计算机科学技术系金芝教授、澜舟科技创始人周明力荐!

编辑推荐

探索“大模型 知识图谱( )”的神经符号融合之道!
浙江大学陈华钧教授领先撰写,陆汝钤院士倾情作序,清华大学计算机学院孙茂松教授、北京大学计算机科学技术系金芝教授、澜舟科技创始人周明力荐!
融合大模型与知识图谱的前沿成果,揭开大模型时代知识增强的核心技术与实践路径。
知识增强预训练:注入结构化知识,提升模型语义理解与领域适应性;
知识驱动推理与问答:融合符号规则与思维链,破解复杂推理难题;
幻觉抑制与知识编辑:结合检索增强、知识对齐,打造可信赖生成;
多模态与智能体进阶:知识引导视觉问答、跨模态检索,探索具身智能新边界。

前 言
前言人类通过观察和认识世界来积累对万物的知识,而语言是最直接的表达和传递这些知识的工具。特别是以和为代表的大模型,标志着人工智能在理解和处理世界知识方面取得了显著的进展。通用智能是一种具备人类水平广泛认知能力的人工智能,充足和广泛的世界知识是实现通用智能的重要基础,大型模型则可以被视为一种处理世界知识的通用智能系统。知识图谱也是一种用于表示和处理人类知识的技术手段,在传统搜索引擎、智能问答和大数据分析等领域有着广泛的应用。大模型扩展了对语言的理解能力,知识图谱则丰富了表示知识的方式,将这二者深度结合和相互补充将极大地提升人工智能在知识处理方面的全面性、可靠性和可控性,为人工智能技术提供更加丰富和精准的知识处理能力。

为什么撰写本书前言 人类通过观察和认识世界来积累对万物的知识,而语言是最直接的表达和传递这些知识的工具。特别是以和为代表的大模型,标志着人工智能在理解和处理世界知识方面取得了显著的进展。通用智能是一种具备人类水平广泛认知能力的人工智能,充足和广泛的世界知识是实现通用智能的重要基础,大型模型则可以被视为一种处理世界知识的通用智能系统。知识图谱也是一种用于表示和处理人类知识的技术手段,在传统搜索引擎、智能问答和大数据分析等领域有着广泛的应用。大模型扩展了对语言的理解能力,知识图谱则丰富了表示知识的方式,将这二者深度结合和相互补充将极大地提升人工智能在知识处理方面的全面性、可靠性和可控性,为人工智能技术提供更加丰富和精准的知识处理能力。

为什么撰写本书
大模型作为当前人工智能领域的重要方向,正在不断拓展人类对智能的认知边界。尽管目前已有大量关于大模型和知识图谱的书籍,但系统介绍二者结合的专著仍然匮乏。本书的第一个出发点就是填补这个空白,旨在通过由浅入深地讲解,为研究者和实践者提供关于大模型与知识图谱融合的清晰指引,帮助他们全面理解这项融合技术的核心理念与实现路径。
本书的第二个出发点是探讨一些新的通用智能实现途径,尤其是从大模型与知识图谱的融合视角出发,探索符号知识增强的大模型技术新路径。长期以来,我国的大模型研究多以追赶和模仿国外技术为主,原创性突破相对较少。我们希望通过本书,推动形成具有自主特色的大模型技术体系,为国内人工智能技术的原创性发展提供一些新思路。
本书是基于作者团队近年来在学术研究和产业实践中的经验整理而成的一部专著,很多内容源自团队自有科研成果和产学研实践。尽管该领域很多内容仍处于探索阶段,但通过在理论与技术上的不断尝试,我们积累了一些实践经验。我们期望,本书的出版能为学术界和工业界的研究者提供一些新的参考,激发不同的创新思路,并为我国人工智能技术的进步和自主创新贡献绵薄之力。

本书主要内容
本书共包括章,主要内容如下。
第章,概述了大模型知识增强的基本概念、分类和方法。首先,探讨大模型时代通用智能的核心特征。接着,分析大模型中世界知识的表示与处理,以及面临的主要问题。随后,从语言模型和传统符号知识的优缺点出发,介绍二者的互补优势。最后,简要介绍大模型知识增强的常见方法与实践,为后续章节的深入讨论奠定基础。
第章,重点介绍预训练阶段的知识增强。作为全书的基础部分,首先,回顾预训练语言模型的基本概念和背景知识。接着,详细探讨常见的知识增强技术方法,包括知识注入的多种方式和结构增强的不同策略。最后,通过多个应用案例,展示知识增强预训练模型的实践效果。
第章,重点介绍提示指令阶段的知识增强。首先,回顾提示学习和指令精调的基本背景。随后,从知识增强提示学习、结构化思维链到知识图谱思维链等多个角度,探讨知识增强提示工程的常见方法与思路。此外,还深入讨论利用知识图谱引导指令生成的技术路径。
第章,聚焦于检索阶段的知识增强。先总体介绍的基本概念、典型架构及训练机制。再讨论并分析知识图谱与的结合,并介绍几种常见的知识图谱增强的技术思路。同时,本章强调生成模型、检索技术和知识图谱三者之间的强互补关系。
第章,聚焦于大模型在结构化知识问答中的应用。首先,介绍结构化知识表示、查询方法及自然语言到查询语言转换的基础知识。接着,分析大模型在查询问答中的能力,探讨基于大模型微调、检索生成和统一表示的查询问答方法。最后,总结大模型在结构化知识问答中的关键作用。
第章,重点探讨推理阶段的知识增强。先比较分析语言模型推理和知识图谱推理两种实现知识推理的技术思路,再围绕知识图谱增强语言模型推理、语言模型增强知识图谱推理及知识图谱基础模型,探讨将知识图谱与语言模型结合以提升推理能力的多种方法。
第章,聚焦知识增强幻觉抑制。先介绍大模型幻觉的背景及成因,再分析几种知识增强幻觉抑制技术,包括检索增强生成、知识约束解码、知识对齐优化和知识表征编辑。
第章,聚焦大模型知识编辑。首先,概述大模型知识编辑的基本概念。接着,介绍两种主要的知识编辑方法:基于外部干预和基于内部更新的知识编辑方法。然后,分析知识编辑对大模型知识能力和通用能力的影响。最后,展示大模型知识编辑的应用与实践。
第章,聚焦知识增强多模态学习。首先,介绍多模态学习及多模态大模型的相关知识背景。随后,深入探讨知识图谱在增强多模态学习方面的价值,并从知识增强视觉问答、跨模态检索、低资源学习和多模态生成等方面展示这些技术的实际应用。
第章,重点探讨知识库和智能体的关系。首先,从知识增强的单智能体规划能力,以及知识增强的多智能体协同能力入手介绍一些相关的研究工作。然后,从大模型的知识机制、知识增强的具身智能与世界知识模型三个方面,结合“符号知识”的视角对未来人工智能进行展望。

如何阅读本书
这是一本偏重技术发展前沿的图书,知识点繁多,读者应该怎样利用这本书呢?
首先,考虑到读者的知识背景和基础不同,本书每章的第一部分均专门介绍相关领域的基础知识。对于基础较弱的读者,可以通过这个部分掌握核心概念和基础知识,为后续深入理解和学习具体的技术内容打下坚实的基础。这样一来,读者无须担心缺乏某些前置知识,能够顺利跟进书中的技术思路和方法。
其次,本书在设计时充分考虑了读者节约时间的需求。章节之间考虑了逻辑上的连贯性,但也尽力确保各章内容的独立性。因此,读者可以根据自己的兴趣和需求,选择性地阅读某个章节,而无须按固定顺序阅读整本书。这样,读者能够更高效地掌握自己关心的内容,避免从头到尾逐章阅读。
最后,本书专门考虑了高阶读者在技术深度和实践方面的扩展需求,涵盖了一些学术前沿知识和开源工具实践,读者可结合书中的参考文献进行扩展阅读,并通过实际操作相关工具,进一步加深对技术概念的理解。
值得注意的是,大模型和知识图谱领域发展迅速,技术方法和思路持续更新。因此,读者在阅读过程中应关注新兴技术趋势,并保持对最新发展的敏感度。

致谢
我首先要感谢浙江大学知识引擎实验室的全体教师和同学,这本书的很多内容源自实验室的自有科研成果,没有团队的集体努力,也就没有这本书的出版。同时,我要特别感谢陈卓、朱渝珊、张溢驰、姚云志、陈想、朱雨琦、乔硕斐、王梦如、黄志玮、金龙、袁源、汪俊杰、屠铭尘、华尹、甘诚韬等同学,他们为本书的核心章节提供关键素材。另外,我要感谢李娟、欧翌昕、王潇寒、习泽坤、方润楠等同学,他们为本书付出了很多努力并帮助审校文字。
我也要感谢我的家人给予我坚持不懈和毫不犹豫的支持。
感谢电子工业出版社博文视点和宋亚东编辑对本书的重视,以及为本书出版所做的一切。
由于水平有限,书中不足及错误之处在所难免,敬请专家和读者给予批评指正。

陈华钧
年月
显示全部信息

媒体评论
本书围绕大模型与知识图谱的融合展开了深入探索,尝试从理论方法到实践路径,系统梳理知识增强在大模型中的应用价值。作者结合自身研究与实践经验,对关键问题进行了细致分析,也呈现了当前该领域的一些代表性进展。作为一本兼具系统性与前瞻性的图书,本书可为关注大模型知识能力提升的研究人员和工程技术人员提供有益参考,亦为相关研究的进一步深入提供了良好基础。
孙茂松
清华大学人工智能研究院常务副院长、欧洲人文和自然科学院外籍院士

本书围绕大模型与知识图谱的融合展开了深入探索,尝试从理论方法到实践路径,系统梳理知识增强在大模型中的应用价值。作者结合自身研究与实践经验,对关键问题进行了细致分析,也呈现了当前该领域的一些代表性进展。作为一本兼具系统性与前瞻性的图书,本书可为关注大模型知识能力提升的研究人员和工程技术人员提供有益参考,亦为相关研究的进一步深入提供了良好基础。
孙茂松
清华大学人工智能研究院常务副院长、欧洲人文和自然科学院外籍院士

本书以知识增强为切入点,为大模型的研究与应用提供了全新视角。特别是系统阐述了大模型与知识图谱互补增强的基本理念、核心技术与典型应用,并结合实际案例,帮助读者理解如何将学术成果有效转化为工程实践。书中注重理论与实践融合,旨在提高人工智能专业人才解决问题的能力,特别是在复杂应用场景中对大模型与知识图谱的灵活运用。本书为产业界与学术界提供了具有实践价值的知识体系,有助于推动相关技术的落地与人才培养。
金芝
北京大学计算机学院教授、

本书聚焦“大模型 知识库”这一令人关注的前沿领域,深入研究了神经网络与符号系统融合的理论,阐释了知识表示与推理的方法。在此基础上,通过多元场景和案例,直观呈现了具体应用。本书兼具研究价值与实践价值,为大模型从业者提供了宝贵的指南。
周明
澜舟科技创始人、中国计算机学会副理事长
显示全部信息

作者简介
陈华钧
浙江大学计算机科学与技术学院教授博导,中文开放知识图谱发起人,浙江省数智科技研究会副会长,中国中文信息学会语言与知识计算专委会副主任,中国人工智能学会知识工程与分布智能专委会副主任。入选浙江省有突出贡献中青年专家、浙江省高层次人才特殊支持计划科技创新领军人才,全球前顶尖科学家终身榜单(人工智能领域)。
主要研究方向为人工智能、知识图谱、自然语言处理、 ,在 、 、、、、、、、、、、、 、 等国际顶级会议和期刊以第一作者或通讯作者发表多篇论文。主持多项国家自然科学基金重点类项目,以及国家重点研发计划、国家重大科技专项、重大企业合作项目。曾获国际语义网会议最佳论文奖、国际知识图谱联合会议最佳论文奖、国家科技进步二等奖、教育部技术发明一等奖、钱伟长科技奖一等奖、浙江省科技进步二等奖、浙江大学优秀教材奖一等奖等多项科技奖励。

张宁豫陈华钧
浙江大学计算机科学与技术学院教授博导,中文开放知识图谱发起人,浙江省数智科技研究会副会长,中国中文信息学会语言与知识计算专委会副主任,中国人工智能学会知识工程与分布智能专委会副主任。入选浙江省有突出贡献中青年专家、浙江省高层次人才特殊支持计划科技创新领军人才,全球前顶尖科学家终身榜单(人工智能领域)。
主要研究方向为人工智能、知识图谱、自然语言处理、 ,在 、 、、、、、、、、、、、 、 等国际顶级会议和期刊以第一作者或通讯作者发表多篇论文。主持多项国家自然科学基金重点类项目,以及国家重点研发计划、国家重大科技专项、重大企业合作项目。曾获国际语义网会议最佳论文奖、国际知识图谱联合会议最佳论文奖、国家科技进步二等奖、教育部技术发明一等奖、钱伟长科技奖一等奖、浙江省科技进步二等奖、浙江大学优秀教材奖一等奖等多项科技奖励。

张宁豫
浙江大学软件学院副教授、特聘研究员、智能科学与工业软件所副所长,入选斯坦福全球前顶尖科学家榜单,主要研究方向为自然语言处理、知识图谱等。担任 ,、、、领域主席, ,高级程序委员,研发了知识获取系统及大模型知识编辑系统。

张文
浙江大学软件学院副教授、特聘研究员。研究方向为知识表示与推理、知识图谱、大语言模型。在、、、、、、 、等国际顶级会议上发表多篇论文。主持国家自然科学基金青年科学基金项目、浙江省自然科学基金探索青年项目、宁波市自然科学基金探索一般项目。曾获国际知识图谱联合会议()最佳论文奖、最佳应用论文奖,浙江省科技进步二等奖等奖励。入选副省级市高层次人才引进计划、百度年度华人女性青年学者榜。
显示全部信息