短文本数据理解 9787111558811

配送至
$ $ USD 美元

编辑推荐

《短文本数据理解》深入浅出、案例丰富,适合知识图谱、自然语言处理、信息检索、人工智能等方向的研究生阅读,也能为相关领域研究人员和开发人员提供重要参考。

作者简介

中国人民大学博士,微软亚洲研究院研究员。负责微软研究院大型Web知识库系统Probase项目,以及企业知识库系统Enterprise Dictionary项目。已在VLDB、ICDE、IJCAI、CIKM等国际顶ji学术会议上发表论文十余篇,并获得ICDE 2015佳论文奖。出版技术专著2本,拥有美国专利5项。研究领域包括:人工智能、知识库系统、自然语言处理、机器学习、数据挖掘等。

目录

从书前言
推荐序一
推荐序二
前言
第1章短文本理解及其应用
1.1短文本理解
1.2短文本理解研究现状
1.2.1短文本理解模型概述
1.2.2短文本理解模型粒度分析
1.3短文本理解框架
第2章基于概率的属性提取与推导
2.1引言
2.2属性提取
2.2.1属性提取的整体框架
2.2.2概率isA网络
2.2.3基于概念和基于实体的属性提取
2.3属性得分推导
2.3.1典型度得分
2.3.2根据CB列表计算典型度
2.3.3根据IB列表计算典型度
2.3.4典型度聚合
2.3.5同义属性集合
2.4相关研究
2.5小结
第3章单实体概念化模型
3.1引言
3.1.1基本层次类别
3.1.2应用
3.1.3BLC计算方法
3.2语义网络
3.3基本层次类别化
3.3.1典型性
3.3.2将典型性用于BLC
3.3.3将平滑典型性用于BLC
3.3.4将PMI用于BLC
3.3.5将Rep(e,c)用于BLC
3.4小结
第4章基于概念化的短文本理解
4.1引言
4.2预备知识
4.2.1概念
4.2.2概念聚类
4.2.3属性
4.2.4整体框架和符号表示
4.3挖掘词汇关系
4.3.1概述
4.3.2解析
4.3.3P(z|t)推导
4.3.4P(c|t,z)推导
4.3.5语义网络
4.4查询理解
4.4.1方法概况
4.4.2算法
4.5小结
第5章基于概念化的短文本主题词与修饰词检测
5.1引言
5.2整体框架
5.3非限定性修饰词挖掘
5.4限定性修饰词挖掘
5.4.1Probase:一个大规模的isA知识库
5.4.2实体级别主题词修饰词
5.4.3概念级别主题词修饰词
5.5主题词与修饰词检测
5.5.1解析
5.5.2针对两个组件的主题词修饰词检测
5.5.3针对两个以上组件的主题词修饰词检测
5.6相关工作
5.7小结
第6章基于概念化的词相似度计算
6.1引言
6.2语义网络和同义词集合
6.3基本方法
6.3.1类型判别
6.3.2语境表示
6.3.3语境相似度
6.3.4讨论
6.4改进方法
6.4.1概念聚类
6.4.2Max—Max相似度计算方法
6.4.3聚类删减优化
6.5相关工作
6.6小结
第7章基于概念化的海量竞价关键字匹配
7.1引言
7.2语义网络
7.3系统框架
7.4概念化
7.4.1实体检测
7.4.2词义推导
7.4.3消除歧义
7.5检索
7.5.1基于点击数据的候选竞价关键字选择
7.5.2基于概念的候选竞价关键字选择
7.5.3排名
7.6相关工作
7.7小结
第8章短文本理解研究展望
8.1知识语义网
8.2显性知识和隐性知识的结合
参考文献

文摘

版权页:



插图:



8.2 显性知识和隐性知识的结合
从另一个角度而言,如上文所述,机器可获取的知识包含了显性知识和隐性知识。未来工作应着重探索二者的结合以完善短文本含义的表示方式。
1.显性知识改进隐性模型
显性知识库可以用来完善隐性的空间向量。换言之,向量应以某种方式反映知识库中实体间的关系。例如,Bian等的工作使用WordNet中的词汇关系作为限制来辅助NLM的训练,使得这些词汇关系(如同义词关系)能够在训练所得的词向量中得以体现。
2.隐性知识改进显性模型
隐性空间向量可以帮助提高概念化的准确性。例如,Cheng等使用改进的NLM将Probase的实体和概念,以及文本中的其他词均映射至统一的向量空间。在这样的设置下,对于某一实体词,其语境词与概念的相关性可以很容易地使用空间距离度量。这一结合语境判断概念的方法有潜力提升概念化的效果。
如图8—1所示,未来工作应围绕强调显性和隐性知识的联系,构建能够更准确体现真实的词与概念语义的向量空间,提升将短文本转换成机器内部表示这一环节的准确性。
ISBN9787111558811
出版社机械工业出版社
作者王仲远
尺寸16