编辑推荐
《现代汉语未登录词词类和语义类标注研究》适用于语言学领域及计算语言学、语料库语言学领域的师生和研究人员。
目录
第1章绪论
1.1研究对象、背景、问题及应用价值
1.2研究原则、方法与技术路线
1.3本书的组织结构
第2章方法论
2.1语言本体方面的相关研究
2.2计算方面的相关研究
2.3本书工作的方法论基础
第3章相关资源、方法和工具
3.1相关语言资源
3.2条件随机场
3.3评测方法与评测指标
3.4软件工具
第4章现代汉语复合词内部结构词典的构造
4.1汉语复合词的基本构造类型
4.2词典构建方案
4.3自动标注方法
4.4结构分析方案、原则和方法
4,5结构关系类型的判断
4.6成分语法类的判断
4.7成分语义类的判断
4.8计算机辅助人工标注
第5章未登录词词类自动标注
5.1基于内部特征的模型
5.2可信度计算
5.3基于外部特征的词类标注模裂
5.4实验结果
5.5实验结果分析
第6章基于内部特征的未登录词语义类自动标注
6.1基线模型
6,2基于内部特征的模型(模型1)
6.3双向平行类推规则与成对替换类推规则的分析
6.4实验
第7章结合内部与外部特征的未登录词语义类自动标注
7.1结合内部特征与外部特征的模型(模型2)
7.2实验
第8章未登录词语义类自动标注的应用
8.1语义词典修正
8.2语义词典扩充
第9章基于分布式词表示的类比识别与类比挖掘
9.1关系相似度任务与词嵌入模型
9.2服务于类比识别的基于依存上下文的词语embedding表示
9.3改进的类比识别方法:使用句法依存减少搜索空间
9.4基于依存embedding的类比挖掘
9.5实验
结语
参考文献
附录
附录A双向平行类推规则示例(后字为共同成分)
附录B双向平行类推规则示例(前字为共同成分)
附录C成对替换类推规则示例(前宁为替换成分)
附录D成对替换类推规则示例(后字为替换成分)
后记
文摘
版权页:
5.1 基于内部特征的模型
根据在词类预测中所使用的特征,可以将前人的研究分为三类。第一类研究主要使用外部特征,包括局部上下文和全局上下文。例如,Nakagawa和Matsumoto(2006)同时使用了局部上下文和全局上下文。第二种研究主要使用内部特征,如文献Chen et al.(1997)和Wu and Jiang(2000)。第三种研究则试图将内部特征和外部特征结合起来,如文献Lu(2005)和Goh et al.(2006)。本书的方法属于第三类,但在整合两类特征的方案上与前人的方案有很大区别。在本书的方法中,内部特征发挥着最主要的作用,基于内部特征的模型可以独立地取得很好的预测结果。外部特征则充当着内部特征的有益补充的角色,它的使用可以在一定程度上改进前者的结果。两种模型通过基于内部特征的模型预测结果的可信度而联系起来,对于可信度较低的词再使用基于外部特征的模型来进行修正。
在这一模型中,将未登录词词类预测任务视为一个序列标注问题。这一想法源于对人理解词语过程的观察。通常,人们将词视为字或语素的序列,这一序列可以被分割成多个成分,成分之间在意义上相互联系,人们通过对成分以及成分间联系的认识来理解整个词语。
《现代汉语未登录词词类和语义类标注研究》适用于语言学领域及计算语言学、语料库语言学领域的师生和研究人员。
目录
第1章绪论
1.1研究对象、背景、问题及应用价值
1.2研究原则、方法与技术路线
1.3本书的组织结构
第2章方法论
2.1语言本体方面的相关研究
2.2计算方面的相关研究
2.3本书工作的方法论基础
第3章相关资源、方法和工具
3.1相关语言资源
3.2条件随机场
3.3评测方法与评测指标
3.4软件工具
第4章现代汉语复合词内部结构词典的构造
4.1汉语复合词的基本构造类型
4.2词典构建方案
4.3自动标注方法
4.4结构分析方案、原则和方法
4,5结构关系类型的判断
4.6成分语法类的判断
4.7成分语义类的判断
4.8计算机辅助人工标注
第5章未登录词词类自动标注
5.1基于内部特征的模型
5.2可信度计算
5.3基于外部特征的词类标注模裂
5.4实验结果
5.5实验结果分析
第6章基于内部特征的未登录词语义类自动标注
6.1基线模型
6,2基于内部特征的模型(模型1)
6.3双向平行类推规则与成对替换类推规则的分析
6.4实验
第7章结合内部与外部特征的未登录词语义类自动标注
7.1结合内部特征与外部特征的模型(模型2)
7.2实验
第8章未登录词语义类自动标注的应用
8.1语义词典修正
8.2语义词典扩充
第9章基于分布式词表示的类比识别与类比挖掘
9.1关系相似度任务与词嵌入模型
9.2服务于类比识别的基于依存上下文的词语embedding表示
9.3改进的类比识别方法:使用句法依存减少搜索空间
9.4基于依存embedding的类比挖掘
9.5实验
结语
参考文献
附录
附录A双向平行类推规则示例(后字为共同成分)
附录B双向平行类推规则示例(前字为共同成分)
附录C成对替换类推规则示例(前宁为替换成分)
附录D成对替换类推规则示例(后字为替换成分)
后记
文摘
版权页:
5.1 基于内部特征的模型
根据在词类预测中所使用的特征,可以将前人的研究分为三类。第一类研究主要使用外部特征,包括局部上下文和全局上下文。例如,Nakagawa和Matsumoto(2006)同时使用了局部上下文和全局上下文。第二种研究主要使用内部特征,如文献Chen et al.(1997)和Wu and Jiang(2000)。第三种研究则试图将内部特征和外部特征结合起来,如文献Lu(2005)和Goh et al.(2006)。本书的方法属于第三类,但在整合两类特征的方案上与前人的方案有很大区别。在本书的方法中,内部特征发挥着最主要的作用,基于内部特征的模型可以独立地取得很好的预测结果。外部特征则充当着内部特征的有益补充的角色,它的使用可以在一定程度上改进前者的结果。两种模型通过基于内部特征的模型预测结果的可信度而联系起来,对于可信度较低的词再使用基于外部特征的模型来进行修正。
在这一模型中,将未登录词词类预测任务视为一个序列标注问题。这一想法源于对人理解词语过程的观察。通常,人们将词视为字或语素的序列,这一序列可以被分割成多个成分,成分之间在意义上相互联系,人们通过对成分以及成分间联系的认识来理解整个词语。
| ISBN | 7030491807,9787030491800 |
|---|---|
| 出版社 | 科学出版社 |
| 作者 | 邱立坤 |
| 尺寸 | 5 |