语义组合与机器翻译 [精装] 9787030292018

配送至
$ $ USD 美元

《语义组合与机器翻译》内容简介:不管采用语言学规则,还是利用统计学知识,语义始终是自然语言处理绕不过去的瓶颈,词义的模糊性、歧义性和多样性是影响自然语言理解的主要原因。随着计算语言学的发展,越来越多的学者加入到了语义研究的行列,语义分析、语义标注、词义消歧、语义知识库建设等研究T作开展得越来越广泛。
编辑推荐
《语义组合与机器翻译》是由科学出版社出版的。
目录
序 前言 Abstract 第1章 绪论 1.1 翻译、语义与评价 1.2 动词概述 1.3 本书的研究框架 1.3.1 研究目的、对象、目标与假设 1.3.2 本书的研究方法与步骤 1.3.3 本书的结构 第2章 动词语义描写 2.1 动词语义描写研究 2.1.1 动词语义描写理论研究 2.1.2 动词语义描写方法研究 2.2 典型的动词语义特征描写体系 2.2.1 典型的英语动词语义描写体系 2.2.2 典型的汉语动词语义描写体系 2.3 本书动词语义特征描写体系 2.3.1 动词语义特征提取 2.3.2 动词语义关系描写 2.3.3 动词语义描述体系 2.4 动词语义描述体系示例 第3章 动词语义组合模式 3.1 动词语义特征 3.1.1 义项描写表 3.1.2 组合描写表 3.2 动词语义特征组合模式 3.3 主观性语义特征 3.3.1 主观性、主观量和主观化 3.3.2 客观性语义特征与主观性语义特征 3.3.3 主观性语义特征与机器翻译译词选择 3.4 动词的语法语义特征 3.4.1 改进的句子语义模型 3.4.2 英语动词句语法意义系统 3.4.3 英汉动词语法语义特征对照表 3.5 双语动词语义描写词典 3.5.1 上节内容回顾 3.5.2 知识库融合 3.5.3 BiVSD建设进展 3.6 本章小结 第4章 机器翻译与词义消歧 4.1 机器翻译概述 4.1.1 机器翻译简史 4.1.2 机器翻译在中国的进展 4.1.3 机器翻译系统的主要方法 4.1.4 机器翻译系统的难点及研究思路 4.2 词义消歧 4.2.1 词义消歧及其意义 4.2.2 词义消歧方法 4.3 机器翻译译词选择 第5章 动词的译词选择 5.1 动词译词选择流程 5.1.1 译词选择策略 5.1.2 动词译词选择的流程 5.2 原语分析 5.2.1 命题P 5.2.2 小句C 5.2.3 句子S 5.3 译词选择 5.4 译词生成 5.4.1 词类转译的主要类型 5.4.2 可选语法译词生成 5.5 特殊结构中的动词译词选择 5.5.1 “v1cv2”结构中的动词译词选择 5.5.2 独动词句中的动词译词选择 5.5.3 复句处理 5.6 动词译词自动选择的个案实现 5.6.1 译词选择步骤和算法 5.6.2 m的确定 5.6.3 Mi和Mn的确定 5.6.4 特殊结构翻译模式 5.6.5 实验语料来源 5.6.6 实验结果及分析 5.7 本章小结 第6章 动词句译词选择评价与译文评价 6.1 译词选择方法与译文质量评价 6.1.1 译词选择方法综述 6.1.2 译文质量评价综述 6.2 译词选择结果比较与分析 6.3 多语言点译文质量综合评价方法 6.4 个案研究及进一步思考 第7章 总结 7.1 已经完成的工作 7.2 对前人研究工作的改进 7.3 本研究工作的不足 7.4 进一步研究计划 参考书目 一、外文参考书目 二、中译参考书目 三、中文参考书目 四、工具书 五、网络资源 附录1英语多义动词 附录2英语动词语义组合模式(样例) 附录3含有动词beat的英语源语句 附录4动词译词选择测试源语句 附录5译词选择评价结果 后记
序言
不管采用语言学规则,还是利用统计学知识,语义始终是自然语言处理绕不过去的瓶颈,词义的模糊性、歧义性和多样性是影响自然语言理解的主要原因。随着计算语言学的发展,越来越多的学者加入到了语义研究的行列,语义分析、语义标注、词义消歧、语义知识库建设等研究T作开展得越来越广泛。 张霄军博士也加入到了这一行列,他的研究工作主要体现在词义消歧方面。不过,他所做的词义消歧研究与他人有所区别:他关注的是跨语言的词义消歧,即寻找跨语言的语义对应关系。这样,他的研究对象就既包括源语词语的语义消歧,也包括目标语译词的语义消歧,但这样的工作绝不是源语研究和目标语研究的简单“叠加”——虽然只是研究对象从单语变成了双语,但涉及的研究内容却比单语语义研究多了不止一倍。毕竟,能够很好地应用于单语词义消歧的方法和模型,未必就适用于跨语言的词义消歧。 张博士想到的解决方案是利用语义的组合模式。这是一种很朴素但很实用的思想:如果源语和目标语的单词之间的语义对应关系难以确定的话,那我们为何不扩大对象-将单词扩展到几个连续的词语呢?单词的特定义项难以确定,那么几个组合在一起的词语序列的义项则是相对固定的。这就是语义组合。组合型语义关系是指词义之间的相互依存关系,在这种依存关系中,往往有一个词义居于中心地位,对其他词义有组配要求。通常说的动词配价、名词配价就反映了这种关系。这种关系既可以是动态地表现在句子之中,也可以是静态地存在于那个居于中心地位的词义之中。因此,语义组合模式中既包括词汇的语义特征组合,也包括语法语义特征。在语义组合研究过程中,细心的张博上还发现了“主观性语义特征”,并将其也纳入语义组合模式之中。 然而,实践这一思想的过程却是艰苦而枯燥的。归纳所有词汇的语义组合模式显然是不现实的,我要求他把常用的动词和名词尽量考察完全。
后记
“有人说语义是沙漠,太广袤而容易迷失;有人说语义是泥潭,太复杂而难以自拔;我说语义是黑洞,太深奥而让人却步。如果我正身处语义沙漠,请诸位专家为我指点迷津;如果我正深陷泥潭,请各位专家把我拎出来;如果我正在语义黑洞的边缘徘徊,请推我一把!” 这是两年前我在博士论文答辩时自我陈述的最后几句话。这段在严肃得有些呆板的学位答辩会上博得答辩评委和会场听众一笑的文字却是我一直以来的真实感受——语义研究太不容易了! “你的本科和硕士都是学外语的,那你就看看英语和汉语词汇之间的语义对译关系吧。”导师陈小荷先生看似漫不经心的一句话,使我走上了漫漫语义之旅。大的研究方向确定了,接下来就是选择合适的选题。计算语言学包罗万象,语义研究到底侧重什么内容呢?语义的自动标注还是语义网络建设?词义消歧还是语义分析? 语义的“对译”实际上就是跨语言的词义消歧,也就是在诸多目标语词汇义项中选择与源语词汇义项最“匹配”的,是为“译词选择”。为此,既需要源语词义的消歧,也需要目标语词义的消歧,最后还有目标语词汇的生成。涉及如此之多的内容,一篇博士论文能完成吗?陈先生体谅我的难处,告诉我只要完成前两项任务即可,无需生成合适的译词。也就是说,导师的要求是只要完成词汇语义对译关系的梳理即可,并不要求到机器翻译系统上去验证。对此,我和导师有些分歧——我的意见是作为计算语言学的博士论文,“行之有理”当然好,但,“行之有效”更好——我要做到“知其所以然,亦知其然”。如果不能到机器翻译系统上去验证,怎知我的研究的应用价值?导师默然,挥挥手——“你先试着去做吧!”
文摘
插图: (3)语义可描写性假设假设自然语言的语义是可以描写的,而且现代语言学研究中的语义描写理论和成果是可以应用并借鉴的。当然,我们也不能绝对地说自然语言的所有语义都是完全可描写或可描写完全的,但对于描写不了或描写不到的语义,我们的研究也不会涉及。 (4)语义可量化性假设 语义的量化是译文评价的基础,赋予不同类型的语义元素和语义特征不同的权值,这是译文综合评价方法的根本。语义的可量化性假设是建立在可描写性基础之上的,具体的量化值是建立在经验之上的,量化的实现是通过数学模型完成的。 (5)语义可形式化及程序化假设 语义的形式化和语义模块的程序化是本研究的意义所在,但由于研究时间限制,对动词语义的形式化和语义模块的程序实现在本研究中可能不能够完全体现出来,只能留到后续研究中去了。但本书的研究是为机器翻译服务的,因此在本体研究和资源建设的同时,我们本着“全心全意为系统服务”、“尽量满足系统需求”的思想,给后续研究奠定基础,留好接口。 1.3.2 本书的研究方法与步骤 1.研究方法 本研究采用“定性+定量”、“理论+实验”的研究方法。在语义研究方面,本书在前人理论研究的基础上,注重挖掘与语义知识库建设和机器翻译语义消歧相关的理论做深入研究,通过程序和实验筛选出800多个英语多义动词作为研究对象;在译词选择研究中,本书在大量实际语料考察的基础上,提取出动词的语义特征组合模式,并据此来进行动词的译词选择。在具体的译词选择之前,还需要对原句做断句的预处理,来满足译词选择的需要。这些都是在语言理论的基础之上进行的定性分析和定量实验;在译文评价中,更是遵循翻译质量评价模式和传统翻译标准等理论,选择一定量的动词句及其不同译文,进行比较,最后归纳一种多语言点的综合评价方法。
ISBN9787030292018
出版社科学出版社
作者张宵军
尺寸32