
编辑推荐
翻译和翻译质量评价是密不可分的两个方面,如影随形,相互促进和影响。目前翻译评价面临的主要问题有:人工
的评价标准不一致,评价体系尚未建立,导致评价的内部一致性和外部一致性都较低;自动评价算法基本局限在语
言形式的浅层比对上,要实现真正意义的语义等价的翻译评价十分困难;深层次的翻译错误的发现研究也没有全面
展开,而且缺乏用于训练机器深层评价的标注语料。这些挑战正是本书要阐述的几个核心问题。
作者简介
秦颖,北京邮电大学智能研究中心博士,北京外国语大学中国外语教育研究中心博士后。2010年起在北京外国语大学计算机系执教,副教授。主要研究方向:计算语言学、机器翻译和翻译质量自动评价。主持2项国家社科基金项目,1项北京市社科重点项目,参与完成国家社科基金重大项目2项,近几年发表论文19篇,专著1部。
目录
序言
前言
第1章绪论
第2章翻译的观点和质量评价标准
2.1系统功能语言学视角下的翻译评价
2.2专家评价与众包评价
2.2.1专家评价的标准
2.2.2人工评价的影响因素
2.2.3衡量人工评价结果的指标
2.2.4众包评价
2.3宏观评价与诊断评价
2.3.1宏观评价的特点
2.3.2诊断评价的特点
2.4层次化的翻译评价体系
2.5小结
第3章译文质量自动评价方法
3.1依赖参考译文的评价
3.1.1基于n—gram的相似度
3.1.2基于图的n—gram最大匹配
3.1.3基于词汇错误率的评价
3.1.4译后编辑率
3.1.5基于词汇语义的相似度
3.1.5基于词汇语义的相似度
3.1.6基于依存元组的相似度
3.1.7深度语言分析评价
3.1.8基于抽象语义表小的评价
3.1.9神经网络学习的心用
3.1.10多篇参考译文的作用
3.2无参考译文的质量估计
3.2.1语言特征参数
3.2.2译文质量估计算法
3.3基于关键语言点的评测
3.3.1人工设置评测点
3.3.2评测点的自动提取
3.3.3译文句法成分评价
3.4译文质量的比较
3.4.1评分还是排序
3.4.2质量排序算法
3.5小结
第4章译文质量评测算法的性能指标与开放平台
4.1评测算法的性能指标
4.1.1质量评分算法的性能指标
4.1.2质量排名算法的性能指标
4.2机器翻译评测的开放平台
4.3小结
第5章翻译错误检查
5.1翻译错误的分类
5.1.1翻译错误的‘分类划分法
5.1.2翻译错误的多分类法
5.1.3机器翻译错误分类
5.2语法错误检查
5.2.1冠词和介词错误
5.2.2搭配错误
5.2.3动词形态错误
5.3词汇短语的错误检查
5.4术语一致性检查
5.5小结
第6章翻译错误语料库
6.1机器翻译错误语料库
6.2学习者翻译错误语料库
6.3语料库错误标注工具
6.4小结
第7章其他生成语言的质量评价
7.1自动文摘及摘要质量的评价
7.1.1自动文摘的方法
7.1.2生成文摘质量的评价方法
7.2网页简介文本的质量评价
7.3图像描述文本的质量评价
7.4小结
第8章翻译自动评价的挑战与展望
8.1语篇级的质量评价
8.1.1语篇的划分
8.1.2语篇分析
8.1.3指代消解
8.2基于语义的质量评价
8.3展望
参考文献
文摘
版权页:
插图:
除了评价态度和语言能力等客观因素外,研究语言测试的很多学者也研究了影响人工评价译文质量的其他主观因素,包括评价人员的严厉度,趋中性,甚至年龄、性别因素也会对评分结果有影响。其中严厉度被认为是评价结果存在差异的主要因素(Kondo—Brown,2002),反映出评价员对译文错误的容忍程度不同。对同样的错误,有的人认为很严重,有的人认为是一般性错误,这样给出的评价结果的宽松度就不同。趋中性也称趋同性,指的是评价人员倾向于给出“中庸”的结果,既不给好的译文很高的分值,比不给差的译文很低的分,打分的区分度不大。当然,对一些存在模棱两可或有争议的内容评价时,趋中性的做法是犯错风险最小的。趋中性的特点在翻译评分中表现得十分显著。
不仅是在对学习者译文的评价中存在上述问题,在历年来机器翻译的人工评测中评价的一致性也是最受关注的问题之一,尽管采取了多项保证评分信度的措施,并且构建了网络评分平台,用技术手段辅助评价工作,但人工对机器译文打分的内部一致性指标——加权Kappa系数也仅仅在0.380到0.483之间(Artstein& Poesio,2008),处于较低的水平。
翻译和翻译质量评价是密不可分的两个方面,如影随形,相互促进和影响。目前翻译评价面临的主要问题有:人工
的评价标准不一致,评价体系尚未建立,导致评价的内部一致性和外部一致性都较低;自动评价算法基本局限在语
言形式的浅层比对上,要实现真正意义的语义等价的翻译评价十分困难;深层次的翻译错误的发现研究也没有全面
展开,而且缺乏用于训练机器深层评价的标注语料。这些挑战正是本书要阐述的几个核心问题。
作者简介
秦颖,北京邮电大学智能研究中心博士,北京外国语大学中国外语教育研究中心博士后。2010年起在北京外国语大学计算机系执教,副教授。主要研究方向:计算语言学、机器翻译和翻译质量自动评价。主持2项国家社科基金项目,1项北京市社科重点项目,参与完成国家社科基金重大项目2项,近几年发表论文19篇,专著1部。
目录
序言
前言
第1章绪论
第2章翻译的观点和质量评价标准
2.1系统功能语言学视角下的翻译评价
2.2专家评价与众包评价
2.2.1专家评价的标准
2.2.2人工评价的影响因素
2.2.3衡量人工评价结果的指标
2.2.4众包评价
2.3宏观评价与诊断评价
2.3.1宏观评价的特点
2.3.2诊断评价的特点
2.4层次化的翻译评价体系
2.5小结
第3章译文质量自动评价方法
3.1依赖参考译文的评价
3.1.1基于n—gram的相似度
3.1.2基于图的n—gram最大匹配
3.1.3基于词汇错误率的评价
3.1.4译后编辑率
3.1.5基于词汇语义的相似度
3.1.5基于词汇语义的相似度
3.1.6基于依存元组的相似度
3.1.7深度语言分析评价
3.1.8基于抽象语义表小的评价
3.1.9神经网络学习的心用
3.1.10多篇参考译文的作用
3.2无参考译文的质量估计
3.2.1语言特征参数
3.2.2译文质量估计算法
3.3基于关键语言点的评测
3.3.1人工设置评测点
3.3.2评测点的自动提取
3.3.3译文句法成分评价
3.4译文质量的比较
3.4.1评分还是排序
3.4.2质量排序算法
3.5小结
第4章译文质量评测算法的性能指标与开放平台
4.1评测算法的性能指标
4.1.1质量评分算法的性能指标
4.1.2质量排名算法的性能指标
4.2机器翻译评测的开放平台
4.3小结
第5章翻译错误检查
5.1翻译错误的分类
5.1.1翻译错误的‘分类划分法
5.1.2翻译错误的多分类法
5.1.3机器翻译错误分类
5.2语法错误检查
5.2.1冠词和介词错误
5.2.2搭配错误
5.2.3动词形态错误
5.3词汇短语的错误检查
5.4术语一致性检查
5.5小结
第6章翻译错误语料库
6.1机器翻译错误语料库
6.2学习者翻译错误语料库
6.3语料库错误标注工具
6.4小结
第7章其他生成语言的质量评价
7.1自动文摘及摘要质量的评价
7.1.1自动文摘的方法
7.1.2生成文摘质量的评价方法
7.2网页简介文本的质量评价
7.3图像描述文本的质量评价
7.4小结
第8章翻译自动评价的挑战与展望
8.1语篇级的质量评价
8.1.1语篇的划分
8.1.2语篇分析
8.1.3指代消解
8.2基于语义的质量评价
8.3展望
参考文献
文摘
版权页:
插图:
除了评价态度和语言能力等客观因素外,研究语言测试的很多学者也研究了影响人工评价译文质量的其他主观因素,包括评价人员的严厉度,趋中性,甚至年龄、性别因素也会对评分结果有影响。其中严厉度被认为是评价结果存在差异的主要因素(Kondo—Brown,2002),反映出评价员对译文错误的容忍程度不同。对同样的错误,有的人认为很严重,有的人认为是一般性错误,这样给出的评价结果的宽松度就不同。趋中性也称趋同性,指的是评价人员倾向于给出“中庸”的结果,既不给好的译文很高的分值,比不给差的译文很低的分,打分的区分度不大。当然,对一些存在模棱两可或有争议的内容评价时,趋中性的做法是犯错风险最小的。趋中性的特点在翻译评分中表现得十分显著。
不仅是在对学习者译文的评价中存在上述问题,在历年来机器翻译的人工评测中评价的一致性也是最受关注的问题之一,尽管采取了多项保证评分信度的措施,并且构建了网络评分平台,用技术手段辅助评价工作,但人工对机器译文打分的内部一致性指标——加权Kappa系数也仅仅在0.380到0.483之间(Artstein& Poesio,2008),处于较低的水平。
ISBN | 7513599491,9787513599498 |
---|---|
出版社 | 外语教学与研究出版社 |
作者 | 秦颖 |
尺寸 | 16 |