《语音与语言处理:自然语言处理、计算语言学和语音识别导论(英文版·第2版)》全面系统地介绍了计算机自然语言处理。全书分为5个部分,共21 章,深入细致地探讨了计算机处理自然语言的词汇、语法、语义、语用等各个方面的问题,介绍了自然语言处理的各种现代技术。在《语音与语言处理:自然语言处理、计算语言学和语音识别导论(英文版·第2版)》的配套网站上,还提供了相关的资源和工具,便于读者在实践中进一步提高。
《语音与语言处理:自然语言处理、计算语言学和语音识别导论(英文版·第2版)》不仅可以作为高等学校自然语言处理和计算语言学等课程的本科生和研究生教材,而且也是自然语言处理相关领域的研究人员和技术人员的必备参考。
编辑推荐
《语音与语言处理:自然语言处理、计算语言学和语音识别导论(英文版·第2版)》是第一本从各个层面全面介绍语言技术的书,自第1版出版以来,一直好评如潮,被国外许多著名大学选为自然语言处理和计算语言学课程的主要教材:《语音与语言处理:自然语言处理、计算语言学和语音识别导论(英文版·第2版)》将深入的语言分析与健壮的统计方法结合起来,新版更是涉及了大量的现代技术,将自然语言处理、计算语言学以及语音识别等内容融合在一本书中,把各种技术相互联系起来,让读者了解怎样才能最佳地利用每种技术,怎样才能将各种技术结合起来使用。《语音与语言处理:自然语言处理、计算语言学和语音识别导论(英文版·第2版)》写作风格引人入胜,深入技术细节而又不让人感觉枯燥。 媒体推荐
“本书是一本十分理想的参考书,它不仅能帮语言学研究者深入了解语言处理的计算模型和技术,而且还能帮助计算机语言应用开发人员了解更多语言学基础,并帮助语音处理的专业人员了解语言理解和语义学知识。”
——Johanna Moore,爱丁堡大学
“这本书对于指导教师是绝对必备,对于研究人员亦是不可或缺。将NLP、计算语言学以及语音识别等溶于一本书中足以看出作者的雄心。作者极好地操控了这几个方面,既注重传统的基础知识,又结合了最新发展和未来趋势,并展现了深刻的洞察力和极强的幽默感。非同凡响!”
——Philip Resnik,马里兰大学
“这简直是自然语言和语音技术最全面的介绍!……这是一部让人印象极其深刻的作品。”
——Richard Sproat,ATT实验室 作者简介
作者:(美国)朱拉斯凯(Daniel Jurafsky) (美国)马丁(James H.Martin)
朱拉斯凯(Daniel Jurafsky) 斯坦福大学语言学系的副教授,兼任计算机科学系教授,之前他曾任教于科罗拉多大学语言学系、计算机科学系和认知科学学院。他分别于1983年和1992年获得加利福尼亚大学伯克利分校的语言学学士学位和计算机科学博士学位。1998年获得美国国家科学基金会CAREER奖,2002年获得麦克阿瑟研究基金。他发表过90多篇语音和语言处理方面的论文。
马丁(James H. Martin)科罗拉多大学计算机科学系、语言学系教授,认知科学学院成员、他分别于1981年和1988年获得哥伦比亚大学计算机科学学士学位和加利福尼亚大学伯克利分校计算机科学博士学位。他发表过70多篇计算机科学方面的文章,著有A Computational Model of Metaphor Interpretation一书。 目录
summary of contents
foreword 23
preface 25
about the authors 31
1 introduction 35
1 words
2 regular expressions and automata 51
3 words and transducers79
4 n-grams 117
5 part-of-speech tagging157
6 hidden markov and maximum entropy models 207
7 phonetics 249
8 speech synthesis 283
9 automatic speech recognition 319
10 speech recognition: advanced topics 369
11 computational phonology395
12 formal grammars of english419
13 syntactic parsing 461
14 statistical parsing 493
15 features and uni?cation523
16 language and complexity563
iv semantics and pragmatics
17 the representation ofmeaning579
18 computational semantics617
19 lexical semantics645
20 computational lexical semantics671
21 computational discourse715
v applications
22 information extraction759
23 question answering and summarization 799
24 dialogue and conversational agents 847
25 machine translation895
bibliography 945
author index 995
subject index 1007 序言
对于从事语音和语言处理的人来说,这是一个激动人心的时期。以往彼此不同的研究领域(自然语言处理、语音识别、计算语言学、计算心理语言学)开始融合。基于Web 的语言技术迅猛发展,基于电话的对话系统投入商用,还有语音合成和语音识别技术,一起为现实系统的开发提供了强劲的动力。由于可以使用大规模的联机语料库,所以在从发音到话语的各个不同层面都可以使用语言的统计模型。在筹划这本既可作为教材又可作为参考书的著作时,我们力图描绘出这种欣欣向荣的状态。
1.覆盖全面
为了全面地描述语音处理和语言处理,本书涵盖了传统上分别在不同系和不同课程中讲授的内容,例如,电子工程系的语音识别,计算机科学系的自然语言处理课程中的语法分析、语义解释及机器翻译,语言学系的计算语言学课程中的计算形态学、音系学和语用学等。本书介绍了这些领域中的基本算法,无论这些算法原来是为口语语言提出的还是为书面语言提出的,无论它们原来是从逻辑的角度提出的还是从统计的角度提出的,我们力求将来自不同领域的算法的描述合在一起。我们也试图把一些机器翻译、拼写检查、信息检索和信息提取这样的应用以及认知建模领域的内容包括在本书中,使其覆盖更加全面。这种面面俱到的方法有一个潜在问题,即要求我们概述性介绍每个领域。因此,在阅读本书时,语言学家可以跳过与发音语音学相关的章节,计算机科学家可以跳过有关正则表达式的章节,电子工程师可以跳过有关信号处理的章节。当然,尽管这本书篇幅很大,但仍不可能包罗万象。正因为如此,本书不能替代语言学、自动机和形式语言理论、人工智能、机器学习、统计学和信息论等重要相关课程的各种专门著作。
2.注重实际应用
我们认为,很重要的一点是要说明与语言相关的算法和技术(从隐马尔可夫模型到合一算法,从λ 演算到对数线性模型)如何应用于重要的现实问题——语音识别、机器翻译、Web 的信息提取、拼写检查、文本文档搜索和口语对话。我们试图在每一章中都讲解一些语言处理应用的描述。这种方法的好处是,让学生有一点儿语言学的背景知识,便于理解特定领域并开展建模。
3.强调评测
近年来,在语言处理中统计算法越来越受到重视,语音和语言处理方面有组织的评测越来越多,因此本书特别加强了评测方面的内容。书中许多章都有专门的评测小节,具体描述评测系统和分析错误的现代经验方法,包括训练集和测试集、交叉确认以及像困惑度这样的信息论评测指标之类的概念。 文摘
插图:
One of the key insights of the last 50 years of research in language processing is thatthe
| ISBN | 9787115238924 |
|---|---|
| 出版社 | 人民邮电出版社 |
| 作者 | 朱拉斯凯(Daniel Jurafsky) |
| 尺寸 | 16 |