文字识别:原理、方法和实践 9787302454625

配送至
$ $ USD 美元

编辑推荐

《文字识别:原理、方法和实践》一书围绕模式识别和文档信息化而展开。基于模式识别和信息熵理论分析,对文字和文档识别的理论和方法以及关键问题进行了较为深入、系统的分析和研究,并介绍了多种文字和文档识别方法和系统。

作者简介

作者:丁晓青 王言伟等

目录

第1章 绪论
1.1 引言
1.2 文字和汉字
1.2.1 文字的代码表示
1.2.2 汉字的字体字形
1.2.3 汉字的特点
1.2.4 中文信息处理
1.3 文字识别和汉字识别
1.4 文字识别研究历程
1.5 文字识别分类
1.5.1 按照不同文种文字和文档的识别技术分类
1.5.2 按照获取图像方式和识别对象不同分类
1.5.3 单个字符识别和文档篇章识别
1.6 文字识别与笔迹鉴别
1.7 汉字识别的基本方法——基于视觉感知的汉字识别方法
1.8 关于本书
参考文献
第2章 模式识别和模式识别信息熵理论
2.1 引言:模式与模式识别
2.2 基于贝叶斯统计决策的模式识别
2.3 模式识别统一信息熵理论
2.3.1 特征和类别及其相关信息熵
2.3.2 后验熵:最优贝叶斯分类器误识率的上限
2.3.3 模式识别的学习与识别信息过程
2.3.4 互信息:决定模式识别性能的鉴别熵
2.4 正态分布条件下的模式识别信息熵系统
2.5 最大互信息鉴别分析(互信息鉴别子空间模式识别)
2.5.1 最大互信息子空间线性鉴别分析方法
2.5.2 最大互信息线性鉴别分析与线性鉴别分析LDA
2.6 特征选择的信息熵准则
2.6.1 基于错误概率的类别可分性准则
2.6.2 基于有效互信息的类别可分性准则
2.7 从信息熵分析看提高识别性能的途径
2.8 汉字集合和汉字文本的信息熵
2.8.1 汉字集合的信息熵
2.8.2 汉字文本的信息熵和汉字的极限熵
2.9 本章小结
参考文献
第3章 汉字识别的特征提取
3.1 引言
3.2 汉字字符图像规一化预处理
3.2.1 线性规一化
3.2.2 非线性规一化
3.2.3 基于整体密度均衡的非线性规一化
3.3 汉字识别中的特征抽取
3.3.1 结构特征
3.3.2 统计特征
3.4 汉字识别特征提取研究的发展历程
3.4.1 基于图像变换的印刷汉字识别特征和系统
3.4.2 基于形态学汉字结构分析的两级印刷汉字识别特征和系统
3.4.3 汉字笔画密度微结构全局特征及多字体汉字识别系统
3.4.4 基于汉字笔画方向网格特征的鲁棒汉字识别系统
3.5 笔画方向线素特征
3.5.1 方向线素特征的形成方法
3.5.2 网格化方向线素特征
3.5.3 对原模糊分块方法的改进——低通采样方向线素特征
3.5.4 实验和结果
3.6 基于Gabor滤波器的高性能汉字识别方向特征
3.6.1 Gabor变换理论分析
3.6.2 适用于汉字识别的Gabor滤波器组设计及实验验证
3.6.3 对Gabor滤波器组输出的非线性变换—
3.6.4 分块特征的抽取
3.6.5 实验及结果
3.7 汉字识别梯度方向特征抽取方法
3.7.1 梯度方向特征
3.7.2 梯度方向特征的快速算法
3.8 不同笔画方向特征的识别性能实验比较
3.9 本章小结
参考文献
第4章 特征的鉴别分析和分布整形
4.1 引言
4.2 线性鉴别分析
4.2.1 优化准则
4.2.2 变换形式和最优解
4.2.3 变换的分解形式
4.2.4 启发式讨论
4.2.5 实验与结果
4.2.6 小结
4.3 正则化线性鉴别分析
4.3.1 小样本带来的问题
4.3.2 利用正则化估计协方差阵
4.3.3 实验结果
4.4 异方差鉴别分析
4.4.1 基于极大似然估计的异方差线性鉴别分析
4.4.2 基于Chernoff准则的异方差线性鉴别分析
4.4.3 基于Mahalanobis准则的异方差线性鉴别分析
4.4.4 实验结果
4.4.5 小结
4.5 特征统计分布整形变换
4.5.1 特征分布的整形
4.5.2 正态性检验
4.5.3 Box—Cox变换
4.5.4 方向线素及梯度特征的整形
4.5.5 实验与结果
4.6 本章小结
参考文献
第5章 模式识别分类器设计/统计模式分类方法
5.1 引言
5.2 贝叶斯判决理论
5.3 正态分布下的贝叶斯分类器
5.3.1 正态分类模型
5.3.2 最小距离分类器MDC
5.3.3 线性距离分类器LDC
5.3.4 二次鉴别函数分类器QDF
5.3.5 二次鉴别函数
5.3.6 QDF误差分析
5.4 改进二次鉴别函数分类器MQDF
5.4.1 修正二次鉴别分类MQDF
5.4.2 QDF修正形式的贝叶斯估计推导
5.4.3 实验与结果
5.5 系统实现与应用
5.5.1 非限定脱机手写汉字识别系统
5.5.2 多字体印刷中、日、韩文识别系统
5.6 分类器的置信度分析
5.6.1 分类器的置信度和广义置信度
5.6.2 基于距离的分类器的广义置信度估计
5.6.3 多层前向神经网络分类器广义置信度估计
5.6.4 从广义置信度求置信度的方法
5.6.5 使用ACT估计后验概率
5.6.6 置信度分析在字符识别中的应用
5.6.7 小结
5.7 分类器集成
5.7.1 集成的3个层次
5.7.2 基于线性回归的多分类器集成
5.7.3 利用线性回归提高后验概率估计的准确性
5.7.4 后验概率的估计误差与误识率的关系
5.7.5 实验结果
5.7.6 小结
5.8 本章小结
参考文献
……
第6章 无约束手写汉字识别分类器鉴别学习
第7章 联机手写汉字识别
第8章 利用上下文信息的汉字识别后处理
第9章 脱机手写文档识别方法
第10章 文档版面自动分析和理解
第11章 蒙藏维多文种识别
附录A 常用缩略语表
附录B 文字识别相关研究成果
附录C 文字识别相关成果主要奖励
附录D 已授权文字识别相关发明专利
附录E 文字识别相关的博士论文
附录F 本书中算法研究相关数据库
索引

序言

文字是人类信息*重要的载体和*集中的表象,记载了几千年人类的文明和历史,对五千年中华文明的传承和发展起着极其关键的作用。当今人类社会进入快速计算机网络信息化的时代,信息的全球化和大数据资源的获取,首先要求解决和实现各类信息的数字化,特别是文字和文档信息的计算机数字化。计算机信息化,就是要求计算机也能像人一样识图认字:使计算机具有对图像或文字表象的自动识别的能力。也就是说,文字和文档识别信息化也是人工智能和计算机视觉需要解决的重要问题。20世纪60年代,国际上就十分重视对文字识别的研究。我国汉字数量巨大、结构复杂,难以输入计算机,这成为汉字信息化的拦路虎,因此,汉字识别及海量文档的计算机数字化研究极为紧迫,并具有特殊的历史意义。作者所在的清华大学智能图文信息处理研究室从20世纪80年代就开始了汉字等多文种文字和文档识别信息化的研究和探索,数十位师生持续卅余年,齐心奋力,在文字识别的理论和方法研讨上、在大规模印刷、联机和脱机手写汉字识别、中日韩、蒙藏维哈柯阿民族文字文档识别的研究上取得领先的研究成果,并将研究成果在世界范围推广应用。这些经历和成果成为本书撰写的直接动因。《文字识别:原理、方法和实践》一书围绕模式识别和文档信息化而展开。基于模式识别和信息熵理论分析,对文字和文档识别的理论和方法以及关键问题进行了较为深入、系统的分析和研究,并介绍了多种文字和文档识别方法和系统。全书包括11章,各章内容如下: 第1章绪论介绍文字的基本属性和特点;第2章模式识别和模式识别信息熵理论,揭示模式识别的核心互信息,汉字和汉字文本的信息熵;第3章介绍汉字识别的特征提取和优良的汉字识别特征;第4章介绍特征的鉴别分析、维数压缩和特征高斯分布整形;第5章介绍*优贝叶斯分类器和MQDF设计;以上章节主要介绍文字识别基本理论。第6章介绍脱机手写汉字识别的鉴别学习方法;第7章介绍基于时空统一模型的结构联机汉字识别方法,以及基于结构特征的统计联机手写汉字识别系统; 第8章介绍利用上下文语言信息进行汉字文本识别后处理的理论方法;第9章介绍基于过切分的文本行识别及基于HMM的无切分文档识别方法;第10章介绍复杂文档版面的自动分析、理解和重构,及文档自动识别和重构方法;第11章介绍蒙藏维多文种文字文档识别的策略、理论和方法,为民\|汉跨文种文档识别理解打下基础。本书有选择性地针对文字和文档识别中必须解决的诸多重要问题,从单字、联机、多变脱机汉字识别、鉴别学习,到复杂版面、连笔书写、上下文相关文档识别,以及多文种民族文字识别,力图较完整地,从理论、方法和实践进行深入分析和讨论。全书内容主要源自我们研究工作的总结,大部分章节源于研究生的论文,包括张睿、刘海龙、张嘉勇、林晓帆、征荆、陈彦、王学文、王言伟、李元祥、姜志威、陈明、王华等同学的博士论文。丁晓青负责全书的编撰,王言伟还做了大量文档编辑工作。希望读者能够对文字和文档识别的理论、方法和实践有较为全面的认知和了解,并从中获得有益的启发。*后需要说明的是,本书没有也不可能完全包括当前在此领域内*新的研究成果和发展。对于读者,本书能够起到抛砖引玉的目的,我们就十分欣慰了。本书的内容主要源自研究组对文字和文档识别理论和方法的研究和探索,特别是汉字识别研究开创者之一,已故的吴佑寿院士,他的一贯支持,为汉字识别研究的成功发挥了重要作用;刘长松、彭良瑞进行了长期的工作,为本书和研究成果的产品化,作出突出贡献;以及集数十位研究生的不懈努力和研究成果,除上面已经提及的参与者外,还包括:朱夏宁、董宏、黄晓非、李彬、徐宁、郭繁夏、苟大银、赵明生、郭宏、刘今晖、陈友斌、方驰、靳简明、陈力、鲁湛、陈彦、李闯、王贤良、文迪、何峰、姚正斌、李昕、蒋焰、付强等。在此一并表示衷心的感谢!

文摘

第1章绪论文字识别: 原理、方法和实践第1章绪论1.1引言人类社会已进入了信息时代,尤为重要的标志之一是互联网的发展已经深入人们的生活,从宽度、广度和深度方方面面改变了和改变着人们的生活方式,也改变了世界。信息化使得信息的获取、传输、交换和使用成为影响社会发展的重要因素,信息事业的发展极大地影响了国家的发达和民族的兴旺,也因此得到世界各国的极大关注。在计算机信息化迅速发展的过程中,信息的电子化处理已成为一种不可逆转的趋势,需要解决如何把大量的已产生或将产生的印刷或手写的海量文档信息高效地输入计算机这样的问题,即使在未来,这也是必不可少的一步。将电子化文档输出为纸质文档,激光照排技术带来了对历史上铅与火排版技术的革命,使信息化得到重要发展。但反之,要将无处不在、无时不有的介质上的印刷或手书文档,自动变成计算机可以阅读(查询和检索等)的电子文档,却是十分重要,但却相当难以实现的。虽然可以采用人工键入的方法,但完全无法满足信息化时代对高速、大数据和大容量的需求。如何满足全球信息化对于文档数字化高速、大数据、大容量的急迫需求,利用计算机模式识别技术进行文字和文档的自动识别,实现形形色色的文档的自动电子化,为计算机信息化发展打下坚实的基础是我们研究工作的目的,也是本书写作的动因。《文字识别:原理、方法和实践》一书源于自20世纪80年代开始作者对汉字识别的研究和探索,以及30余年持续的研发和产业化工作,因此有必要对这些研究工作加以总结和汇总。《文字识别:原理、方法和实践》的写作基本上沿着模式识别与文字和文档的信息化这两条线索展开。第1条线索是模式识别,是本书的理论依据。由于文字识别是*典型的,也是目前*有成效的模式识别技术,因此我们有必要首先介绍模式识别以及解决模式识别问题的统计模式识别的基本理论和方法,从提出模式识别信息熵理论开始,包括模式识别特征提取、特征选择和压缩、分类器设计、上下文相关识别方法等基本问题的研究探讨。第2条线索是文字和文档的信息化,这是本书的中心内容。文字是信息的*集中表现,汉字记载了5000余年中国的历史和现代文明的发展。尤其是在计算机信息化时代,文字信息化是信息化时代的基础问题也是关键的问题,特别是困难的文档信息的计算机自动输入问题。在西方文字信息化已取得较完善发展的20世纪60—70年代,数量巨大、结构复杂的汉字信息化却遇到汉字计算机输入的特殊困难,成为汉字计算机信息化的拦路虎。完善解决多种文字和文档自动识别计算机输入等问题,是本书研讨的主要内容,包括利用统计模式识别方法,对多文种文档识别的众多关键问题进行较为详细的研究和探讨,等等。本书介绍了文字和文档识别的理论、方法和实践应用。根据模仿人类视觉模型,提出有别于结构分析的基于文字图像的统计模式识别方法,有效突破了汉字输入计算机对信息化的壁垒,取得了文字识别令人瞩目的进展。从模式识别信息熵的分析说明了统计模式识别方法的理论基础,分析了从文字图像中提取识别特征的方法,以及文字识别中分类器的学习和设计方法;提出汉字的综合识别研究,以及文本识别必须解决的版面分析、文字切分和利用上下文识别后处理等重要问题,*后,总结了文字识别研究的重要进展情况并对未来工作加以展望。1.2文字和汉字文字是人类社会文明的基石,是人类信息*重要的载体,文字信息是信息*集中的表现,是人类信息传承、交换、记载的依据。应当说,人类文明源于文字的出现,人类文明的发展更离不开文字。在信息化时代的今天,尤其是在互联网全球化之时,文字信息数字化对于人类文明发展更具特殊的意义。这种无所不在和无处不有的海量大数据文字信息的数字化要求,注定了文字识别的不可或缺及其在世界范围内广泛的应用需求。文字是语言的符号表示,世界上使用的文字基本上可以分为以下几种:拉丁字母、基里尔字母、阿拉伯字母、印度字母、汉字系统及其他(韩语、蒙古语、希伯来语等)文字等。汉字是世界上*古老的三大文字系统之一。其他如古埃及的圣书字、两河流域苏美尔人的楔形文字已经失传,仅有*的中国的汉字沿用至今。汉字,是中国人创造的意音文字书写系统,也是当今世界上*仍被广泛采用的意音文字和独源文字,推估历史可追溯至约0年前的夏商时期。汉字主要用于书面记录汉语
ISBN9787302454625
出版社清华大学出版社
作者丁晓青
尺寸32