留学生书写行为数据库建设及应用研究 7561949022,9787561949023

配送至
$ $ USD 美元

编辑推荐

《留学生书写行为数据库建设及应用研究》由北京语言大学出版社出版。

作者简介

李超,男,北京人,语言学及应用语言学博士,现任北京语言大学信息科学学院副书记。主要研究方向为汉字信息处理、中介语语料库建设、语言工程。

目录

第一章绪论
1.1问题的缘起
1.2留学生书写习得研究综述
1.2.1留学生书写习得和偏误研究成果简介
1.2.2留学生汉字书写质量评测研究成果简介
1.2.3留学生书写习得研究评述及分析
1.3研究目标、内容及意义
1.4本书内容的组织
第二章留学生书写行为数据库建设
2.1留学生书写行为数据库建设的内容及目标
2.2留学生书写行为数据库的数据规范设计
2.2.1字体的选取
2.2.2标准字数据规范设计
2.2.3学生字数据规范设计
2.2.4留学生书写行为数据库的数据规范整体设计
2.3采集方案设计
2.4留学生书写行为数据库的数据集合说明
2.4.1数据集合简介
2.4.2数据集合的标注及应用简介
2.5留学生书写行为数据库的管理
2.6本章小结
第三章留学生书写行为数据库的标注设计
3.1面向汉字书写质量评测的汉字字形形式化描述方法
3.1.1汉字字形形式化描述方法综述
3.1.2多层次多特征的汉字字形描述体系
3.1.3面向书写质量评测的汉字字形形式化描述方法定义及举例
3.2错误类型的定义
3.2.1错误类型的设计原则
3.2.2错误类型的多人标注认知实验
3.2.3错误现象举例及错误类型的描述性定义
3.3本章小结
第四章汉字书写质量评测核心算法与数据库人机结合标注
4.1汉字书写质量评测的核心算法
4.1.1标准字的标注和获取
4.1.2学生字的表示和获取
4.1.3自动匹配算法
4.1.4预处理
4.1.5笔画匹配
4.1.6笔段匹配
4.1.7合法性纠正
4.1.8断笔合并
4.1.9算法总结
4.2汉字书写质量评测核心算法的实验
4.2.1笔段分割的准确率检验
4.2.2笔段匹配的准确率检验
4.2.3错误类型映射的效率检验
4.3本章小结
第五章基于书写行为数据库的留学生汉字书写习得研究
5.1留学生书写行为数据库的分析
5.1.1关于“偏误”的说明
5.1.2留学生书写行为数据库汉字和书写者信息统计分析和说明
5.1.3留学生书写行为数据库的汉字字形信息统计分析
5.2留学生笔画使用情况的书写习得研究
5.2.1不同笔画数字例的笔画使用情况
5.2.2不同书写方式的笔画使用情况
5.2.3汉字圈与非汉字圈的笔画使用情况
5.2.4不同国籍书写者的笔画使用情况
5.3时间相关信息的分析
5.3.1时间相关的总体分析
5.3.2不同书写方式的时间相关分析
5.3.3汉字圈与否的时间相关分析
5.3.4不同母语书写者的时间相关分析
5.4时间相关的偏误分析
5.4.1基本观点
5.4.2实验样本的选取和数据的说明
5.4.3四类时间错误的出现频率
5.4.4不同书写方式下时间错误的分析
5.4.5不同母语的时间错误分析
5.4.6典型字的偏误规律
5.4.7书写者个人的书写时间特征分析
5.5本章小结
第六章结论与展望
参考文献
附录
后记

文摘

版权页:

插图:

3.1.2多层次多特征的汉字字形描述体系
让计算机能够处理包括标准字和手写字在内的汉字字形,并能满足汉字书写质量评测的具体应用要求,其根本是设计一套恰当的汉字字形形式化描述体系。这个描述体系要能被计算机识别、计算,同时,还要反映标准字和手写字的全面特征和细节特征。如前文所述,面向书写质量评测的汉字字形形式化描述方法还存在着诸多困难。以下将从面临的困难、设计的原则和方法几个方面,详细阐述设计多层次多特征的汉字字形描述体系的具体过程。
3.1.2.1面临的困难
包括标准汉字和手写汉字在内的汉字的字形计算问题,是一个复杂问题求解的过程,绝非纯工程层面的问题。它主要存在以下几对矛盾:
(1)封闭标准与开放字形的矛盾
手写汉字是人自然书写的结果,其结果又是由书写的过程决定的。手写汉字具有约束性和开放性,约束性表现在:手写汉字是由线条构成,或者说汉字的构成单位没有饼状图形;此外,构成不同汉字的线条都被限制在大小相仿的方框内。开放性表现在:线条的类型是开放的,不能用标准字的横、竖、撇、捺、折来概括,比如可能有圆弧、有右上左下的阶梯形等;基本的线条组成了笔画和部件,这些笔画之间、部件之间、笔画和部件之间、部件和部件之间的关系都是开放的。同时,因环境的不同、书写者的不同等因素,手写汉字也具有不可重复性。
ISBN7561949022,9787561949023
出版社北京语言大学出版社
作者李超
尺寸16