
开本:16开 |
纸张:胶版纸 |
包装:平装-胶订 |
是否套装:否 |
国际标准书号ISBN:9787115663160 |
所属分类:图书>计算机/网络>硬件外部设备维修 |
编辑推荐
技术突破:针对古籍碎片化数据,提出基于深度学习的多模态修复模型,实现破损文字智能补全与语义还原; 方法论革新:三层数据转化模型,打通古籍扫描图像→结构化数据→知识图谱的全链路; 数据工程深度解析:详解古籍文本清洗、标注、增强等关键环节,解决训练数据匮乏难题; 教育增值:配套数据集代码案例,支持高校开设数字人文跨学科课程,培养懂的文献学者与懂古籍的算法工程师商品详情内容简介
古籍数字化是一项复杂而重要的工作,它不仅有助于保护和传承中华优秀传统文化,还为学术研究和文化传播提供了强有力的支持。本书深入探讨了古籍数字化的重要性及其面临的挑战,详细介绍了古籍数据、深度学习在古籍数字化领域的应用场景及其应用潜力,并针对古籍文本数据的碎片化问题进行了深入分析。此外,书中还讨论了基于深度学习的古籍数字化过程中的数据预处理、数据标注和模型优化等问题,提出了一系列解决方案,为读者提供了可借鉴的经验和方法。 本书适合古籍保护与研究人员、图书馆和档案馆工作人员、计算机科学与技术领域的学者,以及对古籍数字化感兴趣的读者参考和使用。
目 录
第章绪论
古籍的定义
文字
深度学习
研究说明
第章古籍数据
数据模型
数据格式
第章古籍文本数据碎片化
碎片数据模型
碎片数据特点
碎片数据生成
第章文本分类
内容分类 第章绪论
古籍的定义
文字
深度学习
研究说明
第章古籍数据
数据模型
数据格式
第章古籍文本数据碎片化
碎片数据模型
碎片数据特点
碎片数据生成
第章文本分类
内容分类
题名分类
第章序列标注
专名识别
句读标点
第章余论
数据
模型
参考文献
附录
附录古籍点校通例(中华书局编辑部年编写)
附录古籍字频统计数据
附录古籍传目项与字段对照表
附录古籍元数据规范()
附录古籍索引数据
附录古籍版式文本数据头文件
附录古籍版式文本数据叶文件
附录古籍碎片数据
附录四部分类法类目表
显示全部信息
作者简介
王秀香,国家图书馆副研究馆员,主要研究方向为图书馆标准化研究、数字图书馆研究、文献资源保护研究等。发表论文余篇,参编著作两部,参与个国家标准、个行业标准的编写,参与多个重量、省部级科研项目,主持完成国家图书馆科研项目项。
技术突破:针对古籍碎片化数据,提出基于深度学习的多模态修复模型,实现破损文字智能补全与语义还原; 方法论革新:三层数据转化模型,打通古籍扫描图像→结构化数据→知识图谱的全链路; 数据工程深度解析:详解古籍文本清洗、标注、增强等关键环节,解决训练数据匮乏难题; 教育增值:配套数据集代码案例,支持高校开设数字人文跨学科课程,培养懂的文献学者与懂古籍的算法工程师商品详情内容简介
古籍数字化是一项复杂而重要的工作,它不仅有助于保护和传承中华优秀传统文化,还为学术研究和文化传播提供了强有力的支持。本书深入探讨了古籍数字化的重要性及其面临的挑战,详细介绍了古籍数据、深度学习在古籍数字化领域的应用场景及其应用潜力,并针对古籍文本数据的碎片化问题进行了深入分析。此外,书中还讨论了基于深度学习的古籍数字化过程中的数据预处理、数据标注和模型优化等问题,提出了一系列解决方案,为读者提供了可借鉴的经验和方法。 本书适合古籍保护与研究人员、图书馆和档案馆工作人员、计算机科学与技术领域的学者,以及对古籍数字化感兴趣的读者参考和使用。
目 录
第章绪论
古籍的定义
文字
深度学习
研究说明
第章古籍数据
数据模型
数据格式
第章古籍文本数据碎片化
碎片数据模型
碎片数据特点
碎片数据生成
第章文本分类
内容分类 第章绪论
古籍的定义
文字
深度学习
研究说明
第章古籍数据
数据模型
数据格式
第章古籍文本数据碎片化
碎片数据模型
碎片数据特点
碎片数据生成
第章文本分类
内容分类
题名分类
第章序列标注
专名识别
句读标点
第章余论
数据
模型
参考文献
附录
附录古籍点校通例(中华书局编辑部年编写)
附录古籍字频统计数据
附录古籍传目项与字段对照表
附录古籍元数据规范()
附录古籍索引数据
附录古籍版式文本数据头文件
附录古籍版式文本数据叶文件
附录古籍碎片数据
附录四部分类法类目表
显示全部信息
作者简介
王秀香,国家图书馆副研究馆员,主要研究方向为图书馆标准化研究、数字图书馆研究、文献资源保护研究等。发表论文余篇,参编著作两部,参与个国家标准、个行业标准的编写,参与多个重量、省部级科研项目,主持完成国家图书馆科研项目项。