
内容简介
《受控词表的互操作研究》是在著者硕士论文和课题研究成果的基础上写成。实现不同词表和分类表之间的互操作已成为受控词表研究中亟待解决的问题之一。《受控词表的互操作研究》作者在全面深入研究国内外关于互操作研究进展的基础上,构建了《中图法》与《杜威法》的映射系统和教育集成词库的构建系统。作者利用同现映射、类目相似度计算、基于结构的自动匹配、基于同义词表的映射等方法,实现了分类表、叙词表、自然语言之间的互操作,并在此基础上开展各种术语服务。
《受控词表的互操作研究》是在大量真实数据集上进行实验研究,所开发的原型系统充分验证了这些方法的实用性和可行性。《受控词表的互操作研究》可作为图书馆、信息机构、高等院校师生及相关人员学习、研究的参考书。
编辑推荐
《受控词表的互操作研究》:情报检索语言与智能信息处理丛书
作者简介
戴剑波,男,1974年生,江西萍乡人。2004年于南京农业大学信息科技学院获得管理学硕士学位。2004年至2005年就职于南京信息工程大学信息管理系,讲师。2005年底调入南京市汽车维修行业管理处,致力于汽车维修、检测行业信息化工作至今。曾经参加匡家社科基金项目和其他合作项目研究,已发表论文6篇。
刘华梅,女,1 980年生,河北张家口人。2003年于南京农业大学信息管理系获得管理学学士学位,2006年于南京农业大学获得管理学硕士学位。现在国家图书馆中文采编部名称与主题规范组《中图法》编委会办公室工作。主要研究方向:受控词表、知识组织,曾经参加两项国家社科基金项目研究,发表论文8篇。
目录
第1章 受控词表的互操作
1.1 受控词表概况
1.2 受控词表的互操作问题
1.3 受控词表互操作的模式和方法
第2章 受控词表互操作研究进展
2.1 国外受控词表互操作研究状况
2.2 国内受控词表互操作研究状况
第3章 《中图法》与《杜威法》映射系统研究
3.1 分类法之间的映射原理
3.2 分类法之间人工映射方法
3.3 分类法自动映射系统的总体设计
3.4 分类法自动映射系统的构建
3.5 自动映射系统的使用与测试评价
第4章 教育集成词库的构建系统研究
4.1 集成词库的设计
4.2 分类语言互操作技术
4.3 主题语言互操作技术
4.4 自然语言与受控词表的互操作
4.5 受控词表互操作的显示及可视化
4.6 结语
附录
附录1:类目与关键词主题词对应数据(样例)
附录2:CLC与DDC类目批处理映射结果(样例)
附录3:分类兼容矩阵结果(样例)
附录4:主题兼容矩阵结果(样例)
名称索引
主题索引
后记
序言
《受控词表的互操作研究》一书是戴剑波、刘华梅在侯汉清教授指导的同主题硕士论文的基础上,经过反复修改增补后出版示人的一部重要论著。该书从情报检索语言的互操作模式和方法研究出发,在分析国内外情报检索语言互操作项目的基础上,研发《中图法》与《杜威十进分类法》(DDC)的互操作系统、《中分表》为基础的教育科学的集成词库系统。虽然两个系统均为试验研究系统,但基于BodandDelphi7.0、SQL2000等软件工具和自动匹配及映射技术开发的互操作系统在国内均应为原型和首创系统,其研究成果意义深远。
近年来,随着网络应用技术的发展,知识服务的深入研究,跨语言、跨结构的知识组织系统互操作问题,越来越成为国际社会文献信息资源共建共享亟须解决的问题。该问题不仅是各种国际性会议和各国学科门户网站研究、合作和报道的焦点,而且也是有关知识组织方面的英美国家标准、国际标准修订补充的主要内容,这些都充分说明了戴剑波、刘华梅基于中国检索语言特点开展其互操作研究的重要性。
这部论著立意明确,结构清晰,材料翔实,有理有据。尤其对《中图法》与DDC类目的自动映射方法和技术,对集成系统的构建设计,语词、结构的自动匹配及类目映射,互操作的显示及可视化技术等做了大量试验研究,为汉语同义词自动识别和挖掘技术、相似度计算等积累了很多试验素材和分析方法。
后记
本书是作者硕士学位论文的主要研究成果,是在导师侯汉清教授的悉心指导和关怀下完成的,特别是在文稿修改、定稿期间,导师倾注了大量的智慧和心血。导师广博的学识、敏捷的思维以及严谨的治学作风、孜孜不倦的教诲精神都给我们留下了深刻的印象,对我们有很大的鼓舞和帮助。同时,导师对我们的严格要求,培养了我们独立思考、做事认真负责的好习惯。这些都使我们终身受益,鞭策着我们在今后的人生旅程中不断学习与提高。在此,谨向导师及其家人表示由衷的感谢和敬意!同时,在撰写论文期间,同实验室的诸位学友在学习和生活上都给了我们很大的帮助和支持,在学术交流上经常提出不同的看法和见解,在编制系统方面也给了很多指导和帮助,都使我们受益匪浅。
南京政治学院上海分院张琪玉教授和国家图书馆的卜书庆研究馆员,在百忙之余欣然为本书作序,倍感荣幸,在此,向他们表示我们诚挚的谢意。还要感谢东南大学出版社给我们提供了这样一个机会,使我们的研究成果得以出版,与大家共享。
关于受控词表的互操作问题,近年来一直是图情界的研究热点,尤其是进入网络时代,发展到知识组织系统后,各国更重视互操作的问题。
文摘
插图:
自然语言到分类语言的转换,主要实现的是关键词到《中图法》分类号的转换,即在关键词和分类号之间建立联系。众所周知,一个词在不同的语言环境中可以表达不同的含义,归属到不同的类中,也就是说,一个词可以对应多个不同的分类号。所以要直接将一个词划分到某一类下是不太可能的,必须要借助一定的语言环境。一般情况下,经常同时出现的两个事物之间具有一定的相互关联性,所以本文基于关键词和分类号的同现信息实现二者的转换。
国内各图书情报机构、信息中心以及文献数据库等这些机构都积累了大量的标引记录,这些标引记录包含了分类标引和主题标引双重数据,而且分类标引大都采用《中图法》作为分类工具,主题标引包括主题词和关键词。所以可以批量下载这种标引记录,对这些数据进行有效整理,然后通过一定的算法建立关键词和分类号的联系。
本系统直接利用本实验室开发的"基于知识库的中文信息自动标引和自动分类系统"的现有知识库数据。该知识库是在《中图法》的基础上,通过机器标引统计归纳出众多人工标引记录中所凝结的标引经验,建立分类号、主题词、关键词之间的概念对应关系。它的主体是"分类号一关键词串"对应表,其中的分类号采用的是《中图法》类号,关键词串是从标引数据中下载来的,通过共现统计的算法计算两者之间的相关度,进而确定它们的关系,它们之间建立的是一对一或一对多的对应关系。如《中图法》分类号"G41/思想政治教育、德育",对应的关键词串有"学校教育一德育;道德一德育;公民教育一学校一德育;生命科学一教育一学生一德育;思想政治教育一学校教育"等。
ISBN | 7564119136/978756411 |
---|---|
出版社 | 东南大学出版社 |
作者 | 戴剑波 |
尺寸 | 32 |