
《情报检索语言的兼容转换》内容简介:作者通过总结十几年来在信息管理、计算机应用技术和地理信息系统等领域的工作成果,较为系统地阐述了情报检索语言兼容转换的研究意义、技术方法和应用案例,探讨了中文文本的关键词抽取技术和中图法知识库构建技术。全书内容组织以智能化、应用化发展趋势为导向,从传统方法到机器学习方法,从文献知识组织到领域信息处理。《情报检索语言的兼容转换》语言简明流畅,图文并茂,是文献信息管理、智能信息处理研究和学习的参考书。
编辑推荐
《情报检索语言的兼容转换》是由东南大学出版社出版的。 作者简介
张雪英,1970年生,四川省仁寿人。南京农业大学信息管理专业文学士和经济管理专业管理学硕士,南京理工大学计算机应用专业工学博士。2003至2005年德国波恩大学计算机系访问学者。现为南京师范大学地理科学学院教授,主要从事地理信息的智能处珲与应用研究。主持1项国家“863”课题和1项国家自然科学基金,参与10余项国家“863”课题、国家自然科学基令、国家社会科学基金和国际合作项目。在国内外期刊发表学术论文30余篇,出版专著1部。 目录
第1章 绪论
1.1 多元信息空间
1.2 情报检索语言的兼容性
1.3 情报检索语言的兼容模式
1.3.1 标准化
1.3.2 中介词典
1.3.3 宏观词/微观词表
1.3.4 集成词表
1.4 情报检索语言的兼容转换
1.4.1 基本概念
1.4.2 兼容转换方法
1.4.3 兼容转换类型
1.5 国内相关研究进展
1.5.1 分类语言一主题语言的兼容转换
1.5.2 主题语言一主题语言的兼容转换
1.5.3 自然语言一主题语言的兼容转换
1.6 小结
第2章 基于集成词表的叙词表转换
2.1 叙词表的比较分析
2.2 集成词表的构建
2.2.1 数据获取
2.2.2 源数据格式转换
2.2.3 补充入口词
2.2.4 数据格式:
2.3 叙词表转换系统
2.3.1 系统结构
2.3.2 转换模式
2.3.3 系统操作界面
2.4 性能评价
2.5 小结
第3章 基于相似度计算的分类表转换
3.1 技术流程
3.2 句法分析处理n
3.3 字面相似度计算模型
3.4 转换模型和算法
3.5 分类表转换系统
3.5.1 数据管理
3.5.2 自动转换
3.5.3 人工转换
3.6 实验评估
3.6.1 实验数据
3.6.2 评估指标
3.6.3 实验结果分析
3.7 小结
第4章 基于FLogl的分类表——钡词表转换
4.1 并行文献数据库的构建
4.2 信息的对数量度原理
4.3 最大似然估计法
4.3.1 基本原理
4.3.2 LogL计算
4.4 分类号一主题词对照数据库的构建
4.4.1 基于LogL的方法
4.4.2 标准对照库的生成
4.4.3 基于MARC的方法
4.5 转换模式
4.5.1 分类号一主题词的转换
4.5.2 主题词一分类号的转换
4.5.3 系统界面设计
4.6 实验评估
4.7 小结
第5章 基于粗糙集的情报检索语言转换
5.1 经典的语义相似度计算方法
5.2 粗糙集理论
5.3 KST转换模型
5.4 语义转换类型
5.4.1 一对一转换
5.4.2 一对多转换
5.4.3 多对多转换
5.4.4 转换关系整合
5.5 实验评估
5.6 小结
第6章 基于FN-gram的关键词自动抽取
6.1 传统方法概述
6.2 技术流程
6.3 GF/GL权重法
6.4 关键词筛选算法
6.5 性能评价
6.5.1 相似度系数
6.5.2 基于文本分类的方法
6.6 小结
第7章 《中图法》知识库的构建及应用
7.1 《中图法》概况
7.2 《中图法》知识库的结构分析
7.3 《中图法》知识库的构建技术
7.4 《中图法》知识库的应用
7.5 小结
名称索引
主题索引
后记
图表目次
图1-1 多元化信息空间
图1-2 联网环境下的信息检索模式
图1-3 中介词典原理示意图
图1-4 微观词表与宏观词表的兼容模式
图1-5 检索语言之间的词汇语义关系
表2-1 《汉表》、《社科表》和《经管表》叙词款目参照系统
图2-1 集成词表的生成
…… 序言
随着计算机、通信和互联网技术的快速发展,信息检索面临着信息量激增、用户大众化和服务创新等多重挑战。目前,自然语言处理、模糊数学、机器学习等先进技术,已经成功应用于语音识别、电子政务、机器翻译和工业控制等领域。因此,如何应用人工智能技术推进信息检索的智能化和大众化,无疑成为当前信息服务的主要议题。
情报检索语言是信息检索的语言保障工具,其兼容性问题成为信息共享和服务的最大障碍。本书较为全面地阐述了情报检索语言兼容转换的基本理论和国内外研究进展,讨论了多种检索语言的兼容转换方法,包括基于集成词表的叙词表兼容转换方法、基于字面相似度的分类兼容转换方法、基于最大似然法的分类表与叙词表兼容转换方法、基于粗糙集的检索语言兼容方法,提出了基于N.Gram的中文文本关键词自动抽取方法,分析了“中图法”知识库的构建理论与方法。
本书内容组织独具匠心,既有详细的理论基础,也有具体的方法和系统。从技术角度看,首先讨论传统的方法,逐步过渡到统计方法和机器学习方法。 后记
当着手写这篇后记的时候,我依稀记起1992年侯汉清教授指导我本科学位论文的情景。岁月匆匆,转眼已经过去整整十七个年头。我也从一个懵懵懂懂的大学生,成为一位母亲和研究生导师。十几年来,侯教授在工作和生活中给予我大量无私的指导、关心和支持,使我有勇气和毅力顺利地跨越了人生的数次转变。今天。当我在享受工作乐趣和收获工作成果的同时,却时常被师恩何以回报的问题所困扰。恰值此书出版之际,谨以此微薄之礼向恩师表示诚挚的谢意!
2003——2005年,我作为访问学者和中德联合培养博士生在波恩大学计算机系进修。在德国导师Juergen KraLise教授和中国导师刘凤玉教授的共同指导下,我开始涉入基于机器学习的智能信息检索技术研究,并取得了一定的研究成果。在此,衷心感谢二位导师为我出国留学和研究工作所做的一切努力。异国他乡的生活经历,带给我一生珍藏的美好记忆。
感谢B.Daille、J.Maniez、M.Stempfhuber、C.w.Hacker、A.B.Cremers、储荷婷、曾蕾等学者给予的大量建议和参考资料;感谢李千目、唐振民、杨洪海、汪涛等同学和朋友的不懈支持和帮助;感谢吴志强、刘竟、何琳、章成志和刘华梅等同门师兄妹的团结协助;特别感谢薛春香博士合作撰写了本书第7章内容。 文摘
插图:
情报检索语言是表达一系列概括文献信息内容的概念及其相互关系的概念标识系统,包括分类、主题和代码三大语系。在文献信息检索系统中,情报检索语言是检索服务质量控制的语言保障工具。
情报检索语言的兼容性是指用某种词表的词汇或代码及其构造的检索式,可以直接适用于、或通过交换适用于多个情报检索系统。事实上,各个检索语言在基本原理、原则和方法之间是相互联系的,联系的基础和实质是主题概念和逻辑关系。实现情报检索语言的兼容,就是要找到一种方法,使具有不同标识、结构、物质载体的类表和词表成分,能够在语义上互相关联起来,消除情报检索语言之间的语义异构性。因此,情报检索语言的兼容性处理,不仅有利于用户查询各种系统中的文档资料,而且有利于文献的集中处理,为文献检索网络化、集成化和共享服务提供支撑。
根据情报检索语言的类型及语种,可以将情报检索语言的兼容性定义为以下几种类型:
·不同类型检索语言的兼容。比如,《中国分类主题词表》(简称《中分表》)就是我国第一部大型的、综合性的、分类与主题兼容、先组式检索语言与后组式检索语言兼容的工具书。
·相同类型检索语言的兼容。比如,叙词表之间、分类法之间的兼容。
·综合性检索语言与专业检索语言的兼容。比如,《汉语主题词表》与专业词表的兼容,《中图法》与专业分类表的兼容。
·中外文检索语言的兼容。不同语种的检索语言之间兼容,实现起来较为困难,但是意义重大。
ISBN | 7564119136 |
---|---|
出版社 | 东南大学出版社 |
作者 | 张雪英 |
尺寸 | 32 |