
《化学信息学》为普通高等教育“十一五”国家级规划教材,是教育部“使用信息技术工具改造课程”项目的研究成果~4章讲述了化学信息的来源,包括手册、书籍、搜索引擎以及目前广为使用的期刊文献数据库;第5 ~ 7章介绍了化学信息的处理工具(即化学软件)、处理方法(相关化学计量学算法)以及定量构效关系(QSAR)的原理及应用;第8章对生物信息学领域的研究进行了概述。
《化学信息学》可作为高等院校化学化工专业本科“化学信息学”课程的入门教材,另外,书中提供了大量与信息学相关的网址,也可作为研究生的参考书籍。
编辑推荐
《化学信息学》是普通高等教育“十一五”国家级规划教材之一。 目录
第1章 概述 1
1.1 什么是化学信息 1
1.2 化学信息的诞生背景 1
1.3 信息科学在化学领域的应用 2
1.4 化学信息的结构和特点 2
1.5 化学信息的工作方式 3
1.6 信息采集接口 4
1.7 化学信息的应用 4
1.7.1 绘制结构 4
1.7.2 数据库 5
1.7.3 计算机辅助设计反应预测系统 5
1.7.4 预测结构与活性的关系 5
1.8 展望 5
第2章 化学信息来源 7
2.1 词典 7
2.2 手册 7
2.3 化学期刊 9
2.3.1 综合类期刊 9
2.3.2 有机化学期刊 10
2.3.3 分析化学期刊 11
2.3.4 无机化学期刊 12
2.3.5 物理化学期刊 12
2.4 图书馆资源 12
2.4.1 生命科学图书馆 13
2.4.2 中国科学院大连化学物理研究所图书馆 13
2.4.3 中国科学院国家科学图书馆 14
2.4.4 国家科技图书文献中心化工分中心 16
2.4.5 清华大学图书馆 17
2.4.6 中国国家图书馆 17
2.4.7 哈佛大学图书馆 17
2.4.8 斯坦福大学图书馆 18
2.5 化学化工信息资源导航系统 19
2.5.1 ChIN 19
2.5.2 Computer Aided Chemistry Tutorial 20
2.5.3 Wilton High School Chemistry 20
2.5.4 化学家链接网站 21
第3章 化学信息数据库资源 22
3.1 数据库简介 22
3.1.1 数据 22
3.1.2 数据库 22
3.1.3 数据库管理系统 23
3.1.4 数据库系统 23
3.2 数据库历史及分类 24
3.2.1 数据库历史 24
3.2.2 数据库的模型分类 25
3.3 三类化学信息数据库 26
3.3.1 文献数据库 26
3.3.2 事实数据库 26
3.3.3 结构数据库 26
3.4 互联网上的化学化工数据库 27
3.4.1 CA 27
3.4.2 ISI数据库 33
3.4.3 OCLC数据库 39
3.4.4 CSA 40
3.4.5 ScienceDirect 40
3.4.6 CNKI 42
3.4.7 万方数据库 48
3.4.8 维普中文科技期刊数据库 48
3.4.9 EI 48
3.4.10 出专利数据库 49
3.4.11 Reaxys数据库 51
3.4.12 谱图数据库 52
第4章 信息搜索引擎 54
4.1 概述 54
4.1.1 搜索引擎的原理 54
4.1.2 搜索引擎的历史及发展趋势 55
4.2 搜索引擎的定义及分类 58
4.2.1 全文搜索引擎 58
4.2.2 目录索引类搜索引擎 58
4.2.3 元搜索引擎 59
4.2.4 垂直搜索引擎 59
4.3 搜索引擎查询方法 59
4.3.1 模糊查询 60
4.3.2 精确查询 60
4.3.3 逻辑查询 60
4.3.4 指定范围查询 61
4.4 常用搜索引擎 61
4.4.1 百度 61
4.4.2 Google中国 62
4.4.3 维基百科 62
4.4.4 BASE 65
4.4.5 Vascoda 65
4.4.6 Information Bridge 66
4.4.7 Intute 67
4.4.8 Infomine 68
4.5 元搜索引擎 68
4.5.1 Dogpile 68
4.5.2 Excite 69
4.5.3 Ixquick 70
4.5.4 Mamma 70
4.5.5 Metacrawler 71
4.5.6 ProFusion 71
4.5.7 Savvysearch 72
4.6 专业搜索引擎 73
4.6.1 专业搜索引擎的优势 73
4.6.2 著名的专业搜索引擎 73
第5章 化学软件 76
5.1 概述 76
5.2 化学软件的分类 77
5.3 语言软件和依托算法的化学计算软件 78
5.3.1 MATLAB 78
5.3.2 R语言 91
5.4 绘图软件 101
5.4.1 ACD/ChemSketch5.0 101
5.4.2 Symyx Draw 103
5.4.3 ChemBioDraw 104
5.5 化学分析仪器数据处理软件 105
5.5.1 GRAMS 106
5.5.2 MestReNova 109
5.5.3 Origin 110
5.6 分子模拟软件 112
5.6.1 Gaussian软件 112
5.6.2 Amber软件 114
第6章 信息处理与数据挖掘 117
6.1 概述 117
6.2 数据的标准化 118
6.3 特征提取与优化 118
6.3.1 主成分分析 118
6.3.2 偏最小二乘法 121
6.3.3 逐步回归分析 122
6.3.4 遗传算法 123
6.4 信号处理方法 125
6.4.1 协方差与相关系数 126
6.4.2 自、互相关分析 126
6.4.3 功率谱密度 127
6.4.4 傅里叶变换 127
6.4.5 小波变换 128
6.5 机器学习方法 132
6.5.1 K最近邻法 132
6.5.2 概率神经网络 132
6.5.3 分类回归树 133
6.5.4 助推法 134
6.5.5 人工神经网络 135
6.5.6 支持向量机 139
6.6 数据库挖掘技术 141
6.6.1 聚类算法 141
6.6.2 决策树算法 142
6.7 Web数据挖掘技术 142
6.7.1 web内容挖掘 142
6.7.2 web结构挖掘 143
6.7.3 web日志挖掘 143
第7章 QSAR及药物设计 144
7.1 概述 144
7.2 QSAR模型的分类 145
7.2.1 二维定量构效关系 145
7.2.2 三维定量构效关系 147
7.2.3 多维定量构效关系 150
7.2.4 方法评价 150
7.3 定量构效关系研究中常用的回归分析法 151
7.3.1 多元线性回归 151
7.3.2 主成分回归 152
7.3.3 偏最小二乘回归 153
7.3.4 投影寻踪回归 154
7.3.5 非线性方法 155
7.4 药物设计 155
7.5 QSAR方法的应用 157
第8章 生物信息学 161
8.1 什么是生物信息学 161
8.2 生物信息学的发展历程 162
8.3 生物信息学的研究内容 164
8.3.1 生物信息挖掘 164
8.3.2 药物设计 164
8.3.3 基因组学 165
8.3.4 蛋白质组学 165
8.4 生物信息学的研究方法 167
8.5 生物信息学的应用 168
8.6 生物信息学的研究趋势 169
8.7 蛋白质功能研究 170
8.8 蛋白质数据库简介 171
8.8.1 综合性蛋白质数据库 171
8.8.2 专用性蛋白质数据库 172
8.9 蛋白质序列的特征提取方法 173
8.9.1 基于氨基酸组成和位置的特征提取方法 174
8.9.2 基于氨基酸物理化学特性的特征提取方法 175
8.9.3 基于数据库信息挖掘的特征提取方法 177
8.10 蛋白质相互作用 178
8.11 蛋白质网络 183
参考文献 187 文摘
版权页:
插图:
作为将计算机与信息科学技术运用到生命科学尤其是分子生物学研究中的重大交叉学科和前沿研究领域,生物信息学已成为基因组研究中强有力的、必不可少的研究手段。从国内外近十几年的研究和应用情况来看,生物信息学在理论上促进了生物学的发展,使人类对生命本质的认识更加深刻。生物信息学改变了传统的生物学研究方法,提高了生物学实验的科学性和研究的效率,生物科学在生物信息学的推动下将会发生一场革命。生物信息学的研究结果不仅具有重要的理论价值,还可以直接应用到工农业生产和医疗实践当中,广泛地用于缩短药物开发周期、加快新基因的寻找过程等研究领域。
由于生物信息学是门崭新的学科,目前生物信息学存在着不少的难题有待解决。首先,生物信息学理论研究还十分薄弱。生物信息学的学科交叉特性对许多涉及其中的学科都提出了巨大的挑战,包括统计生物学、生物数学、分子生物学、生物物理学、生物化学、计算生物学、信息科学等相关学科。如果相关学科的基础理论研究得不到相应的发展,生物信息学的发展也将受到严重制约。其次,随着生物学数据库增长幅度继续加大,数据整合的难度和需求不断加大,新的计算机和信息科学技术不断被引入。由此,新的数据挖掘算法和新的技术支撑平台体系不断涌现,计算复杂度越来越高,从而推动了可重构计算、网格计算和协同工作环境技术的发展。复杂生命体系模拟技术以及与之配套的大型知识库建设已经成为新一轮生物信息技术发展的基础,可统一描述基因调控、生化代谢网络动力学机制的数学模型,文本数据的语义学标准的建立是生物信息学和计算生物学面临的挑战。最后是如何监控生物数据质量的挑战。监控已有数据的可信度对生物信息学的持续发展有着十分重要的意义。
由于生物信息学对生物学基础研究、实验研究及生物医学应用具有重大的意义,而且未来生物学领域的高效、快速发展也将有赖于生物信息学的发展,国内外对此研究领域都非常重视,各种专业研究机构和公司如雨后春笋般涌现出来,生物科技公司和制药公司内部生物信息学部门的数量也与日俱增。结合临床实验、基因组学数据和信息知识发现的诊断和预测分析的生物信息和生物统计技术产业已经成为风险基金投入的新的重点方向。与高通量生物技术配套的生物信息技术和计算生物技术支撑平台与软件系统成为生物信息技术研发的主流并具有可观的市场前景。基于网格的生物信息技术和计算生物技术的应用研发已经成为国际上重点支持的一个新的方向。生物信息的可协同和可重构计算正在发展之中。
ISBN | 7122112039,978712211 |
---|---|
出版社 | 化学工业出版社 |
作者 | 李梦龙 |
尺寸 | 16 |