大数据、小数据、无数据:网络世界的数据学术 9787111575788

配送至
$ $ USD 美元

编辑推荐

《大数据、小数据、无数据:网络世界的数据学术》适合相关学者、研究人员、高校领导、出版商、图书馆和数据档案馆的工作人员以及投资决策者和政策制定者阅读。

作者简介

Christine L. Borgman 加州大学洛杉矶分校信息研究系杰出教授和系主任。她是AAAS(美国科学促进会)和ACM(美国计算机学会)Fellow

目录

丛书前言
译者序
前言
致谢
作者简介
推荐语
第一部分数据与学术
第1章挑战2
1.1引言2
1.2大数据与小数据3
1.2.1大4
1.2.2开放性5
1.2.3长尾6
1.3无数据8
1.3.1数据不可获取8
1.3.2数据不可发布9
1.3.3数据不可用10
1.4六项挑战11
1.5结论12
第2章何为数据13
2.1引言13
2.2定义与术语14
2.2.1按例定义15
2.2.2操作定义16
2.2.3分类定义17
2.2.4概念区分21
2.3结论23
第3章数据学术25
3.1引言25
3.2知识基础设施26
3.3社会与技术28
3.3.1社区与协作29
3.3.2知识与表示30
3.3.3理论、实践与政策31
3.4开放学术32
3.4.1开放获取研究成果32
3.4.2开放获取数据34
3.4.3开放技术37
3.5交流融合38
3.5.1数据隐喻38
3.5.2数据单元40
3.5.3记录文件42
3.6结论43
第4章数据多样性44
4.1引言44
4.2学科与数据45
4.3数据大小问题46
4.3.1项目目标47
4.3.2数据采集48
4.3.3数据分析49
4.4数据产生问题50
4.4.1距离问题51
4.4.2外部影响因素57
4.5结论64
第二部分数据学术案例研究
第5章自然科学领域的数据学术66
5.1引言66
5.1.1研究方法与数据实践66
5.1.2自然科学案例67
5.2天文学68
5.2.1数据大小问题69
5.2.2数据产生问题72
5.2.3天文学研究实践82
5.3传感器网络科学与技术85
5.3.1数据大小问题86
5.3.2数据产生问题87
5.3.3嵌入式传感器网络研究实践93
5.4结论98
第6章社会科学领域的数据学术100
6.1引言100
6.1.1研究方法与数据实践101
6.1.2社会科学案例102
6.2互联网调查与社交媒体研究102
6.2.1数据大小问题103
6.2.2数据产生问题104
6.2.3互联网调查与社交媒体研究实践110
6.3社会技术研究115
6.3.1数据大小问题115
6.3.2数据产生问题116
6.3.3CENS的社会技术研究实践120
6.4结论126
第7章人文学科领域的数据学术129
7.1引言129
7.1.1研究方法与数据实践130
7.1.2人文学科案例131
7.2古典艺术与考古学132
7.2.1数据大小问题133
7.2.2数据产生问题133
7.2.3古典艺术与考古学研究实践144
7.3佛教研究150
7.3.1数据大小问题151
7.3.2数据产生问题151
7.3.3佛教研究实践156
7.4结论161
第三部分数据政策与实践
第8章数据共享、发布与重用166
8.1引言166
8.2研究类数据的供求分析168
8.2.1研究类数据的供给分析169
8.2.2研究类数据的需求分析173
8.3学术动机174
8.3.1出版物与数据174
8.3.2数据资产与数据债务177
8.3.3数据发布178
8.3.4获取重用数据181
8.4知识基础设施183
8.4.1知识库、数据集与档案馆183
8.4.2个体数据实践185
8.4.3人力基础设施186
8.4.4棘手问题187
8.5各学科领域的知识基础设施187
8.5.1自然科学188
8.5.2社会科学192
8.5.3人文学科193
8.6结论194
第9章数据信誉、归属与发现197
9.1引言197
9.2原则与问题199
9.3理论与实践200
9.3.1内容与格式:如何引用201
9.3.2引用行为理论:何时、为何引用何种对象203
9.3.3明确与否:信誉授予对象与责任归属对象206
9.3.4名称或编号:身份问题211
9.3.5当理论遇到技术:引用行为218
9.3.6风险与回报:引用价值219
9.4结论221
第10章保存何种数据及其原因223
10.1引言223
10.2挑战回顾225
10.2.1数据权利、责任、角色和风险225
10.2.2数据共享227
10.2.3出版物与数据229
10.2.4数据获取232
10.2.5利益相关者及其技能233
10.2.6过去、现在和未来的知识基础设施235
10.3结论237
术语表238
人名表251
机构、书籍和项目名称表258
参考文献

文摘

版权页:

插图:

元数据的形式及其创建方式与数据采集方式相一致。如果使用计算机技术进行数据采集或生成,那么对应的元数据也将自动生成。这类例子包括电话记录、信用卡交易记录和科学仪器输出等。同时,也可以在音频、视频、文本和图像中嵌入这种自动化元数据,从而推动信息检索、处理和跟踪认证(“Embedded Metadata Initiative”2013)。比如,一些共享照片和视频的网站就会使用这些元数据对上传的文件进行标记和地理定位。iPhoto等媒体管理软件会使用这些元数据标注研究对象的时间、日期、地点、面部、相机曝光度以及其他信息。目前,自动化元数据已经在消费品和社交媒体领域广泛运用,但与之相匹配的研究类数据分析工具还没有诞生。
如果手工采集数据,那么元数据的创建过程也一定依赖于人力。研究人员记录日期、时间、规程和采集结果以及测试水或土壤的物理样本等工作都是通过手工方式完成。但是,即使数据采集过程像望远镜或在线调查一样实现自动化,也需要在元数据处理中加入人工因素。值班的研究人员可能会记录天气条件、仪器伪影和软件错误等数据解释所必需的环境信息,给调研项目赋予变量名,同时为电子表单加上行列标签。人们往往通过标记章、节、段落、名称和地点等单位的方式,实现数字文本的高效利用。无论是物理还是数字材料,研究对象包含的重要信息往往不是其本身的属性特征。如果时间久远或保存条件不理想,印刷书可能会丢失作者、日期和出版商等信息。要追溯这本书的起源,那么其拥有者、印刷者、装订者以及为其加注的作者等信息都很重要。很少有图书编目者会通过广泛持久的信息搜集来为上述研究对象创建权威元数据。
ISBN9787111575788
出版社机械工业出版社
作者克莉丝汀 L.伯格曼 (Christine L.Borgman)
尺寸16