第1章图情大数据概述1
●1.1图情领域的大数据发展2
1.1.1图书情报学的历史和发展2
1.1.2图书馆对信息资源的管理4
1.1.3图书情报学与数据科学的渊源6
1.1.4图情与大数据的融合发展9
●1.2图情大数据的范畴、特征和价值11
1.2.1图情大数据的范畴和特征11
1.2.2图情大数据的价值与意义14
●1.3图情大数据相关研究与实践14
1.3.1图情科学中的大数据研究14
1.3.2图情机构的大数据实践15
参考文献18
第2章图情大数据的数据资源21
●2.1数字文献22
2.1.1数字期刊23
2.1.2电子图书26
2.1.3数字报纸28
2.1.4专利与标准29
2.1.5数字科技报告30
2.1.6数字会议与学位论文31
●2.2数据库32
2.2.1源数据库32
2.2.2书目数据库34
2.2.3指南数据库35
●2.3网络数据36
2.3.1搜索引擎36
2.3.2门户网站37
2.3.3社交媒体37
●2.4其他数据38
2.4.1用户行为数据38
2.4.2开放政府数据38
参考文献39
第3章图情大数据的技术运用41
●3.1大数据采集与预处理42
3.1.1数据库数据采集42
3.1.2网络数据采集43
3.1.3系统日志采集43
3.1.4大数据预处理43
3.1.5大数据的采集工具44
●3.2文本数据的分析方法44
3.2.1文本分词45
3.2.2词频分析48
3.2.3语义分析48
●3.3文本数据挖掘的方法50
3.3.1文本分类50
3.3.2文本聚类52
3.3.3文本关联分析55
●3.4大数据的存储57
3.4.1大数据的存储方式57
3.4.2大数据的存储技术路线58
3.4.3分布式文件系统59
●3.5图情大数据的标准与规范59
3.5.1数字化标准规范60
3.5.2元数据标准规范61
3.5.3数据互操作规范62
3.5.4数据开放应用协议63
3.5.5数据长期保存规范64
参考文献65