图书介绍

社交大数据挖掘【2025|PDF|Epub|mobi|kindle电子书版本百度云盘下载】

社交大数据挖掘
  • 周雪妍,林泽鸿编 著
  • 出版社: 北京:机械工业出版社
  • ISBN:9787111577225
  • 出版时间:2017
  • 标注页数:173页
  • 文件大小:22MB
  • 文件页数:185页
  • 主题词:数据处理

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

社交大数据挖掘PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第1章 社交媒体1

1.1 什么是社交媒体1

1.2 代表性社交媒体2

1.2.1 Twitter2

1.2.2 Flickr4

1.2.3 YouTube5

1.2.4 Facebook7

1.2.5 维基百科8

1.2.6 通用网络10

1.2.7 其他社交媒体11

参考文献11

第2章 大数据和社交数据13

2.1 大数据13

2.2 物理真实世界与社交媒体的交互15

2.3 集成框架17

2.4 交互的建模和分析19

2.5 元分析模型——概念层21

2.5.1 面向对象的集成分析模型21

2.5.2 原始案例24

2.6 假设的生成和验证——逻辑层25

2.6.1 多变量分析25

2.6.2 数据挖掘25

2.6.3 发现和识别影响25

2.6.4 影响的定量测量26

2.7 兴趣回顾——互动挖掘27

2.8 分布式并行计算框架28

2.8.1 NoSQL28

2.8.2 MapReduce——一种并行分布式计算的机制30

2.8.3 Hadoop31

参考文献33

第3章 大数据时代的假设34

3.1 什么是假设34

3.2 数据采样36

3.3 假设验证36

3.4 假设构建37

3.4.1 归纳法37

3.4.2 推理38

3.4.3 可信推理39

3.4.4 不明推论式40

3.4.5 相关性40

3.4.6 因果关系41

3.4.7 类比43

3.4.8 传递定律44

3.5 假设的粒度44

3.6 对假设的重新审视45

参考文献46

第4章 社交大数据应用47

4.1 普通网页与社交媒体之间作为分析主体的差异47

4.2 基于要素的社交媒体应用分类48

4.3 基于目标的社交媒体应用分类49

4.4 通过MipS模型描述模型51

4.4.1 简单例子51

4.4.2 更复杂的例子55

4.4.3 伪相关关系57

4.5 展望59

参考文献60

第5章 数据挖掘中的基本概念61

5.1 什么是数据挖掘61

5.2 技术问题和相关技术62

5.3 数据挖掘任务63

5.4 基本数据结构64

5.5 数据质量67

参考文献68

第6章 关联规则挖掘69

6.1 关联分析的应用69

6.2 基本概念70

6.3 各种关联规则71

6.4 Apriori算法的概述72

6.5 生成关联规则76

参考文献77

第7章 聚类78

7.1 应用78

7.2 数据结构78

7.3 距离79

7.4 聚类算法80

7.5 基于分区的集群81

7.6 分层聚类83

7.7 聚类结果的评价86

参考文献87

第8章 分类88

8.1 动机88

8.2 分类任务88

8.3 决策树归纳89

8.4 测量属性选择90

8.5 创建分类规则92

8.6 扩展基本算法92

8.7 模型精度92

8.8 提高精度93

8.9 其他模型93

参考文献95

第9章 预测96

9.1 预测和分类96

9.2 预测模型97

9.2.1 多元回归模型97

9.2.2 非线性函数的变换97

9.2.3 路径分析模型98

9.2.4 多指标模型99

9.2.5 因子分析模型100

9.2.6 因子的旋转100

9.2.7 结构方程模型研究101

9.2.8 因子修正或降维103

参考文献104

第10章 Web结构挖掘105

10.1 Web挖掘105

10.2 结构挖掘106

10.2.1 文献计量学106

10.2.2 引用参考数据库和影响因子106

10.2.3 h指数——学术研究者的价值108

10.2.4 声望110

10.2.5 PageRank110

10.2.6 HITS113

参考文献115

第11章 Web内容挖掘116

11.1 搜索引擎116

11.1.1 网页抓取117

11.1.2 索引网页118

11.1.3 网页排名120

11.2 信息检索技术121

11.2.1 特征121

11.2.2 向量空间模型121

11.2.3 查询结果的准确性122

11.2.4 其他问题123

11.3 网页分类125

11.3.1 支持向量机125

11.3.2 κ最近邻算法125

11.3.3 朴素贝叶斯126

11.4 网页聚类127

11.5 微博总结128

参考文献129

第12章 Web访问日志挖掘 信息提取 深层Web挖掘130

12.1 Web访问日志挖掘130

12.1.1 访问日志挖掘和推荐130

12.1.2 聚类访问模式132

12.1.3 合作滤波和Web个性化133

12.2 信息提取134

12.2.1 信息提取中的任务134

12.2.2 信息提取中的问题135

12.2.3 信息提取方法136

12.3 Web深层挖掘137

参考文献139

第13章 媒体挖掘141

13.1 XML挖掘141

13.1.1 挖掘XML141

13.1.2 XML结构挖掘142

13.1.3 XML内容挖掘146

13.2 挖掘更普遍的结构147

13.3 多媒体数据挖掘152

13.4 流数据挖掘154

13.4.1 基本技术154

13.4.2 数据挖掘任务155

参考文献157

第14章 可扩展性和异常检测160

14.1 关联分析的可扩展性160

14.1.1 不共享内存160

14.1.2 共享内存161

14.2 聚类可扩展性的方法161

14.2.1 分层方法161

14.2.2 基于密度的聚类162

14.2.3 图聚类165

14.3 分类和其他任务的可扩展性167

14.4 异常值检测168

参考文献169

附录171

附录A在大数据时代数据科学家所需的能力和专业知识171

附录B关于结构、内容和访问日志挖掘技术之间关系的备注172

热门推荐