图书介绍

Java数据科学指南【2025|PDF|Epub|mobi|kindle电子书版本百度云盘下载】

Java数据科学指南
  • (加)鲁什迪·夏姆斯(Rushdi Shams)著 著
  • 出版社: 北京:人民邮电出版社
  • ISBN:9787115481634
  • 出版时间:2018
  • 标注页数:302页
  • 文件大小:68MB
  • 文件页数:321页
  • 主题词:JAVA语言-程序设计-指南

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

Java数据科学指南PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第1章 获取数据与清洗数据1

1.1简介2

1.2使用Java从分层目录中提取所有文件名3

准备工作3

操作步骤3

1.3使用Apache Commons IO从多层目录中提取所有文件名5

准备工作5

操作步骤5

1.4使用Java 8从文本文件一次性读取所有内容6

操作步骤7

1.5使用Apache Commons IO从文本文件一次性读取所有内容7

准备工作7

操作方法8

1.6使用Apache Tika提取PDF文本8

准备知识9

操作步骤9

1.7使用正则表达式清洗ASCII文本文件11

操作步骤11

1.8使用Univocity解析CSV文件12

准备工作13

操作步骤13

1.9使用Univocity解析TSV文件15

准备工作15

操作步骤16

1.10使用JDOM解析XML文件17

准备工作17

操作步骤18

1.11使用JSON.simple编写JSON文件20

准备工作20

操作步骤21

1.12使用JSON.simple读取JSON文件23

准备工作24

操作步骤24

1.13使用JSoup从一个URL提取Web数据26

准备工作26

操作步骤26

1.14使用Selenium Webdriver从网站提取Web数据29

准备工作29

操作步骤29

1.15从MySQL数据库读取表格数据32

准备工作32

操作步骤32

第2章 为数据建立索引与搜索数据35

2.1简介35

2.2使用Apache Lucene为数据建立索引35

准备工作36

操作步骤40

工作原理47

2.3使用Apache Lucene搜索带索引的数据50

准备工作50

操作步骤51

第3章 数据统计分析56

3.1简介57

3.2生成描述性统计59

操作步骤59

3.3生成概要统计60

操作步骤60

3.4从多种分布生成概要统计61

操作步骤62

更多内容63

3.5计算频率分布64

操作步骤64

3.6计算字符串中的词频65

操作步骤65

工作原理67

3.7使用Java 8计算字符串中的词频67

操作步骤67

3.8计算简单回归68

操作步骤69

3.9计算普通最小二乘回归70

操作步骤70

3.10计算广义最小二乘回归72

操作步骤72

3.11计算两组数据点的协方差74

操作步骤74

3.12为两组数据点计算皮尔逊相关系数75

操作步骤75

3.13执行配对t检验76

操作步骤76

3.14执行卡方检验77

操作步骤78

3.15 执行单因素方差分析(one-way ANOVA test)79

操作步骤79

3.16执行K-S检验81

操作步骤81

第4章 数据学习Ⅰ83

4.1简介83

4.2创建与保存ARFF文件84

操作步骤87

4.3对机器学习模型进行交叉验证91

操作步骤91

4.4对新的测试数据进行分类95

准备工作95

操作步骤96

4.5使用过滤分类器对新测试数据分类102

操作步骤102

4.6创建线性回归模型105

操作步骤106

4.7创建逻辑回归模型108

操作步骤108

4.8使用K均值算法对数据点进行聚类110

操作步骤110

4.9依据类别对数据进行聚类处理113

操作方法113

4.10学习数据间的关联规则116

准备工作116

操作步骤116

4.11使用低层方法、过滤方法、元分类器方法选择特征/属性118

准备工作119

操作步骤119

第5章 数据学习Ⅱ125

5.1简介125

5.2使用Java机器学习库(Java-ML)向数据应用机器学习126

准备工作126

操作步骤128

5.3使用斯坦福分类器对数据点分类137

准备工作137

操作步骤140

工作原理141

5.4使用MOA对数据点分类142

准备工作142

操作步骤144

5.5使用Mulan对多标签数据点进行分类147

准备工作147

操作步骤150

第6章 从文本数据提取信息154

6.1简介154

6.2使用Java检测标记(单词)155

准备工作155

操作步骤155

6.3使用Java检测句子160

准备工作160

操作步骤160

6.4使用OpenNLP检测标记(单词)与句子161

准备工作162

操作步骤163

6.5使用Stanford CoreNLP从标记 中提取词根、词性,以及识别命名实体167

准备工作167

操作步骤169

6.6使用Java 8借助余弦相似性测度测量文本相似度171

准备工作172

操作步骤172

6.7使用Mallet从文本文档提取主题176

准备工作177

操作步骤179

6.8使用Mallet对文本文档进行分类184

准备工作184

操作步骤185

6.9使用Weka对文本文档进行分类189

准备工作190

操作步骤191

第7章 处理大数据194

7.1简介194

7.2使用Apache Mahout训练在线逻辑回归模型195

准备工作195

操作步骤198

7.3使用Apache Mahout应用在线逻辑回归模型202

准备工作202

操作步骤203

7.4使用Apache Spark解决简单的文本挖掘问题207

准备工作208

操作步骤210

7.5使用MLib的K均值算法做聚类214

准备工作214

操作步骤214

7.6使用MLib创建线性回归模型217

准备工作217

操作步骤218

7.7使用MLib的随机森林模型对数据点进行分类222

准备工作222

操作步骤223

第8章 数据深度学习229

8.1简介229

8.2使用DL4j创建Word2vec神经网络241

操作方法241

工作原理243

更多内容246

8.3使用DL4j创建深度信念神经网络246

操作步骤246

工作原理250

8.4使用DL4j创建深度自动编码器254

操作步骤254

工作原理256

第9章 数据可视化259

9.1简介259

9.2绘制2D正弦曲线260

准备工作260

操作步骤262

9.3绘制直方图266

准备工作266

操作步骤268

9.4绘制条形图273

准备工作274

操作步骤275

9.5绘制箱线图或箱须图279

准备工作279

操作步骤281

9.6绘制散点图285

准备工作285

操作步骤286

9.7绘制甜圈图289

准备工作289

操作步骤290

9.8绘制面积图294

准备工作294

操作步骤295

热门推荐