图书介绍
Java数据科学指南【2025|PDF|Epub|mobi|kindle电子书版本百度云盘下载】

- (加)鲁什迪·夏姆斯(Rushdi Shams)著 著
- 出版社: 北京:人民邮电出版社
- ISBN:9787115481634
- 出版时间:2018
- 标注页数:302页
- 文件大小:68MB
- 文件页数:321页
- 主题词:JAVA语言-程序设计-指南
PDF下载
下载说明
Java数据科学指南PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
第1章 获取数据与清洗数据1
1.1简介2
1.2使用Java从分层目录中提取所有文件名3
准备工作3
操作步骤3
1.3使用Apache Commons IO从多层目录中提取所有文件名5
准备工作5
操作步骤5
1.4使用Java 8从文本文件一次性读取所有内容6
操作步骤7
1.5使用Apache Commons IO从文本文件一次性读取所有内容7
准备工作7
操作方法8
1.6使用Apache Tika提取PDF文本8
准备知识9
操作步骤9
1.7使用正则表达式清洗ASCII文本文件11
操作步骤11
1.8使用Univocity解析CSV文件12
准备工作13
操作步骤13
1.9使用Univocity解析TSV文件15
准备工作15
操作步骤16
1.10使用JDOM解析XML文件17
准备工作17
操作步骤18
1.11使用JSON.simple编写JSON文件20
准备工作20
操作步骤21
1.12使用JSON.simple读取JSON文件23
准备工作24
操作步骤24
1.13使用JSoup从一个URL提取Web数据26
准备工作26
操作步骤26
1.14使用Selenium Webdriver从网站提取Web数据29
准备工作29
操作步骤29
1.15从MySQL数据库读取表格数据32
准备工作32
操作步骤32
第2章 为数据建立索引与搜索数据35
2.1简介35
2.2使用Apache Lucene为数据建立索引35
准备工作36
操作步骤40
工作原理47
2.3使用Apache Lucene搜索带索引的数据50
准备工作50
操作步骤51
第3章 数据统计分析56
3.1简介57
3.2生成描述性统计59
操作步骤59
3.3生成概要统计60
操作步骤60
3.4从多种分布生成概要统计61
操作步骤62
更多内容63
3.5计算频率分布64
操作步骤64
3.6计算字符串中的词频65
操作步骤65
工作原理67
3.7使用Java 8计算字符串中的词频67
操作步骤67
3.8计算简单回归68
操作步骤69
3.9计算普通最小二乘回归70
操作步骤70
3.10计算广义最小二乘回归72
操作步骤72
3.11计算两组数据点的协方差74
操作步骤74
3.12为两组数据点计算皮尔逊相关系数75
操作步骤75
3.13执行配对t检验76
操作步骤76
3.14执行卡方检验77
操作步骤78
3.15 执行单因素方差分析(one-way ANOVA test)79
操作步骤79
3.16执行K-S检验81
操作步骤81
第4章 数据学习Ⅰ83
4.1简介83
4.2创建与保存ARFF文件84
操作步骤87
4.3对机器学习模型进行交叉验证91
操作步骤91
4.4对新的测试数据进行分类95
准备工作95
操作步骤96
4.5使用过滤分类器对新测试数据分类102
操作步骤102
4.6创建线性回归模型105
操作步骤106
4.7创建逻辑回归模型108
操作步骤108
4.8使用K均值算法对数据点进行聚类110
操作步骤110
4.9依据类别对数据进行聚类处理113
操作方法113
4.10学习数据间的关联规则116
准备工作116
操作步骤116
4.11使用低层方法、过滤方法、元分类器方法选择特征/属性118
准备工作119
操作步骤119
第5章 数据学习Ⅱ125
5.1简介125
5.2使用Java机器学习库(Java-ML)向数据应用机器学习126
准备工作126
操作步骤128
5.3使用斯坦福分类器对数据点分类137
准备工作137
操作步骤140
工作原理141
5.4使用MOA对数据点分类142
准备工作142
操作步骤144
5.5使用Mulan对多标签数据点进行分类147
准备工作147
操作步骤150
第6章 从文本数据提取信息154
6.1简介154
6.2使用Java检测标记(单词)155
准备工作155
操作步骤155
6.3使用Java检测句子160
准备工作160
操作步骤160
6.4使用OpenNLP检测标记(单词)与句子161
准备工作162
操作步骤163
6.5使用Stanford CoreNLP从标记 中提取词根、词性,以及识别命名实体167
准备工作167
操作步骤169
6.6使用Java 8借助余弦相似性测度测量文本相似度171
准备工作172
操作步骤172
6.7使用Mallet从文本文档提取主题176
准备工作177
操作步骤179
6.8使用Mallet对文本文档进行分类184
准备工作184
操作步骤185
6.9使用Weka对文本文档进行分类189
准备工作190
操作步骤191
第7章 处理大数据194
7.1简介194
7.2使用Apache Mahout训练在线逻辑回归模型195
准备工作195
操作步骤198
7.3使用Apache Mahout应用在线逻辑回归模型202
准备工作202
操作步骤203
7.4使用Apache Spark解决简单的文本挖掘问题207
准备工作208
操作步骤210
7.5使用MLib的K均值算法做聚类214
准备工作214
操作步骤214
7.6使用MLib创建线性回归模型217
准备工作217
操作步骤218
7.7使用MLib的随机森林模型对数据点进行分类222
准备工作222
操作步骤223
第8章 数据深度学习229
8.1简介229
8.2使用DL4j创建Word2vec神经网络241
操作方法241
工作原理243
更多内容246
8.3使用DL4j创建深度信念神经网络246
操作步骤246
工作原理250
8.4使用DL4j创建深度自动编码器254
操作步骤254
工作原理256
第9章 数据可视化259
9.1简介259
9.2绘制2D正弦曲线260
准备工作260
操作步骤262
9.3绘制直方图266
准备工作266
操作步骤268
9.4绘制条形图273
准备工作274
操作步骤275
9.5绘制箱线图或箱须图279
准备工作279
操作步骤281
9.6绘制散点图285
准备工作285
操作步骤286
9.7绘制甜圈图289
准备工作289
操作步骤290
9.8绘制面积图294
准备工作294
操作步骤295
热门推荐
- 1643708.html
- 3053672.html
- 2661647.html
- 3815289.html
- 2373627.html
- 3075158.html
- 386638.html
- 134325.html
- 1353528.html
- 1688069.html
- http://www.ickdjs.cc/book_1874844.html
- http://www.ickdjs.cc/book_110345.html
- http://www.ickdjs.cc/book_3850788.html
- http://www.ickdjs.cc/book_430249.html
- http://www.ickdjs.cc/book_2454971.html
- http://www.ickdjs.cc/book_2520035.html
- http://www.ickdjs.cc/book_657397.html
- http://www.ickdjs.cc/book_3119582.html
- http://www.ickdjs.cc/book_2322013.html
- http://www.ickdjs.cc/book_227362.html