• 1.摘要
  • 2.基本信息
  • 3.图书简介
  • 4.目录

Spark高级数据分析

Spark高级数据分析

《Spark高级数据分析》是2015年人民邮电出版社出版的图书,作者是里扎 、莱瑟森、欧文、威尔斯。

基本信息

  • 定价

    59元

  • 出版社

    人民邮电出版社

  • 出版时间

    2015-11

  • 作者

    [美]里扎(SandyRyza) [美]莱瑟森(UriLaserson) [英]欧文(SeanOwen) [美]威尔斯(JoshWills)

  • 开本

    16开

图书简介

本书是使用Spark进行大规模数据分析的实战宝典,由大数据公司Cloudera的数据科学家撰写。四位作者首先结合数据科学和大数据分析的广阔背景讲解了Spark,然后介绍了用Spark和Scala进行数据处理的基础知识,接着讨论了如何将Spark用于机器学习,同时介绍了常见应用中几个常用的算法。此外还收集了一些更加新颖的应用,比如通过文本隐含语义关系来查询Wikipedia或分析基因数据。

目录

推荐序 ix

译者序 xi

序 xiii

前言 xv

第1 章 大数据分析 1

1.1 数据科学面临的挑战 2

1.2 认识Apache Spark 4

1.3 关于本书 5

第2 章 用Scala 和Spark 进行数据分析 7

2.1 数据科学家的Scala 8

2.2 Spark 编程模型 9

2.3 记录关联问题 9

2.4 小试牛刀:Spark shell 和SparkContext 10

2.5 把数据从集群上获取到客户端 15

2.6 把代码从客户端发送到集群 18

2.7 用元组和case class 对数据进行结构化 19