本书以Spark 1.02版本源码为切入点,着力于探寻Spark所要解决的主要问题及其解决办法,通过一系列精心设计的小实验来分析每一步背后的处理逻辑。本书第3~5章详细介绍了Spark Core中作业的提交与执行,对容错处理也进行了详细分析,有助读者深刻把握Spark实现机理。第6~9章对Spark Lib库进行了初步的探索。在对源码有了一定的分析之后,读者可尽快掌握Spark技术。
作者
目录
摘要
前言
第一部分 Spark概述
第1章 初识Spark
第二部分 Spark核心概念
第2章 Spark整体框架
第3章 Spark Context初始化
第4章 Spark作业提交
第5章 部署方式分析
第三部分 Spark Lib
第6章 Spark Streaming
第7章 SQL
第8章 Graph X
第9章 MLLib
第四部分 附录
附录A Spark源码调试
附录B 源码阅读技巧
书评
查看更多


请您登录后发表评论 登录 | 注册
我的评分:
提交
0/400