本书分为四大部分(不包括附录):

  • 第一部分(第1~2章)为基础篇,简单地介绍Hadoop YARN的环境搭建和基本设计架构,帮助读者了解一些基础背景知识。
  • 第二部分(第3~7章)为YARN核心设计篇,着重讲解YARN基本库、应用程序设计方法和运行时环境的实现,包括ResourceManager、NodeManager和资源调度等关键组件的内部实现细节。
  • 第三部分为计算框架篇(第8~10章),主要讲解当前比较流行的可运行在YARN上的计算框架,包括离线计算框架MapReduce、DAG计算框架Tez、实时计算框架Storm和内存计算框架Spark。
  • 第四部分为高级篇(第11~13章),主要介绍了几个类似于Hadoop YARN的开源资源管理系统,包括Corona、Mesos等,并总结了资源管理系统的特点及发展趋势。
  • 另外本书最后还添加了几个附录:附录A为YARN安装指南;附录B介绍了常见的YARN配置参数;附录C介绍了常用的Hadoop Shell命令;附录D为本书的所有参考资料,包括参考论文、Hadoop jira和网络资源等。

    Hadoop YARN是Hadoop 2.0新引入的系统,对于大部分读者而言,该系统存在很多疑惑与未知之处,而本书正是尝试着全方位剖析该系统。为了能够系统化的学习YARN,推荐读者从第1章的基础理论知识开始学习。