本书分为四大部分(不包括附录):

  • 第一部分为基础篇,简单地介绍Hadoop的阅读环境搭建和基本设计架构,帮助读者了解一些基础背景知识。
  • 第二部分为MAPREDUCE编程模型篇,着重讲解MAPREDUCE编程接口,主要包括两套编程接口,分别是旧API和新API。
  • 第三部分为MAPREDUCE核心设计篇,主要讲解Hadoop MapReduce的运行时环境,包括RPC框架、客户端、JobTracker、TaskTracker和Task等内部实现细节。
  • 第四部分为MAPREDUCE高级篇,主要讲解Hadoop MapReduce中的一些高级特性和未来发展趋势,包括Hadoop调优、多租户作业调度器、安全机制和下一代MapReduce框架等。
  • 另外本书最后还添加了几个附录:附录A为安装Hadoop过程中可能存在的问题及解决方案;附录B为Hadoop 默认HTTP端口号以及HTTP地址;附录C~F为一些参考资料,包括参考书籍、参考论文、Hadoop jira和网络资源。