Hadoop Internals: in-depth study of MapReduce

《Hadoop技术内幕:深入解析MapReduce架构设计与实现原理》(购书链接地址: 当当购书网址京东购书网址卓越购书网址,电子版下载地址:百度云盘下载地址新浪微盘下载地址是一本深入剖析Hadoop MapReduce内部实现原理的 书籍,该书内容基于Hadoop 1.x版本,通过原理介绍与源代码分析相结合的方法解析Hadoop MapReduce计算框架。

该书的姊妹篇《Hadoop技术内幕:深入解析YARN架构设计与实现原理》将于2013年11月末上市,欢迎关注,该书是基于hadoop 2.x编写的,具体参考:hadoop YARN书籍

该书包含以下内容:

  • JobTracker与TaskTracker内部实现
  • Hadoop调度器(FIFO、Capacity Scheduler和FairScheduler)内部实现
  • 数据计算引擎(Map Task、Reduce Task)内部实现
  • Hadoop内部调优
  • 下一代MapReduce(YARN/Corona/Mesos)原理和架构

这本书中涉及的下一代MapReduce(YARN/MRv2)内容比较少,如果你感兴趣,可暂时通过阅读作者的博客学习YARN(Yet Another Resource Negotiator,俗称“下一代MapReduce”),链接是 董的博客

该书不会涉及(有些可能会简单提及)以下内容:

  • MapReduce程序设计方法与实例。(可阅读已出版书籍《Hadoop实战》)
  • HDFS相关基础知识。(可阅读已出版书籍《Hadoop权威指南》)
  • 非MapReduce系统介绍,比如HBase、Hive、Pig等。 (可阅读已出版书籍《Hadoop权威指南》)
  • Hadoop部署、运维相关知识。(可阅读已出版书籍《Hadoop Operations》)

需要说明的是,该书也适合Hadoop应用程序开发工程师,毕竟,只有了解Hadoop内部原理,才能写出更高效的分布式程序,才能对作业进行评估和未知行为的预测,避免编写低效且具有破坏性的应用程序。

如果你是Hadoop应用程序开发、Hadoop内核研究、Hadoop二次开发、大数据方向研究生等相关人士,《Hadoop技术内幕:深入解析MapReduce架构设计与实现原理》和《深入解析Hadoop Common和HDFS架构设计与实现原理》两本新书,则是必读书籍,这两本书相对独立,可根据你的需要选择一本或者两本阅读。

该书将于2013年5月份由机械工业出版社华章分社出版,你可以在当当亚马逊京东淘宝china-pub等网站上购买该书(注意,不同网站上折扣不一样)。你可通过作者的新浪微博:西成懂 关注该书进展)。

与该书相关的另一本书籍《深入解析Hadoop Common和HDFS架构设计与实现原理》(作者:蔡斌 陈湘萍)已于2013年4月份出版,你同样可以在当当亚马逊京东淘宝china-pub等网站上购买该书。

另外,你也可以访问作者的技术博客董的博客了解更多Hadoop知识。