前言


第一部分 基础篇

第1章 开源大数据系统概述

<点击展开>

第二部分 大数据收集系统

第2章 关系型数据的收集

<点击展开>

第3章 非关系型数据的收集

<点击展开>

第4章 分布式消息队列Kafka

<点击展开>

第三部分 大数据存储系统

第5章 数据序列化与文件存储格式

<点击展开>

第6章 分布式文件系统

<点击展开>

第7章 分布式结构化存储系统

<点击展开>

第四部分 分布式协调和资源管理系统

第8章 分布式协调服务Zookeeper

<点击展开>

第9章 集群资源管理系统YARN

<点击展开>

第五部分 大数据计算引擎

第10章 批处理引擎MapReduce

<点击展开>

第11章 内存计算引擎Spark

<点击展开>

第12章 交互式处理引擎

<点击展开>

第13章 流式处理引擎

<点击展开>

第六部分 大数据分析工具

第14章 大数据分析语言HQL与SQL

<点击展开>

第15章 大数据统一编程模型

<点击展开>

第16章 大数据机器学习

<点击展开>

第七部分 大数据可视化与综合案例

第17章 大数据综合案例

<点击展开>