本书从大数据的基本概念出发,深入解析了大数据应用的关键技术与应用。以大数据的数据挖掘技术、大数据的存储与处理、大数据应用的总体架构三方面为线索,详细阐述了大数据挖掘的诸多常用算法,介绍了Hadoop、HDFS及MapReduce等大数据存储与处理的关键技术与应用、大数据应用的框架与构架。本书以通信运营商及互联网电子商务等应用为背景,从典型实例的角度系统地介绍了大数据挖掘应用从目标构建、算法建模到程序实现,再到大数据分析及结果描述应用的整个过程,以期为读者提供从理论到实务的有效借鉴。
内容简介
前言
第1章 大数据概述
1.1 大数据的概念
1.2 大数据的价值与挑战
1.3 大数据与相关领域的关系
1.4 大数据发展状况
参考文献
第2章 大数据挖掘技术
2.1 数据挖掘与过程
2.2 数据挖掘过程
2.3 常用算法
参考文献
第3章 大规模存储与处理技术
3.1 Hadoop概述
3.2 HDFS
3.3 MapReduce编程框架
3.4 建立Hadoop开发环境
3.5 大数据处理系统分类
3.6 大数据查询和分析技术:SQL on Hadoop
3.7 以通信业务分析为例的大数据的技术环境部署
第4章 大数据应用的总体架构和关键技术
4.1 大数据的业务分析
4.2 大数据的总架体构模型
4.3 大数据高级分析
4.4 可视化分析
参考文献
第5章 运营商数据分析
5.1 案例背景
5.2 挖掘目标的提出
5.3 案例分析
5.4 MapReduce操作
5.5 结果分析
第6章 互联网电影推荐系统
6.1 背景描述
6.2 业务目标
6.3 业务需求
6.4 协同过滤推荐系统建模
6.5 项目处理过程
6.6 总结

