《小白学数据挖掘与机器学习——SPSS Modeler案例篇》用生活中常见的例子、有趣的插图和通俗的语言,把看上去晦涩难懂的数据挖掘与机器学习知识以通俗易懂的方式分享给读者,让读者从入门学习阶段就发现,原来数据挖掘与机器学习不但有用,还很有趣。 

《小白学数据挖掘与机器学习——SPSS Modeler案例篇》以IBM SPSS Modeler 作为案例实践工具,首先介绍了数据挖掘的基本概念及数据挖掘方法,然后介绍了IBM SPSS Modeler 工具的基本使用、数据探索、统计检验、回归分析、分类算法、聚类算法、关联规则、神经网络以及集成学习。每一章都会以漫画形式介绍一些日常小例子并作为切入点,用通俗的语言介绍具体的算法理论,同时在每章最后都附上应用案例,让读者更轻松地阅读《小白学数据挖掘与机器学习——SPSS Modeler案例篇》并掌握对应的算法和实践操作。 

《小白学数据挖掘与机器学习——SPSS Modeler案例篇》内容循序渐进,完整覆盖了数据挖掘与机器学习的主要知识点,适合数据挖掘与机器学习入门读者阅读。 


作者

张浩彬 

人称浩彬老撕,曾任IBM大中华区商业智能事业部SPSS分析工程师,认知解决方案事业部数据分析专家;现任广东柯内特环境科技有限公司首席数据科学家。 

致力机器学习及SPSS技术分享,专注于人工智能技术与应用。


查看全部
目录

专家推荐语

前言

第1章 数据挖掘那些事儿

1.1 当我们在谈数据挖掘时,其实在讨论什么

1.2 从CRISP-DM开启数据挖掘实践

第2章 数据挖掘之利器:SPSSModeler

2.1 SPSSModeler简介

2.2 SPSSModeler的下载与安装

2.3 SPSSModeler的主界面及基本操作

2.4 将SPSSModeler连接到服务器端

第3章 巧妇难为无米之炊:数据,数据!

3.1 数据的身份

3.2 数据的读取

3.3 数据的基本设定

3.4 数据的集成

第4章 一点都不简单的描述性统计分析

4.1 分类变量的基本分析:“矩阵”节点

4.2 连续变量的基本分析:数据审核节点

第5章 何为足够大的差异:常用的统计检验

5.1 假设检验

5.2 连续变量与分类变量之间的关系:t检验

5.3 两个连续变量之间的关系:相关分析

5.4 两个分类变量之间的关系:卡方检验

第6章 从身高和体重的关系谈起:回归分析

6.1 一元线性回归分析

6.2 多元线性回归分析

6.3 使用线性回归分析的注意事项

6.4 案例:使用回归分析研究影响房屋价格的重要因素

第7章 回归岂止这么简单:回归模型的进一步扩展

7.1 曲线回归

7.2 Logistic回归

第8章 模型评估那些事儿:过拟合与欠拟合

8.1 过拟合与欠拟合

8.2 留出法与交叉验证

第9章 从看电影的思考到决策树的生成

9.1 决策树概述

9.2 决策树生成

9.3 决策树的剪枝

9.4 案例:用决策树分析客户违约情况

9.5 关于信息熵的扩展

第10章 人工神经网络:从人脑神经元开始

10.1 从人脑神经元到人工神经网络

10.2 感知机

10.3 人工神经网络

10.4 案例:利用人工神经网络分析某电信运营商的客户流失情况

第11章 物以类聚,人以群分:聚类分析

11.1 聚类思想的概述

11.2 聚类方法的关键:距离

11.3 K-Means算法

11.4 案例:利用K-Means算法对不同型号汽车的属性进行聚类分群研究

第12章 啤酒+尿布=关联分析?

12.1 一个关于关联分析的传说

12.2 关联分析的基本概念

12.3 关联规则的有效性指标

12.4 Apriori算法

12.5 案例:利用Apriori算法对顾客的个人信息及购买记录进行关联分析

第13章 三个臭皮匠,赛过诸葛亮:集成学习算法

13.1 集成学习算法概述

13.2 3种不同的集成学习算法

13.3 集成学习算法实践

查看全部
书评
查看更多
请您登录后发表评论 登录 | 注册
我的评分:
提交
0/400