本书作为数据分析的入门图书,以Python语言为基础,介绍了数据分析的整个流程。本书内容涵盖数据的获取(即网络爬虫程序的设计)、前期数据的清洗和处理、运用机器学习算法进行建模分析,以及使用可视化的方法展示数据及结果。首先,书中不会涉及过于高级的语法,不过还是希望读者有一定的语法基础,这样可以更好地理解本书的内容。其次,本书重点在于应用Python来完成一些数据分析和数据处理的工作,即如何使用Python来完成工作而非专注于Python语言语法等原理的讲解。本书的目的是让初学者不论对数据分析流程本身还是Python语言,都能有一个十分直观的感受,为以后的深入学习打下基础。最后,读者不必须按顺序通读本书,因为各个章节层次比较分明,可以根据兴趣或者需要来自行安排。例如第5章介绍了一些实战的小项目,有趣且难度不大,大家可以在学习前面内容之余来阅读这部分内容。

作者

沈祥壮   自学Python两年,以数据分析为主线,系统学习了数据的采集,处理、分析和可视化。在研究统计机器学习理论的同时,使用Python语言实现了部分统计学习算法。研究方向包括数据采集,数据挖掘,统计机器学习及图像处理。

查看全部
目录

作者简介

前言

1 准备

1.1 开发环境搭建

1.2 Python基础语法介绍

1.3 The Zenof Python

参考文献

注释

2 数据的获取

2.1 爬虫简介

2.2 数据抓取实践

2.3 爬虫进阶

2.4 爬虫总结

参考文献

注释

3 数据的存取与清洗

3.1 数据存取

3.2 NumPy

3.3 pandas

3.4 数据的清洗

参考文献

4 数据的分析及可视化

4.1 探索性数据分析

4.2 机器学习入门

4.3 手动实现KNN算法

4.4 数据可视化

参考文献

注释

5 Python与生活

5.1 定制一个新闻提醒服务

5.2 Python与数学

5.3 QQ群聊天记录数据分析

参考文献

注释

查看全部
书评
查看更多
请您登录后发表评论 登录 | 注册
我的评分:
提交
0/400