本书主要介绍大数据分析、人工智能的实战应用。全书共9章,通过8个大型的数据分析案例,系统地介绍常用的数据分析方法。这8个大型案例涉及数据可视化方法,回归、聚类、决策树、朴素贝叶斯等机器学习算法,以及深度学习算法等内容。各章程序在Python3.8.5环境下编写完成,在案例编写过程中,涉及Pandas、NumPy、Matplotlib等Python中常用的依赖库,最大限度地帮助读者掌握相关知识内容。每个案例之间相互独立,读者可以根据自己的兴趣选择相关章节进行学习。本书内容丰富,通俗易懂,以实操为目的帮助用户快速掌握相关技能。书中案例程序全码解析,注释完备,在编程环境下经过简单的修改便可以使用。本书不仅适合大数据分析、人工智能相关领域的入门读者使用,也适合有一定基础的读者进行实战时参考,同时适合本科生、研究生及对Python感兴趣的读者阅读。
作者简介1
内容简介
前言
第1章 Python语法基础
1.1 安装Anaconda
1.2 语法基础
1.3 Python基础库应用入门
1.4 本章小结
第2章 天气数据的获取与建模分析
2.1 准备工作
2.2 利用抓取方法获取天气数据
2.3 天气数据可视化
2.4 机器学习在天气预报中的应用
2.5 本章小结
第3章 养成游戏中人物的数据搭建
3.1 准备工作
3.2 利用Pyecharts库进行数据基本情况分析
3.3 感染病例分析
3.4 疫情趋势预测
3.5 本章小结
第4章 航空数据分析
4.1 准备工作
4.2 基本情况统计分析
4.3 利用Floyd算法计算最短飞行时间
4.4 本章小结
第5章 市民服务热线文本数据分析
5.1 准备工作
5.2 基本情况分析
5.3 利用词云图展示工单内容
5.4 基于朴素贝叶斯的工单自动分类转办
5.5 基于K-Means算法和PCA方法降维的热点问题挖掘
5.6 本章小结
第6章 决策树信贷风险控制
6.1 准备工作
6.2 数据集基本情况分析
6.3 利用决策树进行信贷数据建模
6.4 本章小结
第7章 利用深度学习进行垃圾图片分类
7.1 准备工作
7.2 深度学习的基本原理
7.3 利用Keras库实现基于CNN的垃圾图片分类
7.4 优化CNN模型
7.5 模型应用
7.6 本章小结
第8章 协同过滤和矩阵分解推荐算法分析
8.1 准备工作
8.2 基于协同过滤算法的短视频完播情况分析
8.3 基于矩阵分解算法的短视频完播情况预测
8.4 几种方法在测试集中的表现
8.5 本章小结
第9章 《红楼梦》文本数据分析
9.1 准备工作
9.2 分词
9.3 文本聚类分析
9.4 LDA主题模型
9.5 人物社交网络分析
9.6 本章小结
附录A 抓取数据请求头查询
附录B GraphViz库的安装方法
附录C 在Windows10中安装TensorFlow的方法
参考文献
致谢
作者简介2

