15.5 小结
在本章中,你学习了:如何生成数据集以及如何对其进行可视化;如何使用Matplotlib创建简单的图表,以及如何使用散点图来探索随机漫步过程;如何使用Plotly来创建直方图,以及如何使用直方图来探索同时掷两个面数不同的骰子的结果。
使用代码生成数据集是一种有趣而强大的方式,可用于模拟和探索现实世界的各种情形。完成后面的数据可视化项目时,请注意可使用代码模拟哪些情形。请研究新闻媒体中的可视化,看看其中是否有图表是以你在这些项目中学到的类似方式生成的。
在第16章中,我们将从网上下载数据,并继续使用Matplotlib和Plotly来探索这些数据。
第 16 章 下载数据
本章将从网上下载数据,并对其进行可视化。网上的数据多得令人难以置信,大多未经仔细检查。如果能够对这些数据进行分析,就能发现别人没有发现的规律和关联。
本章将访问并可视化的数据以两种常见格式存储:CSV和JSON。我们将使用Python模块csv 来处理以CSV格式存储的天气数据,找出两个地区在一段时间内的最高温度和最低温度。然后,使用Matplotlib根据下载的数据创建一个图表,展示两个不同地区的温度变化:阿拉斯加州锡特卡和加利福尼亚州死亡谷。然后,使用模块json 访问以JSON格式存储的地震数据,并使用Plotly绘制一幅散点图,展示这些地震的位置和震级。
阅读本章后,你将能够处理各种类型和格式的数据集,并对如何创建复杂的图表有深入的认识。要处理各种真实的数据集,必须能够访问并可视化各种类型和格式的在线数据。