小白学 Python 数据分析(15):数据可视化概述
极客挖掘机 人气:0
![](https://cdn.geekdigging.com/python/spider-blog/Python_logo.jpg)
> 人生苦短,我用 Python
前文传送门:
[小白学 Python 数据分析(1):数据分析基础](https://www.geekdigging.com/2020/01/19/6719980708/)
[小白学 Python 数据分析(2):Pandas (一)概述](https://www.geekdigging.com/2020/01/20/6718497214/)
[小白学 Python 数据分析(3):Pandas (二)数据结构 Series](https://www.geekdigging.com/2020/02/04/3234667780/)
[小白学 Python 数据分析(4):Pandas (三)数据结构 DataFrame](https://www.geekdigging.com/2020/02/05/9920298470/)
[小白学 Python 数据分析(5):Pandas (四)基础操作(1)查看数据](https://www.geekdigging.com/2020/02/16/6852411690/)
[小白学 Python 数据分析(6):Pandas (五)基础操作(2)数据选择](https://www.geekdigging.com/2020/02/20/6566891797/)
[小白学 Python 数据分析(7):Pandas (六)数据导入](https://www.geekdigging.com/2020/02/23/7355903936/)
[小白学 Python 数据分析(8):Pandas (七)数据预处理](https://www.geekdigging.com/2020/02/25/9013297409/)
[小白学 Python 数据分析(9):Pandas (八)数据预处理(2)](https://www.geekdigging.com/2020/02/27/2857868620/)
[小白学 Python 数据分析(10):Pandas (九)数据运算](https://www.geekdigging.com/2020/02/29/5808964196/)
[小白学 Python 数据分析(11):Pandas (十)数据分组](https://www.geekdigging.com/2020/03/03/5975552137/)
[小白学 Python 数据分析(12):Pandas (十一)数据透视表(pivot_table)](https://www.geekdigging.com/2020/03/04/8327177610/)
[小白学 Python 数据分析(13):Pandas (十二)数据表拼接](https://www.geekdigging.com/2020/03/06/5036602239/)
[小白学 Python 数据分析(14):Pandas (十三)数据导出](https://www.geekdigging.com/2020/03/07/6918490736/)
## 引言
从本篇开始,整个系列进入到第二部分,数据可视化。
那么,什么是数据可视化?
可以看下下面这个动图,动图来源阿里云官网( https:/https://img.qb5200.com/download-x/data.aliyun.com/visualhttps://img.qb5200.com/download-x/datav )。
![](https://cdn.geekdigging.comhttps://img.qb5200.com/download-x/data_analysishttps://img.qb5200.com/download-x/data_visualization/taobao_shujukeshihua.gif)
可以看到,这个动图非常的炫,那我们是不是学了数据可视化以后就能做出来这种效果。
emmmmmmmmmmmm。。。。。。。。
这个难度有点高,打怪升级也没有直接出门打 BOSS 的打法撒。
![](https://cdn.geekdigging.comhttps://img.qb5200.com/download-x/data_analysishttps://img.qb5200.com/download-x/data_visualization/toudawai.jpg)
## 工欲善其事必先利其器
我们先看下现在使用的主流数据可视化的工具(类库)有什么。
### Matplotlib
第一个当然是我们在前面开篇中介绍过的 Matplotlib , Python 数据分析经典三件套之一。
首先还是几个官方网址罗列一下,防止有的同学找不到:
GitHub:https://github.com/matplotlib/matplotlib
官网:https://www.matplotlib.org/
中文网:https://www.matplotlib.org.cn/
Matplotlib 的安装过程还是十分简单的:
```python
pip install matplotlib
```
等待进度条走完,我们就算安装完成了。
在学习怎么使用 matplotlib 之前,我们可以先看下 matplotlib 的一些示例:
![](https://cdn.geekdigging.comhttps://img.qb5200.com/download-x/data_analysishttps://img.qb5200.com/download-x/data_visualization/sphx_glr_tricontourf3d_thumb.webp)
![](https://cdn.geekdigging.comhttps://img.qb5200.com/download-x/data_analysishttps://img.qb5200.com/download-x/data_visualization/sphx_glr_voxels_torus_thumb.webp)
错了错了,这么复杂的图我怎么可能画的出来。。。
![](https://cdn.geekdigging.comhttps://img.qb5200.com/download-x/data_analysishttps://img.qb5200.com/download-x/data_visualization/fangcuole.jpg)
下面这种才是我们的目标:
![](https://cdn.geekdigging.comhttps://img.qb5200.com/download-x/data_analysishttps://img.qb5200.com/download-x/data_visualization/sphx_glr_barchart_thumb.webp)
![](https://cdn.geekdigging.comhttps://img.qb5200.com/download-x/data_analysishttps://img.qb5200.com/download-x/data_visualization/sphx_glr_csd_demo_thumb.webp)
![](https://cdn.geekdigging.comhttps://img.qb5200.com/download-x/data_analysishttps://img.qb5200.com/download-x/data_visualization/heihei.png)
### pyecharts
在除了可以使用 Matplotlib 作为数据可视化的工具之余,我们还可以选择 pyecharts 作为数据可视化工具。
先做一个简单的简介,以下内容来自官方文档:
> Echarts 是一个由百度开源的数据可视化,凭借着良好的交互性,精巧的图表设计,得到了众多开发者的认可。而 Python 是一门富有表达力的语言,很适合用于数据处理。当数据分析遇上数据可视化时,pyecharts 诞生了。
相信很多同学对 Echarts 并不陌生,在做页面图表的时候,能选择的第三方支持库并不多,而 Echarts 是其中做的相当不错的一个类库,毕竟背后是由百度开源的。
放几个官方的链接:
GitHub:https://github.com/pyecharts/pyecharts
官方文档:http://pyecharts.org/#/
接下来还是看如何安装:
```python
pip install pyecharts
```
和前面安装 Matplotlib 一样,静静的等待进度条走完就行。
这里有关版本有一点需要注意,不管是使用 Matplotlib 还是使用 pyecharts ,都需要 Python 的版本是 3.x ,在官方文档中都已经注明 2.x 不再进行维护。
至于小编为什么要介绍 pyecharts 呢?给大家看几个官方的示例:
![](https://cdn.geekdigging.comhttps://img.qb5200.com/download-x/data_analysishttps://img.qb5200.com/download-x/data_visualization/pyecharts_1.gif)
![](https://cdn.geekdigging.comhttps://img.qb5200.com/download-x/data_analysishttps://img.qb5200.com/download-x/data_visualization/pyecharts_5.gif)
![](https://cdn.geekdigging.comhttps://img.qb5200.com/download-x/data_analysishttps://img.qb5200.com/download-x/data_visualization/pyecharts_2.gif)
![](https://cdn.geekdigging.comhttps://img.qb5200.com/download-x/data_analysishttps://img.qb5200.com/download-x/data_visualization/pyecharts_3.gif)
![](https://cdn.geekdigging.comhttps://img.qb5200.com/download-x/data_analysishttps://img.qb5200.com/download-x/data_visualization/pyecharts_4.png)
是不是感觉单纯的从 UI 设计的角度上来讲, pyecharts 要比 Matplotlib 要好看的多,感觉 Matplotlib 像是上个世纪的产物。
在接下来的内容中,小编会先分享 Matplotlib 的使用,之后会专门写几篇介绍下 pyecharts 的使用。
![](https://cdn.geekdigging.comhttps://img.qb5200.com/download-x/data_analysishttps://img.qb5200.com/download-x/data_visualization/ok.jpg)
## 数据可视化的基本流程
第一步:整理数据
数据还是数据可视化的基础,在所有的事情开始之前,需要先明确需要把哪些数据图表化。
第二步:明确目的
在上一步中,我们拿到了需要图表化的数据,接着就需要想清楚,我们展示这些数据到底是为了什么,是要表达一种趋势,还是要展现对比等等。
第三步:选择图表形式
在明确了我们的目的之后,就需要选择展现这些数据的形式了,我们需要为这些数据选择合适的展现形式,这就需要分情况讨论了。
例如我们想要展现一种趋势,那么折线图就要比柱状图更为合适,如果是需要展现对比,那么柱状图就要比折线图合适,还有是展现百分比,那么我们选择饼状图就会更为合适。
本篇的内容就到这里了,下一篇,我们接着介绍 Matplotlib 的使用姿势。
![](https://cdn.geekdigging.comhttps://img.qb5200.com/download-x/data_analysishttps://img.qb5200.com/download-x/data_visualization/zaijian.jpg)
加载全部内容