python pyecharts画矩形树图
林老头ss 人气:0一、概念介绍
矩形树图(Treemap),即矩形式树状结构图,利用矩形的面积表示数值的大小,颜色用于类别区分,常用于呈现多类别的一维数值比较,易读性强;基于树状的功能,在结构图中可以同时呈现数据层次的信息。
示例如下:
· 对比常见的柱状图和条形图,矩形树图弥补了以下三个缺点:
1、当我们的数据是多类别且每个类别只有一个数值时,我们用柱状图会浪费很多的空间,而且显得单调。
2、当数据间差异较大(235 vs 18),会是对我们柱状图的纵坐标设定带来困扰,忽略极差会稀释我们小值类的差异。(当然 ,如果我们的大值只有那么一两个,可以单拎出来处理)
3、柱状图无法呈现数据间的层级结构
二、数据展示
我们的目的是为了呈现类间数值大小差异,如果有第二层,也顺便比较第二层的占比情况。
为了展示多各类别,我们利用的是省份的数据,excel表格中呈现如下:
第二层、第三层为了树状的呈现而随机生成,也是为了说明,树层结构并不要求每个节点都有枝叶。
三、数据导入
我们先绘制只有一维的,只需要输入【省份】【关注类】两个列,这个其实更常用一点(我的角度)
province_type1 = pd.DataFrame(pd.read_excel('./各省市上市公司个数/矩形树图示例.xlsx')) tree = [] name = [province_type1['省份'][i]+'\n'+str(province_type1['关注类A'][i]) for i in range(len(province_type1))] for i in range(len(province_type1)): dic = {} dic["value"],dic["name"] = int(province_type1['关注类A'][i]),name[i] tree.append(dic)
①name--列表型数据结构,用于存放每个数据的label,这里我为了同时呈现数据对应的省份和大小,中间用了换行符(不用的话,在我们的树图上是一行,不好看)
②绘制矩形树图需要的是list,list里面是字典,key名指定为"name","value"。
③一定要注意的是,如果你画出来的图没有数据或者没有显示,检查是不是读excel数据中出现了问题,即上述代码中int的位置。
用于绘制treemap的数据结构如下所示:
四、图像绘制
tm = ( TreeMap() .add("关注类A",tree) .set_series_opts(label_opts=opts.LabelOpts(position='inside')) .set_global_opts(title_opts=opts.TitleOpts(title = '',subtitle = '2022/1/18-林老头ss')) ) tm.render('./绘图结果/矩形树图-例一.html')
position---指定label,即我们的name的位置,inside会居中显示。如果不加,默认top,在每个矩形上方显示。
结果如下所示:
由上图可知,广东省、浙江省和江苏省在随机数据中排名前三。受显示区域的限制,数据较小或名字过长的矩形往往不能显示完全,需要交互式放大其数值。
五、树形结构
在加入树形结构后,我们需要在代码中相应增加key为“children"的数据
from pyecharts.charts import Page,TreeMap from pyecharts import options as opts import pandas as pd import math province_type1 = pd.DataFrame(pd.read_excel('./矩形树图示例.xlsx')) tree = [] name = [province_type1['省份'][i]+'\n'+str(province_type1['关注类A'][i]) for i in range(len(province_type1))] for i in range(len(province_type1)): dic = {} dic["value"],dic["name"] = int(province_type1['关注类A'][i]),name[i] if math.isnan(province_type1['关注类A-1'][i]) ==0: dic["children"] = [ {"name":province_type1['省份'][i]+"A-1:"+str(province_type1['关注类A-1'][i]),"value":int(province_type1['关注类A-1'][i])}, {"name":province_type1['省份'][i]+"A-2:"+str(province_type1['关注类A-1'][i]),"value":int(province_type1['关注类A-2'][i])} ] if math.isnan(province_type1['关注类A1-1'][i]) ==0: dic["children"][0]["children"] = [ {"name":"A1-1:"+str(province_type1['关注类A1-1'][i]),"value":int(province_type1['关注类A1-1'][i])}, {"name":"A1-2:"+str(province_type1['关注类A1-1'][i]),"value":int(province_type1['关注类A1-2'][i])} ] tree.append(dic) tm = ( TreeMap() .add("关注类A的树",tree) .set_series_opts(label_opts=opts.LabelOpts(position='inside')) .set_global_opts(title_opts=opts.TitleOpts(title = '加油呀朋友们~',subtitle = '2022/1/18-林老头ss')) ) tm.render('./绘图结果/矩形树图-例二.html')
如果没有枝叶的类,则不需要在"name""value"平级上加"children",如果枝叶中有两个以上类别,相当于是一个新的树,需要增加“children”,结构和树形一致,如下所示:
【“name”:“父节点”,
"value": number,
"children":【{“name”:“子节点一”,“value”:number},
{“name”:“子节点二”,“value”:number},
{“name”:“子节点三”,“value”:number}
】
】
子序列在显示区域允许的情况下,可以继续按上述结构增加。
绘制结果如下所示:
从上图我们可以看到,尽管我们为父类命名,但显示的结果只有最小类的名称和数值。
pyecharts图像交互性较强,可以通过点击不断聚焦类,放大图像,但由于不知道怎么呈现给大家,还是鼓励大家自己动手操作去探索叭~
总结
加载全部内容