数据关系和 AntV、ECharts 图表解析¶
在实际的数据分析场景中,我们经常会遇到的数据关系包括以下五种:即趋势、比较、分布、关系和空间位置。而在制作仪表板的的时候,根据不同的业务场景,为数据关系和数据类型选择合适的视图是十分重要的。
DataEase 开源数据可视化分析平台支持 AntV 和 ECharts 两种视图类型。两种视图类型在设置上存在细微的差别,因此在制作视图时需要根据不同的显示要求选择不同的视图类型。
在了解数据关系之前,需要首先明确数据的类型:
-
定性数据
类别数据:包含有限的类别数或可区分组数。类别数据可能不是逻辑顺序,例如,性别、材料类型、付款方式等。 -
定量数据
离散数据:在两个值之间具有可计数的值的数据,离散数据始终为数值。例如,客户投诉数量,瑕疵或缺陷数,学校的学生人数等;
连续数据:在两个任意值之间具有无限个值的数据,连续型数据可以是数值,也可以是日期/时间。例如,零件的长度、商品的价格、销量、收付款时间等。
1 趋势数据¶
视图所需的数据类型:
-
数据集中只包含一列连续数据的日期变量;
-
数据集中至少包含一列连续数据的数值变量。
数据示例:各年度价格与销量的变化。
- AntV 包含的趋势图:
- ECharts 包含的趋势图:
AntV 和 ECharts 的趋势图对比:
-
视图类型:AntV 相比 ECharts 少了组合图,当数据集中两列指标的数据差距较大时,用组合图可以设置主轴值与副轴值,使两列数据都可以有较好地呈现;
-
数据设置:AntV 相比 ECharts 多了数值格式设置,当原始数据类型是小数时,通过数值格式可以修改为百分比等其他数值格式;
-
样式设置:AntV 相比 ECharts 少了”外间距“的功能(外间距是指图表相对视图组件的距离),以下以基础折线图为例:
- 当不设置外间距时,图像自动显示如下:
- 设置外间距后图像显示如下::
2 比较数据¶
视图所需的数据类型:
-
类别数据:
• 数据集中只包含一列类别数据:柱状图;• 数据集中包含两列类别数据:堆叠图;
• 数据集中包含三列类别数据:分组堆叠图。
-
连续型数据:数据集中至少包含一列连续型数据。
数据示例:不同类别的产品价格与销量的对比。
- AntV 包含的比较图:
- ECharts 包含的比较图:
AntV 和 ECharts 的比较图对比:
-
视图类型:AntV 相比 ECharts 多了瀑布图(主要用于展示股票趋势变动)、百分比图(着重展示比例信息、例如高校男女占比等,主要用于国家统计、用户调查等)、对称柱状图(主要用于两个类别不同指标间的比较,例如某班级男女生各科成绩比较等);
-
数据设置:AntV 相比 ECharts 多了数值格式设置;
-
样式设置:AntV 相比 ECharts 少了“外间距”的功能。
3 分布数据¶
视图所需的数据类型:
-
数据集中只包含一列类别数据;
-
数据集中只包含一列连续型数据的数值变量。
数据示例 1:不同类别的商品销量占比。
所有商品都被分类了,一个商品有且仅有一个分类,不存在一个商品同时归属于两个分类的原则。从一级分类的角度看销量:使用饼图、环形图、南丁格尔玫瑰图、矩形树图,可以看出不同类别商品的销量占整体销量的占比。占比之和 = 1。
数据示例 2:不同类型的用户购买商品数量占比。
所有用户不一定被全部打上标签,也不一定只有一个标签。从用户标签角度看购买量占比:使用雷达图、词云图,可以看出各标签的影响程度。占比之和 ≠ 1。
- AntV 包含的分布图:
- ECharts 包含的分布图:
AntV 和 ECharts 的分布图中的雷达图对比:
- ECharts 和 AntV 的雷达图都不可以调整轴值(每格数据的大小)。假设各指标的数据为 :90,100,95,110。
- ECharts 的轴值是绝对值,雷达中心点 = 0,雷达边缘点=数据指标列最大值。使用 ECharts 难以看出细微差别。
- 此时比较适合使用 AntV 图。AntV 的轴值为相对值,雷达中心点 = 数据指标列最小值,雷达边缘点 = 数据指标最大值。
4 关系数据¶
气泡图数据类型:
-
被解释变量:Y 变量数据集中只包含一列连续型数据的数值变量;
-
解释变量:X 变量数据集中只包含一列连续型数据的数值变量。
数据示例 1:销量随价格的变化趋势。
漏斗图数据类型:
-
被解释变量:Y 变量数据集中只包含一列连续型数据的数值变量;
-
解释变量:X 变量数据集中只包含一列类别数据。
数据示例 2:网站各页面的浏览人数。
AntV 和 ECharts 的关系图对比:
-
AntV 和 ECharts 都包含气泡图和漏斗图,ECharts 的气泡图可以设置“外间距”。
-
ECharts 和 AntV 都不可以设置漏斗图各层级的大小,ECharts 的各层级是固定样式,AntV 的各层级大小由数值大小决定。
5 空间数据¶
符号地图数据类型:
-
数据集中包含一列连续型数值数据(经度);
-
数据集中包含一列连续型数值数据(纬度)。
流向地图数据类型:
-
数据集中包含一列连续型数值数据(起点经度);
-
数据集中包含一列连续型数值数据(起点纬度);
-
数据集中包含一列连续型数值数据(终点经度);
-
数据集中包含一列连续型数值数据(终点纬度)。
地图数据类型:
-
数据集中包含一列类别变量(地区名称);
-
数据集中包含一列连续型数值数据(代表气泡大小)。
AntV 和 ECharts 的空间地图对比:
-
AntV:包含流向地图与符号地图,有经纬度时可以使用该图形,不限制国内或国外。
-
ECharts:只包含地图和气泡地图,目前只有国内地图数据。如需使用国外地图数据,需要自己手动配置。
AntV 包含的空间视图:
ECharts 包含的空间视图: