数据类别
数据类别
序数数据
可明确每项数据的定义或者边界,数据可被枚举。例:部门;性别;花名;商家常用序数比例尺将数据映射为图形,比例尺为等比例等比例尺,对应图表的序数类型的展示。可使用的图形元素包括不仅限于:序数的
常见的数据问题:
-
问题:枚举数目可能过多;解决:取
TOP N ,剩余的归纳为“其他”。N 不宜过大 -
问题:数据项的定义可能不清晰;解决:tooltip,或者说明文案;
展示建议:
线性数据
连续的不能明确每项的边界。这里容易与上诉等序数数据混淆的类型,例:[1,2) ; [2,3) ; [3,4)······。此类数据可明确每项数据的边界,所以应该归类为序数数据而不是连续数据。例如,
在展示中若用户关注数据变化,可按大小递增递减排序。若用户关注其所携带的值
常见的数据问题:
-
数据区间分布不均,通常表现为,多个指标在一个图表中。例如多条折线图,其中一个折线数据区间值范围分布在
[10000 ,2000],而其他指标分布在[100,1000], 这样会把其他折线压平而看不到变化趋势。从视觉上就是一条横线。 -
峰值过大压低其他变化趋势。解决方案:将指标按照数据分布区间拆分成同
X 轴或者同Y 轴的多图展示方式。
时序数据
按照时间顺序,以特定时间粒度为步长增长,例:股票,网站日志,周
- 可采用拉伸
slider 控制展示的时间范围; - 通过切换时间粒度控制展示。
纵向时间轴,纵向图表的一大特性就是可以展示坐标轴刻度较大的数据。也就是说可展示的内容更多。但纵向时间轴不如横向图表一目了然,所以更适合具有故事发展性但数据展示(例如:大事记;版本修订记录
常见的数据问题:
- 数据缺失。时序不像序数数据,类别。缺少某段时间但数据,会使数据视觉上出现跳跃,或者出现空白。非常影响可视化但美观,简而言之,容易误以为有
bug 。解决方案建议:1. 补全时序,数据值补0 。优点:简单,符合数据情况。缺点:展示0 ,不能判断出是真实数据0 ,还是缺失数据。2. 线性过度。注意,线性过度后的展示一定要区别与正常数据的。例如,鼠标经过无效果,或者用虚线或灰线展示。
地理数据
含有单个地理位置的信息,
例:手机机站位置,商场
关系数据
包含节点信息,关系信息的数据,可能带有方向性,例:微博数据
关系数据可能包含:节点类别,节点值大小,关系类型,关系数量,关系权重,关系方向,路径等属性,属性可选。
按照关系类型又可分为:
除开算法分析外,在可视化过程中,我们可以做哪些?
问题:
组合数据
通常我们的数据较少是一维数据,通常都是二维以上数据。在数据可视化中,两个和三个维度的数据展示是最清晰的。四个维度的数据基本是一张图表可视化能理解的上限了。再多就使得图表理解困难。最好对图表进行拆分,进行联动等其他展示方案。