实际上,在大数据可视化这一概念还没有出现之前,人们对于数据可视化的应用就已经非常广泛了,大到人口数据,小到学生成绩统计,都可通过可视化展示,探索其中规律。当今时代,信息可以以多种方式可视化,每种可视化方法都有不同的侧重点。
在大数据时代,当你想要处理数据时,首先要清楚明白的一点是:你打算通过数据告诉用户发生了什么事情,然后数据被显示出来了?透过这些资料,能为您以后的工作提供什么指导,能否帮助读者正确抓住重点,了解行业动态?理解了这些,你就可以选择合理的数据可视化方法,有效地传递数据,你的数据才是有价值的数据。那么,数据可视化到底要怎么做呢?
数据的特性:
数据的可视化,首先要了解资料,然后再掌握可视化的方法,这样才能实现有效的资料可视化。您可能会遇到以下几种常见数据类型:
量化:数据是可测量的,所有值都是数字。
离散性:数字类数据可以在有限范围内取值。举例来说:办公室的雇员数。
持久性:数据可度量,并在一定范围内,例如:年降水量。
作用域:数据可以按编组和分类进行分类,例如:产量、销量。
正确的视觉图表。
对比类柱状图。
类图显示了值和值之间的差异和相似性。用长、宽、位、面、角和色比较数值大小,通常用来表示不同分类的数值对比,在不同时间点进行对比。柱图与直方图不同,柱状图不能显示数据在某一区间内的连续变化趋势。圆柱形图表示分类数据,回答了"在每个分类中有多少?"这个问题。值得注意的是,当柱状图显示的分类过多时,会导致显示问题,例如分类名称重叠。
分配类散点图。
分配类图表显示频率,数据分散在某一区域或分组。利用图形的位置、大小、颜色的渐变程度来表示数据分布,通常用来表示连续数据上的数值分布。
也叫“X-Y图”,它把所有的数据都以点的形式表示在直角坐标系中,表示各变量间的相互作用程度,由变量的数值来确定点的位置。
比重类饼图
比例类别图在同一维度上显示了比例关系。饼图法广泛应用于各个领域,用其表示不同分类的比例,通过弧度大小对比各种分类。
饼图表通过将一块饼按分类比例划分若干块,整块代表数据总量,每一块(圆弧)表示这一分块占总的比例大小,所有块(圆弧)的加和等于100%。
趋势类折线图。
展示数据趋势类别图表。利用一图的位置表现数据在连续区域的分布,显示了数据在连续区域大小变化的规律。
折线图用来显示数据在一个连续的时间间隔或时间跨度上的变化,它的特征是反映一种事物的趋势,即时间或有序类别。
显然,大数据可视化的图表远不止这些,而最关键的是如何利用这些工具和图表,总结出一个数据可视化工程师需要具备三个方面的能力:数据分析能力、交互视觉能力、研发能力。
无论您使用什么工具,无论使用何种图表,都不要忘记您的目标是理解数据,这就是大数据可视化的真正魅力所在。