多维数据可视化实现的方式探究

2017-12-15 10:46高斐陈梅苏晨
电脑知识与技术 2017年32期
关键词:可视化

高斐+陈梅++苏晨

摘要:网络中非结构化数据急速增长则需求功能强大的可视化技术帮助我们理解数据,此技术成为当前的非重要任务。通过使用先进的数据分析技术对大数据进行研究,企业能够及时了解到当前商业状况并快速了解用户最新动态并做出正确的决策。多维数据可视化对数据的进一步分析和处理,通过交互式的可视化数据挖掘细节,能够增加数据的可理解性和可信度。

关键词:多维数据;可视化;数据图表

中图分类号:TP393 文献标识码:A 文章编号:1009-3044(2017)32-0022-02

随着网络和数据信息科学的发展,由于数据的量和复杂度上的爆炸式增长使得世界进入了大数据时代。技术的快速发展给我们带来方便也带来了前所未有的挑战,以最高效率快速解释并使用数据成为当前重要的课题。数据可视化( Data Visualization )通过将数据映射为容易感知的图形、符号、颜色等,利用人的高速信息采集能力为大脑提供数据的全面信息,很大程度上提高了数据的理解性。并且可以直观展示数据内部隐含的模式,对数据的进一步分析和处理提供了基础。

多维数据可视化是将数据信息以某种图形图像可视化的形式呈现出来,给观察者提供一种量化的方式,用来理解嵌入在数据中的隱藏信息。这些隐藏信息通常是异常信息和模式信息。异常信息会使得用户观察到了意想不到的图形图像分布信息,通常由异常的数据现象或者数据特征引起。通过交互式的可视化数据挖掘可以观察数据的细节,能够增加数据的可理解性和可信度。

1 实现数据可视化的基本图表

数据可视化( Data Visualization ) 能够帮助我们理解数据。通常使用图表来实现数据可视化,那么其中:柱状图、折线图、饼图等均为常用基本图表。

基本图表即简单的图表,容易理解,能够快速地理解数据,正是"数据可视化"的最重要目标。数据可视化的目的即是要对数据进行可视化处理,以使得能够明确地、有效地传递信息。

1.1 柱形图(Bar Chart)数据

基本图表当中最为常见且最容易理解的即是柱形图。适合应用于二维数据集(每个数据点包括两个值x和y),维度当中的一个需要进行比较。

图1即是我国智能电视行业2014年激活数量就是二维数据,其中的数量和品牌就是它的两个维度,激活数量是其中一个需要比较维度而已。此图以柱形高度进行反映数据的差别。人类眼睛对柱形高度差可以快速感知识别,效果相对准确。但柱形图的不足在于比较适合中小型数据集。如果使用不同色彩区分柱形区域效果更好。

1.2 折线图(Line Chart)数据

折线图适合多个二维数据集进行数据比较。它能够用于二维的大数据集,对于一些趋势比单个数据点更重要的情境更为适合。

1.3 饼图(Pie Chart)

饼图也是我们最为多用的基本图表,由于人类眼睛对区域面积大小的敏感。仅排列在工作表的一列或一行中的数据可以绘制到饼图中。饼图3显示一个数据系列即在图表中绘制的相关数据点,这些数据源自数据表的行或列。其中的每个数据系列具有唯一的颜色或图案并且在图表的图例中表示(上图右侧为图例)。饼图中显示了各项的大小与各项总和的比例。饼图中的数据点显示为整个饼图的百分比。

当情况是需要反映某个部分占整体的比重,比如磁盘空间使用占比情况等。

1.4 散点图(Scatter Chart)数据

三维数据集可以使用散点图,在图中有两维数据用来进行比较。散点图是指在回归分析中,数据点在直角坐标系平面上的分布图,散点图表示因变量随自变量而变化的大致趋势,据此可以选择合适的函数对数据点进行拟合。散点图分为ArcGIS散点图、散点图矩阵、三维散点图。

如果需要对第三维数据进行识别,可以通过对图中每个数据点加上文字标示,或者也可以采用不同色彩进行区分。

1.5 气泡图(Bubble Chart)数据

气泡图与散点图相似,不同之处在于允许额外加入一表示大小的变量。气泡图通过数据点的面积大小来反映它的第三维数据。是散点图的另一种变化形式。

上图的三个维度分别为销售额、区域、占比。数据点的面积越大就能够代表销售占比越大。气泡图可以通过区域面积的大小对第三维数据进行识别。如果将图中气泡数据使用不同颜色或文本说明标识,可以使用气泡图对四维数据描述。

1.6 雷达图(Radar Chart)数据

多维数据(四维以上)可以使用雷达图,其中每个维度数据必须可以排序。但是,如果当数据点多于6个的情况则无法进行识别。

上图中每个数据点都具有六个维度,分别是沟通、服务、专业技术、销售、执行、次要能力。图中面积越大的数据点表示越重要。使用雷达图需要配以文本说明更能增强解读效果。

1.7 基本数据图表对比

2 图表和信息图层次的数据可视化的实现

数据可视化过程包括:数据的采集、分析、治理、管理、挖掘等复杂数据处理,再经设计师设计表现形式,然后工程师创建对应的可视化算法及技术实现手段。

2.1 数据可视化的构成要素

2.2 通过图表和信息图层次实现数据可视化

通过增加动态信息来提供数据可视化的视觉体验;

通过排版布局对信息的可视化叙事性着力加强;

通过色彩对可视化数据的视觉效果进行提升。

2.3 数据可视化使用工具的选择

用户使用的数据结构不存在一定的复杂程度时,需要将数据展现的多彩且具有交互性,需要将数据转换为决策信息并能够成为BI系统、分析会议、汇报材料等数据分析的工具,应该首先具有多个实用性控件和主题,其次空间占用小并能将分析结果直接嵌入到Web及相关应用软件上,最后当然必须简单易学。

综上所述,现代网络数据急速增长则功能强大的可视化技术成为当前的重要任务,通过使用先进的数据分析技术对大数据进行研究,数据可视化能够将海量的数据转成图表形式,更直观地展示数据间的联系和变化,有效并及时处理后高效利用。企业才能在竞争环境中获得业务优势,是本文探讨此技术的主要目标。

参考文献:

[1] 林子雨.大数据技术原理与应用[M].北京:人民邮电出版社,2015.

[2] 陈为.数据可视化教程[M]. 北京:电子工业出版社,2013.

[3] 胡事民.数据可视化基础[M]. 北京:清华大学出版社,2016.endprint

猜你喜欢
可视化
无锡市“三项举措”探索执法可视化新路径
基于CiteSpace的足三里穴研究可视化分析
自然资源可视化决策系统
三维可视化信息管理系统在选煤生产中的应用
基于Power BI的油田注水运行动态分析与可视化展示
自然资源可视化决策系统
基于CGAL和OpenGL的海底地形三维可视化
可视化阅读:新媒体语境下信息可视化新趋势
“融评”:党媒评论的可视化创新
重大主题报道的可视化探索——以浙江日报的实践为例