数据可视化 | vis.zone

主要功能 / 分布状况

折线图或折线图是一种图表,它将信息显示为由直线段连接的一系列称为“标记”的数据点。
它类似于散点图,不同之处在于测量点是按其x轴值排序的(通常按其x轴值排序),并与直线段连接。折线图显示特定数据如何以相等的时间间隔更改。
折线图类似于样条图形,但样条图形在点之间绘制一条曲线,而不是直线。

折线图

大合唱地图是一种专题地图,其中根据地图上显示的统计变量(如人口密度或人均收入)的测量比例对区域进行阴影或图案绘制。科洛普莱斯地图提供了一种简单的方式来可视化测量在一个地理区域内的变化,或者它显示了一个区域内的可变性水平。

科洛普莱斯地图

标签云是文本数据的可视化表示,通常用于描述网站上的关键字元数据(标签)、可视化自由形式的文本或分析演讲(例如选举的竞选活动)。标签通常是单个单词,每个标签的重要性用字体大小或颜色表示。此格式对于快速识别最突出的术语以及按字母顺序定位术语以确定其相对突出度非常有用。

词云

雷达图是一种以二维图表的形式显示多变量数据的图形方法,该二维图表包含三个或更多数量变量,这些变量表示在从同一点开始的轴线上。轴的相对位置和角度通常不具信息性。

雷达图

面积图或面积图基本上是线条图,线条下面的区域用颜色或纹理填充。与折线图一样,面积图也用来表示一段时间内量化值的发展。它还可以用来比较两个或更多类别,类似于堆积面积图。
面积图通常用于显示一段时间内的总体趋势,而不是特定值。

面积图

热图是一种数据可视化类型,其中包含在矩阵中的各个值通过不同的颜色显示。术语“热点图”最初是由软件设计师Cormac Kinney在1991年引入的,用来描述2D显示,描述实时金融市场信息,尽管类似的可视化已经存在了一个多世纪。
热图可用于可视化多个变量之间的方差,以显示相关模式
分形映射和树形映射通常都使用相似的颜色编码系统来表示层次结构中变量所取的值。这个词也被用来表示它的主题应用,如科洛普斯地图。
许多人还错误地将热图称为大合唱地图,因为“地图”这个词具有误导性。但是,热图在地理边界内包括不同的阴影或图案,以显示感兴趣变量的比例,而热图的着色并不对应于地理边界。

热图

比例面积图(正方形)用于比较比例(大小、数量等)在不使用刻度的情况下提供数据相对大小的快速概览。你也可以找到这种圆圈形状的变体。

正方形比例图

气泡地图是气泡、数据可视化和地图的简单组合。它被用来以一种简单的方式可视化位置和比例。

气泡地图

点图或点图是由以相当简单的比例绘制的数据点组成的统计图,通常使用填充的圆圈。点图有两个常见版本。第一种是由利兰·威尔金森(Leland Wilkinson)描述的,它是一种在手绘(前计算机时代)图表中用来描述分布的图表。另一个版本被威廉·克利夫兰描述为条形图的替代品,条形图中的点被用来描述与分类变量相关的量化值(例如计数)。

点图

直方图是将数字数据分组到存储箱中的图表,将存储箱显示为分段的列。它们被用来描述数据集的分布:值落入范围的频率。直方图最早是由卡尔·皮尔森(Karl Pearson)引入的。
要构建直方图,第一步是将值范围装箱,然后计算每个区间有多少值。绘制的矩形的高度与计数成正比,宽度与箱体大小相等,因此矩形彼此邻接。

直方图

样条图类型是折线图,它绘制通过系列中每个数据点的拟合曲线。折线图显示特定数据如何以相等的时间间隔更改。

样条图

地图学中的流程图可以定义为地图和Sankey图的混合,这些图显示了数量从一个位置到另一个位置的移动,如出行人数、正在交易的货物数量或网络中的数据包数量。
连接的宽度显示了最大数量。有时,您可以使用箭头排列地图以显示移动的方向。
流程图最著名的例子是米纳德的1812年拿破仑灾难性的俄国战役的地图。

流动图

小提琴曲线图是绘制数字数据的一种方法。这是一个箱形图,两边各有一个旋转的内核密度图。小提琴图与盒图类似,不同之处在于它们还显示了不同值下数据的概率密度。通常,小提琴曲线图将包括一个用于数据中值的标记和一个指示四分位数范围的框,就像在标准的框图中一样。

小提琴图

将数据的分布与普通直方图的理论分布进行比较可能非常困难,因为较小的频率由较大的频率主导,很难感知直方图条和曲线之间的差异模式。因此,约翰·图基在1971年推出了吊根图(又称图基吊根图),以解决这些问题。在这种可视化中,通过“悬挂”理论曲线上的观测结果可以更容易地进行比较,这样就可以通过与水平轴的比较而不是与倾斜曲线的比较来看到差异。正如在根图中一样,垂直轴被缩放到频率的平方根,以便引起人们对分布尾部的差异的注意。
他说:
它是直方图和帕累托图概念的变体,它以一种简单的方式将观测和预测结合在一起,其中折线图显示数据在不断变化。

悬根图

泡沫图表是一种显示三维数据的图表。每个实体及其关联数据的三元组(v1,v2,v3)被绘制为一个磁盘,该磁盘通过磁盘的xy位置表示两个vi值,并通过其大小表示第三个vi值。泡沫图表可以促进对社会、经济、医学和其他科学关系的理解。泡沫图表可以被认为是散点图的变体,在散点图中,数据点被气泡取代。

散点气泡图

甘特图是一种条形图,它将各种类别可视化成时间序列。甘特图以时间段为单位说明开始和结束时间。
在项目管理中,甘特图通常被用作显示与时间同步显示的活动(任务或事件)的最流行和最有用的方式之一。图表左侧是活动列表,顶部是合适的时间刻度。每个活动由条形图表示;条形图的位置和长度反映了活动的开始日期、持续时间和结束日期。
与列范围类似,只是指示时间不同。

甘特图

交通地图是一种拓扑图,以示意图的形式显示公共交通系统内的路线和车站-无论是公交线、电车、快速交通、通勤铁路或渡轮路线。主要组件是彩色编码线,用来指示每条线路或服务,用命名图标指示车站或车站。

运输地图

堆积面积图类似于简单面积图,但此处使用多个数据系列,这些数据系列从上一个系列留下的点开始每个点。它对于比较在间隔内变化的多个变量很有用。

堆叠面积图

在描述性统计中,盒图是一种方便的方式,可以通过四分位数以图形方式描述一组数字数据。框图显示中位数、高/低四分位数和最大/最小值。*异常值可以绘制为单个点,框的不同部分之间的间距表示数据中的离散度(Swide)和偏斜度,并显示异常值。框图可以水平绘制,也可以垂直绘制。
小提琴曲线图与盒子曲线图相似,不同之处在于它们还显示了数据在不同值的平均概率密度。

箱线图

地形图是对地面文化和自然特征的详细和准确的图形表示。地形图通常发布为一系列地图,由两张或更多张地图组合而成,形成整个地图。等高线是连接但不相交的两条线段的组合;它们表示地形图上的高程。

地形图

瀑布图有助于理解顺序引入的正值或负值的累积效应。瀑布图也被称为飞砖图或马里奥图,因为柱子(砖)明显悬浮在半空中。通常用于了解一系列中间正值或负值对初始值的影响。
不要与可能命名的瀑布情节混淆。

瀑布图

趋势线是在轴心高点上方或轴心低点下方绘制的一条线,用来显示某事的大致进程或趋势。趋势线是任何时间范围内支撑位和阻力位的直观表示。

趋势线

树形图将分层(树形结构)数据显示为一组嵌套矩形。树的每个分支都被赋予一个矩形,然后用表示子分支的较小矩形来平铺该矩形。叶节点的矩形具有与数据上的指定维度成比例的面积。通常,叶节点会着色以显示数据的单独维度。

树状图

与规则正方形树形图类似,但使用凸多边形而不是矩形,例如新的分层分区方案,也称为多边形分区,它使用凸多边形而不只是矩形。
树状图将分层(树形结构)数据显示为一组嵌套多边形。树的每个分支都被赋予一个多边形,然后用更小的多边形平铺,表示子分支。
当您想要显示分组和关系,而不是正常树映射的严格层次结构时,可以使用凸树映射而不是常规树映射。

凸树图

点密度地图是一种地图类型,它使用点或其他符号来显示要素或现象的存在。
在点密度图中,点较多的区域表示所选场的值高度集中,而点较少的区域表示浓度较低。
点密度图上的每个点既可以表示现象的一次记录(一对一),也可以表示给定数量的现象(一对多)。

点密度地图

泡沫时间轴是一种在时间轴上显示一组事件或项目的方式,时间轴上的变量显示为气泡的弧大小。本质上,泡沫时间轴是一种复合的数据可视化,由缩放的时间轴和比例面积图组成。

气泡时间轴

排序流图是围绕中心轴偏移的面积图,从而形成流动的有机形状-但它是排序的,而不是堆叠的。

排序流图

蜂窝图是绘制网络的一种合理的可视化方法。将节点映射到径向分布的线性轴并将其定位在其上-此映射基于网络结构属性。边绘制为曲线连接。简单易懂。
蜂窝图的目的是为大型网络的可视化建立新的基线-一种既通用又可调的方法,作为直观探索网络结构的起点很有用。

蜂窝图

并行集是一种用于分类数据可视化和交互探索的新方法,它显示的是数据频率而不是单个数据点。该方法基于平行坐标的轴线布局,用方框表示类别,轴之间的平行四边形表示类别之间的关系。

平行集

圆填充是一种可视化大量层次结构数据的方法。切圆表示同一级别的兄弟节点;为了可视化层次,节点的所有子节点都打包到该节点中(从而确定其大小)。叶节点的大小可以表示任意属性,例如文件大小。该算法的一个优点是能够很好地概括大数据集,清晰地表示分组和结构关系。

压缩圆图

散点图是一种使用笛卡尔坐标显示一组数据的两个变量的值的数学图表。数据被显示为点的集合,每个点具有确定在水平轴上的位置的一个变量的值和确定在垂直轴上的位置的另一个变量的值。

散点图

群集分析或群集是对一组对象进行分组的任务,使得同一组(称为群集)中的对象彼此之间比其他组(群集)中的对象更相似(在某种意义上或另一种意义上)。它是探索性数据挖掘的主要任务,也是一种常用的统计数据分析技术,广泛应用于机器学习、模式识别、图像分析、信息检索和生物信息学等领域。

聚类分析

以Vilfredo Pareto命名的帕累托图表是一种同时包含条形图和折线图的图表,其中单个值由条形图以降序表示,累计总数由线条表示。帕累托图的目的是突出一组(通常是大的)因素中最重要的一个。

帕累托图

泡沫饼图是一种独特的泡沫图表,允许您跨四个参数集(而不是两个参数集)显示/比较/关联性能。第三个值确定泡沫标记的大小,第四个值由饼的百分比确定,而其他两个值由轴上的位置确定。

复合泡沫饼图

流图或流图是一种围绕中心轴偏移的堆叠面积图,从而形成流动的有机形状。流记录仪是由李·拜伦发明的。

流图

螺旋热图是一种特定类型的热图,专为连续的可比较周期(如年或天)而设计。螺旋设计使比较周期成为可能,但保持沿螺旋的连续时间线。

螺旋热图

冲积图是一种流程图,最初开发的目的是表示网络结构随时间的变化。冲积图以流水沉积的土壤自然形成的冲积扇命名,既有直观的外观,又有对流动的强调。
变量被指定给平行的垂直轴。值由每个轴上的块表示。挡路的高度表示簇的大小,流场的高度表示由流场连接的两个块中包含的组件的大小。
冲积图是两个平行集合的变体,但用于分类变量,并经常显示随时间和阶段的趋势。

冲积图

极线图以二维图表的形式显示多变量数据,该图表包含三个以上变量,这些变量表示在从同一点开始的轴上。

极线图

泰勒图(Taylor,2001)提供了一种以图形方式总结一个模式(或一组模式)与观测结果匹配程度的方法。两个模式之间的相似性通过它们的相关性、它们的中心均方根差和它们的变化幅度(由它们的标准差表示)来量化。这些图表在评估复杂模型的多个方面或衡量许多不同模型的相对技能时特别有用(例如,IPCC,2001)。

泰勒图

三维散点图类似于散点图,但具有三个变量,假设x,y,z或f(x,y)为实数,则该图可以表示为三维笛卡尔坐标系中的点。它通常使用透视方法(等轴测或透视)绘制在二维页面或屏幕上,因此其中一个维度似乎是从页面中出来的。

三维散点图

六边形入库是管理许多开始重叠的点问题的另一种方法。六边形装箱图的密度,而不是点。点被放入网格的六边形中,并且使用六边形的颜色或面积来显示分布(每个六边形的点数)。该技术于1987年首次描述(D.B.Carr等人)。大N的散点图矩阵技术,美国统计协会杂志,第389页,第424-436页)。
使用六边形而不是正方形将二维曲面绑定为平面的原因有很多。最明显的是六边形与其说是正方形,不如说是圆形。这可以转化为围绕仓位中心更有效的数据聚合。这可以通过观察六边形的一些特殊属性,特别是六边形镶嵌的一些特殊属性来看出。

六边形分档图

径向折线图是径向图形的一部分,它获取数据并将其呈现为环绕圆的数据点的集合。它还从图表范围的最小到最大映射类别列表。径向折线图是使用连接数据点的直线集合呈现的。

径向线图

等值线贴图显示一个数量范围。它们在地图上以第三维的形式显示数据,因此非常适合绘制表面高程或天气数据。雷达地图、温度地图和降雨地图都是等值线地图。

等值线图

等高线图是二维中三个数值变量之间关系的图形表示。两个变量分别用于X轴和Y轴,第三个变量Z用于等高线级别。等高线标高绘制为曲线;曲线之间的区域可以进行颜色编码,以指示内插值。
等高线绘图是三维曲面绘图的替代方案。

等高线图

袋图是稳健统计中的一种方法,用于可视化二维统计数据。袋图使人们可以直观地看到数据集的位置、扩散、偏度和离群值。袋子图由三个嵌套多边形组成,分别称为“袋子”、“栅栏”和“环”。袋图有时被定义为盒子图的多维(二维)版本。

布袋

范围面积图是面积图的变体,它允许您绘制数据波段,如布林波段和天气模式。图表中的每个点由两个y值指定。

射程面积图

瀑布曲线图是同时显示多条数据曲线(通常是光谱)的三维曲线图。通常情况下,曲线在屏幕上和垂直方向上都是交错的,“较近”的曲线掩盖了后面的曲线。结果是一系列看起来并排的“山”形状。瀑布图通常用于显示二维信息如何随时间或某些其他变量(如rpm)变化。
不要与同名的瀑布图混淆。

瀑布图

三维流图是两个变量的函数f(x,y)的图形,或者是三个变量之间的关系g(x,y,z)的图形,只要x,y和z或f(x,y)是实数,则该图形可以表示为三维笛卡尔坐标系中的平面或曲面。三维图形通常是使用透视方法在二维页面或屏幕上绘制的,因此其中一个维度似乎是从页面中出来的。

三维流图