跳转到内容

小提琴图

维基百科,自由的百科全书
小提琴图的范例
PLOS Pathogens英语PLOS Pathogens科学期刊中的小提琴图范例

小提琴图是一种用于比较机率分布统计图形。它与箱形图类似,但在两侧多了翻转的核密度估计图。[1]

历史

[编辑]

小提琴图由 Jerry L. Hintze 和 Ray D. Nelson 于1997年提出,作为比箱形图提供更多资讯的一种方法,而箱形图由John Tukey于1977年发明。[2] 名称来源于图形的形状类似于小提琴[2]

介绍

[编辑]

小提琴图与箱形图相似,不同的是它还显示了不同值下数据的机率密度函数,通常透过核密度估计平滑显示。小提琴图包含所有箱形图的资讯,例如数据的中位数标记;表示四分位距的框或标记;如果样本数不多,还可能包含所有样本点。

虽然箱形图显示的是平均数或中位数及四分位范围等统计摘要,但小提琴图显示的是数据的完整分布。小提琴图可用于具有多峰分布的数据(即具有多个峰值)。在这种情况下,小提琴图显示不同峰值的存在、位置及相对幅度。

与箱形图一样,小提琴图用来比较不同类别变量的分布(或样本分布),例如比较白天和夜晚的温度分布,或者比较不同汽车制造商之间的汽车价格分布。

小提琴图可以具有多层结构。例如,外层形状代表所有可能的结果。下一层内的图形可能代表95%发生的值,接下来的内层可能代表50%发生的值。

小提琴图不如箱形图流行。对于不熟悉小提琴图的读者来说,理解可能会比较困难。在这种情况下,可以使用更容易理解的替代方法,如绘制一系列堆叠的直方图或核密度估计图。

小提琴图的原始含义是箱形图和双侧核密度图的结合。[1] 然而,现在“小提琴图”有时被理解为仅包含双侧核密度图,而不包含箱形图或其他元素。[3][4]

相关条目

[编辑]

参考文献

[编辑]
  1. ^ 1.0 1.1 Violin Plot. NIST DataPlot. National Institute of Standards and Technology. 2015-10-13. 
  2. ^ 2.0 2.1 Hintze, Jerry L.; Nelson, Ray D. Violin Plots: A Box Plot-Density Trace Synergism. The American Statistician. May 1998, 52 (2): 181–184. ISSN 0003-1305. doi:10.1080/00031305.1998.10480559 (英语). 
  3. ^ Wilke, Claus O. Fundamentals of Data Visualization. 
  4. ^ Violin plot — geom_violin. ggplot2.tidyverse.org. [2023-11-19] (英语). 

外部链接

[编辑]

 本条目引用的公有领域材料来自国家标准技术研究所的文档《Dataplot reference manual: Violin plot》